Frisch in der robots.txt

Ganz einfach nachzumachen. Es sind nur zwei Zeilen:

User-agent: GPTBot
Disallow: /

Etwas mehr zum technischen Hintergrund in englischer Sprache. Und nein, ich bin nicht dazu bereit, den Geschäftsmodellen irgendwelcher Klitschen mit ihren angelernten neuronalen Netzwerken – von Politikern, Journalisten und anderen Nichtsblickern regelmäßig mit dem Reklamewort »künstliche Intelligenz« bezeichnet – freiwillig meine Texte als Datenfutter zum Anlernen zu schenken, wenn sie schon (oder: zurzeit noch) so erfreulich zivilisiert sind, sich an den Robots Exclusion Standard zu halten. Sollen die angelernten neuronalen Netzwerke doch einfach ihre eigenen »Texte« fressen! Die sind doch so irre »künstlich intelligent«, dass alle davon beeindruckt sind! Zumindest alle, die ihr Beeindrucktsein in Presse, Funk und Glotze mitteilen. Es ist wirklich wichtig, eine Taube in der Schulklasse zu haben. 😠️

Und nein, um das so genannte »geistige Eigentum« und den gesamten – im Regelfall nicht von Urhebern und Kreativen, sondern von quasi-industriellen Rechteverwertern – darum veranstalteten, stets etwas überschrillen Zirkus geht es mir dabei nicht. Sonst würde ich wohl kaum freiwillig etwas in so eine riesengroße Kopiermaschine wie dieses Internet stecken. Ich bin doch kein Presseverleger! Es geht mir nur um den Missbrauch der Ausflüsse meines Daseins als Datenmaterial für windige Geschäftsmodelle. In meinen Augen ist das Vampirismus, und es sollte genau so geachtet sein.

Wer das ähnlich sieht, mache es mir einfach nach. Wer nicht, der nicht.

Dieser Beitrag wurde unter Technisches abgelegt und mit , , , verschlagwortet. Setze ein Lesezeichen auf den Permalink.

4 Antworten zu Frisch in der robots.txt

  1. orinoco sagt:

    Ich gehe davon aus, dass die sogen. »künstliche Intelligenz« nicht schlauer ist und auch nicht wird als die Menschheit als Ganzes. Sprich: nur wer am lautesten schreit, findet Gehör. Da besteht keine Gefahr, dass meine unmaßgeblichen Ergüsse ins Internet irgendeine Relevanz für wen auch immer haben werden.

  2. Dark City sagt:

    Bei mir kam der Bot mit der IP-Adresse 20.15.240.189 vorbei.
    Das ist aus den Cloud-Netzwerk von Microsoft:
    https://www.whois.com/whois/20.15.240.189
    Ich hab den Mist nicht in der robots.txt aus Gründen, hab aber den Bot in der .htaccess Datei im Wurzelverzeichnis komplett gesperrt.

    ### NetRange: 20.0.0.0 - 20.31.255.255 eg. 20.15.240.189 with https://platform.openai.com/docs/gptbot
    deny from 20.0.0.0/11

    Man kann auch nur die einzelne Adresse damit verbieten, ich habe aber die Erfahrung gemacht, dass auch andere suspekte Bots usw. gerade aus der Cloud kommen und normale Besucher, die nichts zu verbergen haben kaum bis gar nichts und deshalb sperre ich lieber die ganzen IP-Ranges per CIDR Notation – der GBT-Bot nutzt evtl. auch mehrere Adressen, was für Cloud-Hosting nicht ungewöhnlich wäre.
    Dazu noch:

    SetEnvIfNoCase User-Agent gbtbot bad_bot
    SetEnvIfNoCase User-Agent openai bad_bot

    order allow,deny
    allow from all
    Deny from env=bad_bot


    Und das wars dann mit dem Bot, wenn er sich nicht tarnt, wie es z.B. der Apple-Bot gerne tut. Drecks Apple-Wanker.

    Im übrigen wärst Du um einiges glaubwürdiger, wenn Du nicht selbst solche angeblich intelligenten Dienste verwenden würdest, in deinem nerdigen Spieltrieb. JaJa, sind ja Bilder und keine Texte… Ausreden lassen sich immer, für die eigenen Handlungen zu Rechtfertigung finden. Aber da rede ich bei Dir ja ohnehin gegen eine und mit einer Mauer.
    In diesem Sinne – viel Spaß noch in der Beklopptenmatrix…

    • Elias sagt:

      Im übrigen wärst Du um einiges glaubwürdiger, wenn Du nicht selbst solche angeblich intelligenten Dienste verwenden würdest, in deinem nerdigen Spieltrieb

      Dafür habe ich viel zu viel Spaß an den ganzen Artefakten, die dabei wie von allein entstehen. Und ich habe doch sonst nur so wenig Spaß. 😃

      Na ja, tatsächlich habe ich mal ein bisschen mit den so genannten »künstlichen Intelligenzen« rumgespielt. Ich war überhaupt nicht davon überzeugt und finde es einigermaßen gruselig, was für Attribute hier einem Output aus einem Computer zugesprochen werden und was für fürchterliche Gefahren an die Wand gemalt werden. Aber auch das ist nichts Neues. Auf ELIZA sind sie damals, in den Sechzigern, auch abgegangen. Obwohl es nur »gekünstelte Intelligenz« war. Was heute anders ist, ist der Aufwand, den man in so einen Chatbot steckt und die verfügbare Rechenleistung. Über »Intelligenz« lernt man dabei nichts, aber vieles darüber, wie leicht sich so eine menschliches Psyche beeindrucken lässt, wenn nur jemand mit genügend Selbstsicherheit und glatter Formulierung blühenden Unsinn erzählt. Selbst, wenn es nur ein Computer ist. Bislang kannte ich den Effekt ja eher von Werbern und Politikern…

      Für die Zukunft von Berufen rund um die industrielle Textproduktion – zum Beispiel im Journalismus – sieht es allerdings nicht so toll aus.

    • Dark City sagt:

      […] wie leicht sich so eine menschliches Psyche beeindrucken lässt, wenn nur jemand mit genügend Selbstsicherheit und glatter Formulierung blühenden Unsinn erzählt.[…]

      Siehe z.B. https://de.wikipedia.org/wiki/Dr.-Fox-Experiment

      Ansgar Schneider sprach auch mal von einer akademischen Naivität, vielleicht eine Form des »Bestätigungsfehlers«, wo er beschreibt, dass Akademiker eher einfach glauben, was andere Akademiker behaupten, oft ohne es zu überprüfen, weil angenommen wird, dass Akademiker redliche und ehrliche Menschen sind und gründliche, sowie einwandfreie Forschung betreiben. Ich habe das z.B. und insbesondere bei Ärzten schon mehrfach beobachtet. Es kostet ja Zeit die Dinge zu überprüfen und ist nicht immer einfach – da hilft diese »akademische Naivität« ungemein Zeit nicht investieren zu müssen, aber auch um eigene kognitive Dissonanzen auszublenden oder gar nicht erst aufkommen zu lassen, wenn etwas gegen das eigene Weltbild spricht und man es so, z.B. als Blödsinn, einfach bei Seite wischen kann.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert