Kürzlich habe ich Nepenthes entdeckt, eine Teergrube für Schurken-Crawler. Im Grunde ist das Programm ein umgekehrter Slowloris-Angriff der Markov-Ketten Schwachsinn ausspuckt. Ein passendes Tool um ungebetenen Gäste genau das zu geben, was sie suchen.
Nachdem auch meine Dienste von schurkischen LLM Crawlern heimgesucht wurden hab, ich dann mal meine eigene Teergrube aufgesetzt. Die robots.txt
verweigert den Zugriff auf alles, also wer nicht dieses Große STOP Schild am Eingang missachtet, hat auch nichts zu befürchten.
Einrichtung
Die Webseite https://zadzmo.org/code/nepenthes/ hat ein paar Instruktionen aufgelistet. Ich benutze Container:
- Editiere die
docker/config.yaml
Datei. Die Standartwerte sind aber ganz ok. - Bauie den Container mit der
docker/Containerfile
Datei - Füttere die Markov-Kette. Dafür nimmst du am Besten eine lange Textdatei. Siehe z.B. Wikipedia. Ich hab’ Homer’s Illias von Projekt Gutenberg hergenommen. Jeder soll eine andere Quelle verwenden, um möglichst viel Zufall zu generieren. Mehrere Dateien sind zulässig.
curl -X POST -d @iliad.txt -H 'Content-type: text/plain' http://localhost:8893/train
- http://localhost:8893
- Öffne ein Bier und lächle in dich hinein ;-)
Schlussbemerkung
Und damit ist der Link auch in Umlauf. Mal schauen wie lange es braucht bis mir ein paar Bösewichte in die Falle laufen ;-)