Breidbart-Index

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Der nach seinem Erfinder, Seth Breidbart, benannte Breidbart-Index ist der bedeutendste Cancel-Index im Usenet.

Mit einem Cancel-Index wird die Verbreitungsintensität wesensgleicher Artikel bestimmt. Überschreitet der Index einen Grenzwert, so bezeichnet man die betreffenden Artikel als Spam. Sie dürfen dann durch Fremdcancel entfernt werden.

  • Crossposting ist das Versenden eines Artikels in mehrere Gruppen.
  • Multiposting ist das mehrfache Versenden desselben Inhalts.

Die grundlegende Idee des Breidbart-Index besteht darin, diese Methoden unterschiedlich zu bewerten.[1] Zum einen müssen bei Crossposts weniger Daten übertragen und gespeichert werden. Zum anderen sind exzessive Crossposts (ECP) ein plausibler Anfängerfehler, während exzessive Multiposts (EMP) auf vorsätzlichen Einsatz spezieller Software schließen lässt.

Entscheidend ist die Erfassung verschiedener Artikel als wesensgleich (im englischen Original: substantively identical). Dies umfasst unter anderem:

  • Byte für Byte identische Nachrichten;
  • an sich identische Nachrichten, die sich nur in geringen Anpassungen an die Gruppe unterscheiden;
  • Nachrichten, die dasselbe Produkt, Dienstleistung oder Website bewerben;
  • Nachrichten, die aus der gleichen Signatur (und sonst nichts) bestehen;
  • Nachrichten, die sich nur durch den zitierten Text unterscheiden.

Breidbart-Index (BI)

[Bearbeiten | Quelltext bearbeiten]

Der BI einer Menge von Artikeln ist die Summe der Quadratwurzeln von n, wobei n die Anzahl der Newsgroups ist, in die jeder einzelne Artikel gepostet wurde. Bewertet wird dabei eine Serie von m wesensgleichen Artikeln innerhalb eines Zeitraums von 45 Tagen. Das heißt, Postings älter als 45 Tage zählen nicht zur Serie.[2]

Formel

Beispiel

Zwei Postings enthalten denselben Text. Einmal als Crosspost in 9 Gruppen, einmal als Crosspost in 16.

Version 2 des Breidbart-Index (BI2)

[Bearbeiten | Quelltext bearbeiten]

Der BI2 ist definiert als Summe der Quadratwurzeln von n, plus der Summe von n, geteilt durch zwei.[2] Der BI2 ist aggressiver als der BI. Ein Crosspost in 35 Gruppen reicht, damit eine einzelne Nachricht den Grenzwert von 20 übertritt.

Formel

Beispiel

Zwei Postings enthalten denselben Text. Einmal als Crosspost in 9 Gruppen, einmal als Crosspost in 16.

Skirvin-Breidbart-Index (SBI, BI3)

[Bearbeiten | Quelltext bearbeiten]

Die Bezeichnungen Skirvin-Breidbart-Index und SBI finden sich im Spam Thresholds FAQ.[2] In der Hierarchie nl.* wird dieser Index aber BI3 genannt.[3]

Der SBI wird wie der BI2 berechnet, summiert aber die Anzahl der Gruppen in Followup-to: (wenn vorhanden) statt der Anzahl der Gruppen in Newsgroups:. Dadurch wird das Setzen eines Followup-to: belohnt.

Beispiel

Zwei Postings enthalten denselben Text. Einmal als Crosspost in 9 Gruppen, einmal als Crosspost in 16 mit vier Gruppen im Followup-to:

In der Usenet-Hierarchie de.* gilt der Breidbart-Index mit einem Zeitfenster von 7 Tagen statt 45. Dafür hat sich die Abkürzung BI7 eingebürgert.[4]

In der Hierarchie hamster.de.* gilt der Breidbart-Index mit einem Zeitfenster von 30 Tagen statt 45. Dafür hat sich die Abkürzung BI30 eingebürgert.[5]

Cancel-Index in at.*

[Bearbeiten | Quelltext bearbeiten]

Ist im FAQ[6] der Gruppe at.usenet.cancel-reports definiert. Im Wahlaufruf (CfV)[7] und im FAQ wird nur die Bezeichnung Cancel-Index verwendet. Inoffizielle Abkürzungen sind CI und ACI.

Der ACI eines einzelnen Postings berechnet sich als 3 plus Anzahl der Gruppen, an die dieses Posting geschickt wurde. Der Index mehrerer Postings ist die Summe der Indizes der einzelnen Postings.

  • Laut RFC 1036[8] darf ein Artikel nur vom Autor oder dem Administrator des Servers, auf dem der Artikel ins Usenet eingespeist wurde, gecancelt werden.
  • Laut dem Spam Thresholds FAQ[2] gilt im gesamten Usenet ein Breidbart-Index von 20, d. h. Artikelserien, die über diesem Wert liegen, dürfen von jedermann per Fremdcancel entfernt werden.
  • In einigen Hierarchien wurden alternative (strengere) Grenzwerte durch eine Abstimmung festgelegt.
  • In der Hierarchie free.* sind alle Arten von Cancel verboten.[9]

Tatsächlich ist eine Cancel-Message nur eine durch Software automatisch auswertbare Bitte, einen bestimmten Artikel zu löschen. Betreiber von Newsservern dürfen frei entscheiden, wie sie die widersprüchlichen Richtlinien umsetzen.[10]

Hierarchie Cancel-Index Zeitfenster Grenzwert Berichte Festlegung
* BI 45 20 news.admin.net-abuse.bulletins [2]
at.* ACI 45 11 at.usenet.cancel-reports [7][11]
at.anzeigen.* ACI 14 4 at.usenet.cancel-reports [12][13]
bln.* BI 45 3 [14]
de.* BI 7 5 de.admin.net-abuse.announce [4][15]
de.alt.dateien.* BI 45 1 de.admin.net-abuse.announce [4][14]
de.markt.* BI 45 2 de.admin.net-abuse.announce [16][4][14]
es.* BI 45 20 [17]
fr.* BI 30 10 fr.usenet.abus.rapports [18]
hamster.de.* BI 30 3 hamster.cancelreport [5]
it.* BI 45 20 it.news.net-abuse [19][20]
muc.* BI 45 2 [14]
nl.* SBI 10 nl.internet.misbruik.rapport [3]
nrw.* BI 7 2 [21]
schule.* BI 14 3 schule.cancelreport [22]

Einzelnachweise

[Bearbeiten | Quelltext bearbeiten]
  1. <news:36i6hk$3li@panix3.panix.com>
  2. a b c d e Spam Thresholds FAQ
  3. a b Over cancelrapporten in nl.internet.misbruik (Memento vom 4. August 2007 im Internet Archive)
  4. a b c d <news:Result-festlegung-bi-06-05-1999@dana.de>, http://home.snafu.de/hweede/debi.txt
  5. a b Regelsatz für hamster.de.* (Memento vom 10. Februar 2013 im Webarchiv archive.today)
  6. Spam Cancel in at.* (FAQ)
  7. a b <news:CfV$1$at.usenet.cancel-reports$3@usenet.backbone.at>
  8. RFC: 1036 – Standard for Interchange of USENET Messages. Dezember 1987 (englisch).
  9. free.* FAQ. killfile.org
  10. Cancel Messages: Frequently Asked Questions. killfile.org
  11. <news:Result-festlegung-bi-06-05-1999@dana.de>
  12. <news:938889391/18913@usenet.backbone.at>
  13. <news:RESULT-Entfernung_von_at.anzeigen.computer.haendler-03.10.1999@orcus.priv.at>
  14. a b c d Die Jobbörse in den Newsgroups: de.markt.arbeit.*
  15. Fremdcancel-FAQ (Memento vom 25. Juni 2007 im Internet Archive)
  16. Archivlink (Memento vom 30. Januar 2011 im Internet Archive), <Result-de.markt.ALL-28.05.1998@dana.de>
  17. FAQ: SPAM.ES (Memento vom 3. Mai 2010 im Internet Archive)
  18. Les annulations d’articles (Cancel)
  19. Tutto quello che occorre sapere sulla cancellazione
  20. Pagina Antispam in italiano
  21. Regeln der nrw.*-Hierarchie. nrw.usenetverwaltung.de
  22. schule.afaik.de (Memento des Originals vom 27. Februar 2021 im Internet Archive)  Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/schule.afaik.de