Wikipedia:Weblinks/Block/spaceeducation.de

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Auf dieser Seite werden Anfragen zu Sperrungen und Entsperrungen der im Titel oder der Überschrift genannten Website, Domain oder Sub-Domain besprochen.

spaceeducation.de

[Quelltext bearbeiten]

Hallo, der Artikel Benutzer:Awoezel/Artikelentwurf-ISEI kann nicht veröffentlicht werden, da in der deutschen SBL MediaWiki:Spam-blacklist – Wikipedia ein Eintrag zu "eeducation.de" vorhanden ist und der Teilstring offenbar fälschlicherweise für "spaceeducation.de" matched.

Wie kann das behoben werden? --Awoezel (Diskussion) 10:47, 5. Sep. 2022 (CEST)[Beantworten]

siehe [1][2], eine Veröffentlichung deines Artikels ist auch bei Whitelisting eurer URL nicht ersichtlich, wie dir schon von mehreren Administratoren mitgeteilt wurde. --Johannnes89 (Diskussion) 10:53, 5. Sep. 2022 (CEST)[Beantworten]
gudn tach!
user:Awoezel: ich hab den sbl-eintrag geaendert, sodass spaceeducation.de nicht mehr betroffen sein sollte. fuer spaceeducation.de liegen keine spamming-faelle vor, weshalb ein blacklisting nicht angebracht waere.
dennoch gilt, was die anderen schrieben, naemlich dass der artikel, den du schreibst, unsere kriterien (WP:RK, WP:NPOV etc.) erfuellen sollte, bevor er in den main namespace verschoben wird. das link-thema ist davon weitgehend unberuehrt. solltest du noch fragen zur erstellung des artikels haben, empfehle ich dir WP:FNV, da wird einem normalerweise recht freundlich geantwortet. -- seth 11:18, 10. Sep. 2022 (CEST)[Beantworten]
Tach seth, endlich versteht mich jemand. Als Informatiker bekomme ich die Krise, wenn ich sehe, dass ein Blacklisting so unscharf gesetzt wird, dass es über das Ziel hinaus schießt. Dann doch am besten gleich so konsequent sein und das Prinzip des "least privilege" einsetzen und mit * Wildcard das gesamte Internet blacklisten und nur eindeutig erwünschte Domains whitelisten. ;-)
Ich vermute aber einfach, dass Regex hier schlicht lazy angewendet wurde/wird. Wenn ich eine Domain und seine Subdomains blocken möchte, dann doch so, dass ich nicht den gesamten Substring von rechts matche.
Im Wiki Wikipedia:Spam-blacklist/manual – Wikipedia ist es doch auch richtig erklärt und mit Hinweis versehen, was passieren kann: "dann werden zusätzlich auch Domains der Art "nichtexample.net" gesperrt, was man meist nicht möchte." --Awoezel (Diskussion) 22:11, 11. Sep. 2022 (CEST)[Beantworten]
gudn tach!
ich denke, die anderen haben es prinzipiell schon auch verstanden, aber keine notwendigkeit dafuer gesehen, das regexp-pattern zu entschaerfen, weil es sich bei spaceeducation.de zwar um ein false positive bzw. der SBL handelte, aber in diesem fall von der sorte, die (also die blockade der domain) akzeptiert ist, solange der zugehoerige artikel an sich als nicht-wp-tauglich angesehen wird.
die ablehnende haltung war also eher eine art pragmatismus. ich bin so gesehen nur der regelhuber, der sagt: "ja schon, aber unsere regeln geben nicht her, dass wir solche false positives akzeptieren sollen, wenn keine anzeichen fuer spamming vorhanden sind."
was einige der anderen wikipedianys vielleicht weniger gesehen haben, ist, dass es insb. fuer neulinge frustrationsverstaerkend bis kafkaesk wirkt, wenn so viel so hart abgeblockt wird.

zum technischen teil: ja, die regexp-pattern werden quasi-lazy ausgewertet, weshalb man als admin ziemlich aufpassen muss. wir hatten's schon mal, dass jemand versehentlich kurzzeitig alle hosts, die ein "t" enthielten, global in allen wikipedias blockierte. :-)
auf globaler wikipedia-ebene versucht man, probleme wie jenes, auf das du gestossen bist, zu vermeiden, indem man word boundaries \b vor jeden host setzt, also z.b. \beeducation\.de. ich bin unschluessig, wie gut ich das finden soll. wir hatten's naemlich schon haeufiger, dass das von einigen leuten missverstanden wurde und die das b literal verstanden (und das backslash ignorierten). ausserdem schlaegt sowas immer noch an, wenn ein bindestrich davor kommt, also z.b. "blabla-eeducation.de". daher nutze ich's in der deutschsprachigen wikipedia nur in ausnahmefaellen wie diesem hier oder gehe in manchen faellen sogar auf nummer sicher und nutze die look-behind-assertion (?<=\.|://)eeducation\.de, was halt zunehmend schwerer lesbar ist, insb. fuer nicht so regexp-affine leute.
dein hinweis auf die anleitung ist allerdings durchaus berechtigt. die faelle kommen zwar selten vor, aber du bist nicht der erste betroffene. vielleicht sollte ich bei gelegenheit doch mal (fast) ueberall die look-behind-assertion davorsetzen. der performance sollte es nicht merklich schaden. -- seth 23:36, 11. Sep. 2022 (CEST)[Beantworten]