Wikipedia:Weblinks/Block/archive.today

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Auf dieser Seite werden Anfragen zu Sperrungen und Entsperrungen der im Titel oder der Überschrift genannten Website, Domain oder Sub-Domain besprochen.

archive.today und archive.is

[Quelltext bearbeiten]

related:

Die Shorturl-Funktion von archive.today sollte geblockt werden (siehe Wikipedia:Web#Einzelrichtlinien Nr.14) . Mit dem Tool url-converter steht eine Funktion zur Gewinnung der Lang-urls zur Verfügung. Nachdem ich die alten Shorturls im ANR inzwischen alle umgestellt habe, und der url-converter (bis auf leicht ergänzbare Zusatzfunktionalitäten) funktioniert, sollte die zwingende Verwendung von Langurls kein größeres Problem darstellen.

Zu blocken wäre alle Links die dem Muster \barchive.(today|is)/\w{5,8}\b(#selection\b)? entsprechen. Frohes Schaffen — Boshomi ☕⌨☺11:40, 6. Jul. 2014 (CEST)[Beantworten]

gudn tach!
hmm, derzeit sind kurzlinks auf die domains noch auf recht vielen (grob geschaetzt, rund 300) seiten ausserhalb des main namespace verlinkt, siehe special:linksearch/*.archive.today, special:linksearch/*.archive.is
die ersetzung im main namespace war sicherlich sinnvoll, aber ausserhalb weiss ich nicht, wie viel sinn eine link-ersetz-aktion macht. klar, ich koenne einen bot drauf ansetzen. trotzdem bliebe es bei eigentlich sinnlosen edits. man muesste die edits aber bei einer SBL-aufnahme durchfuehren, weil ansonsten archiv-bots und ggf. user, wenn sie manuell threads verschieben, probleme bekommen koennen.
ein ausweg waere, das edit filter darauf anzusetzen; also eingeschraenkt auf den main namespace. -- seth 20:53, 8. Jul. 2014 (CEST)[Beantworten]
Nur mal als Verständnisfrage: Warum sind kurze URIs unerwünscht? --Pölkky 21:01, 8. Jul. 2014 (CEST)[Beantworten]
gudn tach!
<ergänzung>special:linksearch/https://*.archive.today und special:linksearch/https://*.archive.is (es wird auch https gelieftert, bei fehlender Protokollangabe gibt die MW-Software per default http zurück.) Frohes Schaffen — Boshomi ☕⌨☺20:16, 9. Jul. 2014 (CEST)[Beantworten]
es geht nicht um kurze URLs, sondern um URL shortener (im deutschen manchmal "kurzurls" bezeichnet). die koennen als sperrumgehung der SBL benutzt werden und werden deshalb gesperrt, normalerweise sogar global, aber bei einer so haeufig eingesetzten domain wird das schwierig. -- seth 21:36, 8. Jul. 2014 (CEST)[Beantworten]
+1 zusätzlich kommt hinzu, dass die Domain als Privatprojekt auf rechtlich recht schwachen Beinen steht. Es ist durchaus möglich, dass die Domain von einen Tag auf den anderen ersatzlos schließen muss. In so einem Fall bräuchten wir die Originalurls wie einen Hungernder einen Bissen Brot, wenn es um die Suche nach Ersatz für die dann toten Links geht. Frohes Schaffen — Boshomi ☕⌨☺22:09, 8. Jul. 2014 (CEST)[Beantworten]
Ich denke eine Einschränkung auf ns:0 (Artikel), ns:10(Vorlage), ns:6(Datei) und ns:14(Kategorie) wäre meiner Meinung nach schon ein Vollprogamm, und würde so ziemlich alles abdecken was die nach außen sichtbare Enzyklopädie betrifft, wobei ns:0 99% der Fälle abdeckt.  Frohes Schaffen — Boshomi ☕⌨☺22:09, 8. Jul. 2014 (CEST)[Beantworten]
in den letzten 14 Tagen ware es rund 3 Links pro Tag die hier neu eingebracht wurden. Bei nicht wenigen wurden hier Mementos auf archive.org/web/ eingetragen, vermutlich weil sich diese Seiten dadurch wieder im Googleindex befinden, was bei archive.org nicht der Fall ist. Frohes Schaffen — Boshomi ☕⌨☺10:22, 26. Jul. 2014 (CEST)[Beantworten]
gudn tach!
sorry fuer die verspaetung, hab jetzt WP:Bearbeitungsfilter/182 angelegt. erst mal wird nur mitgeloggt. wenn's funzt und nicht binnen kurzer zeit false positives auftreten, koennen wir ein warning ausgeben lassen. -- seth 13:04, 26. Jul. 2014 (CEST)[Beantworten]
no Problem. Mir ist das ganz recht wenn das ganze langsam und für die Anwender wenig überraschen passiert. Ich bin derzeit jedenfalls zumindest täglich erreichbar, und kann Benutzern helfen, die momentan noch Probleme beim Auffinden der Langlinks haben.  Frohes Schaffen — Boshomi ☕⌨☺14:37, 26. Jul. 2014 (CEST)[Beantworten]
archive.today ist derzeit überhaupt nicht erreichbar. Ich bitte daher um die Scharfschaltung, denn die hinzukommenden Link wie auf John_Penrose_Barron oder Rodrigo Guarteche sind nicht mehr auflösbar.  Frohes Schaffen — Boshomi ☕⌨☺20:59, 3. Aug. 2014 (CEST)[Beantworten]
Nach rund eine halben Tag scheint archive.today nun wieder erreichbar zu sein. Frohes Schaffen — Boshomi ☕⌨☺23:17, 3. Aug. 2014 (CEST)[Beantworten]
gudn tach!
ich tue mich etwas schwer damit, die regel scharfzuschalten. habe mir gerade einige der link additions angeschaut und dabei festgestellt, dass die fast immer mit groesseren aenderungen einhergingen. die gefahr ist, dass die leute aus technischem unvermoegen ihre aenderung nicht abspeichern und somit die aenderungen dann verloren gehen.
vielleicht ist es vorerst noch besser, wenn wir nur mitloggen und dadurch selbst geringfuegig mehr arbeit haben.
und wenn archive.today tatsaechlich abgeschaltet werden sollte, wird vermutlich auch niemand mehr darauf verlinken. -- seth 23:22, 3. Aug. 2014 (CEST)[Beantworten]
* Insgesamt bin ich bei dir, solange die Domain erreichbar ist, ist ein benutzerfreundlicher Umgang die beste Variante.
* Ich habe mich mit Filtern noch wenig beschäftigt, vermute aber dass der Filter nicht anspricht, wenn eine Seite neu erstellt wird, bzw. vom BNR in den ANR verschoben wird. Das betrifft etwa ein viertel aller Fälle seit Einrichtung des Filters 182. Schön wäre es, wenn der Filter nicht nur mitloggt, sondern auch nützliche Hinweise wie einen Link auf url-converter geben könnte.
* Der Fall mit der .is-Domain (John_Penrose_Barron) ist auffällig, da dies vermutlich aus einer anderen Quelle (andere Sprachversion?) stammt. ".is" ist jedenfalls schon seit 3 Monaten nur noch eine Weiterleitung.  Frohes Schaffen — Boshomi ☕⌨☺23:46, 3. Aug. 2014 (CEST)[Beantworten]
Der Betreiber schreibt: If you are concerned which domain (archive.is or archive.today) to use in the permanent links, I would bet on archive.is, which is redirecting to archive.today and will redirect to a new domain in case of problems with archive.today. Also wäre es nach wie vor besser, nach archive.is als nach archive.today zu verlinken. --Grip99 02:30, 5. Aug. 2014 (CEST)[Beantworten]
In der deutschen Wikipedia ist die Domain praktisch vollständig über Vorlagen eingebunden, eine neuerliche Umstellung weitgehend problemlos. Diesen Satz kenne ich, allerdings scheint die '.is'-Domain derzeit praktisch vollständig aus der Codebasis getilt zu sein, jedenfalls liefern Header-Files und sonstige Infos die man auslesen kann, ausschließlich die '.today' Domain. Die '.is'-Domain wurde im April abgeschaltet, und ist folglich für normale User kaum noch auffindbar, ausgenommen alte Verlinkungen z.B in anderen Sprachversionen der Wikipedia. Dort liegen Kurzlinks noch in hoher 5-stelliger Zahl vor, und das ist ein ernsthaftes Problem, da bei mangelhafter Linkbeschreibung zu einem kompletten Informationsverlust eintreteten könnte. Frohes Schaffen — Boshomi ☕⌨☺07:45, 5. Aug. 2014 (CEST)[Beantworten]

Der Filter 182 ist übrigens ein ganz guter Trollfilter. Ein Drittel aller Treffer entfallen auf die IP 217.85.*.*  Frohes Schaffen — Boshomi ☕⌨☺22:09, 24. Sep. 2014 (CEST)[Beantworten]

gudn tach user:Boshomi!
ich denke, statt einer filterregel sollte das eher per bot-generierter wartungsliste und user-ansprachen erledigt werden. vielleicht kann ich das die tage CamelBot beibringen. 182 werde ich dann deaktivieren. -- seth 20:38, 26. Dez. 2018 (CET)[Beantworten]
seth: Ja, das ist eine gute Idee. Ich bin bis auf weiteres sehr knapp mit meiner Freizeit, sodass die Bot-Lösung tatsächlich ein Vorteil wäre.  Frohes Schaffen — Boshomi Defekte URLs - Hilfe mit!08:12, 28. Dez. 2018 (CET)[Beantworten]
gudn tach!
user:CamelBot sollte von nun an die wartungsliste user:CamelBot/maintenance_list/archive.today befuellen. ausserdem sollte er selbststaendig die links ersetzen, wenn archive.is und die original-links erreichbar sind. #182 habe ich abgeschaltet. -- seth 21:10, 29. Dez. 2018 (CET)[Beantworten]