Wikipedia Diskussion:Löschkandidaten/Urheberrechtsverletzungen/Archiv/2019
AutoQS-URV
Moin, der Bot wird bald den Betrieb aufnehmen, und neue Artikel durch Earwigs Copyvios Tool schicken. Allerdings wird er dort nur die in den Artikel eingebauten Links prüfen, und die Suche nicht über das ganze Internet laufen lassen, wie es das Toll auch zulassen würde. Sollten irgendwelche Fehler während des Betriebs auftauchen, so könnt ihr auf der Benutzerseite des Bots den roten Knopf drücken und die Seite dort speichern, dann bricht der Job ab, man braucht den Bot dazu nicht sperren. Viele Grüße, Luke081515 02:44, 13. Jan. 2019 (CET)
- Der Bot erfasst nun übrigens auch Artikel die aus Benutzer: oder Wikipedia: in den ANR verschoben werden. Viele Grüße, Luke081515 12:16, 14. Jan. 2019 (CET)
- Sollten das zu viele Treffer werden, kann man den Bot auch so schalten, das er nur >75% listet. Viele Grüße, Luke081515 22:22, 14. Jan. 2019 (CET)
- Die Meldung zu Mantón de Manila ist Unfug. Der Bot nimmt eine Website als Quelle an, die ihrerseits nur aus der tatsächlichen Quelle zitiert. Diese tatsächliche Quelle ist im Artikel korrekt genannt. --Mussklprozz (Diskussion) 09:32, 10. Mär. 2019 (CET)
- Genau das selbe ist heute auch im Artikel Wohnhochhaus Weitblick. Klar gibt es da eine Übereinstimmung zu https://bda-bund.de/awards/wohnhochhaus-leibnizweg/ da von dort die Preisbegründung übernommen und korrekt zitiert wurde. So schafft man sich nur unnötig Arbeit wenn der Bot derartige Fälle nicht aussieben kann. --Alabasterstein (Diskussion) 08:16, 17. Apr. 2019 (CEST)
- Den Inhalt von {{Zitat}} auszunehmen sollte ja eigentlich machbar sein. --Universalamateur (Diskussion) 08:18, 17. Apr. 2019 (CEST)
- Schwer, da der Bot den Artikel bisher nicht liest. Klar, kann man einführen, das Problem ist, das es nicht nur Zitate sind, sondern auch lange Literaturlisten, so einfach ist das nicht. Und Zeit brauche ich auch noch. Viele Grüße, Luke081515 20:29, 17. Apr. 2019 (CEST)
- Den Inhalt von {{Zitat}} auszunehmen sollte ja eigentlich machbar sein. --Universalamateur (Diskussion) 08:18, 17. Apr. 2019 (CEST)
- Genau das selbe ist heute auch im Artikel Wohnhochhaus Weitblick. Klar gibt es da eine Übereinstimmung zu https://bda-bund.de/awards/wohnhochhaus-leibnizweg/ da von dort die Preisbegründung übernommen und korrekt zitiert wurde. So schafft man sich nur unnötig Arbeit wenn der Bot derartige Fälle nicht aussieben kann. --Alabasterstein (Diskussion) 08:16, 17. Apr. 2019 (CEST)
- Die Meldung zu Mantón de Manila ist Unfug. Der Bot nimmt eine Website als Quelle an, die ihrerseits nur aus der tatsächlichen Quelle zitiert. Diese tatsächliche Quelle ist im Artikel korrekt genannt. --Mussklprozz (Diskussion) 09:32, 10. Mär. 2019 (CET)
- Sollten das zu viele Treffer werden, kann man den Bot auch so schalten, das er nur >75% listet. Viele Grüße, Luke081515 22:22, 14. Jan. 2019 (CET)
- <linksrück> @Luke081515: Sorry, Luke, aber dieser Bot tut nicht das, wofür er wohl programmiert ist. Dauernd finde ich auf dieser Seite meine biografischen Artikel, die natürlich Lebensdaten, Titel usw. enthalten, die auch im – ordentlich zitierten – Artikel vorkommen. Zu viele false positives also. Imho solltest du die Auswertungsalgorithmen noch einmal überarbeiten und dabei beachten, dass es für eine URV einer Schöpfungshöhe bedarf, damit überhaupt ein subjektives Urheberrecht entstehen kann, denn für triviale Informationen wie die von mir genannten ist das nicht möglich. Bei aller Wertschätzung deiner Arbeit: so funktioniert das noch nicht, lass dir das von einem alten Softwaretester in aller Kollegialität gesagt sein. Nichts für ungut :) --Altkatholik62 (Diskussion) 03:34, 10. Mai 2019 (CEST)
- Danke, wie gesagt, momentan ist das so ein halbes Ding: Dadurch das die Search Engine nicht läuft, werden die Ergebnisse ungenau. Bei den Bio-Artikeln muss ich noch ein entsprechendes Muster finden, wie man die gut ausschließen kann. Da es die Quota momentan zulässt, werde ich 40-50% der Requests wieder gegen die Suchmaschine laufen lassen. Ich hoffe WMDE meldet sich bald zurück, und man kriegt das mit einem zusätzlichen API-Schlüssel hin (s. u.a. meine Beiträge in enwiki). Viele Grüße, Luke081515 20:52, 10. Mai 2019 (CEST)
Versteckte Versionen der Meldungsseite
Wieso fehlen hier denn 10 Versionen? Das Logbuch zeigt nichts an. --StYxXx ⊗ 00:27, 10. Jul. 2019 (CEST)
Benutzer:Nixnubix - ich fürchte, da sind noch weit mehr Artikel betroffen
2 Artikel von ihm hab ich soeben umseitig eingetragen. Doch ich fürchte, bei genauerer Kontrolle könnten sich eine ganze Reihe seiner in den vergangenen Jahren angelegter Artikel als URV herausstellen. Dass ein Benutzer einerseits auf QS mit extremer Autorität auftritt und stolz auf seine vieljährige Artikelarbeit hinweist, und andererseits selbst vergleichsweise junge Artikel von ihm Wort-für-Wort URV (von deutschen Texten, oder Satz für Satz aus dem Englischen übersetzt) sind, macht mich sehr misstrauisch. Viele seiner Personenartikel fallen durch recht geschraubte Formulierungen auf, wie sie für gedruckte Lebensläufe und Nachrufe üblich sind.--Niki.L (Diskussion) 12:54, 15. Jul. 2019 (CEST)
- Schicke mir die die Artikelnamen, ich schicke dir die Freigaben. --Nixnubix (Diskussion)*(ohne (gültigen) Zeitstempel signierter Beitrag von Nixnubix (Diskussion | Beiträge) 13:04, 15. Jul. 2019 (CEST))
- Hi Nixubix, die Artikel auf Verdacht durchzugehen ist etwas schwierig. Sinnvollerweise vermeidet man URV Verdacht, indem man Freigaben, die man hat, an das OTRS Team schickt. Wäre dir das möglich? Danke! --Kritzolina (Diskussion) 13:13, 15. Jul. 2019 (CEST)
- Eigentlich bin ich ja außen vor. Ich habe mit WP zumindest die nächste Zeit nichts am Hut. Im Interesse des Urhebers (Autors), ich habe gerade mit ihm telefoniert und er möchte, daß diese Artikel nicht gelöscht werden, schickt er die Genehmigung an Wikimedia und an mich. Natürlich sende ich ihm zuvor das Formular. --Nixnubix (Diskussion) (ohne (gültigen) Zeitstempel signierter Beitrag von Nixnubix (Diskussion | Beiträge) 13:28, 15. Jul. 2019 (CEST))
- Vielen Dank! --Kritzolina (Diskussion) 21:25, 16. Jul. 2019 (CEST)
- Eigentlich bin ich ja außen vor. Ich habe mit WP zumindest die nächste Zeit nichts am Hut. Im Interesse des Urhebers (Autors), ich habe gerade mit ihm telefoniert und er möchte, daß diese Artikel nicht gelöscht werden, schickt er die Genehmigung an Wikimedia und an mich. Natürlich sende ich ihm zuvor das Formular. --Nixnubix (Diskussion) (ohne (gültigen) Zeitstempel signierter Beitrag von Nixnubix (Diskussion | Beiträge) 13:28, 15. Jul. 2019 (CEST))
- Hi Nixubix, die Artikel auf Verdacht durchzugehen ist etwas schwierig. Sinnvollerweise vermeidet man URV Verdacht, indem man Freigaben, die man hat, an das OTRS Team schickt. Wäre dir das möglich? Danke! --Kritzolina (Diskussion) 13:13, 15. Jul. 2019 (CEST)
Michael Herr (Übersetzer), 10. September
für den hier unterstellten 68%-igen URV würde ich das gerne schon etwas genauer wissen wollen: Eine zum Beispiel 86,3%-ige Übernahme eines Werkverzeichnisses bewirkt eine 2/3tel URV? Oder wie ist das zu verstehen? Oder geht es ausschließlich um den Textkorpus, den Fischer bei Wickersheimer und dieser beim ADB (siehe Wikisource) entliehen hat? --Goesseln (Diskussion) 11:35, 12. Sep. 2019 (CEST)
- kommt hier noch etwas, oder rede ich hier mit einem Bot (apropos KI) ?--Goesseln (Diskussion) 22:01, 20. Sep. 2019 (CEST)
- Siehe eins drunter. Luke081515 19:50, 21. Sep. 2019 (CEST)
Jessica Heesen, 21. September
siehe eins drüber, dieselben Fragen. Luke081515, gibt es hier einen Menschen, der die Einträge prüft? Wie hoch ist die hier genannte „vom Script definierte Grenze“? Biografische Daten, Veröffentlichungslisten mit Werktiteln, Namen von Instituten und Organisationen werden bei kurzen Biografien immer einen bestimmten Level erzeugen. Einen URV-Vorwurf muss ich zurückweisen, der Artikel ist auf Basis von zahlreichen Belegen und mit nicht kleinem Aufwand geschrieben.--elya (Diskussion) 15:40, 21. Sep. 2019 (CEST)
- Also die Werte für die Wahrscheinlichkeiten kommen vom Tool, laut diesen Zeilen sind das dann 40 und 75 Prozent, dementsprechend schreibt der Bot dann "vermutet" oder "wahrscheinlich". Die Einträge prüft normalerweise Doc Taxon, manchmal ich, kann auch gerne jeder andere machen. Eintrag prüfen, wenn nichts ist entfernen, sonst weiter unten eintragen und das normale Prozedere. Die Einträge die der Bot erstellt sind keine konkreten "das ist definitiv URV" sondern eher ein "da könnte was sein, bitte schau da als Mensch mal drauf", dementsprechend sollte das ganze auch kein Vowurf sein, wenn das aus dem Text so gelesen wird: Ich bin eher Programmierer als Texter, über die mache ich mir weniger gedanken, also wenn jemand einen besseren Vorschlag hat, dann raus damit, dann pass ich das gerne an. Das entsprechend false-positives dabei sind liegt in der Natur der Sache, da lediglich geprüft wird, wie viel Prozent vom Text identisch sind. Sowas kann man noch optimieren, aber momentan habe ich zu wenig Zeit dafür. Viele Grüße, Luke081515 19:50, 21. Sep. 2019 (CEST)
- Ja, ja, die Zeit ;-) … danke erst mal für die Ifnos. Wo hast du die Texte des Scripts abgelegt? Ich schau gerne mal drüber. --elya (Diskussion) 21:23, 21. Sep. 2019 (CEST)
- nein, nein die Zeit ... Dann stell bitte den Bot ein und suche erstmal eine sozialverträgliche Lösung. Ich hatte in der ersten Überraschung den Bot bei VM gemeldet und bin hierher verwiesen worden. Auch ich habe grad mal keine Zeit und ich bin auch nicht der Typ, meine knappe Zeit bei Meta zu verbringen. Aber ich komme im Wiederholungsfall zurück, es ärgert mich schon sehr. Auf meine detaillierte Frage (Textkorpus oder Literaturverzeichnis?) habe ich keine Antwort bekommen. not amused. --Goesseln (Diskussion) 23:36, 21. Sep. 2019 (CEST)
- @Elya: Der Text ist:
# " . $title . ": URV " . $possibility . ", Wahrscheinlichkeit " . $number . "%. Stammt mglw. von
. titel ist der Artikel, Number die Prozentzahl, und $possibility entspricht "vermutet" bei einer Wahrscheinlichkeit zwischen 40 und 75 Prozent, ab 75 wird dann dort wahrscheinlich eingesetzt. Ich versuche auf Umlaute in den Texten komplett zu verzichten, da ich in der Vergangenheit ab und an Probleme hat, und ungern moeglich oder möglich (siehe Quelltext) schreiben möchte. Hinter diesem Text werden dann noch die Links auf das Tool generiert. Also im Prinzip kannst du die Texte auf der Vorderseite gut sehen. - @Goesseln Also soweit ich das gefunden habe, wurdest du gebeten mich doch auf meiner Diskussionsseite anzusprechen, das ist auch generell die Art der Kommunikation die ich bevorzuge, man kann auch völliog konstruktiv über so ein Thema reden, ohne jemanden oder den Bot melden zu müssen. Deine Frage habe ich übrigens schon beantwortet: "(...) da lediglich geprüft wird, wie viel Prozent vom Text identisch sind". Text meint hier Quelltext, also alles. 1:1. Stattdessen würde mich mal interessieren warum dich das ganze so ärgert? Ist es der Text des Bots, siehe oben? Ansonsten hat es dich doch nicht zu interessieren: Ein Mensch sieht das trifft nicht zu, und die Sache ist erledigt, wo ist das Problem? Der Bot schreibt ja nicht, das er der Meinung wäre das xy schlechte Arbeit gemacht hat, es geht ja wie gesagt lediglich um zwei menschliche Augen die sich das ganze mal anschauen. Viele Grüße, Luke081515 00:20, 22. Sep. 2019 (CEST)
- @Elya: Der Text ist:
- nein, nein die Zeit ... Dann stell bitte den Bot ein und suche erstmal eine sozialverträgliche Lösung. Ich hatte in der ersten Überraschung den Bot bei VM gemeldet und bin hierher verwiesen worden. Auch ich habe grad mal keine Zeit und ich bin auch nicht der Typ, meine knappe Zeit bei Meta zu verbringen. Aber ich komme im Wiederholungsfall zurück, es ärgert mich schon sehr. Auf meine detaillierte Frage (Textkorpus oder Literaturverzeichnis?) habe ich keine Antwort bekommen. not amused. --Goesseln (Diskussion) 23:36, 21. Sep. 2019 (CEST)
- Ja, ja, die Zeit ;-) … danke erst mal für die Ifnos. Wo hast du die Texte des Scripts abgelegt? Ich schau gerne mal drüber. --elya (Diskussion) 21:23, 21. Sep. 2019 (CEST)
- Wikipedia vergisst nicht : what links here? Wikipedia:Löschkandidaten/Urheberrechtsverletzungen/Archiv/August 2019 , es sei denn, du findest einen Oversighter ;)), und also gilt semper haeret (es bleibt immer etwas hängen, insbesondere wenn es wortreich zurückgenommen wurde). Dass, wenn ich dich richtig verstanden habe, bei den Übereinstimmungen in diesem Fall das nicht kleine Werkverzeichnis eine Rolle spielt, wer weiß das dann schon? Also bitte, nimmt die Schriften und die Literatur und die Weblinks (also den ganzen Apparat) raus, vergleiche den Textkorpus, und dann sieht man, ob sich der Wikipediatext in (zu) großer Nähe anderer Texte befindet. Und so weiter. --Goesseln (Diskussion) 00:52, 22. Sep. 2019 (CEST)
- @Luke, URV ist ein sensibles Thema bzw. ein potentiell rufschädigender Vorwurf – zum Teil kann ich Goesselns Argumente also schon nachvollziehen, zumal wenn die Beiträge eben nicht gelöscht werden, wie du es mit meinem jetzt gemacht hast, sondern im Archiv landen – offenbar werden sie also nicht geprüft und dann gelöscht. Insofern wäre es – wenn du nicht kurzfristig eine Verbesserung wie oben vorgeschlagen vornehmen kannst – ein Minimum, den Abschnitt mit einem Infotext oder einem Link zu einer Infoseite zu versehen, damit von false positives Betroffene hier wenigstens entsprechend beruhigt werden. Sowas: „Ein experimenteller Bot hat die Übereinstimmung mit Texten im Web geprüft und einen gewissen Anteil Übereinstimmung gefunden. Da auch Literaturlisten etc. verglichen werden, kann es leicht noch zu Fehleinschätzungen (false positives) kommen. Es wird auf jeden Fall von Menschen geprüft, ob es sich möglicherweise um eine Urheberrechtsverletzung handeln kann.“ Die Einschätzung, ob vermutet oder übereinstimmend, würde ich dann ebenfalls dem prüfenden Menschen überlassen – denn es ist ja anscheinend eine einsame oder eher zufällige Einschätzung, welcher Prozentsatz „vermutlich“ oder „wahrscheinlich“ ist, der eben auch sehr stark von der Länge des Korpus abhängt … Im Einzeltext dann also so etwa:
# " . $title . ": Textvergleich durchgeführt,
URV " . $possibility. ", Übereinstimmung: " . $number . "%. mit- Ich verstehe als alte Nerdtante sehr gut, dass es Spaß macht, solche Scripte zu schreiben (und dann wieder weiterzuziehen und neue coole Projekte zu machen), man muss sich aber auch immer über die Effekte auf Betroffene und die Usability klar sein. Es wäre schön, wenn du deinen Code verbessern könntest, so oder so. Grüße --elya (Diskussion) 08:22, 22. Sep. 2019 (CEST)
- @Elya: Wie ich oben schrieb haben manche Programme leider Probleme mit umlauten, könnten wir deinen Vorschlag so umformulieren, dass er ohne Umlaute auskommt? Text ergänzen sollte kein Problem sein. Bestimmte Abschnitte rauszunehmen ist dagegen nicht so gut möglich: Einmal wird die Überprüfung von einem externen Tool durchgeführt, man kann dort nur Artikel angeben, andererseits könnte jemand der mutwillig URV einbaut das auch in andere Abschnitte einbauen. Viele Grüße, Luke081515 16:01, 22. Sep. 2019 (CEST)
- dann mal Butter bei die Fische, lass doch mal deine Prozedur über den Artikel laufen, indem du a) nur den Werketeil nimmst und b) nur den Textkorpus. Dann sehe ich klarer, was hier abläuft. --Goesseln (Diskussion) 16:46, 22. Sep. 2019 (CEST)
- @Elya: Wie ich oben schrieb haben manche Programme leider Probleme mit umlauten, könnten wir deinen Vorschlag so umformulieren, dass er ohne Umlaute auskommt? Text ergänzen sollte kein Problem sein. Bestimmte Abschnitte rauszunehmen ist dagegen nicht so gut möglich: Einmal wird die Überprüfung von einem externen Tool durchgeführt, man kann dort nur Artikel angeben, andererseits könnte jemand der mutwillig URV einbaut das auch in andere Abschnitte einbauen. Viele Grüße, Luke081515 16:01, 22. Sep. 2019 (CEST)
- @Goesseln, ich vermute, dass das für ihn nicht so trivial ist, weil er dafür die Texte irgendwie parsen muss.
- @Luke: Text ohne Umlaute (auch wenn ich nicht verstehe, wie UTF8 2019 noch ein Problem sein kann … ,-)
# " . $title . ": Ein automatischer Textvergleich ergab " . $number . "%. identische Inhalte mit
- „Ein experimenteller Bot hat die folgenden Artikel mit vorhandenen Texten im Web verglichen und einen gewissen Anteil identische Inhalte gefunden. Da auch Literaturlisten etc. verglichen wurden, kann es leicht noch zu so genannten false positives kommen. Es wird auf jeden Fall noch von Menschen abgeglichen, ob es sich vielleicht um eine Urheberrechtsverletzung handeln kann.“
- Grüße, --elya (Diskussion) 16:52, 22. Sep. 2019 (CEST)
- Ich hab das Skript mal angepasst, passt das soweit? Und ich muss an der Stelle Elya zustimmen, Teile getrennt einlesen ist alles andere als trivial. Viele Grüße, Luke081515 21:08, 22. Sep. 2019 (CEST)
- trivial wäre es, wenn du, als du das Script getestet hast, eine Testversion (Testschalter oder ähnliches) eingebaut hättest, in der einzelne Fälle aus deinem Benutzernamensraum durchgeschleust werden. Liebe Prozedur, nimmt mal die Datei Benutzer:Luke081515/urvtestfall1 und dann nimm mal die Datei Benutzer:Luke081515/urvtestfall2 und spucke das Ergebnis jeweils bei Benutzer:Luke081515/urvtestergebnis aus. Aber wahrscheinlich ist das Datenverarbeitung von 1980 und heute nicht mehr state of art, und das Testen war schon 1980 ein Gräuel für jeden anständigen Programmierer, fast so schlimm wie dokumentieren. Also ich sehe schon, das wird hier nichts. --Goesseln (Diskussion) 22:09, 22. Sep. 2019 (CEST)
- Ich hab das Skript mal angepasst, passt das soweit? Und ich muss an der Stelle Elya zustimmen, Teile getrennt einlesen ist alles andere als trivial. Viele Grüße, Luke081515 21:08, 22. Sep. 2019 (CEST)
Fortbildung Urheberrecht
Falls Interesse besteht: hier entlang! Grüße, --Ghilt (Diskussion) 17:10, 25. Okt. 2019 (CEST)
Si Mustapha-Müller (Auto-URV)
Die Auto-URV verweist m. E. immer noch auf ein Zitat aus der Webseite der Fremdenlegion, was aber meiner Ansicht nach keine URV mehr sein kann, da ich das Zitat inzwischen stark gekürzt habe. Mir scheint eher, dass der Hauptgrund für diesen Eintrag die Verweise auf und die Zitate aus einem Artikel von Klaus Polkehn sind. Auch die habe ich inzwischen überarbeitet und auch gekürzt, doch löst das offenbar das Problem nicht. Die Ursache hierfür dürfte darin liegen, dass sowohl Polkehn als auch ich wörtliche Zitate aus dem von mir ebenfalls erwähnten Film von Erika Fehse benutzt haben. Die von mir benutzten beruhen ausschließlich auf eigenen Transkripten, aber die Unterschiede zu Polkehns Nacherzählungen sind meist nur marginal. Für eine automatische Überprüfung ist das kaum nachvollziebar, weshalb es so aussieht, als hätte ich mich in größerem Umfange als nötig bei Polkehn bedient, während unser beider Quelle der Dokumentarfilm ist (worauf wir aber beide jeweils auch verwiesen haben). Ich hoffe, dass wir dieses Problem gemeinsam lösen können.--Der wilde bernd (Diskussion) 14:32, 14. Dez. 2019 (CET)
- Nachtrag: Nicht nachvollziehbar ist mir auch der 2. Konfliktpunkt mit über 47 %. Es handelt sich hier um ein einziges (inzwischen gekürztes) Zitat aus einem sehr langen Artikel. Wodurch sich hier eine URV ergeben soll, ist mir schleierhaft. Dagegen mutet die nächste beanstandete URV mit "nur" 42,9 % schon recht komisch an. Eigentlich müsste da ja 100 % stehen, denn mein Spiegel-Zitat entspricht der vollen Länge dieser Spiegel-Notiz. Wofür wurde da ein Abschlag gewährt?--Der wilde bernd (Diskussion) 15:04, 14. Dez. 2019 (CET)