Benutzer Diskussion:Wurgl/Fehler Infobox
False Positives
[Quelltext bearbeiten]Da ich nun erneut mehrere False Positives gelöscht habe, wäre es sinnvoll eine Unterseite anzulegen wo die Artikel aufgelistet werden, und dem Bot diese als Ausnahmenliste vorzugeben. --Wikijunkie Disk. (+/-)
- Mach mal ein paar einfach hier rein. Am Anfang waren so viele, dass ich den Wald vor lauter Bäumen nicht mehr gesehen hab. Ein paar Ausnahmeregeln hab ich ja schon ins Script eingebaut, aber es sind noch einige. Dann guck ich momentan nur, ob das Modul Wikidata eingebunden ist und wenn ja, nehme ich an dass die Geburtsdaten von dort kommen. Eine Ausnahme ist die Infobox_Fußballspieler, die hat das zwar eingebunden, holt sich aber anderes Zeugs raus. Ist halt alles "irgendwie" und anders, folglich viele Sonderfälle. Aber wie gemurmelt, papp ein paar hier rein und werde aus denen verallgemeinern und die filtern. --Wurgl (Diskussion) 13:38, 6. Nov. 2017 (CET)
- zwei aktuelle Beispiele: Dave Bautista (logischerweise braucht es keine 2 komplett ausgefüllten Boxen) und Julius Seyler (Angabe wie bei den PD vorgeschrieben macht die Box unnötig breit). --Wikijunkie Disk. (+/-) 17:34, 6. Nov. 2017 (CET)
Schachspieler
[Quelltext bearbeiten]Was ist jetzt eigentlich mit den Schachspielern? 188.98.181.8 21:08, 6. Nov. 2017 (CET)
- Die Wiederbelebung von WikiHistory ist dazwischengekommen. Alles geht nicht auf einmal. --Wurgl (Diskussion) 23:01, 6. Nov. 2017 (CET)
2. Infobox
[Quelltext bearbeiten]Hab das mal entführt:
- Georgia_Simmerling Geburtsdatum
- 11. März 1989 in Vorlage Personendaten
- fehlt in Infobox
Hierbei handelt es sich um eine 2. Infobox. Stellt sich die Frage, ob die auch noch einmal komplett ausgefüllt werden muss. Silke (Diskussion) 21:30, 26. Nov. 2017 (CET)
- Ich kann zwar erkennen, dass eine zweite Infobox ist, aber da ich (fast) nur Abfragen auf APPERs Datenbank zu Vorlagenfeldern mache, hab ich keine Chance zu erkennen ob das die erste oder die zweite ist.
- Ich denke, ich werde hier eine Blacklist basteln. Sind ja so einige Fälle wo ich nicht so richtig weiß, wie ich das angehe. --Wurgl (Diskussion) 21:48, 26. Nov. 2017 (CET)
Fußballspieler
[Quelltext bearbeiten]@Wurgl: ich habe einmal die Liste abgearbeitet und bei den Falsch-Positiven meinen Kommentar hinterlassen. Bei 2 Einträgen, die ich mit unsicher gekennzeichnet habe, fehlt mir einfach das Hintergrundwissen zu der Vorlage. Schade, dass von den Portalen da nicht mehr Hilfe kommt... Viele liebe Grüße --Silke (Diskussion) 21:06, 3. Dez. 2017 (CET)
- Sehr gut! Danke! Jetzt bist du Fußballexperte!!!!!! Dann guck ich die nächsten Tage mal drüber und bastel noch ein wenig an Wünschen ein. So eine IP am Schachportal will unbedingt was *seufz* --Wurgl (Diskussion) 21:21, 3. Dez. 2017 (CET)
- Du hast es selbst angeboten. 129.13.72.197 13:51, 4. Dez. 2017 (CET)
Probleme bei den Infoboxen
[Quelltext bearbeiten]Ich hab einige Fälle von falsch benamsten Parametern die allerdings (noch) leer sind, ich liste hier die extremsten auf, einzelne falsche ignorier ich.
- Infobox Behindertensportler
- 11 mal sterbetag statt sterbedatum
- Infobox Fußballspieler
- 163 mal sterbetag statt sterbedatum
- Infobox Schwimmer
- 643 mal sterbetag statt sterbedatum
- Infobox Taekwondoin
- 263 mal sterbetag statt sterbedatum
- Infobox Wasserspringer
- 320 mal sterbetag statt sterbedatum
Das kann entweder ignoriert werden und beim Nachtragen der Daten darf sich dann der entsprechende User ärgern oder es ist eine Aufgabe für einen Bot. --Wurgl (Diskussion) 15:43, 14. Dez. 2017 (CET)
Neue Liste nach Totalumbau des Scripts
[Quelltext bearbeiten]Ich hab das Script jetzt von der Logik auf den Kopf gestellt, es waren einfach zu viele Sonderfälle und diese Sonderfälle alle zu berücksichtigen kann ein Mensch nicht machen, ein Bot aber schon. Das Problem ist die konsequent durchgezogene Veruneinheitlichung der Infoboxen. Das Geburtsdatum steht im Parameter geburtstag, oder Geburtstag, GEBURTSTAG, Geburtsdatum, GBtag, Geboren am, Geboren, birthdate und auch birth_date. Das Sterbedatum ist nicht besser, das steht in sterbetag, sterbedatum, Sterbedatum, STERBEDATUM, Todesdatum, Todestag, todestag, Verstorben am, Verstorben, deathdate und death_date. So nebenbei finde ich die Kombination von "geburtstag" und "sterbedatum" als äußerst unglücklich. Aber es ist nunmal so wie es ist.
Jedenfalls hatte ich keinerlei Lust in über 50 verschiedenen Infoboxen herumzuwühlen und aus dem Source die Informationen zu ziehen (Auch die Doku mitsamt Kopiervorlage ist in mindestens zwei Fällen falsch: [1] und [2]), sucht der Bot erstmal alle Infobox-Vorlagen die gemeinsam mit der Vorlage Personendaten in Artikeln vorkommen, liest den Source der Vorlage und prüft Daumen mal Pi welcher der oben aufgeführten Parameter vorkommt und ordnet die dann zu. Ähnlich wird auch herausgefunden ob das Wikidata-Modul von der Vorlage verwendet wird und in dem Fall auch der Abgleich mit Wikidata vorgenommen (nur wenn Wikidata-Daten auch angezeigt werden). Als Nebeneffekt werden falsch benamste Parameter gefunden, soferne der falsche Name einer aus der Liste oben ist. Reine Tippfehler finde ich nicht.
Infobox Inline-Speedskater
[Quelltext bearbeiten]Das Skript erkennt den Parameter geburtstag in der Infobox nicht. Viele Grüße, Andim (Diskussion) 18:19, 26. Dez. 2017 (CET)
- Nee. Also beim ersten ist es so, dass da *zwei* Infoboxen sind. In der einen (Infobox Eisschnellläufer) steht ein Datum und in der zweiten (Infobox Inline-Speedskater) steht nix. Für den Fall: ==> Blacklist, dort ein Abschnitt Infobox Inline-Speedskater und dann den Kerl eintragen. Bei zwei weiteren ist das auch so, mehr hab ich nix geguckt. --Wurgl (Diskussion) 00:29, 27. Dez. 2017 (CET)
- Ist bei allen so, habe ich nun in die Blacklist eingetragen. Andim (Diskussion) 01:04, 27. Dez. 2017 (CET)
- Gibt ein paar solche. Ich werte das via Datenbank von APPER aus, ich lese nicht die ca. 80.000 Artikel. Und daher hab ich keine Chance, irgendwie festzustellen welches die obere Infobox ist, also die wo das Datum drinnen sein sollte. Ob das Dingens jetzt geburtstag oder birthday oder so heißt, stelle ich durch recht simple Textsuche in der Vorlage selbst fest. Solange die Infoboxen die bisher bekannten und verwendeten Parameternamen verwenden, erkenne ich das, auf diese Art erkenne ich auch die nicht gar so richtigen Namen der Parameter (ein paar solche hast du ja ausgebessert). --Wurgl (Diskussion) 01:12, 27. Dez. 2017 (CET)
- Ist bei allen so, habe ich nun in die Blacklist eingetragen. Andim (Diskussion) 01:04, 27. Dez. 2017 (CET)