Wikipedia Diskussion:Personendaten/Wartung/Fehlerliste/Archiv/2008/Nov

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Geburtstag- oder Sterbetag fehlt im Text

Wenn im Text das Datum mit {{FormatDate|1852-02-23|link}} formatiert ist, wie z.B. bei Dục Đức, dann steht der Artikel in der Liste. Formatierung löschen oder Skript anpassen? Gruss -- Pelz 22:06, 2. Nov. 2008 (CET)

Siehe #Vorlage FormatDate --Der Umherirrende 22:43, 2. Nov. 2008 (CET)
Danke für den Hinweis -- Pelz 23:26, 2. Nov. 2008 (CET)

Geburts- oder Sterbejahr fehlt im Text

Bei Jürgen Kurz (Autor) ist mir aufgefallen, dass das Geburtsjahr zwar im Text enthalten ist, aber ein anderes als in den PD und in der Kat. :-) Also müsste man vermutlich die Beschreibung auf der Projektseite anpassen - oder vielleicht eine neue Kategorie einführen, wo die Daten in Text, PD und/oder Kat nicht übereinstimmen (was sich jedoch aufgrund der geringen Zahl in dieser Kat jedoch nicht aufdrängt).

Wird eigentlich schon geprüft, ob Daten in Kat und PD übereinstimmen? --Marsupilami04 16:52, 4. Nov. 2008 (CET)

Also die Überprüfung der Kategorien mit den Personendaten erfolgt schon. Ebenso erfolgt die Überprüfung der PD mit dem Text. Das heißt wenn ein einziger Vergleich scheitert, dann wird das auch gemeldet. Im Fall von Jürgen Kurz (Autor) wurde das ja heute früh entdeckt und unter "Geburts- oder Sterbejahr fehlt im Text" aufgelistet. Mein Skript schnappt sich das Geburtsjahr aus den Personendaten und sucht dann nach "* 1965" oder "* 1. März 1965" im Text. Sollte es nicht fündig werden meldet es das. -- sk 22:36, 4. Nov. 2008 (CET)
Ach, so funktioniert das: Daten werden auch als fehlend interpretiert, wenn sie zwar vorhanden aber ungleich der PD sind. Jetzt ist mir alles klar. Ist zwar wegen der geringen Anzahl nicht so zentral; aber man könnte dann in diesem Kapitel kurz erwähnen, dass der Fehler in den PD auch sein kann, dass das Datum zwar vorhanden ist, aber nicht übereinstimmt. --Marsupilami04 01:33, 5. Nov. 2008 (CET)

"zwischen" nicht notwendig am Anfang

Hallo Stefan, bei den unter „Kein zwischen am Anfang“ aufgeführten sind die meisten irrtümlich drin: die Form „6. Mai zwischen 987 und 993“ ist zugelassen. Ich streiche sie dann mal raus. Gruß, --Griot 10:06, 7. Nov. 2008 (CET)

Ups, das war mir nicht aufgefallen. Dann muss ich das noch ändern. Falls es morgen nochmal auftaucht, bitte nochmal entfernen. Ich komme heute nicht zum ändern des Skriptes. -- sk 11:09, 7. Nov. 2008 (CET)
 Ok eingebaut. -- sk 21:53, 7. Nov. 2008 (CET)

Anregung: tool zur Erkennung von Fehlern bei der Bearbeitung von Artikeln zu Personen

Hallo zusammen, in der Vergangenheit hat mir dieses tool recht imponiert. Man kann damit Rechtschreibfehler finden. Bei der Abarbeitung einiger Fehler in der Personendaten ist mir aufgefallen, dass ich meinen Fokus auf einen bestimmten Fehler setze und andere Fehler leicht übersehe (zum Beispiel das Komma vor †). Gibt es kein tool, das die üblichen Fehler abklappern kann und ähnlich zu der Rechtschreibprüfung von Revvar auf diese Fehler hinweisen kann? Wäre echt eine Arbeitserleichterung. Hat keiner Muße so etwas zu programmieren? Eventuell könnte man dann auch gleich andere "Fehlerchen" anzeigen lassen und bei der Bearbeiung erkennen und optimieren, zum Beispiel die fehlenden Leerzeichen in den Überschriften oder fehlende defaultsorts, oder... -- Hey Teacher 01:47, 7. Nov. 2008 (CET)

Frag doch mal bei Revvar nach, ob er es einbauen kann. Dann brauchst du kein zweites Tool. -- sk 19:53, 9. Nov. 2008 (CET)

Umbau

Also ich hab am Wochenende einiges umgebaut. Eine Reihe neuer Fehler sind jetzt drin. Die Überschriften sind nur noch kleingeschrieben und werden alphabetisch in den Prioritätsrubriken sortiert. Bei Textausschnitten mit ...XYZ abc... hab ich den Textausschnitt jetzt so gewählt, das nur ganze Wörter enthalten sind. Dann hat mich jemand beim Chechwiki Projekt auf die Idee gebracht, einen Edit-Link einzubauen. Das sollte das Abarbeiten erleichtern. Ein neuer Test überprüft ob die Personendaten vor den Kategorien steht. Da kommen sicherlich auch nochmal einige Artikel auf uns zu. (Erste Hochrechnungen ergeben 6000-9000, aber noch nicht überprüft!). Ansonsten hab ich noch viel Kleinkram gemacht. Bin mal gespannt, wie das morgen komplett aussieht. - Wenn ihr Fehler entdeckt oder Verbesserungsvorschläge habt, dann schreibt sie mal hier mit hin. -- sk 22:25, 9. Nov. 2008 (CET)

Ich finde die edit-links ziemlich störend, dadurch wird die Seite gleich dreimal so groß und merklich langsamer zu laden. Und ob Personendaten vor oder nach den Kategorien stehen, ist doch eher Quelltextkosmetik ohne einen Einfluss auf den angezeigten Text und ohne irgendeinen Einfluss auf die Funktionalität von Kategorien und Personendaten; also ziemlich sinnlos das zu ändern, auch weil das die Verärgerung der anderen Benutzer provozieren würde. --Ephraim33 20:28, 10. Nov. 2008 (CET)
Naja, die Position ist in WP:PD genau festgelegt und deshalb würde ich das auch dann so bei allen machen. - Der Edit-Link erleichtert doch aber auch die Bearbeitung. Also bei mir mit DSL 3000 geht es recht gut. Wie sehen das die anderen Nutzer? -- sk 20:38, 10. Nov. 2008 (CET)
Ein gesonderter Abschnitt für die Reihenfolge (Kat-PD) könnte überflüssig sein. Richtig ist aber der Hinweis von Stefan, dass wir hier eine Festlegung haben. Da ich keine Lust habe schon wieder über das Für und Wider groß und breit zu Diskutieren: laß diese Rubrik drin. Ich habe das bisher auch schon geändert, wenn ich es gesehen habe. Auch den Edit-Link benutze ich eher nicht weil ich mir die Artikel gerne erst mal im Normalmodus ansehe. So finde ich optisch schneller heraus, ob der Fehler nicht schon abgearbeitet ist und nur aus der Liste nicht gelöscht wurde. Auch Rechtschreibfehler sehe ich so viel besser. Ein Geschwindkeitsproblem sehe ich trotz meiner mehr als bescheidenen <1000-Leitung nicht. -- Pelz 20:46, 10. Nov. 2008 (CET)
Den Edit-Link nutze ich nicht, da ich mir erstmal einen Kurzüberblick über den Artikel verschaffe. Im Quelltext dieser Seite empfinde ich ihn eher als störend. Bzgl. Reihenfolge (Kat-PD): da es nur 599 Treffer sind, lass diese Kategorie drin. Wenn ich die falsche Reihenfolge sehe, korrigiere ich es sowieso. Die neue Kategorie Kurzbeschreibung mit unnötigem Jahrhundert ist für mich fragwürdig. Ich empfinde solche Einträge nicht als störend. Ansonsten will ich hier mal die Gelegenheit nutzen, Stefan für seine Arbeit hier und bei Check Wikipedia zu danken. Andim 21:05, 10. Nov. 2008 (CET)
Ich empfehle fullurl als editlink zu verwenden, dadurch hat man auch die Leute mit https zufrieden gestellt, außerdem wird es übersichtlicher: {{fullurl:<Seite>|action=edit&noredirect}}, als verlinkung beispielsweise: ([{{fullurl:Wikipedia Diskussion:Personendaten/Wartung/Fehlerliste|action=edit&noredirect}} {{INT:editlink}}]), wird zu (bearbeiten) und ist sprachenunabhängig, zusätzlich braucht es kein urlencode. plainlink wäre sicherlich zu viel des guten, so wie es in Vorlage:Bearbeiten geschieht. Der Umherirrende 22:11, 10. Nov. 2008 (CET)
Da die Mehrzahl der "Power-User" sich dagegen ausspricht, werde ich es wieder rausnehmen. @Umherirrender, danke für den Tipp, werde das bei Checkwikipedia berücksichtigen. -- sk 21:47, 11. Nov. 2008 (CET)

Aktualisierungszeit

Ich fände es praktisch, wenn die Aktualisierungszeit wieder in die frühen Morgenstunden (zB. um 2 oder 3 Uhr) gelegt werden könnte. In dieser Zeit dürften wohl die wenigsten Bearbeitungen der Wartungsliste vorkommen. Wenn die Aktualisierung aber um 23 Uhr läuft werden alle Artikel, die ich nach dieser Zeit anfasse noch in der neuen Liste drinstehen. -- Pelz 23:16, 12. Nov. 2008 (CET)

Ich habe einen cronjob auf dem Toolserver, der um 23 Uhr UTC (also 0 Uhr deutscher Zeit) anfängt zu arbeiten. (Da gehe ich meistens schlafen.) Der Cronjob sucht zuerst nach neuen dumps und lädt die runter. Dann startet er die Personendatenauswertung und danach fängt er die Checkwiki-Projekte von af-sv durchzuarbeiten. Das dauert derzeit fast genau 24 Stunden alles zusammen. Die Uhrzeit habe ich deshalb auf 23 Uhr gesetzt, weil ich dann wenn ich mal wieder zeitig munter werde direkt auf die Auswertung der Personendaten und die de-Auswertung der checkwikipedia zugreifen kann. Ich überlege mir mal ob ich das evtuell anpasse. -- sk 09:28, 13. Nov. 2008 (CET)
Vielleicht ist ein Start um 0 Uhr UTC im Winter und 23 Uhr UTC zur Sommerzeit besser, also immer um (1 Uhr deutscher Zeit). Andim 11:37, 13. Nov. 2008 (CET)

Jänner

Wenn im Artikel Jänner steht und in den PD Januar wird dies bekanntlich in der Rubrik "Geburts- oder Sterbetag fehlt im Text" ausgeworfen. Gängige Lösung ist die Linkschreibweise [[x. Januar | x. Jänner]], und das ist ja auch Standard. Nun gibt es aber mit Karloff lugosi einen fundamentalistischen Österreicher, der darauf besteht, dass Januar nicht im Quelltext von österreichbezogenen Artikeln stehen darf. Der Kollege Hey Teacher hatte denselben Ärger auch schon, ebenso Gf1961. Mir geht es um den Artikel Anton Koch. Originalzitat von Karloff lugosi: "ich dachte ich habe klar gemacht, dass ich das nicht akzeptiere". Da die Übereinkunft WP:PD eindeutig ist, wähnte ich mich im Recht, und ich habe den Editwar auf WP:VM den Admins zur Kenntnis gebracht. Dort wurde ich angeschnauzt und der Vorgang ruckzuck unerledigt archiviert, und das ist ja irgendwie auch nicht richtig. Eure Ideen bitte! -- Arno Matthias 11:42, 18. Nov. 2008 (CET)

Alleine das Adjektiv in der Überschrift finde ich eine Frechheit. Wenn hier militant-fundamentalistische Missionare unterwegs sind, dann sind es die Auf-Deubel-komm-raus-Jänner-Wegbieger. Ach ja: dies schreibt ein des Ösismus vollkommen unverdächtiger Süddäne. -- Wwwurm Mien Klönschnack 11:57, 18. Nov. 2008 (CET)
Daher hab ich die Überschrift entschärft. So schafft man kein produktives Diskussionklima. bluntnich' nett? 12:21, 18. Nov. 2008 (CET)
In einem Gemeinschaftsprojekt ist die Beachtung (und ggf. Durchsetzung) von geltenden Konventionen wichtig. -- Arno Matthias 12:34, 18. Nov. 2008 (CET)
Da stimme ich dir zu. Es ging mir lediglich um die provozierende Überschrift hier. bluntnich' nett? 14:54, 18. Nov. 2008 (CET)
Mein Kenntnisstand ist, dass Links auf Redirect-Seiten unerwünscht sind, weil sie die Datenbank zusätzlich belasten. Der Zielartikel heisst [[x. Januar]]. Bereits das Tutorial lehrt, dass das dann in der Form [[Name des Zielartikels|abweichende Form]] zu schreiben ist. Die abweichende Form ist mir herzlich willkommen, aber nicht bei den normierten Ansetzungen einer Beschlagwortung. Gruss, --Gf1961 13:41, 18. Nebelung 2008 (CET)
Unter Wikipedia:Datumskonventionen steht kurz gesagt, dass wir "Jänner" zu akzeptieren müssen. Das heißt für uns aber nur, dass wir für den Artikeltext selber das akzeptieren sollten. In den Personendaten dagegen haben wir uns ja selber auf die ausschließliche Nutzung von "Januar" sinnvollerweise geeinigt. Ich werde also mein Skript anpassen müssen. Das ist kein Problem und kann ich bei nächster Gelegenheit machen. -- sk 13:44, 18. Nov. 2008 (CET)
Ich denke, dass es am besten sein wird, wenn das Skript akzeptiert, wenn im Einleitungssatz [[x. Jänner]] steht, und in den Personendaten dann Januar. Ich kann auch die Vertreter des Jänners gut verstehen, dass im Artikel kein Januar stehen soll. Warum der Januar aber nicht im Quelltext (also [[x. Januar|x. Jänner]]) vorkommen darf/soll kann ich nicht nachvollziehen. Das ist wie wenn die Denglisch-Hasser verlangen würden, dass ab sofort nicht mehr DEFAULTSORT, sondern AUTOMATISCHSORTIERENNACH geschrieben werden soll. Mein Fazit: Script anpassen, dass Januar/Jänner nicht mehr als Fehler erkannt wird und Karloff Lugosi seine Eigenheiten lassen, die tun keinem so richtig weh (auch wenn ich ihn nicht verstehen kann und mir sein Diskussionsstil extrem missfällt). In den Personendaten sollte aber schon auf den Januar bestanden werden. -- Hey Teacher 19:56, 18. Nov. 2008 (CET)
Nur zur Klärung: ein Redirect belastet die Datenbank nicht mehr und sie sind auch nicht unerwünscht, dazu gibt es eine ausführliche Hilfeseite. Für DEFAULTSORT kann bald (vorraussichtlich) SORTIERUNG geschrieben werden. Zum Thema: Das Meinungsbild sagt eindeutig, das Jänner erlaubt ist, dies sollte also als alternative im eigentlichen Artikel erkannt werden. Genauso wird in den PD auch keine schweizschreibung berücksichtigt, aber im Artikel ist es erlaubt. --Der Umherirrende 20:44, 18. Nov. 2008 (CET)
Es hat ja auch keiner etwas gegen den redirect (ich zumindest nicht), aber genau dort steht auch geschrieben, dass im Allgemeinen ... nicht auf eine Weiterleitung verlinkt (wird), sondern auf den Zielartikel.... Es wird (voraussichtlich) nie einen Artikel zum x. Jänner geben, also warum über den redirect verlinken und nicht direkt über den x. Januar? -- Hey Teacher 21:28, 18. Nov. 2008 (CET)
Ich bezog mich nur auf das Links auf Redirect-Seiten unerwünscht sind, weil sie die Datenbank zusätzlich belasten (Gf1961) von oben. Einen Aritkel zu Jänner wird es nicht geben, der redirect wird auch nicht gelöscht, da ist es egal wie man es macht. Trotzdem ist die Verlinkung über den redirect ja nicht falsch und kann gemacht werden. Der Umherirrende 21:41, 18. Nov. 2008 (CET)

<Neustart> Zusammenfassung aus meiner Sicht: Mit der Linkschreibweise [[x. Januar | x. Jänner]] sind alle bestehenden Konventionen erfüllt, und das Skript braucht auch nicht geändert zu werden. Das einzige Problem bleibt Karloff lugosi Karloff lugosis Verhalten (nach berechtigter Kritik geändert), der den Januar unbedingt aus dem Quelltext löschen will. Sehe ich das richtig? -- Arno Matthias 10:37, 19. Nov. 2008 (CET)

Das siehst Du zumindest in soweit nicht richtig, als ich eine Reihe weiterer ÖWPner kenne, die das seit Jahren genauso sehen wie Karloff l., sich (bisher) lediglich hier noch nicht geäußert haben. Nicht jeder findet ständig jede Diskussionsseite am Rande der Galaxis: mir selbst war sie bis gestern ja auch unbekannt. Vielleicht solltest Du diese Frage hier mal im Portal:Österreich ansprechen und verlinken.
BTW: Deine Wortwahl zur Charakterisierung von Autoren mit von Deiner abweichender Sichtweise hat sich gegenüber Deinem Faux pas oben leider nicht zum Erträglicheren gewandelt: Karloff ist mitnichten „ein Problem“. -- Wwwurm Mien Klönschnack 15:44, 19. Nov. 2008 (CET)
In der Sache hast du (wenn du dich an bestehenden Konventionen orientiers) recht (wobei Im Allgemeinen (s.o.) auch nicht gerade bindend ist), wobei schon hinterfragt werden darf, ob nicht auch auf redirects verlinkt werden darf/sollte, die als feststehendes Synonym für einen anderen Begriff stehen. Sollte sich diese Ansicht durchsetzen, sollte (wie schon erwähnt) das script insofern angepasst werden, dass der Jänner im Einleitungssatz nicht als Fehler erkannt wird. Das Ziel ist ja, Fehler in den PD zu finden. Steht in den PD Januar und "oben" Jänner, ist in den PD kein Fehler. In Stilfragen: sehe ich ähnlich wie Wwwurm. -- Hey Teacher 17:23, 19. Nov. 2008 (CET)
Nochmal zur Klarstellung: Jänner oder nicht Jänner ist mir ganz herzlich egal. Wenn das der Konsens ist: sehr gerne. Editwars gegen bestehende Konventionen und Sätze wie der oben zitierte zeugen aber von einer geistigen Einstellung, die nicht in die Wiki passt. Klar kann man Konventionen ändern - aber eben auf zivilisierte Art und Weise. Wenn man, weil man mit dem bestehenden Konsens unzufrieden ist, die Diskussion selbst startet (z.B. im Portal:Österreich), muss man nicht zufällig abgelegene Diskussionsseiten finden. -- Arno Matthias 21:49, 19. Nov. 2008 (CET)

Genaugenommen ist es mir ja ziemlich wurscht, was im Quelltext steht und die Artikel Anton Koch und Gyula Lázár waren halt der vergleichsweise harmlose Kristallationspunkt eines viel grundsätzlicheren Problems. In den zwei Jahren, die ich hier Artikel verfasse, habe ich regelmäßig mit Edits zu tun, wo diverse Nutzer meinen, Begriffe des österreichischen Deutsch durch solche zu ersetzen, die in Deutschland gebräuchlicher sind (besonders beliebt: öfters durch oftmals zu ersetzen oder Saisonen durch Saisons, vom Klassiker Jänner/Januar ganz zu schweigen) und dies mit "fehlerhaftem Deutsch" begründen. Je nach Art dieser Änderungen/Kommentare empfinde ich sie als ärgerlich bis beileidigend und irgendwann reicht es mir dann ganz einfach. Ich baue ja schließlich auch keine von anderen erstellten Artikel auf öst. Dt. um, daher erwarte ich mir andererseits aber auch, dass die von mir erstellten Artikel nicht preussifiziert werden. Nach meiner Ansicht obliegt es allein dem Ersteller eines Artikels, zu entscheiden, in welcher von mehreren gleichwertigen Sprachfassungen ein Artikel erstellt wird und dann auch verbleibt. --Karloff lugosi 23:26, 19. Nov. 2008 (CET)

Den Schweizern geht es mit "ß" vs. "ss" ähnlich. Was dort ganz gut funktioniert, ist die Einfügung des Bapperls <!--schweizbezogen--> am Anfang des Quelltextes. Wir könnten also analog handeln, zumindest versuchsweise: In die Artikel kommt <!--österreichbezogen--> und auf die WP:PD -Seite die Erklärung, was er bedeutet, also was nicht ins Preussisch-Deutsche geändert werden soll. Gute Idee? -- Arno Matthias 14:28, 20. Nov. 2008 (CET) zwecks Lesbarkeit unwesentlich geändert. --Griot 12:07, 21. Nov. 2008 (CET)
@Karloff: Was genau spricht deiner Meinung nach gegen die einmalige Verlinkung der Geburtsdaten mit [[x. Januar|x. Jänner]]? Den Schweizern und Österreichern geht es doch grundsätzlich nur um die Darstellung. Wir sind ja hier jetzt nur dadrauf gestossen, weil mein Skript genau danach sucht um die Personendaten zu verifizieren. Uns ist es hier eigentlich sonst egal wie die Daten im Artikel stehen. Es muss meiner Meinung nach nur eindeutig geklärt sein, damit man die Programme die das benutzen dementsprechend anpassen kann. Die derzeitige schwammige Regel bzw. Regeln die entgegengesetzt arbeiten sind nicht hilfreich. -- sk 14:38, 20. Nov. 2008 (CET)
1. Eine „Regel“, die festlegt, wie hier zu verfahren ist, scheint mir überzogen. M.E. sollte eine Bitte an Österreicher (resp. Schweizer) ausreichen, zu tolerieren, dass [[1. Jänner]] in [[1. Januar|1. Jänner]] (resp. „* in [[Dessau-Rosslau]]“ in „* in [[Dessau-Roßlau|Dessau-Rosslau]]“) geändert wird. Wenn dann an geeigneter Stelle eine ausführliche Begründung dafür gegeben wird und bei möglichst jeder entsprechenden Änderung darauf verwiesen wird, wäre ich optimistisch, dass der Bitte weitgehend oder gänzlich entsprochen wird.
2. Allerdings ist das eigentlich nur eine unschöne Hilfslösung, ein Missbrauch des Linkmechanismus. Sie versagt schon, wenn auch Angaben wie „unsicher: Jänner 1860“ kontrolliert werden sollen. Allgemeiner und vielfältiger nutzbar wäre die Einführung einer Vorlage, sagen wir „Comment“, die nichts oder jedenfalls nichts Sichtbares liefert [Unsichtbares evtl. optional für Sortierzwecke]. Dann wäre etwa möglich:
  • [[1. Jänner]]{{Comment|1. Januar}}
  • * in [[Dessau-Rosslau]]{{Comment|* in Dessau-Roßlau}}
  • Karfiol{{Comment|Blumenkohl}}
(Auch hierbei wird allerdings das Entgegenkommen der Österreicher/Schweizer benötigt.)
3. @Karloff: Deine Verärgerung ist nachvollziehbar. Und bei offenbar Unbelehrbaren auch berechtigt. In den meisten Fällen dürfte aber „Nachsicht“ hilfreicher sein: „Diese <geeignetes Schimpfwort einfügen> Deutschen wissen es eben nicht besser. Versuchen wir mal, es ihnen beizubringen.“ (Auch ich wurde schon - von Herzi Pinki - sehr freundlich darauf aufmerksam gemacht, dass „immatrikulieren“ in Österreich und Südtirol nicht reflexiv ist [1].)
4. Die Anregung von Arno Matthias, einen Kommentar <!--österreichbezogen--> in entsprechende Artikel zu setzen, halte ich für sehr gut. Allerdings schiene mir <!--österreichisches Deutsch--> geeigneter, da weniger einschränkend. Wobei dahinter ja noch eine artikelbezogene Konkretisierung wie <!--deshalb: „öfters“; irreflexives „immatrikulieren“--> gesetzt werden kann („kann“, nicht „muss“, nicht einmal „sollte“).
Eine sehr sinnvolle Ergänzung wäre eine Hilfeseite, welche die häufigsten Besonderheiten des österreichischen Deutsch auflistet, welche von Nicht-Österreichern leicht als fehlerhaft fehlinterpretiert werden können. (Die Artikel Österreichisches Deutsch und Liste von Austriazismen sind für diesen Zweck nicht geeignet.) Nicht-Österreicher könnten hier im Bedarfsfall nachschlagen oder sich diese Formen einprägen. Da eine solche Seite klein beginnen und dann wachsen kann, wäre der Aufwand gering. (Natürlich: dasselbe für die Schweiz. Ob es auch für Deutschland nützlich wäre, müssten Nicht-Deutsche beurteilen.)
5. PS. Anderes Thema: Bitte kein „SORTIERUNG“ statt „DEFAULTSORT“ …
--Griot 12:07, 21. Nov. 2008 (CET)

Fehlerkategorie: Name kleingeschrieben

Das Problem ist, dass einige Namen wirklich kleingeschrieben werden, so zum Beispiel bei E.o.plauen, dessen Künstlername kleingeschrieben wird. Ich nehme an theoretisch könnte man hingehen und alle Personen mit Kategorien wo Künstlernamen wahrscheinlich (also z.B. Autor, aber nicht Politiker) sind ausschliessen, damit es keine falschen positiven gibt. Allerdings dürfte das ein riesiger Aufwand sein und es würden dadurch auch diverse korrekte Fehlermeldungen ausgeschlossen. Kann man irgendwie die überprüften (und als korrekt erkannten) klein geschriebenen Artikel irgendwie aus den nächsten Ergebnissen raussortieren? (Ich nehme an, wenn man jetzt plauen löscht, kommt er morgen wieder rein, da automatisch erstellt.) --Marsupilami04 00:16, 22. Nov. 2008 (CET)

Das Skript sucht in dieser Fehlerkategorie nach Namen, die vor dem Komma nur Kleinbuchstaben stehen haben. Das sollte eigentlich nie der Fall sein. Das heißt "meier, Franz" wird gefunden. "del Gardo, Franz" wird als akzeptabel angesehen. Meiner Meinung nach müsste man eigentlich bei E.o.plauen den Namen so schreiben "NAME=Plauen, E. O.". Genau so macht es die deutsche Nationalbibliothek [2]. Da E.o.plauen der einzigste von 200000 Personendaten ist, der uns hier Probleme bereitet, sollte man das entsprechend korrigieren. -- sk 10:08, 22. Nov. 2008 (CET)

Nichterfassung von Artikeln

Hi Stefan, wie werden eigentlich deine Listen von potentiellen Artikeln erstellt? Mir fiel z.B. gerade auf, dass die PD bei Hildegard Maria Nickel fehlerhaft waren (zweimal "ALTERNATIVNAMEN"), hier jedoch nicht auftauchten. Ist das ein Fehler im Script oder liegt es daran, dass der Artikel erst sechs Tage alt ist? --APPER\☺☹ 20:08, 21. Nov. 2008 (CET)

Ich habe ein Skript, das alle 6 Stunden in allen für PD und Check Wikipedia relevanten Sprachen die neusten 500 Artikel aus der Spezial:Neue Seiten heruasfiltert. Wenn diese Personendaten enthalten oder Infoboxen über Personen oder Kategorie:Mann bzw. Frau, dann schau sich mein Skript sie näher an. Die Erfassung der neuen Artikel klappt nicht 100%ig, da der 501 Artikel innerhalb von 6 Stunden nicht mehr erfasst wird. Das ist aber eigentlich kein Problem, weil spätestens mit dem nächsten Dump ich alle übersehen Artikel bekomme. Frei nach dem Motto: "Wir kriegen euch alle!" :-) -- sk 22:05, 21. Nov. 2008 (CET)
Die Zahl 500 lässt mich auf die API schließen, da ich nicht weiß, wie viel du damit zu tuen hast, meine Idee um das Problem zu umgehen: Bei der Abfrage kann man den Parameter rcend angeben, dann werden die Einträge nur bis zu dem Zeitpunkt angegeben, hier wäre der Zeitpunkt der letzten Ausführung einzutragen, falls mehr als 500 Seiten erstellt wurden, wird ein query-continue angeboten. Dieses paging kann dann genutzt werden, um die anderen zu erreichen, einfach hinter die Abfrage den dort genannten parameter und den Wert hängen (Beispiel), dann werden alle Titel erreichbar. Der Umherirrende 13:11, 22. Nov. 2008 (CET)
Hochinteressant! Nein, diese API sehe ich heute zum ersten Mal. Werde mir das mal in einer ruhigen Sekunde anschauen. -- sk 14:03, 22. Nov. 2008 (CET)

Alternativnamen mit Verlinkung

Bezieht sich dies auch auf die in Klammern angegebende Ergänzungen? Ich denke, dort könnte man eine Verlinkung erlauben, oder sollte man dies nicht? Der Umherirrende 18:21, 23. Nov. 2008 (CET)

In der Klammer sollte ja eigentlich nur (Spitzname, russisch) oder (Künstlername) oder (dänisch) stehen. Nicht mehr und nicht weniger. Aber verlinken braucht man das nicht. Für die Auswertung ist ein totales Verbot, wie es in Festgelegt wurde, sehr hilfreich. Ohne dem wäre es wesentlich komplizierter das auszuwerten. -- sk 18:31, 23. Nov. 2008 (CET)

Kurzbeschreibung mit Rechtschreibfehler - Fehler ist richtig

Der dort aufgeführte Fehler ist in dieser Kombination richtig: richtig: estnisch, falsch: estisch in: amerikanische Schriftstellerin, bei der zum ersten Mal ein hyperthymestisches Syndrom beobachtet wurde, den Artikel Hyperthymestisches Syndrom gibt es ja. Der Umherirrende 18:26, 23. Nov. 2008 (CET)

Das Fehler ist mir auch aufgefallen, da muss ich was anpassen. -- sk 18:33, 23. Nov. 2008 (CET)
 Ok, eingebaut (bzw. ausgebaut). -- sk 09:15, 25. Nov. 2008 (CET)

Die Ausgabe wurde aber auf 200 Artikel begrenzt.

Scheint nicht so ganz zu funktionieren, diese Liste von heute morgen scheint alle Artikel zu beinhalten? War das der Wochendbonus? Ich wollte das nur klären, da ich gerade etwas verwirrt bin. Zusätzlich wollte ich noch sagen, das bei der Rubrik "Alternativnamen mit Verlinkung" einige Leerzeichen gespart werden können, zwischen den nowikis. Der Umherirrende 18:09, 30. Nov. 2008 (CET)

Seltsam, eigentlich dürfte das nicht passieren, da die Ausgabe immer auf 200 begrenzt werden soll. Ich suche mal nach der Ursache. -- sk 20:22, 30. Nov. 2008 (CET)
Es ist ein Rundungsfehler. Mal sehen ob ich den entschärfen kann. -- sk 21:21, 30. Nov. 2008 (CET)
 Ok, man war das knifflig. Ich wollte die Ausgabe begrenzen, aber gleichzeitig von A-Z die Fehler anzeigen. Das beides unter einen Hut zu bringen ist kein einfaches Problem. Aber jetzt geht es. -- sk 21:57, 30. Nov. 2008 (CET)

* und † ohne nachfolgendem Leerzeichen

Da der erste Klammerausdruck ja bereits auf das Semikolon überprüft wird, könnte man zusätzlich ja noch nach einem Leerzeichen nach * und † schauen, diese sind auch nicht immer vorhanden. Der Umherirrende 21:23, 12. Nov. 2008 (CET)

Man bist du penibel. :-) Du weißt das das wieder viel Arbeit gibt! Ich baues gerne ein, aber frühestens am Wochenende. -- sk 21:51, 12. Nov. 2008 (CET)
Als ob das Semikolon nicht auch penibel ist oder die Position der PD oder …, vielleicht kannst du mich ja erstmal mit einer Fehlerzahl erschrecken? Dann überlege ich mir das vielleicht anders… Auch ruhig nach dem Wochenende, eilt ja nicht. Der Umherirrende 21:54, 12. Nov. 2008 (CET)
Ich schätze mal es sind so ungefähr 1873 neue Fehler. -- Pelz 22:10, 12. Nov. 2008 (CET)
Na ich mach mal am Wochenende einen Testlauf. Ich tippe mal auf 2800. Mal sehen wer näher dran liegt. -- sk 22:54, 12. Nov. 2008 (CET)
Ich tippe eher auf 3587 oder noch mehr. Wäre es nicht sinnvoller Interwikibots beizubringen, solche Fehler zu berichtigen? Die machen ja auch sonst schon kosmetische Änderungen. Dann könnte man sich viel manuelle Arbeit sparen. Zumal das immer geändert werden sollte und es keine Ausnahmen gibt in denen kein Leerzeichen dazwischen stehen darf. Auch für die Wikipedia:WikiProject Check Wikipedia-Fehlerkategorien "HTML-Textformatierungselemente" "Symbol für Todestag" und vielleicht noch andere wäre es interessant, das von Bots miterledigen zu lassen. --Ephraim33 20:36, 13. Nov. 2008 (CET)
Als Hinweis kann ich noch mitgeben, das ein &nbsp; zwischen den Zeichen und Text erlaubt ist. Wenn man schon dabei ist, könnte man auch noch weitere Überprüfungen anstellen: Leerzeichen vor und nach dem Semikolen (bzw. Komma), Leerzeichen vor und nach den Klammern. Gerne alles in eine Rubrik. Alles Fälle aus dem Leben, die Diffs spar ich mir aber. Der Umherirrende 21:18, 24. Nov. 2008 (CET)
Sorry, bin bis jetzt noch nicht dazu gekommen. Hab heute ein paar neue Fehler eingebaut und die nächsten Tage bis Weihnachten auch zu tun. Mal schauen wann ich es einschieben kann. -- sk 22:41, 24. Nov. 2008 (CET)
Es drängt ja nicht, außerdem sind derzeit ja genug Fehler zum Abarbeiten da, da sollte für jeden etwas dabei sein. Der Umherirrende 20:18, 25. Nov. 2008 (CET)

Also es sind genau 2657 im letzten Dump. Ich werde diese morgen mit beim Live-Scan überprüfen und mal schauen wie viele noch nicht korrigiert wurden. Mit 2800 lag ich ja sehr nah dran. -- sk 10:49, 6. Dez. 2008 (CET)

Danke für die Zahlen, dann ist das ganze ja garnicht so schlimm. Und: Glaube keiner Statistik, die du nicht selber gefälscht hast ;) --Der Umherirrende 11:28, 6. Dez. 2008 (CET)

Da die Rubirk "Personendaten stehen vor den Kategorien" jetzt abgearbeitet ist, würde ich sie vielleicht verallgemeinern, sodass auch die Position der Interwiki gecheckt wird (Beispiel1; Beispiel2). Der Umherirrende 08:14, 30. Nov. 2008 (CET)

Ich hab noch eine Reihe von Fehlern in der Hinterhand, die ich aber nicht alle auf einmal auf die Liste setzen wollte, um die Leute nicht zu verprellen. Der mit den Interwikis ist auch dabei. :-) --sk 09:27, 30. Nov. 2008 (CET)
Das lässt hoffen. Aber es ist eine gute Idee, die erstmal zurückzuhalten, es sind ja derzeit genug Fehler vorhanden, die erstmal abgearbeitet werden sollten, wenn man keinen Fortschritt sieht, macht es ja auch keine Lust mehr. Der Umherirrende 12:48, 30. Nov. 2008 (CET)Ich hoffe, das Abschnitt nach den Personendaten dazu gehören (Beispiel) Der Umherirrende 13:24, 30. Nov. 2008 (CET)
Hab jetzt beides eingebaut. -- sk 16:52, 30. Nov. 2008 (CET)
Ich glaube in Kommentaren brauchst du nicht suchen: Beispiel. Ist angedacht, dies auch global zu machen? Halte das für sinnvoll, dass nach den Kategorien/Interwikis keine Abschnitte mehr kommen, macht den Quelltext übersichtlicher und man übersieht nichts, damit nicht davon ausgeht, das ganz unten noch etwas steht. Der Umherirrende 19:44, 2. Dez. 2008 (CET)
Mit dem Kommentar scheint häufiger vorzukommen: noch einer --Der Umherirrende 19:32, 3. Dez. 2008 (CET)
Ja ich will das auch in Check Wikipedia einbauen, aber da muss es erst stabiler laufen. Derzeit überprüfe ich nur auf eine Auswahl von wenigen Sprachen. -- sk 18:11, 9. Dez. 2008 (CET)
Aso, darum ist das erstmal in die Höhe geschoßen, weil weitere Sprachen ergänzt wurden. An der Stelle wo ich alle interwikis brauche, nutze ich diese API-Abfrage, überall wo prefix und language angegeben ist, ist ein interwikilink der unter "Andere Sprachen" auftaucht. Warum ist aber eigentlich "Personendaten stehen vor den Kategorien" so in die Höhe geschoßen? Sind wirklich durch den neuen Dump soviele neue aufgetreten? Der Umherirrende 19:52, 9. Dez. 2008 (CET)