Benutzer:SirJective/Personendaten/Datumserkennung0
Die Liste ist aufgrund ihrer Länge unterteilt.
Benutzer:SirJective/Personendaten:
Altersprobleme und untergeordnete Probleme; reine Sterbezeichenprobleme: Alter
Unerkannte Datumsformate und untergeordnete Probleme: Datumserkennung0
Nur unerkannte Datumsformate: Datumserkennung1 Datumserkennung2 Datumserkennung3
Keine Geschlechtsangabe und untergeordnete Probleme: Keingeschlecht
Fehlende Datumsangaben und untergeordnete Probleme: Keinedaten0
Fehlende Datumsangaben: Keinedaten1 Keinedaten2
Fehlende Ortsangaben: A-Al Am-Az B C D E F G H I J K L M N O P+Q R S T U+V W X-Z, Sonstige
Überprüft wurden alle Artikel, die im Dump vom 9. Februar 2005 Personendaten enthielten. Die gemeldeten Probleme sind teilweise schon behoben.
Artikel, in denen die beanstandeten Probleme behoben sind, sollen bitte aus dieser Liste entfernt werden. Artikel, bei denen trotz Meldung kein Problem besteht, sollen bitte in dieser Liste nur markiert werden (nicht entfernen).
Beachte für die nachfolgende Beschreibung der erkannten Datumsformate:
- Leerzeichen zwischen Teilausdrücken sind optional.
- Geklammerte Ausdrücke sind optional (es gibt auch mehrfach geklammerte Ausdrücke!).
- TT steht für eine 1-oder-2-stellige Zahl.
- Monat steht für einen der 12 deutschen Monatsnamen.
- JJJJ steht für eine 1-bis-4-stellige Zahl.
- JAHR steht für den Ausdruck "([[) JJJJ (v. Chr.) (]]) (n. Chr.)"
- "VMTL" steht für eine ganze Reihe von Begriffen, wie "vermutlich", "wahrscheinlich", "vor", "um", "Anfang", "circa", ...
- Groß-/Kleinschreibung wird am Wortanfang in VMTL ignoriert, nicht aber in den Monatsnamen.
- Nur beim Monatslink (und da nicht immer) wird ein Pipelink-Format erkannt.
Erkannte Datumsformate:
- "unbekannt", "?"
- "([[) TT. Monat (|...) (]]) JAHR"
- "(VMTL) (([[) Monat (]])) JAHR"
- "(VMTL) zwischen JAHR und JAHR"
- "([[) (TT.) (Monat) (|...) (]]) (JAHR) oder ([[) (TT.) (Monat) (|...) (]]) (JAHR)", wobei aber mindestens ein JAHR auftreten muss, und wenn ein Tag angegeben ist, muss ein Monat angegeben sein
- Dies dient auch der Erkennung von Formaten wie "12. Februar 1202 oder 1203", "28. Februar oder 1. März 1789", "13. oder 14. April 1998", "1265 oder 1267", "März oder Februar 1265"
- Das Kurzformat "TT.MM.JJJJ" wird erkannt und als Fehler gemeldet
Nicht erkannte Datumsformate werden gemeldet.
Für die Überprüfung auf Konsistenz wird bei Angaben mit mehreren Daten stets das erstgenannte Datum verwendet.
Gemeldet werden folgende Bedingungen (gesternte werden nur gemeldet, wenn auch ungesternte Bedingungen erfüllt sind):
- Geburts- oder Sterbedaten ab dem Jahr 2006
- Geboren vor 1880, aber keine Sterbedaten
- Gestorben, aber keine Geburtsdaten
- Alter über 120 Jahre
- Geburtsjahr größer oder gleich Sterbejahr
- Frau (geb. nach 1900) ohne Alternativnamen (*)
- Geboren nach 1800, aber ohne Geburtsort (*)
- Gestorben nach 1900, aber kein Sterbeort (*)
Zusätzlich wird gemeldet, wenn der Artikel nicht in genau eine der Kategorien Mann oder Frau eingeordnet ist.