Portal:Fußball/Infoboxdaten aus Wikidata
In einigen Artikeln zu Fußballspielern werden derzeit einige Informationen der Infobox direkt von Wikidata bezogen. Dabei steht insbesondere die Anzeige der Vereinsstationen inkl. der Leistungsdaten (Start- und Endzeitpunkt, Ligaspiele und -tore) im Fokus. Auf dieser Seite sollen die Ziele, Grenzen, Vorteile und Probleme dieses Testlaufs dargestellt sowie eine Koordination der beteiligten Benutzer ermöglicht werden.
Kurzübersicht
[Quelltext bearbeiten]In den Infoboxen von Fußballspielern werden auf strukturierte Art Daten bereitgestellt. Dies erfolgt, indem diese Daten als Parameter direkt in den Wikitext des Artikels geschrieben werden. Für einen solchen Zweck der Datenverarbeitung eignen sich Datenbanken allerdings deutlich besser (siehe #Vorteile). Mit Wikidata steht eine offene Datenbank zur Verfügung, von der die Informationen direkt bezogen werden können. Zu weiteren Informationen über Wikidata siehe Wikipedia:Wikidata.
Anfang Oktober 2015 wurde die Infobox so umgearbeitet, dass dort einige Daten direkt von Wikidata bezogen werden können (zu Details siehe #Funktionsweise). Alle Fußballspieler-Artikel, die in der Infobox direkt Daten aus Wikidata beziehen, sind in der Kategorie:Wikipedia:Infobox Fußballspieler mit Daten aus Wikidata zu finden.
Vor- und Nachteile, ungeklärte Probleme
[Quelltext bearbeiten]
Vorteile:
- Strukturierte Daten, wie es die Leistungsdaten sind, können in einer Datenbank vernünftig verwaltet werden. In Wikitext ist das nicht möglich.
- Durch die Strukturierung der Daten können einfach Tools programmiert werden, die bei der Aktualisierung, Wartung und Überwachung helfen und die Arbeit erheblich vereinfachen.
- Die Aktualisierung der Daten kann mittelfristig auf Grundlage festgelegter vertrauenswürdiger Quellen potentiell auch per Bot erfolgen, sodass die manuelle stupide Arbeit für Menschen vollständig entfällt.
- Die Strukturierung der Daten ermöglicht klassische Datenbankabfragen. So können alle Spieler angezeigt werden, die bei einem bestimmten Verein gespielt haben oder mit einer Mindestzahl an Spielen. Die Möglichkeit der Abfragen sind praktisch nicht begrenzt. Diese Abfrageergebnisse dienen einem Informationsinteresse und sind zugleich bei der Wartung des Artikelbestands sehr hilfreich.
- Die Strukturierung der Daten ermöglicht eine deutlich bessere Überwachung dieser Daten, wodurch veraltete Artikel und Bestände endlich identifiziert werden können. Beispiel: Leistungsdaten aller Spieler von Montreal Impact.
- Jedes Statement auf Wikidata kann mehrfach durch externe Quellen belegt werden. Somit wird die Nachvollziehbarkeit der Angaben deutlich verbessert: Bislang war es unüblich bis unerwünscht, Daten in Infoboxen zu referenzieren. Auf Wikidata ist dies ausdrücklich erwünscht. Dabei kann insbesondere dem Problem, dass externe Datenbanken für unterschiedliche Ligen unterschiedlich gut sind, beigekommen werden.
- Die Daten auf Wikidata stehen allen zur freien Verfügung. Dies führt zu diversen weiteren Vorteilen:
- Die Daten können zentral gepflegt werden, weshalb sie nur einmal aktualisiert werden müssen und sofort alle Wikipedia-Sprachversionen Zugriff auf die aktuellen Daten haben. Dies ist endlich eine Möglichkeit für kleine Wikipedien, über aktuelle Daten zu verfügen.
- In verschiedenen Sprachräumen stehen andere Ligen im Fokus. Durch die zentrale Verwaltung wird die Aktualität der Daten in allen Wikipedien, auch in den sehr großen, deutlich verbessert.
- Auch externe Projekte können von den aktuellen freien Daten profitieren, was dem Ziel Freies Wissen für jedermann dient.
- Die Aktualisierung der Daten ist für Neulinge auf Wikidata wegen der intuitiven Benutzeroberfläche deutlich einfacher als die Aktualisierung in Wiki-Syntax, besonders bei der alten Version der Infobox mit <br />-Anweisungen zur Zeilentrennung.
Nachteile:
- Es ist für erfahrene Wikipedia-Editoren eine Umgewöhnung notwendig. Diese kann auf Widerstand stoßen.
ungeklärte Probleme:
- Aus Wikidata werden immer die aktuellen Daten bezogen. Kommt es im Wikidata-Item zu Vandalismus, wird dieser Vandalismus unmittelbar in den entsprechenden Artikeln angezeigt. Das lokale Sichtungssystem wird so umgangen.
- Durch die Beschränkung der Datentypen ist die Art des Vandalismus sehr eingeschränkt. So ist es bei der Anzahl der Spiele beispielsweise möglich, aus 30 Spielen 300 Spiele zu machen; typischer „Penis“-Vandalismus ist aber nicht möglich.
- Wikidata verfügt über automatisierte Vandalismus-Erkennung und -Bewertung, weshalb Vandalismus im Regelfall schnell revertiert wird. Diese Vandalismus-Erkennung wird derzeit (April 2016) auch aktiv weiterentwickelt.
- Die Einführung von „gesichteten Versionen“ auf Wikidata steht zur Diskussion.
- Manche Benutzer nutzen in den Infoboxen bei den Leistungsdaten die Vorlage {{0}}, um die schließenden Klammern der Angaben der Tore untereinander stehen zu haben. Dies ist bislang in dem Lua-Modul noch nicht implementiert (dies wäre technisch aber möglich).
- Dem gegenüber steht, dass diese Formatierung nie im Konsens beschlossen wurde und Wikipedia:Schreibweise von Zahlen widerspricht. Durch die Vorlage werden zusätzliche Nullen eingefügt, deren Sichtbarkeit ausgeschaltet wird.
Funktionsweise
[Quelltext bearbeiten]Zunächst ist die Lektüre der kurzen Wikidata-Einführung zu empfehlen.
Um die Leistungsdaten eines Fußballspielers hinzuzufügen / zu aktualisieren, ist folgendermaßen vorzugehen:
- Wikidata-Item des Artikels aufrufen (Link Wikidata-Datenobjekt aufrufen im Menü Werkzeuge in der Navigation links)
- Die Leistungsdaten werden über die Eigenschaft Mitglied von Sportmannschaft oder -verein (P54) verwaltet. Daher bis zu diesem Eintrag scrollen (oder, falls nicht vorhanden, ein solches Statement anlegen).
- Als Wert der Aussage wird das Item des jeweiligen Clubs ausgewählt.
- Mit Hilfe der Qualifikatoren werden weitere Infos für die jeweilige Vereinsstation festgelegt. Dabei kommen die folgenden Eigenschaften zum Einsatz:
- Startzeitpunkt (P580)
- Endzeitpunkt (P582)
- Anzahl der gespielten Partien (P1350)
- erzielte Punkte/Tore (P1351)
- Transferabwicklung (P1642) mit dem Wert Leihe (Q2914547), falls es sich um eine Leihe handelt und
- Zeitpunkt/Stand (P585) für die Angabe der letzten Aktualisierung (Verwendung in der Infobox als „Stand“).
- Nicht implementiert ist hier Wettbewerbsklasse (P2094), da müsste zuerst geprüft werden, ob Wikidata-Infoboxen anderer Wikipedias dies auch beachten.
- Für jede Aussage sollten verlässliche Einzelnachweise als Fundstellen (bei externen Verweisen wie Fußball-Datenbanken über (P584)) angegeben werden!
- In die Infobox wird als Parameter für vereine_tabelle = und nationalmannschaft_tabelle = sowie lgupdate = und nmupdate = jeweils der Schlüsselbegriff ABFRAGE_WIKIDATA eingesetzt. Den Rest übernimmt die Verwaltung der Infobox automatisch.
- Bei Angabe von Nationalmannschaftseinsätzen ist zu beachten, dass das Item der jeweiligen Nationalmannschaft folgende Statements enthält, damit die Abfrage ordnungsgemäß funktioniert:
- ist ein(e) (P31) → Fußball-Nationalmannschaft (Q6979593) oder Fußball-Nachwuchs-Nationalmannschaft (Q21945604) oder Kanadische Fußball-Olympiaauswahl (Q3873967)
- Land (Sport) (P1532) → das jeweilige Land / Staat der Nationalmannschaft
- Wettbewerbsklasse (P2094), falls es sich um eine Nachwuchs-Nationalmannschaft handelt (z.B. U16 (Q44418672) oder U16 (Q44419274)).
- Die Trainerstationen werden über die Eigenschaften Trainer von Sportteam oder -verein (P6087) verwaltet mit folgenden Qualifikatoren:
Beispiele
[Quelltext bearbeiten]häufig gestellte Fragen
[Quelltext bearbeiten]... folgt ...
Diskussionen und Verweise
[Quelltext bearbeiten]- Wikipedia:Meinungsbilder/Nutzung von Daten aus Wikidata im ANR – Meinungsbild, das die Nutzung von Daten aus Wikidata im Artikelnamensraum unter Bedingungen legitimiert
- Überarbeitung der Infobox – erste Diskussion im Portal:Fußball