Wikipedia Diskussion:WikiProjekt Vorlagenauswertung/Archiv/2009
Commons
Wäre es möglich, Commons in die Liste verfügbarer Wikis aufzunehmen? --::Slomox:: >< 07:21, 10. Jan. 2009 (CET)
- Liebend gerne, von der Menge der Information-Templates würde sich das auch richtig lohnen. Bis jetzt scheiterte es immer daran, das wir bis jetzt nie andere Namensräume als den Artikelnamensraum unterstützt habe. Wenn wir für Commons einfach "File:XYZ.jpg" wie einen normalen Artikel behandeln würden, sollte es kein Problem gäben. Alles andere wäre eine größere Umstellung. --Kolossos 10:45, 10. Jan. 2009 (CET)
- Ideal wäre natürlich alle Namensräume zu unterstützen und die Auswertung auf bestimmte Namensräume beschränkbar zu machen. Aber wenn das kurzfristig zu viel Arbeit ist, wäre die andere Lösung natürlich auch schon mal ein Schritt vorwärts. --::Slomox:: >< 17:42, 10. Jan. 2009 (CET)
Parameternamen in der WP
Wenn ich zu einem Parameternamen nachschauen will, in welchen Vorlagen dieser gebraucht wird, würde ein
select distinct entry_name, tp_name from pub_tt1_de
wertvolle dienste leisten. Das ganze um eine Semantiktabelle erweitert wäre natürlich der Hammer. Mal davon ausgehend das jeder Parametrisierte Begriff in der WP beschrieben ist, würde das mir zB. ermöglichen
- alle Parameternamen zu Höhe über dem Meeresspiegel zu finden
- alle Vorlagen zu einer Semantik zu finden zB. zu Breitengrad
Diese semantischen Informationen könnte man auf einer Subpage ../Semantik der Vorlage erfassen und stünde so der Auswertung zur Verfügung.
Parametername Semantik
-- visi-on 16:39, 2. Jan. 2009 (CET)
- Sorry, für die späte Anwort, hatte es übersehen. Dein erster Wunsch sollte einfach erfüllbar sein. Aber was meinst du mit seiner Semantik genau? Kannst du das an einem Beispiel erläutern? --Kolossos 12:00, 10. Jan. 2009 (CET)
- Ja, ich versuchs, jede Vorlage gibt einen Kontext vor z.B. durch Vorlage:Infobox Bauwerk ein Gebäude in diesem Kontext hat der Parameter Höhe eine ander Bedeutung (Längenmaß) als z.B. in der Vorlage:Infobox Berg (Meter über dem Meeresspiegel). Stünde diese semantische Differenzierung zur Verfügung wären Auswärtungen einer anderen Qualität möglich. Wurde die Vorlage vorbildlich dokumentiert, ist die Semantik aus der Parameterbeschreibung ersichtlich Vorlage:Infobox Berg#Parameter. Da ss wohl kaum möglich sein wird die Dokumentation so zu standardisieren, dass man diese Info einfach herausfiltern kann, schlug ich eine Unterseite Vorlage:Infobox Bauwerk/Semantik vor. Dass diese Zuordnung von Parameter und Bedeutung Eindeutig ist, muss diese als Lemma in der Wikipedia existieren.-- visi-on 12:24, 10. Jan. 2009 (CET)
Deinen ersten Wunsch konnte ich wohl mit http://toolserver.org/~kolossos/templatetiger/parameter-usage.php?lang=de¶meter=Breitengrad schon erfüllen. Das Skript braucht allerdings echt seine Zeit zur Bearbeitung. Was die Semantic angeht, so geht wohl der Vorlagenmeister am ehesten in deine Richtung. Für alles andere warten wir wohl lieber auf was richtig großes, professionelles wie das Semantic MediaWiki.--Kolossos 23:43, 10. Jan. 2009 (CET)
- Man kann nicht immer alles haben.
- Performance, grumel ... hast du auch mal anstelle von LIKE "=" probiert? wäre ja immerhin noch etwas, vorgängig den String auf Platzhalter zu prüfen, bevor man ihn in die Mühle wirft. -- visi-on 23:55, 10. Jan. 2009 (CET)
- Hab mal von "like" auf "=" umgestellt, bringt aber wohl recht wenig gefühlten Geschwindigkeitsvorteil. Die Verwendung von Umlauten geht leider auch nicht, dass kann aber auch an den Errungenschaften des neuen Firefoxes liegen, da steige ich wohl nicht dahinter. --Kolossos 12:17, 11. Jan. 2009 (CET)
- So jetzt gibt es eine neue Tabelle _para mit der Zuordnung von Vorlagen zu Parametern und umgekehrt. Davon profitiert auch die Parameteranzeige und das Übersetzungstool. --Kolossos 13:04, 27. Jan. 2009 (CET)
- cool ;-) -- visi-on 12:08, 28. Jan. 2009 (CET)
- So jetzt gibt es eine neue Tabelle _para mit der Zuordnung von Vorlagen zu Parametern und umgekehrt. Davon profitiert auch die Parameteranzeige und das Übersetzungstool. --Kolossos 13:04, 27. Jan. 2009 (CET)
Problem der Vorlagenauswertung mit Umlauten
Die Vorlagenauswertung scheint Umlaute nicht zu mögen. So ist war es mir nicht möglich inner halb der Vorlage:Infobox Unternehmen das Feld Gründungsdatum zu durchsuchen. Das gleiche gilt für den Inhalt der Felder. Bei Sitz München wird kein Treffer angezeigt. Kann irgendjemand helfen? -- chemiewikibm cwbm 10:31, 1. Mär. 2009 (CET)
- Das Formular nutzt anscheind die falsche Encodierung: Vergleiche: mit Formular (keine Ergebnisse), modifiziert (165 Ergebnisse) --Der Umherirrende 22:16, 1. Mär. 2009 (CET)
- Tausend Dank. -- chemiewikibm cwbm 22:45, 1. Mär. 2009 (CET)
CSV-Probleme
Ich habe ein klein wenig Probleme mit der CSV-Ausgabe des Inhalts. Excel kommt nicht klar mit dem Format, in dem die Texterkennungszeichen und die expliziten Feldtrenner fehlen. Darf ich vorschlagen mit einem CONCAT jedes Feld in " oder ' einzuschließen, und anschließend mit zu trennen. Eventuell wäre es noch sinnvoll mit einem replace eventuell vorhandene Trennzeichen in etwas anderes umzuwandeln. Falls das in PHP und mySQL geschrieben ist, ich helfe ggfs. gern. COM Lampe 18:01, 18. Apr. 2009 (CEST)
- Excel hat mit vielem Probleme. Probiermal die CSV-Datei in Access zu nutzen. Da hatte ich früher immer die besseren Ergebnisse beim Einlesen. Man kann dann problemlos von Access nach Excel kopieren. -- sk 22:27, 18. Apr. 2009 (CEST)
Livedaten-Update aus Datendump?
Beim ansehen der TEmplate-Daten sind mir einige Ungereimtheiten aufgefallen, die aus den Livedaten stammen. Hier werden einfach TEmplates nicht richtig benutzt. Frage: Gibt es irgendein Projekt dem man solche Fehler melden kann, die dann direkt ein Update der Livedaten basierend aus den FEhlern vornehmen können? COM Lampe 18:01, 18. Apr. 2009 (CEST)
- Also, wir arbeiten nicht mit "Livedaten", sondern mit monatlichen Dumps. Wenn du einen Fehler findest, solltest du ihn in der Wikipedia koorigieren. Wenn es ein systematischer Fehler ist, solltest du herausfinden, welche Leute die Daten (aus deiner Sicht falsch) in die Vorlagen eintragen. Bei einer Schienenfahrzeug-Vorlage, wäre dann dein Ansprechpartner z.B. wohl das Portal Bahn oder du nimmst die Disk.-seite der Vorlage. Eine genaue Antwort gibt es nicht. Wenn die Einträge in der Wikipedia koorigiert wurden, haben wir dann ca. 1 Monat später mit den neuen Dumps auch die korrekten Werte und genau für solche Überprüfungen wurde das Tool geschrieben. Schneller geht es derzeit leider nicht. --Kolossos 18:56, 18. Apr. 2009 (CEST)
- Also, die Grundtheorie kenne ich, meine Idee war mehr systematische Fehler direkt aus dem Dump in die Livedaten zu aktualisieren. ZUgegeben, eine gewagte Idee.. COM Lampe 20:24, 18. Apr. 2009 (CEST)
- Was spricht gegen einen Bot, der nochmal prüft, ob ein Fehler noch aktuell ist und dann verbessert? Nur ist das nicht mehr Projektinhalt. --Kolossos 21:55, 18. Apr. 2009 (CEST)
- Also, die Grundtheorie kenne ich, meine Idee war mehr systematische Fehler direkt aus dem Dump in die Livedaten zu aktualisieren. ZUgegeben, eine gewagte Idee.. COM Lampe 20:24, 18. Apr. 2009 (CEST)
- Bot-Programmierung geht leider weit über das hinaus was ich kann, ich kann nur SQL. Dennoch danke für deine Hilfe und Antworten, Kolossos! COM Lampe 22:12, 18. Apr. 2009 (CEST)
Formular für RegExp funktioniert nicht
Das Formular fügt bei Auswahl von "Übereinstimmung ist ein Regulärer Ausdruck" einen Parameter ®ex=yes
an die URL. Es müsste aber richtig ®exp=yes
lauten. Danke. Der Umherirrende 22:58, 25. Jul. 2009 (CEST)
- Welches Formular meinst du? Es gab da wohl mal ein GUI, keine Ahnung von wem und ob das noch gepflegt wird. Schreib am besten mal den Benutzer direkt an. --Kolossos 19:54, 10. Aug. 2009 (CEST)
- Es ging mir um tools:~rhodo/tigergui/. Ich habe Rhododendronbusch bereits angeschrieben, ich weiß nur nicht wann er es ließt, da er derzeit sehr wenig bis gar keine Bearbeitungen hat. Das Formular ist als "Suchmaske" unter Wikipedia:WikiProjekt Vorlagenauswertung#Nutzung verlinkt. Der Umherirrende 20:12, 10. Aug. 2009 (CEST)
Normalisierung von Vorlagennamen
Damit der Vorlagennamen auch normalisiert ist, sollte er mit dem Regex /[\s|_]+/g
vergnügt werden, damit die Unterstriche und doppelte Leerzeichen entfernt werden. Anschließend noch den ersten Buchstaben groß machen. Dadurch würden gleiche Vorlagen auf der Übersichtsseite auch unter demselben Punkt dargestellt werden. Diese Änderung im Artikel vorzunehmen, halte ich nicht für ratsam, da es nur kosmetischer Natur ist. Danke. Der Umherirrende 22:54, 25. Jul. 2009 (CEST)
- Naja, ich bin der auffassung, dass das schon so geändert werden sollte. Es wird ja nur einmal der Artikel angefasst und dann brauch sich niemand mehr um dieses Problem kümmern. -- sk 18:22, 10. Aug. 2009 (CEST)
- Das Problem hier ist eher die Freiheit die MediaWiki gibt und diese sollte man für ein externes Tool nicht aufgeben. Außerdem ist es schwerig auch alle Einbindungen zu erfassen. Manchmal wird es systematisch gemacht und ohne normalisierung ist die Einbindung über die normale Suche (GUI oder Gadget-Tab) nicht auffindbar. Wenn man wirklich alle haben möchte, muss man immer daran denken, mögliche Schreibweisen zu beachten. Der Aufwand fürs Skript ist dabei erheblich kleiner, als das überall zu ändern. Ich denke auch, das man das in anderen Sprachen schlecht signalisieren kann. Mögliche Weiternutzer der Wikipedia müssen an so etwas eh denken, da braucht man das nicht vereinheitlichen, finde ich. Der Umherirrende 19:43, 10. Aug. 2009 (CEST)
- Wie soll mit unterschiedlichen Vorlagen umgegangen werden, die sich nur durch den Unterstrich unterscheiden? Ich weiß jetzt nicht ob wir solche haben, aber ich habe nicht den Überblick über alle Sprachen. -- sk 19:51, 10. Aug. 2009 (CEST)
- @Stefan: Einen Unterstrich in einem Vorlagenname kann es aus meiner Sicht nicht geben. Es wäre schön wenn das Problem auf deiner Pearl-Seite gelöst werden könnte, alles andere verlangsamt die DB-Abfrage. --Kolossos 20:11, 10. Aug. 2009 (CEST)
- Das mit den Unterstrichen werde ich mal angehen. -- sk 22:00, 10. Aug. 2009 (CEST)
- @Stefan: Einen Unterstrich in einem Vorlagenname kann es aus meiner Sicht nicht geben. Es wäre schön wenn das Problem auf deiner Pearl-Seite gelöst werden könnte, alles andere verlangsamt die DB-Abfrage. --Kolossos 20:11, 10. Aug. 2009 (CEST)
- Wie soll mit unterschiedlichen Vorlagen umgegangen werden, die sich nur durch den Unterstrich unterscheiden? Ich weiß jetzt nicht ob wir solche haben, aber ich habe nicht den Überblick über alle Sprachen. -- sk 19:51, 10. Aug. 2009 (CEST)
- Soweit ich weiß, können sich Vorlagen nicht an Unterstrichen unterscheiden. Bei Vorlageneinbindungen verhält es sich genauso wie mit Wikilinks (Außer, das man Wikilinks auch URL-encodiert angeben kann, was bei Vorlagen derzeit nicht funktioniert). Unterstriche und doppelte Leerzeichen machen keine Probleme. Ob der erste Buchstabe einen Unterschied macht ist konfigurationsabhängig. Die Konfiguration kann dem Dump entnommen werden: Element case (im Element siteinfo): "first-letter" (wie hier) oder "case-sensitive" (wie im de.wiktionary) --Der Umherirrende 20:09, 10. Aug. 2009 (CEST)
- @Umherirrender: Hast du ein Beispiel bei der Hand? --Kolossos 20:11, 10. Aug. 2009 (CEST)
- Nach dieser Abfrage gibt es mehr Seiten mit Infobox_Unternehmen (4820) anstatt Infobox Unternehmen (2826). Wenn die zusammengefasst würden, wäre das eine Bereicherung, da sie beide die gleiche Vorlage beschreiben. Der Umherirrende 20:19, 10. Aug. 2009 (CEST)
- Gibt es noch ein Beispiel für die doppelten Leerzeichen? Ich weiß jetzt nicht wo die genau sein solle. -- sk 09:52, 11. Aug. 2009 (CEST)
- Die doppelten Leerzeichen können zwischen den Namensteilen sein (führende und nachhängende Leerzeichen sollten ja schon entfernt sein): cite book vs. cite_book vs. cite book --Der Umherirrende 11:54, 11. Aug. 2009 (CEST)
- Alles klar, ich werde mal schauen was ich da machen kann. -- sk 13:58, 11. Aug. 2009 (CEST)
- Ich habe keine Ahnung von Perl, aber nach selfhtml.org sollte
$vorlagenname =~ s/[\s_]+/ /g;
, das gewünschte Ergebnis bringen. Der Umherirrende 14:22, 11. Aug. 2009 (CEST)
- Ich habe keine Ahnung von Perl, aber nach selfhtml.org sollte
- Das Problem ist nicht wie man es macht, sondern wo an welcher Stelle genau man das im Skript einbauen kann, ohne das alles gleich explodiert. War am Ende aber ganz einfach. Mal schauen ob der Effekt auch so ist wie geplant. -- sk 21:15, 11. Aug. 2009 (CEST)
- Aso, das hatte ich dann falsch verstanden. --Der Umherirrende 21:29, 11. Aug. 2009 (CEST)
- Das Problem ist nicht wie man es macht, sondern wo an welcher Stelle genau man das im Skript einbauen kann, ohne das alles gleich explodiert. War am Ende aber ganz einfach. Mal schauen ob der Effekt auch so ist wie geplant. -- sk 21:15, 11. Aug. 2009 (CEST)
Mit dem neuen Dump funktioniert es soweit ich sehen konnte. Danke für den Hinweis. --Kolossos 20:56, 12. Aug. 2009 (CEST)
- Ich habe zu danken, die „cite book“s sind auch alle zusammen. Sieht sehr gut aus. Das I-Tüpfelchen wäre aber noch ein großer Anfangsbuchstabe (wie oben erklärt), damit man dann auch über die Gadget-Tabs von Vorlage:Cite book die richtige Seite bekommt. Hat keine hohe Priorität, aber wenn ihr mal Zeit findet. Der Umherirrende 21:20, 12. Aug. 2009 (CEST)
Stand und Aktuallisierung
Hallo, gibt es irgendwo eine Möglichkeit rauszufinden auf welche Datenbasis (also Datum usw.) die Abfragen basieren? Wie oft wird der Datenbestand eigentlich aktualisiert? --Cepheiden 15:30, 17. Dez. 2009 (CET)
- Unter http://toolserver.org/~kolossos/templatetiger/ gibt es eine Spalte "Date of Dump". Das letzte Einspielen war im Oktober, das nächste Mal ggf. zwischen Weihnachten und Silvester. So 2-3 Monate haben sich da als geeignetes Intervall gezeigt, um auch uns (Stefan und ich) und die Server zu schonen. Ausnahme ist die englische WP die mit >24h zu lange zum Einspielen braucht und Probleme bereitet, naja wir Reden da von ca. 30 Mio. Datensätzen. Ein engeres Updateintervall wäre bei größerer Nutzerresonanz wohl sicher möglich, aber ich wünsche mir eher, das das Thema von der Foundation professionell angegangen wird und man durch Integration ins Mediawikis eine Echtzeitfunktionalität bekommt (Semantic-Mediawiki oder so). --Kolossos 21:27, 17. Dez. 2009 (CET)
- Aha, danke für die Infos. Grüße --Cepheiden 22:46, 17. Dez. 2009 (CET)
- Woran hakts momentan? Mittlerweile ists schon Februar, nen Update dürfte wohl nicht schaden.. Gruß --Ureinwohner uff 11:23, 11. Feb. 2010 (CET)
- Aha, danke für die Infos. Grüße --Cepheiden 22:46, 17. Dez. 2009 (CET)