Benutzer Diskussion:Stefan Kühn/Archiv/2008/Jul

aus Wikipedia, der freien Enzyklopädie
Letzter Kommentar: vor 16 Jahren von Stefan Kühn in Abschnitt Post
Zur Navigation springen Zur Suche springen

Kleine große Frage ;-)

Moin Stefan, DaB. meinte, Du könntest weiterhelfen: Kannst Du die de.wikipedia- (sowie ggf. auch en.wikipedia-) Dumps nach Seiten durchsuchen, die noch class="townBox" verwenden und eine entsprechende Liste zwecks Abarbeitung (zumindest für de.wikipedia: Umstellung auf class="sideBox" oder noch zu erstellende Infoboxvorlagen) zur Verfügung stellen? Der aktuelle Hintergrund ist u.a. hier nachlesbar. Danke und gute Grüße :-) --:bdk: 16:45, 6. Jul. 2008 (CEST)

Mache ich gerne. Ich bastel da mal fix was. -- sk 17:36, 6. Jul. 2008 (CEST)
@Bdk: Also wenn ich nix falsch gemacht habe, dann gibt es den Text class="townbox" nicht im letzten Dump von DE. -- sk 18:41, 6. Jul. 2008 (CEST)
Oh, supifix :-) Allerdings müsste sich der string im Dump zumindest noch in den da verlinkten Stadtbezirksartikeln finden (das hatte ich erst heute morgen gefixt, siehe [1]) … --:bdk: 20:21, 6. Jul. 2008 (CEST)
Stimmt, da muss ich nochmal schauen, woran das lag. Zweiter Versuch läuft. -- sk 22:04, 6. Jul. 2008 (CEST)
28 Artikel gefunden, hab Mail mit Liste an dich verschickt. -- sk 22:39, 6. Jul. 2008 (CEST)
Astrein. Nun scheint alles auch in Ordnung zu sein (gerade die restlichen Artikel überprüft). Vielen Dank nochmal! LG --:bdk: 23:05, 6. Jul. 2008 (CEST)

Hallo Stefan, ich habe mal nach der Text-Fassung des Auszugs aus dem dump gesucht, aber keinen gefunden. Kannst du mir mal sagen, ob es den noch gibt und wo er liegt? – Simplicius 2004-2008 17:53, 6. Jul. 2008 (CEST)

Also es gibt eine XML-Datei, die verpackt als bz7 bei jedem Dump mitgeliefert wird. Mit diesem XML-File arbeite ich. Ist ja nix anderes als eine große Textdatei. Oder meinst du was anderes? -- sk 18:13, 6. Jul. 2008 (CEST)

Ich meinte die Daten, aus denen du die kml-Datei machst, also die gut 100.000 Zeilen und mehr, samt der Kategorien dahinter, die du früher auf deiner Website als Textdatei ebenfalls zum Download gestellt hattest. – Simplicius 2004-2008 18:22, 6. Jul. 2008 (CEST)

Schau mal hier Wikipedia:WikiProjekt_Georeferenzierung/Wikipedia-World in der Box rechts und dort ganz unten, dass müsste das sein, was du suchst. -- sk 18:26, 6. Jul. 2008 (CEST)
Ich meinte die Dateien im Format text, pro Zeile ein Datensatz, mit Semikolons, in denen eine oder mehrere Kategorien noch hinten an standen. – Simplicius 2004-2008 16:22, 9. Jul. 2008 (CEST)
Diese Datei befindet sich nur auf dem Toolserver und ist nicht öffentlich zugänglich. Da sie 44 MB groß ist und ich den Server schonen wollte, hab ich die nicht weiter veröffentlicht. Nutzer auf dem Toolserver haben aber Zugriff. Kolossos nutzt sie ja für seine Weiterverarbeitung. -- sk 10:06, 13. Jul. 2008 (CEST)

Vorlagenauswertung

Kopie von meiner Benutzerseite:--Kolossos 11:24, 13. Jul. 2008 (CEST)
Hallo, unter [2] gibt es wieder einen neuen Dump für die Vorlagenauswertung. Ich hoffe, es macht nicht zuviel Arbeit, die Vorlagen auszuwerten. Viele Grüße und vielen Dank für Deine Arbeit. Andim 10:11, 13. Jul. 2008 (CEST)

Hallo Kolossos, ist gerade durchgelaufen, wollte dir gleich die Mail schicken. :-) -- sk 11:34, 13. Jul. 2008 (CEST)
Ich muss mir unbedingt mal ein Infosystem für die neuen Dumps programmieren, das mich täglich über die neusten Dumps, die verfügbar sind, aufmerksam macht. -- sk 11:35, 13. Jul. 2008 (CEST)
Naja von zentraler Stelle das zu programmieren wäre das einfacher und sinnvoller, Also z.B. über Mailinglisten in die automatisiert gepostet wird. Nur kenne ich da keinen Ansprechpartner. --Kolossos 14:27, 13. Jul. 2008 (CEST)
Dann frag ich mal auf der Toolserver-Mailingliste, vielleicht hat ja jemand Zeit. -- sk 15:38, 13. Jul. 2008 (CEST)

Wagengrab von Bell

Hier habe ich in Google Map die Lage des Wagengrab von Bell als Link: [3] . Vielleicht kannst du ihn bei wiki als Koordinate ( Mitte des Bildes ) eingeben. MfG Achim Berg 21:54, 15. Jul. 2008 (CEST)

Ich hab mal die Koordinate eingetragen, aber ich bin nicht sicher ob ich die Mitte genau getroffen habe, weil das auch von der Browserfensterbreite abhängt. Schau dir doch mal diese Tool an, damit lässt sich sehr einfach die Koordinaten-Vorlage erstellen (siehe ganz unten). -- sk 18:31, 18. Jul. 2008 (CEST)

Dump

Hallo !
Man hat mir mitgeteilt, du hättest SW zum Suchen in einem XML-Dump der WP. Wenn dem so ist: Kannst du mir dazu etwas sagen ? Hintergrundinfo unter Wikipedia:Fragen_zur_Wikipedia#Dump Cäsium137 (D.) 23:55, 17. Jul. 2008 (CEST)

Hallo Cäsium137, ich hätte dir ja heute schon früher mal eine Mail geschickt, aber du hast keine E-Mail-Adresse bei deinem Benutzerkonto angelegt, das erschwert die Kommunikation. Ok, nun zu deiner Frage. Wie ich gelesen habe hast du den Dump schon entpackt mit 7-Zip. Das mach ich genauso. Wenn du jetzt den Dump Zeile für Zeile einlesen kannst mit irgendeiner Programmiersprache deiner Wahl, bist du schon fast selber so weit. Ich hab mir halt ein Programm mit perl erstellt, weil ich das ein wenig kann. Das liest Zeile für Zeile ein. Merkt sich immer wenn ein Artikelname kommt, und setzt danach alle folgenden Zeilen zum Artikeltext zusammen, bis der nächste Artikelname kommt. So kann ich dann jeden Artikel Stück für Stück auswerten. Wenn du dir z.B. unter Windows ActivePerl installierst, kannst du auch deine Programme in perl schreiben ohne Linux, Toolserver oder Appache. Zumindestens könnte ich dir dann so ein einfaches Skript vorbereiten, das schon mal nach einem Wort sucht und eine Artikelliste mit Treffern ausgibt. -- sk 18:23, 18. Jul. 2008 (CEST)

Das wäre schon was. Ich habe aber auch einen Cpp-Compiler. Der ist etwas älter (Borlands Builder, Version 5) und ich habe bloß Bedenken wegen der Dateigröße > 2GByte (2^31) (über der Long-int-Grenze). Das erfordert die langsameren 64 Bit-Funktionen des Compilers. Hast du da eine Idee ? Cäsium137 (D.) 00:54, 19. Jul. 2008 (CEST)

Also wenn du mit Cpp arbeitest, dann probier es ruhig mal damit. Einzigstes Problem, was sein könnte, dass du die große Datei nicht öffnen kannst. Unter Perl ist die Dateigröße für mich bisher noch zu keinem Problem geworden. Hab aber keine Ahnung ob dass mal irgendwann kommt. Wie gesagt einfach Zeile für Zeile einlesen und schauen was drinsteht. -- sk 04:34, 19. Jul. 2008 (CEST)
Danke. Ein paar Tipps über den Inhalt könnte ich noch gebrauchen:
  1. Enthält die Datei bereits Zeilenumbrüche ? Das ist für die C++ - Programmierung wichtig, da die VCL (C++ - Bibliothek) Objekte dafür hat.
  2. Hast du einen Baum der Tags (zumindest bis zur Seitenebene) ?
  3. Welcher Tag trennt die Seiten ? Das erlaubt mir, gleich einzelne Seiten zu lesen.
  4. Könntest du ggf. eine XML-Seite als Beispiel in meinen BNR (auf Benutzer:Cäsium137/Beispielseite in den PRE-Tag) schreiben ?
Cäsium137 (D.) 07:01, 19. Jul. 2008 (CEST)


Ja die Datei enthält Zeilenumbrüche. Nein ich habe keinen XML-Baum. Such einfach nach <page> bzw. </page>. Da ich aber nicht mit XML-Mitteln arbeite brauche ich auch nicht den Baum. Mein Vorschlag, schau dir mal eine ganz kleinen Dump an (z.B. ndswiki nur 8MB und für gut verständlich). --sk 08:32, 19. Jul. 2008 (CEST)
Alternativ kannst du auch einige Seiten exportieren, die (relevante) Struktur ist die gleiche:
<page>
 <title></title>
 <id></id>
 <revision>
  <id></id>
  <timestamp></timestamp>
  <contributor>
   <username></username> 
   <id></id>
oder
   <ip></ip>
  </contributor>
  <comment></comment>
  <text xml:space="preserve"></text>
 </revision>
</page>
Nur das text-tag enthält Umbrüche, wenn auch im Wikilink umbrüche sind. Ansonsten ist nach jedem schließendem tag ein Umbruch als trennung dieser, kann also zeilenweise eingelesen werden. Die metainformationen am anfang kann man für sprachenunabhängige Programmierung nutzen. Falls nötig, musst du den wikitext decodieren:
&lt; -> <
&gt; -> >
&quot;  -> "
&#039; -> '
&amp; -> &
Das amp als letztes, da ansonsten die anderen verfälscht werden.
Stefan, was hast du für Ressourcen auf den Toolserver, das du einen Dump in 20 Minuten schaffst? (so schrieb Kolossos auf WP:FzW) oder liegt das auch an der Programmiersprache? Der Umherirrende 11:45, 19. Jul. 2008 (CEST)

Danke für die Auskunft. Cäsium137 (D.) 17:14, 19. Jul. 2008 (CEST)

Ich nutze wie gesagt die Programmiersprache perl. Was für Ressourcen ich auf dem Toolserver habe kann ich nicht mal genau sagen. Auf jeden Fall dauert der Scan für die Geokoordianten bei dem letzten deutschsprachigen Dump genau 1856 Sekunde oder 30.93 Minuten. Dabei wurden 1.608.730 Seiten (572.357 Artikel) mit insgesamt 78.171.447 Zeilen eingelesen. -- sk 18:48, 19. Jul. 2008 (CEST)

Piri Reis Karte

Sehr geehrter Herr Kühn

Ist es möglich diese Seite (Piri Reis Karte) zu ändern?

--DasAugeDerWahrheit 06:36, 20. Jul. 2008 (CEST)

Der Artikel Karte des Piri Reis ist derzeit halbgespeert, dass bedeutet, dass nur angemeldete Benutzer daran etwas ändern dürfen. Da du ja hier angemeldet bist, kannst du auch problemlos daran etwas ändern. -- sk 06:54, 20. Jul. 2008 (CEST)

Gilt für mich die 4-Tage Regelung? --84.164.230.196 07:10, 20. Jul. 2008 (CEST)--DasAugeDerWahrheit 07:12, 20. Jul. 2008 (CEST)

Korrekt. Laut Wikipedia:Pressemitteilungen/FAQ Semi-protection policy (3. Frage) muss man mehr als vier Tage angemeldet sein. Dadurch sollen spontaner Vandalismus unterbunden werden. Bis dahin kannst du ja noch an anderen Ecken in der Wikipedia hilfreich sein. -- sk 07:15, 20. Jul. 2008 (CEST)

Lieber nicht, denn dann würden viele beleidigt sein. --DasAugeDerWahrheit 07:19, 20. Jul. 2008 (CEST)

Naja, wenn du meinst. Du scheinst ja schon länger in der Wikipedia rumzuturnen. Generell sollt ja bei einer Diskussion mit Argumenten diskutiert werden und nicht mit Beleidigungen reagiert werden. -- sk 07:26, 20. Jul. 2008 (CEST)

Haben Sie meine Beiträge gelesen? --DasAugeDerWahrheit 07:28, 20. Jul. 2008 (CEST)

Nein, hab ich nicht. Sie sind mir zu lang und ich hab gerade eine andere zeitfressende aber wichtige Beschäftigung. Meine Schlüsse hab ich aus dem Satz "Lieber nicht, denn dann würden viele beleidigt sein." gezogen. Entweder unterschätzt du die Toleranz der Wikipedianer (insbesondere wenn die Argumente mit Quellen belegt werden können) oder du hast schon negative Erfahrungen hier gesammelt und versucht jetzt mit einem neuen Account einen zweiten Start. Von mir auf jeden Fall ein herzliches Willkommen. Freue mich auf viel produktive Artikelarbeit. -- sk 07:48, 20. Jul. 2008 (CEST)

Kategorie:Mann für Personen aus dem Tanach?

Die Kategorie:Mann sollte doch nur für reale Personen genutzt werden. Deshalb verstehe ich nicht, warum du die für Personen aus dem Tanach anwendest, wie hier. --Ephraim33 10:13, 20. Jul. 2008 (CEST)

In dem Fall sollte aber auch die Kategorie Kategorie:Jüdischer Geistlicher aus dem Artikel rausfliegen. -- sk 10:56, 20. Jul. 2008 (CEST)
ok, gemacht. --Ephraim33 11:34, 20. Jul. 2008 (CEST)

Bild:Brot 1943.jpg

Hi Stefan, durch den Eintrag bei WP:KEB bin ich darauf aufmerksam geworden. Nun legt das Motiv nahe, daß dieses Bild kein Beutematerial ist sondern ev. wirklich von einem US-Beamten gemacht wurde. Weißt du dazu Näheres? Gruß RalfRDOG 2008 16:52, 23. Jul. 2008 (CEST)

Wenn du unter http://www.archives.gov/research/arc/index.html schaust und dort die Nummer 531156 eingibst, dann kommst du zu der Bildbeschreibung. Dort steht "Creator(s):Department of Defense. Department of the Army. Office of the Chief Signal Officer. (09/18/1947 - 02/28/1964)" -- sk 17:31, 23. Jul. 2008 (CEST)
Ok, danke - auf englischen Seiten tue ich mich schwer, mich dort zurechtzufinden. --RalfRDOG 2008 17:46, 23. Jul. 2008 (CEST)

Bot

Hallo.
Ich wende mich mit meinem Anliegen an dich, da Raymond gem. Benutzerseite z.Z. länger offline ist:

Ich habe vor ca. 6 Wochen für einen Bot ein Flag beantragt, was aber wegen eines Botfehlers und dem nicht sehr fairen Verhalten von einem Admin von Raymond abgelehnt wurde. Zu dem Zeitpunkt auch nachvollziehbar. Der Account wurde später gesperrt, da man mir nicht mitgeteilt hat, dass ich den Bot ohne Flag nicht benutzen darf und das zu der Zeit auch nicht in den Regeln stand. Mein Problem ist, dass ich jetzt an der Erstellung und Anpassung von Vorlagen arbeite und daher den Bot benötigen würde, um ggf. Einbindungen anzupassen. Gibt es eine Möglichkeit, den Bot wieder benutzen zu können ? Dazu benötige ich aber auch das Flag, da sich sonst diverse Admins über zugeflutete Beob.-listen beschweren, was bei der Arbeit an V-Einbindungen unweigerlich geschieht.

Info:

Das ich mit einem Bot vorsichtig umgehen muss, habe ich inzwischen kapiert. Cäsium137 (D.) 12:08, 25. Jul. 2008 (CEST)

Stelle einfach erneut einen Antrag. In den sieben Tagen wo der Antrag läuft, kannst du den Bot ja unter intensiver Beobachtung laufen lassen. Nach den 7 Tagen wird dann erneut entschieden. -- sk 09:53, 26. Jul. 2008 (CEST)
Mach mal lieber einen Antrag. -- sk 12:07, 27. Jul. 2008 (CEST)

Dazu müsste er aber in den sieben Tagen frei gegeben werden. Es besteht aber dann das Problem mit den B-Listen. Was empfiehlst du mir da ? Cäsium137 (D.) 14:13, 26. Jul. 2008 (CEST)

Das Freigeben ist nicht das Problem. Du solltest halt dann in den sieben Tagen nicht versuchen 100.000 Artikel zu ändern. Das könnte dir einige übel nehmen. Fang klein an und wenn dein Bot die 7 Tage keinen Blödsinn macht, dann kriegt er auch das Flag. Ich hab den Bot gerade freigegeben. -- sk 20:02, 26. Jul. 2008 (CEST)

Danke. Ich bin dezent und vorsichtig. Muss ich den Antrag neu stellen, oder geht es auch unter deiner "Obhut" ? Cäsium137 (D.) 11:38, 27. Jul. 2008 (CEST)

Frage übersehen ? Cäsium137 (D.) 07:29, 30. Jul. 2008 (CEST)

Ich antworte mal in seinem Namen: Bitte stelle einen neuen Antrag. Danke. — Raymond Disk. Bew. 08:25, 30. Jul. 2008 (CEST)

Wolfgang Mitzinger

Wölfgang Mitzinger war kein Hauptenergetiker im Geiseltal.

Benutzer_Diskussion:Toolittle#Wolfgang_Mitzinger hab mal dne Erstautor informiert. -- sk 21:10, 1. Jul. 2008 (CEST)
Erledigt. -- sk 08:43, 13. Sep. 2008 (CEST)

Dein Bild:Milk_glass.jpg

Siehe Wikipedia:Weiternutzung/Mängel#http://www.oppt.de -- Martina Nolte Disk. 15:58, 7. Jul. 2008 (CEST)

Erledigt. -- sk 08:43, 13. Sep. 2008 (CEST)

Post

Hallo Stefan.

Habe dir gerade eine E-Mail geschrieben. Grüße, —DerHexer (Disk.Bew.) 11:59, 8. Jul. 2008 (CEST)

Erledigt. -- sk 08:43, 13. Sep. 2008 (CEST)