Benutzer Diskussion:Inforapid

aus Wikipedia, der freien Enzyklopädie
Letzter Kommentar: vor 14 Jahren von Martina Nolte in Abschnitt 21.11.2010 - Wissensnetz für die englische Wikiepdia online
Zur Navigation springen Zur Suche springen

Hallo, Ich denke wir sollten besser hie als im Kurier weiter diskutieren. Nur damit keine Falsche Eindruck aufkommt Ich finde so ein Tool gut. Mich interessiert nur warum es manche (nicht) macht.

--HAL 9000 05:09, 11. Nov. 2010 (CET)Beantworten

Auswertungsweise

[Quelltext bearbeiten]

Hallo liebe Inforapid Leute,

danke für euer tolles Werkzeug, ich bin begeistert. Kann man die Art und Weise der Berechnung des Graphen einsehen? Du schreibst im Kurier, dass auch inhaltlich verglichen wird. Der Artikel Leitart wird nur von wenigen Artikel verwiesen, wird jedoch über 50 mal in anderen Artikeln im Fließtext angesprochen. Der Graph de.inforapid.org/index.php5?search=Leitart ist nun eher dürftig - woran liegt das? Dankend, liebe Grüße, Conny 16:14, 12. Nov. 2010 (CET).Beantworten

Hallo,
habe neues Ergebnis kurz in Augenschein genommen. Es sind auf jeden Fall jetzt mehr Ergebnisse sichtbar, obwohl die zweite Ebene viele gleichrangige Objekte enthält, müsste es doch noch filigranere Wichtungsunterschiede geben oder? Liebe Grüße, Conny 11:51, 19. Nov. 2010 (CET).Beantworten

Funktionsweise InfoRapid KnowledgeMap Server

[Quelltext bearbeiten]

Hallo Conny, hallo HAL 9000,

um zu verstehen, was der InfoRapid KnowledgeMap Server kann und was eben nicht möchte ich Sie bitten sich vorzustellen, Sie müssten ein ähnliches Programm entwickeln. Im Kurier haben Sie das Projekt WikiMindMap angesprochen. Ich möchte das mal als Ausgangspunkt nehmen, da die Ergebnisse dort sehr leicht zu verstehen sind. Der Autor hat das Inhaltsverzeichnis, das in jedem Wikipedia-Artikel enthalten ist, extrahiert und zeigt es in derselben Struktur als MindMap an. Zu jedem Abschnitt aus dem Inhaltsverzeichnis zeigt er schließlich alle Links, die in diesem Abschnitt enthalten sind, an. Großer Vorteil dieser Methode: Die Struktur der MindMap wird durch den Autor des Artikels bestimmt. Nachteil: Auf der tiefsten Ebene sind alle Hyperlinks, die ein Artikel enthält, aufgeführt. Das ist eine wahnsinnige Informationsfülle, da ein Artikel viele hundert Links auf andere Seiten enthalten kann. Der Entwickler der WikiMindMap hat daher alle Knoten zunächst zugeklappt, sonst würde sich eine riesige MindMap ergeben, die den Benutzer mit nicht gewichteten Informationen erschlägt.

Das möchte der KnowledgeMap Server besser machen. Er zeigt alle Beziehungen zu verwandten Themen gewichtet an, und zwar so, dass der Benutzer alle Informationen auf einen Blick erfassen kann ohne etwas aufklappen zu müssen. Schwierigkeit dabei: Eine Metrik zu definieren, mit der sich die Relevanz eines Artikels für einen anderen Artikel berechnen lässt, und zwar ohne dabei auf Hyperlinks oder Inhaltsverzeichnisse zurückgreifen zu müssen. Es soll schließlich eine allgemeine Methode sein, die auf beliebige Dokumente anwendbar ist. Zweites Problem: Die deutsche Wikipedia enthält ungefähr 1 Million Artikel, jeder besteht aus tausenden von Wörtern. Um sie miteinander zu vergleichen müsste man 1.000.000 x 1.000.000 mal jeweils mehrere tausend Wörter analysieren und vergleichen. Der Aufwand wächst quadratisch mit der Anzahl der Dokumente und wird schon bei einer relativ kleinen Anzahl von Dokumenten unbeherrschbar. Diese Berechnungen müssen im voraus durchgeführt werden, da der KnowledgeMap Server extrem performat sein soll und bei mir z.B. auf einem Standard Webspace läuft, den ich für ein paar Euro im Monat bei einem Provider gemietet habe.

Ich habe viel Zeit investiert um den Algorithmus so hinzubekommen, dass der Aufwand linear mit der Anzahl der Dokumente wächst. Ich habe Threading-Pools verwendet, um die Berechnung auf alle Prozessorkerne zu verteilen. Die Ergebnisse werden von einer hochperformanten Datenbank verwaltet. Trotzdem dauert die Berechnung noch mehrere Tage. Was Sie zu Gesicht bekommen ist das Ergebnis dieser Berechnungen, eine Wissenslandkarte, die anstelle vieler Links nur relativ wenige, gewichtete Relationen zu verwandten Artikeln enthält. Die Auswahl dieser Relationen erfolgt ausschließlich aufgrund statistischer Worthäufigkeiten. Das kann schon einmal dazu führen, dass eine solche Relation für Sie keinen Sinn macht. Aber selbst wenn 10 Prozent der Relationen sinnlos erscheinen vermitteln die restlichen 90 Prozent einen solchen Überblick zu dem Thema, den Ihnen kein anderes, mir bekanntes Tool liefert.

Nur ein Beispiel, falls Sie sich z.B. mit Ihrem Geld an Firmen beteiligen möchten: Sie interessieren Konkurrenzfirmen zur Firma XY. Sie rufen die Seite der Firma XY im KnowledgeMap Server auf und sehen zum einen die Firmenbeteiligungen und die Produkte der Firma. Von den Produkten gehen Relationen weiter zu Konkurrenzfirmen, die diese Produkte ebenfalls herstellen. All dies können Sie mit einem Blick erfassen. Sie sind sich jetzt zwar noch nicht sicher, dass Sie wirklich alle Konkurrenzfirmen gefunden haben, aber Sie können auf eines der Produkte klicken und bekommen ausführlicher angezeigt, worum es sich dabei handelt und von welchen Firmen es ebenfalls hergestellt wird. Sie können so in kürzester Zeit Wissen und Verständnis zu einem Thema aufbauen. Das geht so schnell und einfach wie bei keiner anderen mir bekannten Methode. Klar sind dabei auch einmal Informationen enthalten, die für Sie irrelevant sind. Aber da dies nur wenige sind werden diese problemlos von Ihrem Gehirn herausgefiltert.

Ich hoffe, ich konnte Ihnen einen kleinen Einblick in die Funktionsweise des KnowledgeMap Servers und seiner Anwendungsmöglichkeiten geben. Ziel ist es nicht, mit wissenschaftlicher Genauigkeit alle Daten zu einem Thema darzustellen, sondern sich vielmehr schnell einen Überblick zu einem Thema verschaffen zu können.

Mein nächster Schritt besteht darin, ein Wissensnetz für die englische Wikipedia zu erstellen - eine große Herausforderung, da diese 4 mal so umfangreich wie die deutsche Wikipedia ist. Zum Schluss möchte ich Sie noch bitten, mir zu helfen, dieses Wissensnetz für die Wikipedia mehr publik zu machen. Nur wenn sich bei mir auch ein gewisser Erfolg einstellt, kann ich das Projekt über längere Zeit am laufen halten und es auch weiterentwickeln.

Ich wünsche Ihnen noch viel Spaß mit dem InfoRapid KnowledgeMap Server Ingo Straub

Vielleicht sollte man vorher erst mal am Algorithmus feilen. Solange er bei der Suche nach Angela Merkel Das Lemma Bundeskanzler (Deutschland) nicht gefunden wird ist das ganze gelinde gesagt unbrauchbar. --HAL 9000 12:14, 13. Nov. 2010 (CET)Beantworten

Zur Kritik von HAL 9000

[Quelltext bearbeiten]

Hallo HAL 9000, schauen Sie sich die Seite zu Angela Merkel im Wissensnetz bitte nochmals an. Die Aussage, dass sie Bundeskanzlerin ist, finden Sie dort im zweiten Satz. Das genügt völlig und muß später nicht nochmals wiederholt werden. Das Wissensnetz selbst soll nicht einfach dumpf Fakten aufzählen wie geboren in ... am ... studierte ... arbeitete von ... bis ... bei der Firma ... usw. Dazu ist eine Tabelle viel besser geeignet. Bei Frau Merkel handelt es sich um eine Person, d.h. das Wissensnetz stellt hauptsächlich die Beziehungen der Person Angela Merkel zu anderen Personen aus ihrem Umfeld dar. Wenn Sie etwas anderes erwarten müssen Sie das entsprechende Wissensnetz selbst erstellen.

Solche grundlegenden Sachen sollten an sich auf der Seite erklärt werden schon damit man keine falsche Erwartungshaltung hat. Dann gibt es sicher auch eine tiefere Beziehung zwischen ihr und der Bundestagswahl 1980, die ein Programm findet aber ich in meiner Unwissenheit einfach nicht wahrnehme. --HAL 9000 12:23, 14. Nov. 2010 (CET)Beantworten

Zu jedem Knoten im Wissensnetz wird ab sofort ein Erklärungstext in einem Tooltip angezeigt.

21.11.2010 - Wissensnetz für die englische Wikiepdia online

[Quelltext bearbeiten]

Seit heute ist das Wissensnetz für die englische Wikipedia online. Es kann über die URL [http://en.inforapid.org en.inforapid.org] aufgerufen werden. Auch das Wissensnetz für die deutsche Wikipedia wurde komplett überarbeitet und mit einer neuen Suchfunktion ausgestattet.

Hallo! Falls du den Kurier weiter zu deinem privaten Update-Ticker umfunktionierst, werde ich versucht sein, den Absatz zum Wissensnetz wieder zu verkürzen bis "Es handelt sich dabei um ein nichtkommerzielles Projekt". --Martina Nolte Disk. 21:55, 21. Nov. 2010 (CET)Beantworten