Diskussion:PageRank
Auf dieser Seite werden Abschnitte ab Überschriftenebene 2 automatisch archiviert, die seit 14 Tagen mit dem Baustein {{Erledigt|1=--~~~~}} versehen sind. Die Archivübersicht befindet sich unter Archiv. |
Wert der Anteile der Uni Stanford
[Quelltext bearbeiten]Laut dem hier im Artikel verlinkten Artikel http://www.redorbit.com/news/education/318480/stanford_earns_336_million_off_google_stock/ erhielt die Uni Stanford 1.8 Mio Anteile, nicht Anteile im Wert von 1.8 Mio Dollar. Ich würde vorschlagen, das zu berichtigen. --Idna 18 (Diskussion) 13:15, 10. Feb. 2016 (CET)
- Danke, ich habe es angepasst. --Doc ζ 13:47, 10. Feb. 2016 (CET)
Beispielgrafik hinzufügen
[Quelltext bearbeiten]Grundsätzlich finde ich, dass dies ein sehr schöner Artikel ist, der kurz und knapp alle relevanten Fakten präsentiert und auch keine inhaltlichen Fehler aufzuweisen scheint. Allerdings ist mir aufgefallen, dass die englische Version dieses Artikels gleich mit einer Visualisierung des PageRanks für ein kleines Netzwerk beginnt. Dies scheint mir eine sehr sinnvolle Ergänzung für die Einleitung zu sein, da sonst alle Nichtmathematiker direkt nach dem Inhaltsverzeichnis Gefahr laufen, von den Formeln »erschlagen« zu werden. Ich werde die Grafik deshalb gleich mal übernehmen – wie sagt man doch so schön: Ein Bild sagt mehr als tausend Worte … --Frakturfreund 03:00, 8. Jul. 2009 (CEST)
- Beispiele sind zwar gut, dieses Beispiel ist jedoch schlecht, da es nicht zur angegebenen Formel
- passt. Also das Beispiel korrigieren (und die Grafik schmaler einbinden), das Beispiel entfernen oder ein anderes einfügen. --79.222.150.249 08:51, 8. Jul. 2009 (CEST)
- Hallo 79.222.150.249, was die Größe der Beispielgrafik angeht muss ich Dir Recht geben, mir war sie so auch zu groß. Leider kann man die diversen Formatierungsvorgaben für Bilder anscheinend nicht beliebig miteinander kombinieren :-(, aber in der aktuellen Version des Enwurfes sollte dieses Problem behoben sein.--Frakturfreund 13:54, 8. Jul. 2009 (CEST)
- Hallo 79.222.150.249, was die Mathematik angeht muss ich Dir jedoch widersprechen: Das Beispiel ist korrekt – welche abweichende Wahrscheinlichkeitsverteilung hast Du denn ausgerechnet? Aber wahrscheinlich hast Du einfach versucht, die in der Grafik angegebenen Prozentwerte direkt in die von Dir zitierte Formel einzusetzen. Ein Problem bei diesem Ansatz ist jedoch, dass hier eine andere Normalisierung des PageRanks vorliegt als bei der Sicht als Wahrscheinlichkeitsverteilung (genaueres hierzu findest Du auf der englischen Diskussionsſeite: Changing the damping factor […] leads to re-scale of PageRank (due to the PageRank source of 1-d)). Wenn Du das Beispiel also komplett nach dieser Formel ausrechnest und dann am Ende alle Werte durch teilst, solltest Du auf dieselben Prozentwerte kommen. --Frakturfreund 15:26, 8. Jul. 2009 (CEST)
- Das Beispiel ist nicht korrekt, weil die Normierung nicht korrekt ist (bzw. nicht zu den im Text genannten Normierungen passt). Entweder mann normiert das Ganze wie in
- (Durch Seiten, die keine ausgehende Links besitzen, ist der totale PageRank in dem Beispiel kleiner als 1. Hätten alle Seiten ausgehende Links wär' die Normierung automatisch eins.) oder so wie im Bereich Zufallsurfer beschrieben auf 1, jedoch nicht auf 100. Vermutlich sind die Angaben in Prozent gemeint, nur dann muss man es auch schreiben (und zwar in die Grafik selber und nicht nur unter die Bildunterschrift - das überliest man sonst leicht und führt nur zur Verwirrung). --79.222.150.249 17:06, 8. Jul. 2009 (CEST)
- Hallo 79.222.150.249, erstmal vielen Dank für Deine stetigen Rückmeldungen! Zusammen sollten wir dieses Beipiel sachlich korrekt hinkriegen :-). Zur Sache: Die Angaben in der Grafik sind tatsächlich als prozentuale Angaben gemeint, ich habe das jetzt erstmal in der Bildunterschrift ergänzt (und werde das heute Abend wie von Dir vorgeschlagen auch auf Commons nachtragen). Die einzige Seite, die im Beispiel keine ausgehenden Links hat, ist Seite A, und hier steht ganz klar in der Bildbeschreibung: Da Seite A keine anderen Seiten referenziert, wurden bei der Berechnung des PageRanks Links zu allen vorhandenen Seiten hinzugefügt, genau so wie es im Artikel vorgeschlagen wird, so dass die Angaben auf normiert sind. --Frakturfreund 17:39, 8. Jul. 2009 (CEST)
- Inzwischen habe ich auf Commons das Prozentzeichen hinzugefügt; auf die »künstlich« hinzugefügten Links der Seite A sollten wir aber lieber verzichten, da dies die Grafik nur unnötig verkomplizieren würde. --Frakturfreund 18:21, 8. Jul. 2009 (CEST)
- Außerdem befindet sich das Beipiel gleich direkt neben der Anleitung, in der die von Dir erwähnte Formel noch gar nicht vorkommt. Stattdessen steht dort: Der PageRank-Algorithmus bildet einen zufällig durch das Netz surfenden User nach. Die Wahrscheinlichkeit, mit der dieser auf eine Webseite stößt, korreliert mit dem PageRank.. Von daher scheint es mir schon sinnvoll/natürlich zu sein, das Bespiel auf zu normieren. Wie ursprünglich gesagt, ging es mir darum, mit diesem Beispiel auch Nichtmathematiker anzusprechen, und da ist es durchaus üblich anstatt von zu schreiben. --Frakturfreund 17:56, 8. Jul. 2009 (CEST)
- Wenn Du jetzt noch "Da Seite A keine anderen Seiten referenziert, wurden bei der Berechnung des PageRanks Links zu allen vorhandenen Seiten hinzugefügt." durch "Bei Seiten, die keine anderen Seiten referenzieren, wurden bei der Berechnung des PageRanks Links zu allen vorhandenen Seiten hinzugefügt." ersetzt (gilt außer für A auch für die lila Seiten) und das Beispiel zum Abschnitt "Der PageRank-Algorithmus" verschiebst, da es auf die Mathematik bezieht und konkrete Werte angibt und somit über die allgemeine Einleitung hinausgeht, bin ich zufrieden :-) - dem Leser wird's auf jeden Fall helfen. Mit "5%" statt "0,05" habe ich keine Probleme - mit "5" aber schon. Die amerikanische Formatierung der Dezimalstellen finde ich zwar nicht so schön, aber nicht problematisch.--79.222.150.249 19:04, 8. Jul. 2009 (CEST)
- Wer sagt’s denn, so langsam finden wir doch noch zueinander. Aber noch sind wir noch nicht ganz soweit: a) Was die lila Seiten angeht, kann ich Deine Argumentation leider inhaltlich nicht nachvollziehen, da jede dieser Seite bereits einen oder zwei ausgehende Links hat und es somit bei der Berechnung nicht notwendig ist, hier »künstliche« Links zu ergänzen. b) Findest Du wirklich, dass diese Grafik in den »algorithmischen« Teil verschoben werden sollte? Es sind zwar konkrete Zahlen angegeben, aber es fehlt doch die genaue Herleitung, was ich im »mathematischen« Teil erwarten würde. Ich finde dieses Bild eigentlich in der Einleitung sehr passend … wobei man hier im Prinzip auch komplett auf die Zahlen verzichten könnte. Vielleicht sollten wir hier einfach mal andere Meinungen abwarten. c) Was "5" statt "5%" bzw. "0,05" angeht hast Du natürlich recht, das ist mathematisch gesehen einfach nur falsch. Was "3.6%" (englisch) statt "3,6 %" (deutsch) angeht, habe ich das bewusst so gelassen, da diese Seite auf Commons liegt und so auch von der englischen Version des PageRank-Artikels eingebunden wird. Eine eigene Dateiversion nur für die deutschen typographischen Gepflogenheiten zu erstellen, schien mir hier einfach etwas übertrieben zu sein. Viele Grüße, --Frakturfreund 19:34, 8. Jul. 2009 (CEST)
- Mit den lila Seiten hast Du Recht - da hab' ich in der Hektik nicht aufgepasst. Die Position der Grafik finde ich nicht entscheidend - aber passender bei "Der PageRank-Algorithmus" (wegen der Nachvollziehbarkeit der Werte. Ohne Zahlen fände ich die Grafik schlechter). Ich hatte gesehen, dass die Datei auf Commons liegt und sooo wichtig fand ich die Formatierung auch nicht. --79.222.150.249 19:58, 8. Jul. 2009 (CEST)
- Ich habe eben die Grafik wie von Dir vorgeschlagen in den Abschnitt "Der PageRank-Algorithmus" verschoben – vielleicht ist die Grafik dort wirklich besser aufgehoben. Aber das wichtigste: Damit scheinen wir jetzt tatsächlich alle das Beispiel betreffenden offene Punkte aufgelöst zu haben. --Frakturfreund 03:07, 9. Jul. 2009 (CEST)
Gespiegelter PageRank
[Quelltext bearbeiten]Im Artikel zum gespiegeltem PageRank wurde sinnvollerweise vorgeschlagen, die Thematik hier im Artikel einzubauen. Daher bin ich gerade dabei, den Abschnitt "Manipulation" zu erweitern. Spricht irgendetwas dagegen, auch den Link zu http://www.crsystem.de/?s=pagerank-check.html zu übernehmen? --AdamSmith 11:43, 5. Mär. 2010 (CET)
- Danke für die Ergänzung, ich habe es noch etwas umzuformulieren. Gespiegelter PageRank kann mMn in ein Redirect auf das Kapitel umgewandelt werden. Der obige Link ist zum Thema PageRank nicht geeignet (s.a. WP:WEB), da er erstens keine weiterführenden Informationen bietet und zweitens nur ein Unter-Unter-Unterthema des Lemma behandelt. Zudem ist es nichts weiter als eine "info:"-Abfrage bei Google. --Doc ζ 13:38, 5. Mär. 2010 (CET)
- Danke, sieht gut aus. --AdamSmith 13:47, 5. Mär. 2010 (CET)
- Allerdings meine ich, dass ein Hinweis auf die Site-Abfrage durchaus einen Mehrwert für den Leser darstellen dürfte. Vielleicht könntest Du Deine Überarbeitung in diesem Sinne noch etwas ausbauen. --AdamSmith 14:13, 5. Mär. 2010 (CET)
- Ich finde ganz grundsätzlich, dass dieses Lemma den Page Rank eher als abstrakten mathematischen Algorithmus behandeln sollte; eine (wenngleich die bei weitem bekannteste) Implementierung ist zwar die in der Suchmaschine von Google, aber konkrete Manipulationen des Google-Pageranks sollten auch eher dort eingebaut werden. --Frakturfreund 14:28, 5. Mär. 2010 (CET)
- Nö, die PageRank-Spiegelung ist keine Manipulation der Suchergebnisse - steht hier auch so drin. Deshalb ist es bei Google#Manipulation_der_Suchergebnisse falsch aufgehoben. Zudem ist die Anzeige des PageRank in der Toolbar (darum geht es bei der Spiegelung) eindeutig ein Unterpunkt von PageRank-Thema. --Doc ζ 14:38, 5. Mär. 2010 (CET)
- Da hast Du schon recht, meine Anmerkung war aber ganz grundsätzlich gemeint: Ich persönlich finde tatsächlich den gesamten Unterabbschnitt Toolbar- und Verzeichnis-Werte auch nicht wirklich zum Lemma passend, da er sich ausſchließlich auf die konkrete Suchmaschinen-Engine von Google (über die man halt nicht alles Bescheid weiß) und nicht auf den abstrakten Algorithmus an sich (als Gegenstand der wissenschaftlichen Forschung) bezieht. Von daher fände ich es schöner, solche konkreten Eigenschaften der Suchmaschine von Google auch irgendwo dort in Google#Technik mit einzubauen. Oder dies hier im Artikel sauberer zu trennen, indem man etwa einen Unterpunkt Einsatz/Implementierung/Umsetzung bei Google (oder so) einbauen könnte. Diese Meinung muss man nicht teilen, aber ich empfände es halt als Verbesserung. --Frakturfreund 15:33, 5. Mär. 2010 (CET)
- Jetzt ist es zumindest klarer was Du meinst. Da Google den Algorithmus als einziger einsetzt, fände ich die Trennung und Verschiebung zwar formal nachzuvollziehen, aber Leserunfreundlich und nicht gut. Eine Umstrukturierung mit einem Unterpunkt "Einsatz/Implementierung/Umsetzung bei Google" gefällt mir aber gut. --Doc ζ 16:00, 5. Mär. 2010 (CET)
- Super, das wäre für mich auch die beste Lösung! Wenn sich hier kein Widerspruch mehr regt, werde ich das dann bald mal in Angriff nehmen (hoffentlich noch an diesem Wochenende, aber ich kann nichts versprechen).
- Und in der englischen Version des Lemmas werden durchaus auch noch ein paar andere Beispiele für die Verwendung des Algorithmus außerhalb von Google genannt, aber natürlich bleibt die Google-Suchmaschine der mit riesigem Abstand wichtigste Anwendungsfall. --Frakturfreund 16:25, 5. Mär. 2010 (CET)
- Jetzt ist es zumindest klarer was Du meinst. Da Google den Algorithmus als einziger einsetzt, fände ich die Trennung und Verschiebung zwar formal nachzuvollziehen, aber Leserunfreundlich und nicht gut. Eine Umstrukturierung mit einem Unterpunkt "Einsatz/Implementierung/Umsetzung bei Google" gefällt mir aber gut. --Doc ζ 16:00, 5. Mär. 2010 (CET)
- Da hast Du schon recht, meine Anmerkung war aber ganz grundsätzlich gemeint: Ich persönlich finde tatsächlich den gesamten Unterabbschnitt Toolbar- und Verzeichnis-Werte auch nicht wirklich zum Lemma passend, da er sich ausſchließlich auf die konkrete Suchmaschinen-Engine von Google (über die man halt nicht alles Bescheid weiß) und nicht auf den abstrakten Algorithmus an sich (als Gegenstand der wissenschaftlichen Forschung) bezieht. Von daher fände ich es schöner, solche konkreten Eigenschaften der Suchmaschine von Google auch irgendwo dort in Google#Technik mit einzubauen. Oder dies hier im Artikel sauberer zu trennen, indem man etwa einen Unterpunkt Einsatz/Implementierung/Umsetzung bei Google (oder so) einbauen könnte. Diese Meinung muss man nicht teilen, aber ich empfände es halt als Verbesserung. --Frakturfreund 15:33, 5. Mär. 2010 (CET)
- Nö, die PageRank-Spiegelung ist keine Manipulation der Suchergebnisse - steht hier auch so drin. Deshalb ist es bei Google#Manipulation_der_Suchergebnisse falsch aufgehoben. Zudem ist die Anzeige des PageRank in der Toolbar (darum geht es bei der Spiegelung) eindeutig ein Unterpunkt von PageRank-Thema. --Doc ζ 14:38, 5. Mär. 2010 (CET)
- Ich finde ganz grundsätzlich, dass dieses Lemma den Page Rank eher als abstrakten mathematischen Algorithmus behandeln sollte; eine (wenngleich die bei weitem bekannteste) Implementierung ist zwar die in der Suchmaschine von Google, aber konkrete Manipulationen des Google-Pageranks sollten auch eher dort eingebaut werden. --Frakturfreund 14:28, 5. Mär. 2010 (CET)
Kategorie Graphentheorie
[Quelltext bearbeiten]Ich habe bereits am 21. August 2009 den Artikel über Pagerank in die Kategorie Graphentheorie einordnen wollen, was damals abgelehnt wurde http://de.wikipedia.org/w/index.php?title=PageRank&oldid=63625813 Pagerank ist mittlerweile in Forschung und Wissenschaft ein Standardverfahren, um Relevanz und Autoritäten in Graphen zu bestimmen. Eine einfache Abfrage nach "graph theory" in der Menge aller Paper, welche die Quellarbeiten von Page und Brin zitieren auf Google Scholar zeigt, dass bereits 2400 Paper aus dem Bereich graph theory die Arbeit von Page und Brin zitieren. http://scholar.google.de/scholar?hl=de&sciodt=0&q=graph+theory&btnG=Suche&lr=&cites=5607911455750926614&scipsc=1&as_ylo=&as_vis=0
Auf Grund dieses Argumentes würde ich hier gerne die Diskussion eröffnen, den Artikel in die Kategorie Graphentheorie einzuordnen! -- Renepick 19:09, 13. Sep. 2011 (CEST)
- Von mir aus immer doch! --arilou (Diskussion) 15:29, 25. Mai 2012 (CEST)
- Wie ich ja schon in der Diskussion nach meinem damaligen Revert schrieb: An mir wird diese Kategorisierung nicht scheitern. Es ist aber weiterhin so, dass das Wort "Graph" im Artikel nur ein einziges Mal auftaucht, und auch da nur in einer Bildbeschreibung. Das ist ein bisschen wenig für einen Artikel, der für sich in Anspruch nimmt, ein Thema der Graphentheorie zu behandeln. Gegenüber der blossen Kategorisierung wäre also auf jeden Fall die Beschreibung der graphentheoretischen Aspekte, Überlegungen, Effekte und Auswirkungen im Artikel (mit Kategorisierung) vorzuziehen. --YMS (Diskussion) 15:48, 25. Mai 2012 (CEST)
- Ich finde, dass man im Artikel noch klarer zwischen dem PageRank als mathematische Konstruktion und der konkreten Implementierung bei Google mit allem was da praktisch dran hängt (Toolbarverzeichnis, Manipultionsversuche etc.) trennen sollte. Das der »mathematische« Kern des Lemmas zur Graphentheorie gehört, dürfte wohl unstrittig sein. --Frakturfreund (Diskussion) 23:07, 14. Jul. 2012 (CEST)
neue Beispiel-Grafik
[Quelltext bearbeiten]Ich habe die Beispiel-Grafik ersetzt, da die dort angegebenen Zahlen nicht mit den von meinem PC errechneten übereinstimmen. Auch ist es falsch, Wahrscheinlichkeiten in Prozent anzugeben. --Arno Matthias (Diskussion) 13:06, 22. Jul. 2012 (CEST)
- Beide Grafiken sind richtig. Und selbstverständlich kann man Wahrscheinlichkeiten in Prozent angeben. Der Unterschied ergibt sich durch die Normierung. Da es ein "totes Ende" in dem Graphen gibt, ist die Summe alle PageRank-Werte nicht gleich eins. Dividiert man die einzelnen PageRank-Werte durch die Summe alle PageRank-Werte, so erhält man die Wahrscheinlichkeiten, die mit den Werten der alten Grafik übereinstimmen. (s.a. Abschnitt Beispielgrafik hinzufügen oben bzw. Zufallssurfer-Modell im Artikel)
- Nichtsdestotrotz finde ich die neue Grafik besser, da die Werte sich direkt auf die Definition des PageRank-Algorithmus beziehen. --Doc ζ 13:24, 22. Jul. 2012 (CEST)
alternative Konstruktion
[Quelltext bearbeiten]Guten morgen, ich habe gerade angefangen die alternative konstruktion der PageRanks als Markovkette reinzustellen. es ist alles noch kraut und rüben, ich werd aber probieren die schreibweisen sobalt wie möglich zu vereinheitlichen und diese Baustelle abzuschließen. könntet ihr mir bitte noch eine rückmeldung geben, ob die neue (alternative) konstruktion verständlich ist? ist eben alles recht mathelastig. LG --NikelsenH (Diskussion) 07:34, 23. Jun. 2013 (CEST)
- Wenn Du es selber so siehst, dann frage ich mich, warum Du es in der Form eingestellt und nicht weiter vorbereitet sowie hier zur Diskussion gestellt hast, insbesondere wenn der Artikel vorher verbesserungswürdig, aber keine Katastrophe war. Alles weitere und Details dazu weiter unten. --Doc ζ 15:07, 23. Jun. 2013 (CEST)
Algorithmus zum Patent anmelden?
[Quelltext bearbeiten]Wie kann das denn? Ein mathematisches Modell ist nicht patentierbar; das gilt auf dem gesamten Globus. (nicht signierter Beitrag von 188.101.1.112 (Diskussion) 23:13, 7. Feb. 2014 (CET))
- Mitunter ist jedoch eine Software-Implementierung davon patentierbar (zumindest in den USA); und nicht jeder Patentamt-Mitarbeiter kennt alle Regelungen, so dass immer wieder Patente fällschlich zuerkannt werden.
- PS: Alles unter Vorbehalt, ich bin kein Jurist.
- --arilou (Diskussion) 08:54, 10. Feb. 2014 (CET)
- Softwarepatente sind ein ganz großes Gift für den Fortschritt. Die Wikipedia hat dazu zwei passende Artikel Softwarepatent und Trivialpatent. --IT-Compiler (Diskussion) 03:18, 28. Jul. 2022 (CEST)
Neuer Weblink
[Quelltext bearbeiten]Ich schlage folgenden Link zur wissenschaftlichen Arbeit von Brin und Page vor, in der sie die Idee des PageRank-Algorithmus erklären: http://infolab.stanford.edu/~backrub/google.html#pr (nicht signierter Beitrag von Marcuskreusch (Diskussion | Beiträge) 10:47, 12. Sep. 2014 (CEST))
Wie wäre es mit einem Verweis auf den Page Rank Simulator von Andrew Scholer http://faculty.chemeketa.edu/ascholer/cs160/WebApps/PageRank/ ? .-- HRKaiser 12:45, 4. Oct. 2017 (CEST)
- Ich finde den Link nicht besonders hilfreich (bspw. weil er keinerlei Infos enthält) und er widerspricht meiner Meinung nach auch WP:WEB. --Doc ζ 13:23, 4. Okt. 2017 (CEST)
von - bis / hoch - niedrig
[Quelltext bearbeiten]Eigentlich wollte ich nur schnell wissen,
- von wo bis wo der Pagerank-Wert gehen kann und
- ob eine hohe Zahl für hohe Relevanz steht oder für niedrige Relevanz.
Ausgerechnet diese Informationen sind aber nicht schnell ersichtlich, schon gar nicht in der Einleitung. Mal als Anregung für die aktiven Autoren hier. --Giraldillo (Diskussion) 14:43, 16. Sep. 2014 (CEST)
- "PageRank" ist nicht Google-exklusiv, auch andere Suchmaschinen verwenden solche Algorithmen.
- Und ob dabei "hoch"=wichtig oder =unwichtig bedeutet, ob es überhaupt Ober- und/oder Untergrenzen gibt, ist unterschiedlich.
- Solche Detail-Informationen bitte direkt bei Google/Yahoo/Bing und Konsorten nachfragen, sofern sie überhaupt veröffentlicht werden. Wikipedia ist kein Google-Howto.
- --arilou (Diskussion) 15:10, 16. Sep. 2014 (CEST)
- dann würde ich dich herzlich bitten, dich in der Disk zu Wikipedia:Richtlinien_Websites#Positive_Indizien einzubringen, damit der dann ja sinnfreie Zahlenwert in "...ein hoher Pagerank in Suchmaschinen (ab ca. 6–7),... können ein Indiz für Relevanz sein" dort verbessert wird. --Giraldillo (Diskussion)
- s. auch Wikipedia:Löschprüfung#Netzkino