Clusterkoeffizient

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Der Clusterkoeffizient (engl. clustering coefficient) ist in der Graphentheorie ein Maß für die Cliquenbildung bzw. Transitivität in einem Netzwerk. Sind alle Nachbarn eines Knotens paarweise verbunden, also jeder mit jedem, dann bilden sie eine Clique. Dies ist gleichbedeutend mit dem Begriff der Transitivität, denn innerhalb einer Clique gilt: Ist A mit B verbunden und A mit C, so sind auch B und C verbunden.[1] Man unterscheidet zwischen dem globalen Clusterkoeffizienten, der das gesamte Netzwerk charakterisiert und dem lokalen Clusterkoeffizienten, der einen einzelnen Knoten charakterisiert.

Globaler Clusterkoeffizient

[Bearbeiten | Quelltext bearbeiten]
Drei Knoten sind oben zu einem Dreieck verbunden, unten bilden drei Knoten ein „verbundenes Tripel“. Der Graph hat einen globalen Clusterkoeffizienten von , da man 1 Dreieck zählt und 4 „verbundene Tripel“

Der globale Clusterkoeffizient , auch Transitivität genannt,[2] ist definiert als das Verhältnis der Anzahl von Dreiecken zu „verbundenen Tripeln“ in einem Netzwerk (siehe nebenstehende Abbildung).

.

Ein Dreieck sind drei Knoten, die alle untereinander verbunden sind. Dagegen ist ein verbundenes Tripel ein Knoten A und ein ungeordnetes Paar von zwei Knoten B und C, wobei A Kanten zu B und C hat.[1] Jedes Dreieck bildet somit 3 verbundene Tripel. Der Faktor 3 im Zähler der Formel kompensiert dies.[2] Nur mit dem Faktor 3 erhält ein Netzwerk bestehend aus einem einzigen Dreieck den Clusterkoeffizient , was einer perfekten Clique entspricht.

Lokaler Clusterkoeffizient

[Bearbeiten | Quelltext bearbeiten]

Der von Duncan Watts und Steven Strogatz definierte[3] lokale Clusterkoeffizient eines Knotens in einem Graphen bezeichnet in der Graphentheorie den Quotienten aus der Anzahl der Kanten, die zwischen seinen Nachbarn tatsächlich verlaufen (), und der Anzahl an Kanten, die zwischen diesen Nachbarn maximal verlaufen könnten (ungerichteter Graph: ):

Diese Formel gilt für einen ungerichteten Graph, für einen gerichteten Graph entfällt der Faktor 2, da doppelt so viele Kanten zwischen den Nachbarn möglich sind wie in einem ungerichteten Graph.

Graph mit sechs Knoten

In dem nebenstehenden Graph hat der Knoten 1 die Nachbarn 2 und 5. Zwischen diesen Nachbarn ist eine Kante möglich und auch vorhanden, so dass der Clusterkoeffizient ist. Der Knoten 2 hat 3 Nachbarn, zwischen denen 3 Kanten möglich sind, jedoch sind nur die Nachbarknoten 1 und 5 durch eine Kante verbunden. Der Clusterkoeffizient ist daher . Der Clusterkoeffizient von Knoten 6, also sämtlicher Knoten des Grades 1, ergibt laut Berechnung die Division Null durch Null. In manchen Implementierungen wird dies mit dem Wert 1 umgesetzt; bei vielen Knoten dieser Art resultiert ein unnatürlich hoher globaler Clusterkoeffizient. Andere Autoren wiederum definieren den lokalen Clusterkoeffizienten für isolierte Knoten und Knoten vom Grad 1 durch .[1] Mit der letztgenannten Konvention ergeben sich für nebenstehendes Bild folgende lokale Clusterkoeffizienten bis :

.

Der lokale Clusterkoeffizient kann äquivalent auch als

definiert werden.

Als globaler Clusterkoeffizient wird oft auch das Mittel aller lokalen Clusterkoeffizienten bezeichnet:

.

Diese Definition liefert nicht denselben Wert wie die erste Definition des globalen Clusterkoeffizientens; die Reihenfolge der Berechnung des Dreieck-zu-Tripel-Verhältnisses einesteils und der Mittelung andererseits ist vertauscht. Der Unterschied besteht effektiv in der Umkehrung der Operationen der Verhältnisberechnung von Dreiecken und Tripeln und der Mittelung: Die letztere Definition ist das Mittel des Dreieck-zu-Tripel-Verhältnisses, die erstere berechnet in gewisser Weise das Verhältnis der mittleren Anzahl von Dreiecken zu der mittleren Anzahl von Tripeln.[1] Beide Definitionen und können sehr unterschiedliche Ergebnisse liefern: Für das gezeigte Netzwerk ergibt sich und .

lässt sich auf dem Computer einfacher berechnen und wird daher in numerischen Studien häufig verwendet.[1]

Kleine-Welt-Netzwerke haben – unabhängig von der gewählten Definition – meist hohe Clusterkoeffizienten, Zufallsgraphen dagegen eher niedrige.

Commons: Clustering coefficient – Sammlung von Bildern, Videos und Audiodateien
  1. a b c d e M. E. J. Newman: The Structure and Function of Complex Networks, SIAM Review 45, 167 (2003), S. 183
  2. a b S. Boccaletti, V. Latora, Y. Moreno, M. Chavez, and D. U. Hwang: Complex networks: Structure and dynamics, Physics Reports 424, 175 (2006)
  3. D. J. Watts and Steven Strogatz: Collective dynamics of 'small-world' networks. In: Nature. 393. Jahrgang, Nr. 6684, Juni 1998, S. 440–442, doi:10.1038/30918, PMID 9623998, bibcode:1998Natur.393..440W (nature.com).