next up previous contents
Next: 3-dimensionaler Testdatensatz ohne Hintergrund Up: Testdaten und zus"atzliche Eigenschaften Previous: 2-dimensionaler Testdatensatz getrennter Cluster

2-dimensionaler Testdatensatz mit Dichtestaffelung

 

Ein weiterer Vorteil des Algorithmus ist seine F"ahigkeit, Cluster unterschiedlicher Dichte zu detektieren. Zum Test dieser Eigenschaft dient das Beispiel aus Abbildung 4.6, welches wie der eben verwendete Datensatz aus 6000 Punkten besteht.

  figure260
Figure 4.6: 2-dimensionaler Testdatensatz mit Dichtestaffelung und tex2html_wrap_inline3782-Diagramm f"ur Voronoi-Nachbarschaft.

Die Punkte sind auf drei Zonen aufgeteilt. Zun"achst werden 3000 Punkte auf einer Fl"ache von 2 x 2 mit einem gleichverteilenden Zufallszahlengenerator verteilt. Dazu kommen dann 2000 Punkte auf einer Fl"ache von 4/3 x 4/3 und zum Schluss noch 1000 Punkte auf das innere Neuntel der Fl"ache.

Diese Punktanordnung f"uhrt dazu, dass die Dichte der Punkte von au"sen nach innen zunimmt. In der "au"seren Zone ist die Dichte 750 Punkte/Einheitsfl"ache, in der mittleren 1875 Pkt./EF. und im Zentrum 4125 Pkt./EF. Demzufolge sollten nacheinander zwei Cluster mit etwa 4333 Punkten (mittlere und innere Zone) und 1833 Punkten (innere Zone) detektiert werden.

Der Modellmagnet wird mit zunehmender Temperatur nicht nur eine Region erh"ohter Suszeptibilit"at aufweisen, vielmehr werden f"ur N Cluster unterschiedlicher Dichte Maxima f"ur N Phasen"uberg"ange auftreten.

Tats"achlich sind im Verlauf der Suszeptibilit"at mit wachsender Temperatur drei markante lokale Maxima zu beobachten. Im Temperaturbereich zwischen den Maxima ist die Suszeptibilit"at deutlich h"oher als bei niedrigen und sehr hohen Temperaturen. Die Maxima werden so interpretiert, dass sich beim ersten Maximum die inneren beiden Zonen von der "au"seren Punktwolke trennen. Bei dem zweiten Anstieg trennt sich von dem eben entstandenen Cluster der zentrale Cluster, wohingegen der restliche Teil bereits in die paramagnetische Phase "ubergeht.

Das dritte Maximum l"asst sich dadurch erkl"aren, dass bei dieser Temperatur der zentrale Cluster durch den "Ubergang in die paramagnetische Phase zerf"allt und dabei kurzzeitig viele kleinere Cluster entstehen, die daf"ur sorgen, dass die Suszeptibilit"at drastisch ansteigt. Dieses Maximum ist also kein Hinweis auf eine weitere detektierbare Struktur in unserem Sinne der Clusterdetektion. Offenbar ist dies ein unerw"unschter Nebeneffekt des implementierten Algorithmus, zumal dieser Effekt nicht bei jedem untersuchten Datensatz auftrat.

Aus dem Verlauf des Suszeptibilit"atsdiagramms lassen sich demzufolge zwei Temperaturbereiche f"ur unsere Clusterbestimmung ableiten, tex2html_wrap_inline3964 und tex2html_wrap_inline3966.

  
Figure: Ergebnisse der Clusteranalyse des Datensatzes mit Dichtestaffelung f"ur tex2html_wrap_inline3968 (links) und tex2html_wrap_inline3970 (rechts).

Die Ergebnisse der daraufhin unternommenen Analyse sind in Abbildung 4.7 dargestellt.Bei tex2html_wrap_inline3968 wird eindeutig ein Cluster mit 4392 Punkten (hier schwarz gef"arbt) identifiziert, die restlichen Punkte (grau) sind in Clustern mit einer Maximalgr"o"se von 10 Punkten angeordnet. Im rechten Teil der Abbildung 4.7 ist das Ergebnis bei tex2html_wrap_inline3970 zu sehen. Dominiert wird die Darstellung von dem zentralen Cluster mit 2017 Punkten (schwarz). Weiterhin sind noch sechs Cluster mit Gr"o"sen zwischen 24 und 49 Punkten erkannt worden.

Die vorgestellte Methode ist in der Lage, die mit blo"sen Auge erkennbaren Strukturen in den Testdaten als Cluster zu detektieren. Die geringe Punktanzahl ist daf"ur verantwortlich, dass der Zufallszahlengenerator keine echte Gleichverteilung der Punkte gew"ahrleisten kann. Deshalb weicht die Form des zentralen Clusters etwas von der quadratischen Form ab. Aus eben diesem Grund werden auch im weniger dicht besetzten Umfeld des zentralen Clusters kleine H"aufungen gefunden, in denen die Dichte erheblich h"oher ist als in der weiteren Umgebung; sie werden folgerichtig als Cluster detektiert.


next up previous contents
Next: 3-dimensionaler Testdatensatz ohne Hintergrund Up: Testdaten und zus"atzliche Eigenschaften Previous: 2-dimensionaler Testdatensatz getrennter Cluster

Udo Schwarz
Thu Mar 1 15:43:04 MET 2001