Visualisierung der Zitationsnetzwerke
Contents
Visualisierung der Zitationsnetzwerke#
In diesem Notebook möchten wir nun die im vorherigen Notebook gebildeten Netzwerke darstellen und untersuchen. Dafür nutzen wir Gephi, eine Open Source Software zur Visualisierung von Graphen. Um die verschiedenen historischen Zitationsnetzwerke vergleichbar zu machen, wählen wir bei allen Netzwerken die selben Parameter:
Die Farbe der Knoten stellt die modularity, d.h. die Subgruppen-Zugehörigkeit dar.
Die Größe der Knoten stellt deren In-Degree dar (min = 10, max = 50). Der Grad eines Knotens lässt sich als Maß der Eingebundenheit in das umgebende Netzwerk interpretieren. Je mehr gerichtete Kanten zu einem Knoten zeigen, desto höher der Indegree dieses Knotens (Jansen 2003, S. 95f.). In Zitationsnetzwerken stellt der In-Degree demnach den Einfluss eines Knotens dar, denn: je höher der Knoten, desto mehr Zitationen.
Die Größe der Labels stellt die betweeness der Knoten dar (min = 1, max = 5). Diese ist ein sogenanntes Zentralitätsmaß und sagt daher etwas über die Position eines Knotens im Netzwerk aus. Je höher die betweeness eines Knotens, desto mehr Wege führen durch diesen (Jansen 2003, S. 148).
Gephi stellt verschiedene Layout-Algorithmen bereit, welche die Graphen unterschiedlich darstellen. Für unsere Visualisierungen nutzen wir den ForceAtlas-Algorithmus. Dieser wurde von Gephi selbst entwickelt und ermöglicht eine gute Lesbarkeit bei einer geringen Anfälligkeit für Biases beim Plotten (Gephi, 2011, S. 11). Der Algorithmus zieht dabei stark miteinander verbundene Knoten eng zusammen und schiebt weniger stark verbundene Knoten auseinander (Mosse 2020). Für eine noch bessere Darstellung nutzen wir außerdem die Noverlap- und den LabelAdjust-Algorithmen, die dafür sorgen, dass keine Knoten oder Labels übereinander liegen.
Legende:
Die ersten sieben Subgruppen des Netzwerks werden farbig codiert, die restlichen Gruppen sind in grau dargestellt. Diese sieben Gruppen stellen die verhältnismäßg größten Gruppen im Netzwerk dar. Für die Netzwerke bis einschließlich 2015 entspricht die Farbcodierung immer der gleichen Gruppennummer (Subgruppe 1 ist daher immer lila dargestellt, Subgruppe 2 grün, usw.).
Zitationsnetzwerk bis 1995#
Die Visualisierung des ersten Zitationsnetzwerkes, das alle Publikationen bis 1995 erfasst, zeigt, dass bereits zu diesem Zeitpunkt eine große Gruppe im Feld der SNA existiert hat, die miteinander über gegenseitige Zitationen verbunden ist. Außerhalb dieser Gruppe bildet sich ein Ring an kleinen Subgruppen, die jeweils nur wenige Publikationen umfassen. Da unser Korpus allerdings für das letzte Jahrhundert recht große Datenlücken offenbart hat und das Netzwerk bis 1995 nur ca. 4,2 % aller Zitationsbeziehungen abdeckt, sind diese Ergebnisse kritisch zu betrachten. So könnten die einzelnen, außen im Netzwerk angeordneten Subgruppen weniger ein Ausdruck exklusiver Zitationsbeziehungen sein, sondern vielmehr ein Resultat der hier fehlenden verbindenen Knoten darstellen. Umso interessanter ist jedoch die klare Erkennbarkeit eines großen, gemeinsamen, vielfach miteinander verbundenen Netzwerkes. Im Hinblick auf den wissenschaftshistorischen Kontext der Disziplin der SNA zu dieser Zeit, unterstreicht dies die Institutionalisierung des Feldes, die zu einem Zusammenwachsen der verschiedenen sozialwissenschaftlichen Forschungsstränge geführt hat.
Hinsichtlich der farblich codierten Modularity-Subgruppen zeigt sich, dass diese eng aneinander liegen, also, nach dem ForceAtlas-Algorithmus, besonders stark verbunden sind. Während die Subgruppen 0 (lila) und 2 (blau) sich über das Netzwerk ausdehnen, was sich als stärkere Verbundenheit mit Publikationen anderer Subgruppen interpretieren lässt, sind die Subgruppen 1 (grün), 3 (schwarz) und 4 (orange) konzentrierter. Da zu diesem Zeitpunkt jedoch alle Subgruppen von der Soziologie dominiert sind, lässt sich hier nur schwer eine Aussage über interdisziplinäre Informationsflüsse treffen.
Zitationsnetzwerk bis 2005#
Die Visualisierung des zweiten Netzwerkes, das nun auch die Publikationen bis 2005 umfasst, zeigt ein recht ähnliches Bild wie das Netzwerk bis 1995 mit einem einzelnen großen Cluster, dass den Großteil der Knoten umfasst. Im Gegensatz zu 1995 ist eine stärkere Durchmischung der einzelnen Modularity-Subgruppen zu erkennen. Aus der wissenschaftshistorischen Betrachtung wissen wir, dass zu diesem Zeitpunkt bereits Physiker:innen zur SNA publizieren, die Disziplinengrenzen zwischen “alten” und “neuen” Netzwerkanalyst:innen aber, laut Freeman, noch bestehen. Dies hat sich auch in der Analyse der Zusammensetzung der Subgruppen gezeigt, wobei mit Subgruppe 03 (schwarz) eine erste naturwissenschaftlich-dominierte Gruppe entstanden ist. Anhand der Sortierung des ForceAtlas-Algorithmus lässt sich erkennen, dass diese Subgruppe, weniger als andere Gruppen, einen Kern hat. Die einzelnen Publikationen sind recht weit voneinander entfernt, was eine weniger starke Verbindung impliziert. Es ist zwar ein schwarz dominiertes Feld im Netzwerk zu erkennen (die Knoten der Subgruppe 03 haben also tendenziell doch eher engere Verbindungen zur eigenen Gruppe als zu anderen Gruppen), dieses ist jedoch weniger stark ausgeprägt wie z.B. bei Subgruppe 06, die stark soziologisch geprägt ist). Ebenfalls lässt sich anhand des ForceAtlas-Algorithmus erkennen, dass die naturwissenschaftliche Gruppe mit ihrer Lage am Rand des Netzwerks eher eine Art “Außenseiter-Rolle” einnimmt. Die naturwissenschaftlichen Publikationen sind zum Zeitpunkt 2005 also klar als Gruppe erkennbar, haben aber mittlerweile auch vielfach Verbindungen zu anderen Subgruppen obwohl sie immernoch am Rand positioniert sind.
Im Folgenden möchten wir einige einflussreiche Knoten im Netzwerk, die anhand ihres In-Degrees und ihrer Betweeness herausstechen genauer analysieren, um die Informationsflüsse zwischen den Knoten (im dem Sinn, dass die Zitation einer Publikation einen Einfluss dieser auf die zitierende Publikation darstellt) in dem nun mittlerweile recht groß gewordenen Netzwerk besser untersuchen zu können.
Knoten mit sehr hoher Betweeness: marsden pv 1990
Peter V. Marsden ist ein US-amerikanischer Soziologe an der Harvard University, der hauptsächlich zu Organisationen und sozialen Netzwerken forscht (Harvard, o.J.). Freeman erwähnt ihn ebenfalls mehrmals in seiner Erzählung der Entwicklung der SNA und benennt ihn als beteiligte Person an der Institutionalisierung des Feldes. Seine 1990 veröffentlichte Publikation mit dem Thema “Network Data and Measurement”, auf die sich dieser Knoten bezieht, wird über 3,000 mal zitiert, so dass die einflussreiche Stellung im Netzwerk plausibel erscheint. Aufgrund der Größe des Knotens kann dabei, neben der hohen Betweeness, auch von einem hohen Indegree ausgegangen werden.
Hinsichtlich der Interdisziplinarität der Informationsflüsse zeigt sich, dass Marsden vor allem im lila Feld (Subgruppe 0, überwiegend soziologisch) und damit weniger interdisziplinär zu wirken scheint. Der Knoten hat auch Kanten zu recht weit entfernten, hauptsächlich blau eingefärbten Punkten (Subgruppe 2), allerdings ist auch diese Gruppe soziologisch dominiert.
Knoten mit hoher Betweeness: newman mej 2003:
Mark Newman ist ein US-amerikanischer Physiker an der University of Michigan und forscht insbesondere zu sozialen und Informationsnetzwerken (University of Michigan, o.J.). In seiner Publikation “The structure and function of complex networks” 2003, gibt er einen Überblick über die Entwicklungen im Feld der Netzwerkforschung und der entwickelten Methoden und Techniken. Obwohl er nicht Teil der Aufzählungen der in Notebook zwei herangezogenen relevanten Wissenschaftler:innen ist, nimmt er doch eine relevante Rolle im Feld der SNA ein. Freeman (2004, S. 166) berichtet, dass er einer der Physiker:innen war, die recht früh Beziehungen zu den “alten” Netzwerkanalyst:innen aufgebaut haben, z.B. in dem er deren Konferenzen besucht und in Journals wie “Social Networks” publiziert hat. Im Netzwerk 2005 ist der Knoten “newman mej 2003” sehr zentral angesiedelt und hat einen recht großen Radius, in dem Kanten ihn mit anderen Publikationen verbinden. Im Gegensatz zu Marsden liegt bei Newman der Indegree (die Größe des Knotens) niedriger. Damit ist mit Newman erstmals ein Physiker unter den scheinbar zentralsten Akteuren im Netzwerk der SNA.
Obwohl der Knoten Teil der naturwissenschaftlich-dominierten Subgruppe (schwarz) ist, liegt er interessanterweise außerhalb des Kerns der schwarzen Subgruppe im Netzwerk und hat auch einige Kanten zu Knoten der lila und grünen Subgruppen, die soziologisch geprägt sind. Der Knoten kann demnach als eine Art Brücke zwischen den Disziplinen verstanden werden und scheint den interdisziplinären Informationsaustausch zu unterstützen. Das erscheint auch inhaltlich logisch, da Newman mit seiner Publikation 2003 eine Art Review der bisherigen, vordergründig technisch-mathematischen, Technologien und Methoden zur Netzwerkforschung beigetragen hat. Hier lässt sich vermuten, dass beide Seiten der sich annährenden Felder von diesem Beitrag profitiert haben können. Damit unterstützt das visualisierte Netzwerk die Aussage von Freeman, wonach Newman früh zur transdisziplinären Verständigung beigetragen habe.
Knoten mit hohem In-Degree: burt rs 1987:
Neben den beiden Knoten mit der höchsten Betweeness, möchten wir noch einen Knoten mit einem hohen In-Degree bei eher kleiner Betweeness betrachten. Ronald S. Burt ist in mehreren mittelgroßen Knoten sichtbar. Burt ist ein US-amerikanischer Soziologe, der unter dem mathematischen Soziologen James Coleman studiert hatte (Chicago Booth, o.J.). Dieser war ebenfalls ein bedeutender Forscher in der SNA (Freemann 2004). Seine Publikation mit dem Titel “Social Contagion and Innovation: Cohesion versus Structural Equivalence” aus 1987 (Subgruppe 0, lila, soziologisch dominiert) nimmt in unserem Netzwerk 2005 eine interessante Position ein, da sie Kanten zu Knoten an den verschiedensten Punkten im Netzwerk hat und somit einen recht großen Teil des Netzwerkes mit ihrem Netz bedeckt. Dabei tangiert sie verschiedene andere Subgruppen (lila, blau, grün), die ebenfalls der sozialwissenschaftlichen Richtung entspringen. Der Knoten kann also als Verbindungspunkt zwischen verschiedenen Subgruppen, aber nicht zwischen den verschiedenen Diszplinen gesehen werden.
Zitationsnetzwerk bis 2015#
Bei der Visualisierung des Zitationsnetzwerks bis 2015 sehen wir, dass die Rechenleistung unserer Laptops bereits an ihre Grenzen kommt. Selbst nach einigen Stunden Laufzeit ist es den drei genutzten Algorithmen (Noverlap, LabelAdjust und ForceAtlas) nicht gelungen durchzulaufen um eine gut sichtbare und damit analysierbare Netzwerk-Abbildung zu berechnen. Somit ist auch die Analysierbarkeit eingeschränkt, v.a. hinsichtlich der Interpretation der Entfernungen der verschiedenen Knoten. Nichtsdestotrotz lassen sich einige Auffällligkeiten beobachten:
Auf der Abbildung zeigt sich eine grobe Unterteilung des Netzwerkes in eine lila- (Subgruppe 0) und eine grün-dominierte Hälfte (Subgruppe 1) feststellen. Die blauen (2), schwarzen (3) und orangenen (4) Knoten sind jedoch recht gleichmäßig über das Netzwerk verteilt. Während die lila Subgruppe (0) zu diesem Zeitpunkt bereits von den Computer Science und der Physik dominiert ist, ist die grüne Subgruppe (1) sozialwissenschaftlich geprägt (mit einem größeren Anteil an Business- und Management-bezogenen Publikationen). Bei genauer Betrachtung der blauen Subgruppe fällt auf, dass diese stark interdisziplinär zusammengesetzt ist und recht gleichmäßig aus natur- und sozialwissenschaftlichen Anteilen besteht, sowie aus nicht genau zuordnenbaren Disziplinen wie z.B. Environmental Studies. Daher scheint diese mit ihren über das Netzwerk verteilten Verbindungen eine Art Vermittlungsrolle einzunehmen.
Der Knoten mit dem höchsten In-Degree ist newman mej 2003, gefolgt von mcpherson m 2001. burt und marsden, die in den beiden Netzwerken bisher den größten In-Degree hatten, fallen somit raus während newman, der auch 2005 schon deutlich sichtbar war, nun anscheinend den zentralen Bezugspunkt für die anderen Knoten darzustellen scheint. Umso interessanter ist es, dass dieser Knoten recht weit außerhalb des Netzwerkes zu liegen scheint. Ein Erklärungsansatz hierfür könnte der schlechte Durchlauf des ForceAtlas-Algorithmus sein. mcpherson m 2001, der 2005 noch weniger zentral gewesen zu sein scheint, bezieht sich auf den Artikel “Birds of a Feather: Homophily in Social Networks” von Miller McPherson, Lynn Smith-Lovin und James M. Cook in dem diese beschreiben, dass starke soziale Verbindungen in Netzwerken hauptsächlich zwischen Menschem mit starken Ähnlichkeiten entstehen. Alle drei Autor:innen forschen an soziologischen Departments und der Artikel ist in einem klar soziologisch ausgerichteten Journal, “Annual Review of Sociology”, erschienen. Demnach erscheint die Verortung in der grünen Subgruppe (1) plausibel. Auch hier ist interessant, dass der Knoten am Rand des Netzwerkes steht.
Die Betweeness der Knoten ist auf der Abbildung nicht zu erkennen und kann daher nicht genauer untersucht werden.
Zitationsnetzwerk von 2015 bis 2022#
Wie in Notebook 3 bereits erwähnt, war es uns aufgrund der hohen erforderlichen Rechenleistung nicht möglich das komplette Netzwerk bis 2022 zu visualisieren. Um trotzdem einen Einblick in die aktuelle Struktur des Netzwerkes zu ermöglichen, haben wir die Publikationen vor 2015 abgeschnitten und ein Netzwerk aller Publikationen zwischen 2015 und heute gebildet. Somit war es möglich das Netzwerk in Gephi zu laden, einzufärben und die Knoten- und Textgröße je nach In-Degree und Betweeness zu formatieren, allerdings konnten abermals die Layout-Algorithmen nicht komplett durch das Netzwerk durchlaufen. Somit ist auch hier die Interpretierbarkeit des Netzwerks, insbesondere der Position der Knoten, eingeschränkt. Auch der Schnitt ab 2015 schränkt die Analyse ein, vor allem hinsichtlich des Vergleichs mit den bisherigen Netzwerken. Trotzdem möchten wir auf die beiden herausstechenden Knoten, pastor-satorras r 2015 und wang z 2015 im Folgenden eingehen.
Aufgrund des Schnitts ändert sich für dieses Netzwerk die Farbcodierung der Subgruppen, die nun nicht mehr chronologisch verläuft sondern wie in der nachfolgenden Legende abgebildet.
Knoten mit hohem In-Degree: Pastor-satorras r 2015
Dieser Knoten bezieht sich auf eine Publikation von Romualdo Pastor-Satorras, Claudio Castellano, Piet Van Mieghem und Alessandro Vespignani mit dem Titel “Epidemic processes in complex networks” in dem physikalischen Journal “Reviews of Modern Physics”. Hierbei haben die Autor:innen die Ausbreitung von Infektionen in Epidemien als eine Art von komplexen Systemen untersucht. Der Knoten ist Teil der lila Subgruppe 0, die die größte Subgruppe darstellt. Dies erscheint plausibel, da die Gruppe überwiegend aus Disziplinen der Computer Science und Physik mit einem kleinen Anteil an Social Sciences Interdisiplinary und Mathematical Methods besteht.
Aufgrund des Titels und Abstract kann vermutet werden, das die einflussreiche Stellung der Publikation im Netzwerk auch auf die Corona-Krise zurückzuführen ist, in der die Modellierung von möglichen Infektions-Szenarien und dadurch von komplexen Systemen in den Fokus geraten sind.
Das Netzwerk zeigt, dass sich die Verbindungen der Publikation über das ganze Netzwerk erstrecken, was den Einfluss auch auf weniger stark verbundene Knoten zeigt und ein Indiz für interdisziplinäre Informationsflüsse sein kann. Da allerdings eine Darstellung des Netzwerks nach den Entscheidungsregeln des ForceAtlas-Algorithmus nicht möglich war, ist die Aussagekraft hier eingeschränkt.
Knoten mit hohem In-Deegree: wang z 2015:
Der zweite Knoten der hier betrachtet werden soll bezieht sich auf die Veröffentlichung von Zhen Wang, Michael A. Andrews, Zhi-Xi Wu, Lin Wang und Chris T. Bauch mit dem Titel “Coupled disease–behavior dynamics on complex networks: A review”. Alle Autor:innen sind an naturwissenschaftlichen Departments angesiedelt und auch der Journalname, “Physics of Life Reviews”, und die Zugehörigkeit zur lila Subgruppe 1 weisen auf eine naturwissenschaftliche Disziplin hin. Ähnlich wie bei Pastor-satorras r 2015 untersucht auch dieser Text die Ausbreitung von Infektionen in komplexen Systemen und die Kontrolle davon. Dies bestätigt die Vermutung, dass der große Einfluss dieser beiden Publikationen im abgebildeten Netzwerk mit der Corona-Krise zusammenhängt.
Fazit der Netzwerkvisualisierung#
Zusammenfassend hat die Visualisierung unsere Annahmen bestätigt und veranschaulicht. Die historischen Netzwerke zeigen den Wandel von einem soziologisch- hin zu einem interdisziplinären Feld, an dem Physik und Computerscience wesentlich beteiligt sind, deutlich auf. Die naturwissenschaftliche(n) Subgruppe(n), die 1995 noch nicht existieren, sind 2005 noch deutlich am Rand des Netzwerkes angesiedelt. Ab diesem Zeitpunkt tritt mit Mark Newman auch zum ersten Mal ein Physiker als einflussreicher und zentraler Knotenpunkt im Netzwerk in Erscheinung. Die Einzelbetrachtung der Kanten dieses Knotens zeigt außerdem, dass Newman bereits von Knoten anderer Subgruppen zitiert wird und somit hier ein Informationfluss über die Disziplinengrenzen hinaus besteht. Ab 2015 stellen die Naturwissenschaften erstmals die größte Subgruppe im Netzwerk. Sie haben sich von einer Randposition in 2005 weit in das Netzwerk hinein ausgebreitet und stellen mit Newman den einflussreichsten Knotenpunkt dar. Demnach kann auch hier von transdisziplinären Informationsflüssen ausgegangen werden.
Dieser Trend zeigt sich auch in der heutigen Betrachtung des Netzwerkes. Die Physiker:innen und Computerwissenschaften stellen nun sowohl die beiden einlussreichen Knoten als auch einen großen Teil der Subgruppen. Besonders interessant ist hierbei die Erkenntnis, dass beide Publikationen die Verbreitung von Infektionskrankheiten beleuchten, womit ein Zusammenhang zwischen der Corona-Pandemie und der Popularität dieser Publikationen nahe liegt. Eine genauere Untersuchung dieser Beobachtung ist im Rahmen dieser Arbeit nicht möglich, könnte aber einen Ansatzpunkt für weitere Forschungsarbeiten darstellen.
Trotz dieser durchaus bestätigenden Ergebnisse, bleiben einige methodische Limitationen sowie abweichende Beobachtungen bestehen. Ein großer Einschnitt ergibt sich durch die Tatsache, dass die Netzwerke ab 2015 so groß geworden sind, dass wir sie mit der Rechenleistung unserer Laptops nicht mehr in dem erforderlichen Maß visualisieren konnten. Somit sind die späteren Netzwerke nur schlecht interpretierbar. Insbesondere die Eingrenzung des heutigen Netzwerks auf Publikationen nach 2014 führt dazu, dass dieses Netzwerk nur schwer mit den historischen Netzwerken vergleichbar ist. Eine inhaltliche Beobachtung entgegen unserer Annahmen ist, dass die Netzwerke andere Personen als einflussreich und zentral hervorheben als in der Literatur beschrieben. Ein erstes Indiz für diese abweichenden Ergebnisse war die Tatsache, dass viele der aufgeführten Personen nicht in unserem Corpus enthalten waren (wie in Notebook 2 beschrieben). Trotzdem stellen die Personen die enthalten waren, anders als vermutet, nicht die einflussreichen Knoten dar, sondern hier treten neue Akteure ins Feld. Dies kann zum einen daran liegen, dass unser Search Query nur Teilmengen des von u.a Freeman, Otte und Rousseau und Maltseva und Batagelj beschriebenen Feldes darstellt. So haben letztere z.B. in WoS alle Einträge inkludiert, die dem Keyword “social network*” entsprochen haben oder einem dediziert netzwerk-analytischen Journal entstammten (Maltseva & Batagelj 2018, S. 5). Zum anderen könnte die Abweichung zwischen unseren Beobachtungen und der Literatur darin begründet werden, dass die in der Literatur identifizierten Personen überwiegend vor der Jahrtausendwende aktiv waren, während der Großteil unseres Korpus erst aus den Jahren danach stammt. Somit können unsere Ergebnisse vielmehr als Ergänzung zu den bisherigen Auflistungen verstanden werden und damit zur Identifizierung der prägenden Akteure der SNA beitragen.