Betweenness Centrality

10.5.1 Ego Network

En almindelig brug af Twitter er at holde kontakten med sit personlige sociale netværk – familie, kolleger, bekendte og så videre. Nogle af dine venner og følgere på Twitter vil helt sikkert tilhøre personer, som du er tæt på, mens andre kan være fjerne bekendte eller endda helt fremmede mennesker. Vi kalder det sæt af en Twitter-brugeres venner og følgere for hans eller hendes “egocentriske netværk”. Når vi taler om en Twitter-brugers egocentriske netværk, omtales den pågældende bruger ofte som “ego” og hans eller hendes venner og følgere som “alters” (men vi bruger stadig udtrykket “ven” eller “følgere”, når vi taler specifikt om et af disse forhold). Vi vil bruge udtrykkene “ego” og “alter” i dette afsnit.

Nogle bånd i det egocentriske netværk er gensidige – ego følger alter og alter følger ego, så begge kan holde sig orienteret om hinandens statusopdateringer. Forskning om gensidige bånd inden for samfundsvidenskab tyder på, at sådanne bånd oftere findes mellem nære venner og familie end mellem fjerntstående bekendtskaber. I forlængelse af denne forskning antager vi i dette afsnit, at et netværk med mange gensidige bånd indikerer et sæt af stærke sociale relationer, hvor begge personer er interesserede i hinandens opdateringer, mens et netværk med mange envejsbånd indikerer svage sociale bånd, hvor egoet måske ikke engang kender følgeren, som i tilfældet med Twitter-berømtheder.

En anden indikator for stærke bånd i et socialt netværk er “lukkede triader”, som er bånd mellem to alters af et ego. Ligesom med gensidige bånd viser forskning om lukkede triader, at tætte fællesskaber med stærke sociale bånd indeholder flere lukkede triader end løse fællesskaber med svage sociale bånd. I overensstemmelse med denne forskning antager vi, at et ego med mange lukkede triader blandt sine alters er mere tilbøjeligt til at være indlejret i et tæt fællesskab, hvor alle kender hinanden. I modsætning hertil er et ego med få lukkede triader mellem sine alters mere tilbøjeligt til at være ensomt eller slet ikke et individ. F.eks. kan Twitter-konti for forretningsmarkedsførere have mange følgere, der er interesserede i deres produkter, men disse følgere kender ofte ikke hinanden.

Analyse af egocentriske netværk kan ofte føre til brugbare resultater, hvis man ønsker at bruge Twitter som en udviklings- eller reklameplatform. Tætte fællesskaber kan f.eks. være meget mere tilbøjelige til at tage et produkt til sig sammen eller slet ikke, mens sparsomme egocentriske netværk med mange envejsforbindelser kan være stærkt påvirket af adfærden hos “hubben” i netværket – Twitter-brugeren med mange følgere, men få venner. Især giver en analyse af berømthedernes egocentriske netværk på Twitter os et indblik i, hvordan de rige og berømte i dag bruger sociale medier til at nå ud til tusindvis (hvis ikke millioner) af tilbedende fans.

Med hjælp fra NodeXL kan du undersøge den relative tilstedeværelse eller fravær af gensidige bånd og lukkede triader i dit egocentriske Twitter-netværk. De fleste egocentriske netværk er en blanding af stærke og svage sociale bånd, så hvis man opsummerer gensidige bånd og triader i et enkelt tal, fører det ofte til forkerte konklusioner om din sociale kreds. I stedet kan en visualisering af dit sociale netværk give dig indsigt i dine tætte versus fjerne bånd og interaktionerne mellem dine nære venner og bekendte.

Mange Twitter-brugere udsender begivenheder i deres liv, fra det trivielle (spisevaner) til det vigtige, såsom rejsearrangementer, større livsbegivenheder osv. Disse begivenheder er på kort sigt synlige for alle brugerens følgere, som udgør en del af hendes egocentriske netværk. I meget små egocentriske netværk (f.eks. når en brugers følgere er begrænset til ens familie) er denne form for udsendelse nyttig til at holde kontakten med slægtninge, der er rejst til udlandet eller er flyttet væk. Mange aktive brugere har imidlertid ret store egocentriske netværk, og deres tweets går ofte ud til folk, der slet ikke interesserer sig for dem. Samtidig gør det store antal følgere, som en Twitter-bruger samler på sig, det svært at holde styr på, hvem der læser tweets. NodeXL gør det relativt nemt at identificere forskellige grupper i dine egocentriske netværk, f.eks. dine følgere, som er dine kolleger, i forhold til dem, som er din familie. Du kan udnytte den nye Twitter Lists-funktion til at organisere disse grupper i praktiske lister, som du kan følge og referere til i dine tweets.

Det første skridt i analysen af dit egocentriske netværk i NodeXL er at indsamle data. En måde at gøre det på er at bruge funktionen Importer > fra Twitter-brugerens netværk i NodeXL. Hvis du klikker på fanen NodeXL i Excel-menuen og derefter på rullelisten Import til venstre i NodeXL-båndet, får du flere importmuligheder (sørg for, at afkrydsningsfeltet “Clear NodeXL Workbook First” (Ryd NodeXL Workbook først) er markeret). Vælg indstillingen Fra Twitter-brugerens netværk i rullelisten, hvorefter du får vist en dialogboks (fig. 10.12).

Figur 10.12. NodeXL’s skærmbillede til import af Twitter-brugerens netværk. De valgte niveauindstillinger vil importere både @vlad43210’s venner og følgere samt eventuelle ven/følgere-forbindelser mellem dem.

Overst i feltet er der et tekstfelt for den Twitter-bruger, hvis egocentriske netværk du vil indsamle. I dette eksempel vil vi bruge en af vores egne Twitter-konti -@vlad43210. Under tekstfeltet ligger tre afkrydsningsfelter: Tilføj en kant for Follows, Replies-to og Mentions-relationer i tweets. Sørg for, at kun afkrydsningsfeltet Follows er markeret, de to andre er mere relevante for informationsnetværk, som vi skal undersøge senere. Sørg også for, at afkrydsningsfeltet “get both friends and followers” er markeret, så du kan indsamle data om alle alters, ikke kun venner eller følgere.

Længere nede bliver du præsenteret for rullelisten “Get connections out to X degrees” (Få forbindelser ud til X grader). Vælg “1,5” i rullelisten for at registrere alle dine alters samt alle følg- og venskabsrelationer mellem dem. Sidstnævnte sæt af relationer er nødvendigt for at observere tilstedeværelsen af lukkede triader i dit egocentriske netværk. Sørg dernæst for, at afkrydsningsfelterne “Add statistic columns to the Vertices worksheet (slower)” og “Add a Tweet column to the Vertices worksheet” ikke er markeret. Disse er meget nyttige til indsamling af data om Twitter-aktivitet i dit egocentriske netværk, men i det aktuelle eksempel fokuserer vi på relationer, ikke aktivitet.

De sidste to tekstfelter giver dig mulighed for at angive et brugernavn og en adgangskode, hvis du har en Twitter-konto på en whitelisted (omtalt tidligere). Uanset om du udfylder disse felter eller ej, kan du derefter klikke på OK og begynde dataimporten. Når processen er afsluttet, vil du se regnearket igen, fyldt med rækker med parvis af Twitter-brugere og forbindelserne mellem dem. Det kan være nødvendigt at klikke på “Refresh Graph” (Opdater graf) for at få vist disse brugere og relationer på grafen på lærredet. Bemærk, at egoet er i midten – i vores eksempel er det @vlad43210 – omgivet af et væld af alters. Billedet på lærredet ligner en stjerne, da @vlad43210 har mange alters, som ikke følger hinanden. Disse er sandsynligvis hans svage sociale bånd, hvoraf de fleste er helt fremmede (fig. 10.13).

Figur 10.13. @vlad43210’s 1,5 graders egocentriske Twitter-netværk. Vertexet i midten er @vlad43210, de mange vertices på kanterne repræsenterer @vlad43210’s svage sociale bånd, hvoraf de fleste er helt fremmede.

Du kan fokusere på stærkere sociale bånd ved at kigge på alters i @vlad43210’s egocentriske netværk med mindst to bånd til andre personer (begge bånd kan være til den samme person) i begge retninger, ven eller følgere. Alle, vi har indsamlet data om, vil have mindst ét bånd til @vlad43210. Alters med mindst to bånd vil enten have et bånd til et andet alter til @vlad43210 (hvilket indikerer, at de er en del af en lukket triade), eller de vil have et gensidigt ven/følger-bånd til @vlad43210. Som vi diskuterede tidligere, kan begge disse faktorer indikere tilstedeværelsen af et stærkere socialt forhold mellem @vlad43210 og den pågældende person. I den grafiske repræsentation af netværket vil personer med to bånd til andre personer blive repræsenteret af hjørner med mindst to kanter (i begge retninger) mellem dem og mindst ét andet hjørne. For kun at fokusere på disse hjørner skal du først beregne in- og out-degree-graden. Klik på knappen “calculate graph metrics”, marker “in-degree” og “out-degree”, og klik på “Compute Metrics.”

Nu skal vi indstille vertex synlighed i grafen baseret på in-degree + out-degree > 1. Vertices, der passer til dette kriterium, vil have mindst to venner, to følgere eller en ven og en følger (som kan være den samme person), hvilket er præcis det, vi leder efter. For at gøre dette skal du først tilføje en ny kolonne ved at klikke på cellen under etiketten “Tilføj dine egne kolonner her” i regnearket Vertices og derefter indstille celleværdien som summen af C3 og D3 (svarende til henholdsvis in- og out-degree). Resten af cellerne i kolonnen vil automatisk blive udfyldt med den samme formel. Mærk nu denne nye kolonne som “Sum Degree” ved at redigere kolonneetiketten. Klik endelig på Autofill Columns, klik på rullelisten ved siden af “Vertex Visibility”, klik på “Sum Degree”, klik derefter på knappen ved siden af rullelisten og skriv 1 i tekstboksen for at angive, at du kun ønsker at vise hjørner med in-degree + out-degree > 1. Klik på OK, derefter på Autofill og derefter på Refresh Graph (Opdater graf). Bemærk, at antallet af vertices er blevet meget mindre, og at grafen ikke længere ligner en stjerne – i stedet ser vi @vlad43210 omgivet af to tæt forbundne grupper af vertices med få forbindelser mellem grupperne.

Figur 10.14 antyder, at @vlad43210’s egocentriske netværk har to separate tæt forbundne grupper, eller klynger, af alters. NodeXL kan hjælpe med at bekræfte denne intuition ved at udføre automatisk klyngedetektion. For at detektere klynger skal du blot klikke på “Find Clusters” (Find klynger) i analyseafsnittet i NodeXL-menubåndet. NodeXL vil automatisk søge efter klynger og tildele forskellige farver til toppene i forskellige klynger (disse tildelinger tilsidesætter alle toppens farver, der er defineret via Autofill kolonner eller via redigering af regnearket). Klik nu på “Refresh Graph”, og de nye vertexfarver vil blive vist på lærredet.

Figur 10.14. @vlad43210’s 1,5 graders egocentriske Twitter-netværk. Vi har filtreret de helt fremmede personer fra for at fokusere på @vlad43210’s stærke sociale bånd – hans venner og kolleger. Der opstår to klynger (øverst til højre og nederst til venstre).

Du kan nu klikke på vertices i forskellige klynger for at få en fornemmelse af, om klyngerne repræsenterer meningsfulde opdelinger af @vlad43210’s egocentriske Twitter-netværk. Faktisk viser udforskningen af regnearket, at den lilla klynge svarer til alters, der er Vlads akademiske kolleger, mens den grønne klynge svarer til alters, der er hans venner (i almindelig forstand, ikke i Twitter-forstand, dvs. brugere, som @vlad43210 følger). Klyngerne kan bruges til at oprette to lister for Vlads Twitter-konto: en til kommunikation med hans venner og en til kommunikation med hans kolleger.

Du kan også bruge begreberne egenvektorcentralitet og betweenness centralitet, som er beskrevet tidligere, til at se på den relative betydning af aktørerne i @vlad43210’s egocentriske Twitter-netværk ud fra opmærksomheds- og informationsperspektiverne. Som vi diskuterede i afsnit 10.3.1, er aktører med høj egenvektorcentralitet i venner/følgere-netværket centre for opmærksomhed, mens aktører med høj betweenness-centralitet i det samme netværk er informationsformidlere. NodeXL giver os mulighed for at visualisere begge disse størrelser på samme tid ved at mappe dem til forskellige egenskaber ved toppene i grafen canvas.

Lad os mappe toppens farve til egenvektorcentralitet og toppens størrelse til betweenness-centralitet.7 For at gøre dette skal du først klikke på knappen Graph Metrics i Analysis-sektionen i NodeXL-menubåndet, derefter markere “Eigenvector centrality” og “Betweenness and closeness centralities” og klikke på “Compute Metrics”. Klik dernæst på knappen Autofill Columns i NodeXL-menuen, klik på rullelisten ved siden af “Vertex Color” og vælg “Eigenvector Centrality”, klik på rullelisten ved siden af “Vertex Size” og vælg “Betweenness Centrality”. Klik på “Autofill” (automatisk udfyldning) og derefter på knappen Refresh Graph (opdater graf) på grafvisningsruden for at opdatere vertexstørrelserne og -farverne i grafen på lærredet. Foretag endnu en justering, inden du viser grafen – fordi @vlad43210 pr. definition befinder sig i centrum af sit egocentriske netværk, vil hans betweenness- og egenvektorcentraliteter være høje, men de vil ikke fortælle os noget om @vlad43210’s position i hans netværk. Sæt manuelt @vlad43210’s betweenness- og egenvektorcentraliteter til 0 i regnearket og tryk på “Refresh Graph” igen.

Hvis du sammenligner figur 10.15 og 10.15.16, kan man se, at @vlad43210’s kolleger er mere i centrum for opmærksomheden end hans venner, men at de to klynger er ret jævnbyrdige med hensyn til informationsstrømmen (med undtagelse af @redlog, som både har meget høje egenvektor- og meget høje betweenness-centraler og dukker op som en stor grøn knude i grafen).

Figur 10.15. Det 1,5 graders egocentriske Twitter-netværk @vlad43210 (kun stærke sociale bånd). NodeXL identificerer automatisk klyngerne og farver dem forskelligt. Øverst til højre (grønt) svarer til @vlad43210’s venner, og nederst til venstre (lilla) svarer til hans akademiske kolleger.

Figur 10.16. Det 1,5 graders egocentriske Twitter-netværk @vlad43210. Grønnere vertices har højere egenvektorcentralitet, og større vertices har højere betweenness-centralitet.

Lad os til sidst sammenligne @vlad43210’s egocentriske netværk af venner og følgere med @vlad43210’s netværk af @replies og omtaler. Bemærk, at begge disse netværk er egocentriske, men at altererne ikke nødvendigvis er de samme i hvert af dem. NodeXL importerer ikke detaljerede @reply- og omtaledata for brugere i skrivende stund, men Twitter API’et giver mulighed for en hurtig omgåelse. Ved hjælp af statuses/mentions API’et kan du besøge URL’en www.twitter.com/statuses/mentions.xml og manuelt registrere navnene på alle @vlad43210’s venner eller følgere, der har @replied til ham eller nævnt hans Twitter-brugernavn i et af deres tweets, samt antallet af @replies eller omtaler pr. navn. Da @vlad43210 ikke får mange @replies eller omtaler, er dette ikke en tidskrævende opgave – for mere tidskrævende opgaver ville et alternativ være at skrive et script, der registrerer disse navne automatisk. Find derefter for hvert af disse navne den kant i regnearket Edges, der forbinder @vlad43210 med en bruger, der har @replied til eller nævnt ham. Indstil manuelt bredden af disse kanter til antallet af @replies eller omtaler af @vlad43210 af den tilsvarende bruger. Til sidst trykker du på “Refresh Graph” for at afspejle disse opdateringer (fig. 10.17).

Figur 10.17. Det 1,5-grads egocentriske Twitter-netværk @vlad43210. Grønnere vertices har højere egenvektorcentralitet, og større vertices har højere betweenness-centralitet. Tykkere kanter svarer til brugere, der @reply til @vlad43210 eller nævner hans brugernavn i et af deres tweets.

Det ses, at selv om @vlad43210’s kolleger er mere centrale end hans venner, @reply til @vlad43210 og nævner ham oftere, end hans kolleger gør. Bemærk også, at selv om nogle @reply- og omtaleforbindelser knytter @vlad43210 til aktører med høj centralitet som f.eks. @redlog, knytter andre @vlad43210 til aktører med lav centralitet. Det er tydeligt, at informations- og opmærksomhedsrelationerne i @vlad43210’s venner/followers egocentriske netværk ikke nødvendigvis har samme vægt i hans @replies/mentions egocentriske netværk.

Advanced Topic

Alignment the Vertices in a Graph

Lad os se kort på figur 10.9 og 10.10 (information/opmærksomhedsnetværket og centralitetsnetværkets eksempler). Lad os antage, at du ønsker at opstille et lille antal hjørner på en måde, der tydeligt viser grupperinger. Det må være et stort arbejde at liniere disse vertices så skarpt op i hånden ved at trække dem rundt en efter en.

Som vi beskrev i boksen “Avanceret” tidligere, kan du manipulere NodeXL-netværk ligesom almindelige regneark. Fanebladet Vertices indeholder kolonner kaldet “X” og “Y”, som indeholder vertices’ positioner i grafen. Der er også en kolonne med navnet “Locked?”, som styrer, om toppunktspositionerne er låst på plads, eller om de kan flyttes, når grafen tegnes på ny.

Når du har omarrangeret toppene, som du vil have dem, skal du køre følgende makro for at justere dem perfekt:

Sub Realign()

′ afstanden til at afrunde hver placering til

RDIST = 500

COL_VERTEX = 1

COL_LOCK = 21

COL_X = 19

COL_Y = 20

ROW_START = 3

Dim wksht As Worksheet

Set wksht = Sheets(“Vertices”)

current_row = ROW_START

While wksht.Cells(current_row, COL_VERTEX).Text > “”

′ sørg for at vertexets position er låst

wksht.Cells(current_row, COL_LOCK) = “Yes (1)”

′ runder x og y

x = Round(wksht.Cells(current_row, COL_X) / RDIST) * RDIST

wksht.Cells(current_row, COL_X) = x

y = Round(wksht.Cells(current_row, COL_Y) / RDIST) * RDIST

wksht.Cells(current_row, COL_Y) = y

current_row = current_row + 1

Wend

End Sub

Denne makro sløjfer gennem hvert toppunkt i grafen. Den låser først vertexets position og runder derefter X- og Y-koordinaterne til nærmeste 500 pixel. Så hvis to toppunkter ligger ved siden af hinanden, og deres y-koordinater er 1498 og 1502, vil de hver især blive flyttet til y = 1500. Dette sikrer, at toppene er korrekt justeret.

Skriv en kommentar