Betweenness Centrality

10.5.1 Ego Network

En vanlig användning av Twitter är att hålla kontakten med sitt personliga sociala nätverk – familj, kollegor, bekanta och så vidare. En del av dina vänner och följare på Twitter kommer med all säkerhet att tillhöra personer som du står nära, medan andra kan vara avlägsna bekanta eller till och med helt främmande personer. Vi kallar mängden av en Twitteranvändares vänner och följare för hans eller hennes ”egocentriska nätverk”. När vi talar om en Twitteranvändares egocentriska nätverk kallas användaren ofta för ”ego” och hans eller hennes vänner och följare för ”alters” (men vi använder fortfarande termen ”vän” eller ”följare” när vi talar om ett av dessa förhållanden specifikt). Vi kommer att använda termerna ”ego” och ”alter” i det här avsnittet.

Vissa band i det egocentriska nätverket är ömsesidiga – ego följer alter och alter följer ego, så att båda kan vara medvetna om varandras statusuppdateringar. Forskning om ömsesidiga band inom samhällsvetenskapen tyder på att sådana band oftare finns mellan nära vänner och familj än mellan avlägsna bekanta. I enlighet med denna forskning antar vi i det här avsnittet att ett nätverk med många ömsesidiga band indikerar en uppsättning starka sociala relationer, där båda personerna är intresserade av varandras uppdateringar, medan ett nätverk med många envägsband indikerar svaga sociala band, där egot kanske inte ens känner följaren, som i fallet med Twitterkändisar.

En annan indikator på starka band i ett socialt nätverk är ”slutna triader”, som är band mellan två alterner till ett ego. Liksom när det gäller ömsesidiga band visar forskningen om slutna triader att det finns fler slutna triader i täta samhällen med starka sociala band än i lösa samhällen med svaga sociala band. I enlighet med denna forskning antar vi att ett ego med många slutna triader bland sina alters är mer sannolikt inbäddat i en tät gemenskap, där alla känner varandra. Däremot är det troligare att ett ego med få slutna triader mellan sina alters är ensamt eller inte alls en individ. Till exempel kan Twitterkonton för affärsmarknadsförare ha många följare som är intresserade av deras produkter, men dessa följare känner ofta inte varandra.

Analysen av egocentriska nätverk kan ofta leda till användbara resultat om man vill använda Twitter som en utvecklings- eller annonsplattform. Täta grupper kan till exempel vara mycket mer benägna att anta en produkt tillsammans eller inte alls, medan glesa egocentriska nätverk med många envägsförbindelser kan påverkas kraftigt av beteendet hos ”navet” i nätverket – Twitteranvändaren med många följare men få vänner. Särskilt analysen av kändisars egocentriska nätverk på Twitter ger oss en inblick i hur dagens rika och berömda använder sociala medier för att nå ut till tusentals (om inte miljontals) beundrande fans.

Med hjälp av NodeXL kan du undersöka den relativa närvaron eller frånvaron av ömsesidiga band och slutna triader i ditt egocentriska Twitter-nätverk. De flesta egocentriska nätverk är en blandning av starka och svaga sociala band, så att en sammanfattning av ömsesidiga band och triader i en enda siffra ofta leder till felaktiga slutsatser om din sociala krets. Istället kan en visualisering av ditt sociala nätverk ge dig insikter om dina nära kontra avlägsna band och interaktionerna mellan dina nära vänner och bekanta.

Många Twitteranvändare sänder ut händelser i sina liv, från det triviala (matvanor) till det viktiga, till exempel researrangemang, större livshändelser och så vidare. Dessa händelser är på kort sikt synliga för alla användarens följare, som utgör en del av hennes egocentriska nätverk. I mycket små egocentriska nätverk (t.ex. när användarens följare är begränsade till familjen) är denna form av sändning användbar för att hålla kontakten med släktingar som har rest utomlands eller flyttat bort. Många aktiva användare har dock ganska stora egocentriska nätverk, och deras tweets går ofta ut till personer som är helt ointresserade av dem. Samtidigt gör det stora antalet följare som en Twitter-användare samlar på sig det svårt att hålla reda på vem som läser tweetsen. NodeXL gör det relativt enkelt att identifiera olika grupper i dina egocentriska nätverk, t.ex. dina följare som är dina kollegor jämfört med de som är din familj. Du kan dra nytta av den nya funktionen Twitter Lists för att organisera dessa grupper i praktiska listor som du kan följa och referera till i dina tweets.

Det första steget i analysen av ditt egocentriska nätverk i NodeXL är att samla in data. Ett sätt att göra det är att använda funktionen Import > From Twitter User’s Network i NodeXL. Om du klickar på fliken NodeXL i Excel-menyn och sedan på rullgardinslistan Import till vänster i NodeXL-bandet visas flera importalternativ (se till att kryssrutan ”Clear NodeXL Workbook First” är markerad). Välj alternativet From Twitter User’s Network i rullgardinslistan och då visas en dialogruta (fig. 10.12).

Figur 10.12. NodeXL:s skärm för import av Twitter User’s Network. De valda nivåalternativen kommer att importera både @vlad43210:s vänner och följare, samt alla vän/följare-anslutningar mellan dem.

Ovanför rutan finns ett textfält för den Twitter-användare vars egocentriska nätverk du vill samla in. I det här exemplet använder vi ett av våra egna Twitterkonton -@vlad43210. Under textfältet ligger tre kryssrutor: Lägg till en kant för följare, svar till och omnämnanden i tweets. Se till att endast kryssrutan Follows är markerad, de andra två är mer relevanta för informationsnätverk, vilket vi kommer att undersöka senare. Se också till att kryssrutan ”get both friends and followers” (få både vänner och följare) är markerad så att du kan samla in data om alla alters, inte bara vänner eller följare.

Längre ner presenteras rullgardinslistan ”Get connections out to X degrees” (få anslutningar ut till X grader). Välj ”1,5” i rullgardinslistan för att samla in alla dina alters, samt alla följ- och vänrelationer mellan dem. Den sistnämnda uppsättningen relationer är nödvändig för att observera förekomsten av slutna triader i ditt egocentriska nätverk. Se sedan till att kryssrutorna ”Add statistic columns to the Vertices worksheet (slower)” och ”Add a Tweet column to the Vertices worksheet” är avmarkerade. Dessa är mycket användbara för att samla in data om Twitteraktivitet i ditt egocentriska nätverk, men i det aktuella exemplet fokuserar vi på relationer, inte aktivitet.

I de två sista textfälten kan du ange ett användarnamn och ett lösenord om du har ett vitlistat Twitterkonto (som diskuterats tidigare). Oavsett om du fyller i dessa fält eller inte, kan du härnäst klicka på OK och påbörja dataimporten. När processen är klar ser du kalkylbladet igen, fyllt med rader med par av Twitter-användare och relationerna mellan dem. Du kan behöva klicka på ”Refresh Graph” (uppdatera grafen) för att visa dessa användare och relationer på grafen. Observera att egot står i centrum – i vårt exempel är det @vlad43210 – omgivet av en mängd alters. Bilden på grafiken liknar en stjärna, eftersom @vlad43210 har många alters som inte följer varandra. Dessa är sannolikt hans svaga sociala band, de flesta av dem är helt främmande (figur 10.13).

Figur 10.13. @vlad43210:s 1,5 graders egocentriska Twitternätverk. Vertexen i mitten är @vlad43210, de många verterna i kanterna representerar @vlad43210:s svaga sociala band, de flesta av dem helt okända.

Du kan fokusera på starkare sociala band genom att titta på alster i @vlad43210:s egocentriska nätverk med minst två band till andra personer (båda banden kan vara till samma person) i båda riktningarna, vän eller följare. Alla vi har samlat in uppgifter om kommer att ha minst en koppling till @vlad43210. Alter med minst två kopplingar kommer antingen att ha en koppling till en annan alter till @vlad43210 (vilket visar att de ingår i en sluten triad), eller så kommer de att ha en ömsesidig vän/följare-koppling till @vlad43210. Som vi diskuterade tidigare kan båda dessa faktorer tyda på att det finns ett starkare socialt förhållande mellan @vlad43210 och personen i fråga. I den grafiska framställningen av nätverket kommer alster med två band till andra personer att representeras av hörn med minst två kanter (i båda riktningarna) mellan dem och minst ett annat hörn. För att endast fokusera på dessa hörn måste du först beräkna in- och outgraden. Klicka på knappen ”calculate graph metrics”, markera ”in-degree” och ”out-degree” och klicka på ”Compute Metrics.”

Nu ska vi ställa in vertexens synlighet i grafen baserat på in-degree + out-degree > 1. Vertikaler som passar det här kriteriet har minst två vänner, två följare eller en vän och en följare (som kan vara samma person), vilket är precis vad vi letar efter. För att göra detta lägger du först till en ny kolumn genom att klicka på cellen under etiketten ”Lägg till egna kolumner här” i arbetsbladet Vertices och sedan ställa in cellvärdet som summan av C3 och D3 (motsvarande in- respektive out-degree). Resten av cellerna i kolumnen fylls automatiskt med samma formel. Märk nu den nya kolumnen som ”Sum Degree” genom att redigera kolumnetiketten. Klicka slutligen på Autofyllda kolumner, klicka på rullgardinslistan bredvid ”Vertex Visibility”, klicka på ”Sum Degree”, klicka sedan på knappen bredvid rullgardinslistan och skriv in 1 i textrutan för att ange att du bara vill visa hörn med in-degree + out-degree > 1. Klicka på OK, sedan på Autofyllning och sedan på Uppdatera grafiken. Observera att antalet hörn har blivit mycket mindre och att grafen inte längre ser ut som en stjärna – i stället ser vi @vlad43210 omgiven av två tätt sammankopplade grupper av hörn med ett fåtal kopplingar mellan grupperna.

Figur 10.14 antyder att @vlad43210:s egocentriska nätverk har två separata tätt sammankopplade grupper, eller kluster, av alster. NodeXL kan hjälpa till att bekräfta denna intuition genom att utföra automatisk klusterdetektering. För att upptäcka kluster klickar du helt enkelt på ”Find Clusters” (hitta kluster) i avsnittet Analysis (analys) i NodeXL:s menyband. NodeXL kommer automatiskt att söka efter kluster och tilldela olika färger till vertexar i olika kluster (dessa tilldelningar åsidosätter eventuella vertexfärger som definierats via Autofyll-kolumner eller via redigering av arbetsbladet). Klicka nu på ”Refresh Graph” och de nya vertexfärgerna kommer att visas på canvas.

Figur 10.14. @vlad43210:s 1,5 graders egocentriska twitternätverk. Vi har filtrerat bort de helt främmande personerna för att fokusera på @vlad43210:s starka sociala band – hans vänner och kollegor. Två kluster framträder (uppe till höger och nere till vänster).

Du kan nu klicka på hörn i olika kluster för att få en uppfattning om klustren representerar meningsfulla uppdelningar av @vlad43210:s egocentriska Twitter-nätverk. En undersökning av arbetsbladet visar att det lila klustret motsvarar alters som är Vlads akademiska kollegor, medan det gröna klustret motsvarar alters som är hans vänner (i ordets vanliga bemärkelse, inte i Twitter-begreppet användare som @vlad43210 följer). Klustren kan användas för att skapa två listor för Vlads Twitterkonto: en för att kommunicera med hans vänner och en för att kommunicera med hans kollegor.

Du kan också använda begreppen egenvektorscentralitet och betweenness-centralitet, som beskrivits tidigare, för att titta på den relativa betydelsen av aktörerna i @vlad43210:s egocentriska Twitter-nätverk, ur uppmärksamhets- och informationsperspektiv. Som vi diskuterade i avsnitt 10.3.1 är aktörer med hög egenvektorcentralitet i nätverket vänner/följare centrum för uppmärksamhet, medan aktörer med hög betweenness-centralitet i samma nätverk är informationsförmedlare. NodeXL gör det möjligt för oss att visualisera båda dessa storheter samtidigt genom att mappa dem till olika egenskaper hos verkterna i grafen canvas.

Låt oss mappa vertexfärg till egenvektorscentralitet och vertexstorlek till betweenness-centralitet.7 För att göra detta klickar du först på knappen Graph Metrics (grafmetriker) i avsnittet Analysis (analys) i NodeXL:s menyband, kryssar sedan för ”Eigenvector centrality” (egenvektorscentralitet) och ”Betweenness and closeness centralities” (betweenness och closeness-centraliteter) och klickar på ”Compute Metrics”. Klicka sedan på knappen Autofyllda kolumner i NodeXL-menyn, klicka på rullgardinslistan bredvid ”Vertex Color” och välj ”Eigenvector Centrality”, klicka på rullgardinslistan bredvid ”Vertex Size” och välj ”Betweenness Centrality”. Klicka på ”Autofill” och sedan på knappen Refresh Graph (Uppdatera graf) i rutan för grafisk visning för att uppdatera vertexstorlekarna och färgerna i grafen. Gör ytterligare en justering innan du visar grafen – eftersom @vlad43210 per definition befinner sig i centrum av sitt egocentriska nätverk kommer hans betweenness- och egenvektorscentralitet att vara höga, men de kommer inte att berätta något om @vlad43210:s position i hans nätverk. Sätt manuellt @vlad43210:s betweenness- och egenvektorcentraler till 0 i arbetsbladet och tryck på ”Refresh Graph” igen.

Om du jämför figurerna 10.15 och 10.16 kan du se att @vlad43210:s kollegor är mer centrala än hans vänner, men att de två klustren är ganska jämnt fördelade när det gäller informationsflödet (med undantag för @redlog, som har både mycket höga egenvektor- och mycket höga betweenness-centraler och syns som en stor grön nod i grafen).

Figur 10.15. @vlad43210 1,5 graders egocentriskt Twitter-nätverk (endast starka sociala band). NodeXL identifierar automatiskt kluster och färgar dem olika. Överst till höger (grönt) motsvarar @vlad43210:s vänner och nederst till vänster (lila) motsvarar hans akademiska kollegor.

Figur 10.16. Det 1,5 graders egocentriska Twitter-nätverket @vlad43210. Grönare hörn har högre egenvektorcentralitet och större hörn har högre betweenness-centralitet.

Slutligt kan vi jämföra @vlad43210:s egocentriska nätverk av vänner och följare med @vlad43210:s nätverk av @replies och omnämnanden. Observera att båda dessa nätverk är egocentriska, men att alternerna inte nödvändigtvis är desamma i båda. NodeXL importerar i skrivande stund inte detaljerade @reply- och omnämningsdata för användare, men Twitter API möjliggör en snabb lösning. Med hjälp av status/mentions API kan du besöka webbadressen www.twitter.com/statuses/mentions.xml och manuellt registrera namnen på alla @vlad43210:s vänner eller följare som @replied till honom eller nämnde hans Twitter-användarnamn i ett av sina tweets, samt antalet @replies eller omnämnanden per namn. Eftersom @vlad43210 inte får många @replies eller omnämnanden är detta inte en tidskrävande uppgift – för mer tidskrävande uppgifter kan ett alternativ vara att skriva ett skript som registrerar dessa namn automatiskt. För varje sådant namn ska du sedan hitta den kant i arbetsbladet Kanten som förbinder @vlad43210 med en användare som svarat eller nämnt @vlad43210. Ställ manuellt in bredden på dessa kanter till antalet @repliker eller omnämnanden av @vlad43210 av motsvarande användare. Tryck slutligen på ”Refresh Graph” för att återspegla dessa uppdateringar (figur 10.17).

Figur 10.17. Det 1,5 graders egocentriska Twitter-nätverket @vlad43210. Grönare hörn har högre egenvektorcentralitet och större hörn har högre betweennesscentralitet. Tjockare kanter motsvarar användare som @ svarar @vlad43210 eller nämner hans användarnamn i ett av sina tweets.

Du kan se att även om @vlad43210:s kollegor är mer centrala för uppmärksamheten än hans vänner, så @ svarar hans vänner @vlad43210 och nämner honom oftare än vad hans kollegor gör. Observera också att även om vissa @reply- och omnämningsförbindelser kopplar @vlad43210 till aktörer med hög centralitet, t.ex. @redlog, kopplar andra @vlad43210 till aktörer med låg centralitet. Det är uppenbart att informations- och uppmärksamhetsrelationerna i @vlad43210:s egocentriska nätverk av vänner/följare inte nödvändigtvis har samma vikt i hans egocentriska nätverk av @replies/mentions.

Advanced Topic

Aligning av topparna i en graf

Låt oss titta kort på figurerna 10.9 och 10.10 (exemplen på informations-/uppmärksamhetsnätverket och centralitetsnätverket). Antag att du vill rada upp ett litet antal hörn på ett sätt som tydligt visar grupperingar. Det måste vara mycket arbete att rada upp dessa hörn så skarpt för hand, genom att dra runt dem en efter en.

Som vi beskrev i rutan ”Avancerat” tidigare kan du manipulera NodeXL-nätverk precis som vanliga kalkylblad. Fliken Vertices innehåller kolumner som kallas ”X” och ”Y”, som innehåller verternas positioner i grafen. Det finns också en kolumn som heter ”Locked?” som styr om hörnens positioner är låsta på plats eller om de kan flyttas när grafen ritas om.

När du har arrangerat om hörnen som du vill ha dem, kör följande makro för att rikta in dem perfekt:

Sub Realign()

′ avståndet att avrunda varje plats till

RDIST = 500

COL_VERTEX = 1

COL_LOCK = 21

COL_X = 19

COL_Y = 20

ROW_START = 3

Dim wksht As Worksheet

Set wksht = Sheets(”Vertices”)

current_row = ROW_START

While wksht.Cells(current_row, COL_VERTEX).Text > ””

′ se till att vertexets position är låst

wksht.Cells(current_row, COL_LOCK) = ”Yes (1)”

′ avrunda x och y

x = Round(wksht.Cells(current_row, COL_X) / RDIST) * RDIST

wksht.Cells(current_row, COL_X) = x

y = Round(wksht.Cells(current_row, COL_Y) / RDIST) * RDIST

wksht.Cells(current_row, COL_Y) = y

current_row = current_row + 1

Wend

End Sub

Detta makro loopar genom varje vertex i grafen. Det låser först vertexens position och avrundar sedan X- och Y-koordinaterna till närmaste 500 pixlar. Om två hörn ligger bredvid varandra och deras y-koordinater är 1498 och 1502, kommer båda att omplaceras till y = 1500. Detta säkerställer att hörnpunkterna är korrekt inriktade.

Lämna en kommentar