Betweenness Centrality

10.5.1 Rețeaua Ego

O utilizare obișnuită a Twitter este păstrarea legăturii cu rețeaua socială personală – familie, colegi, cunoștințe și așa mai departe. Unii dintre prietenii și urmăritorii dvs. de pe Twitter vor aparține, cu siguranță, unor persoane de care sunteți apropiat, în timp ce alții pot fi cunoștințe îndepărtate sau chiar necunoscuți. Ne referim la setul de prieteni și urmăritori ai unui utilizator Twitter drept „rețeaua egocentrică” a acestuia. Atunci când vorbim despre rețeaua egocentrică a unui utilizator Twitter, utilizatorul respectiv este adesea denumit „ego”, iar prietenii și urmăritorii săi sunt numiți „alteri” (dar folosim în continuare termenul „prieten” sau „urmăritor” atunci când vorbim despre una dintre aceste relații în mod specific). Vom folosi termenii „ego” și „alter” în această secțiune.

Câteva legături în rețeaua egocentrică sunt reciproce – ego îl urmărește pe alter și alter îl urmărește pe ego, astfel încât ambii pot rămâne la curent cu actualizările de stare ale celuilalt. Cercetările privind legăturile reciproce în științele sociale sugerează că astfel de legături există mai des între prietenii apropiați și familie decât între cunoștințele îndepărtate. Urmărind aceste cercetări, în această secțiune presupunem că o rețea cu multe legături reciproce indică un set de relații sociale puternice, în care ambele persoane sunt interesate de actualizările celuilalt, în timp ce o rețea cu multe legături unidirecționale indică legături sociale slabe, în care ego-ul poate nici măcar să nu-l cunoască pe urmăritor, ca în cazul celebrităților de pe Twitter.

Un alt indicator al legăturilor puternice într-o rețea socială este reprezentat de „triadele închise”, care sunt legături între doi alteri ai unui ego. Ca și în cazul legăturilor reciproce, cercetările privind triadele închise arată că comunitățile strânse de legături sociale puternice prezintă mai multe triade închise decât comunitățile libere de legături sociale slabe. Urmând aceste cercetări, presupunem că un ego cu multe triade închise între alterii săi are mai multe șanse să fie integrat într-o comunitate strânsă, în care toată lumea se cunoaște. În schimb, un ego cu puține triade închise între alterii săi este mai probabil să fie solitar sau să nu fie deloc un individ. De exemplu, conturile de Twitter pentru comercianții de afaceri pot avea mulți adepți interesați de produsele lor, dar acești adepți adesea nu se cunosc între ei.

Analiza rețelelor egocentrice poate duce adesea la rezultate acționabile dacă doriți să folosiți Twitter ca platformă de dezvoltare sau de publicitate. Comunitățile strânse, de exemplu, ar putea fi mult mai predispuse să adopte un produs împreună sau deloc, în timp ce rețelele egocentrice rare, cu multe conexiuni unidirecționale, ar putea fi puternic influențate de comportamentul „centrului” rețelei – utilizatorul Twitter cu mulți urmăritori, dar cu puțini prieteni. În special, analiza rețelelor egocentrice ale celebrităților de pe Twitter ne oferă o privire asupra modului în care bogații și celebritățile din ziua de azi folosesc social media pentru a ajunge la mii (dacă nu chiar milioane) de fani care îi adoră.

Cu ajutorul NodeXL, puteți investiga prezența sau absența relativă a legăturilor reciproce și a triadelor închise în rețeaua dvs. egocentrică Twitter. Majoritatea rețelelor egocentrice sunt un amestec de legături sociale puternice și slabe, astfel încât rezumarea legăturilor reciproce și a triadelor într-un singur număr duce adesea la concluzii incorecte despre cercul dvs. social. În schimb, vizualizarea rețelei dvs. sociale vă poate oferi informații despre legăturile dvs. apropiate față de cele îndepărtate și despre interacțiunile dintre prietenii dvs. apropiați și cunoscuții dvs.

Mulți utilizatori de Twitter transmit evenimente din viața lor, de la cele banale (obiceiurile alimentare) la cele importante, cum ar fi aranjamentele de călătorie, evenimentele majore din viața lor și așa mai departe. Aceste evenimente sunt, pe termen scurt, vizibile pentru toți urmăritorii utilizatorului, care alcătuiesc o parte din rețeaua sa egocentrică. În rețele egocentrice foarte mici (de exemplu, atunci când urmăritorii unui utilizator se limitează la familia acestuia), această formă de difuzare este utilă pentru a păstra legătura cu rudele care au călătorit în străinătate sau s-au mutat. Cu toate acestea, mulți utilizatori activi au rețele egocentrice destul de mari, iar tweet-urile lor ajung adesea la persoane complet dezinteresate de ei. În același timp, numărul mare de adepți pe care îi are un utilizator Twitter face dificilă urmărirea celor care citesc tweet-urile. NodeXL permite identificarea relativ ușoară a diferitelor grupuri din rețelele egocentrice, cum ar fi urmăritorii care vă sunt colegi față de cei care vă sunt rude. Puteți profita de noua funcție Twitter Lists pentru a organiza aceste grupuri în liste convenabile pentru a le urmări și pentru a face referire în tweet-urile dumneavoastră.

Primul pas în analiza rețelei dumneavoastră egocentrice în NodeXL este colectarea datelor. O modalitate de a face acest lucru este de a utiliza funcția Import > From Twitter User’s Network (Import > din rețeaua utilizatorului Twitter) din NodeXL. Făcând clic pe fila NodeXL din meniul Excel, apoi pe lista derulantă Import din stânga panglicii NodeXL, vi se prezintă mai multe opțiuni de import (asigurați-vă că este bifată caseta de selectare „Clear NodeXL Workbook First” (Ștergeți mai întâi registrul de lucru NodeXL)). Selectați opțiunea From Twitter User’s Network (Din rețeaua utilizatorului Twitter) din lista derulantă, moment în care vi se prezintă o casetă de dialog (Fig. 10.12).

Figura 10.12. Ecranul de import al rețelei de utilizatori Twitter al NodeXL. Opțiunile de nivel selectate vor importa atât prietenii și urmăritorii lui @vlad43210, cât și orice conexiuni de prieteni/ urmăritori între ei.

În partea de sus a casetei se află un câmp de text pentru utilizatorul Twitter a cărui rețea egocentrică doriți să o colectați. Pentru acest exemplu, vom folosi unul dintre propriile noastre conturi Twitter-@vlad43210. Sub câmpul de text se află trei casete de selectare: Add an edge for Follows, Replies-to, and Mentions (Adăugați o muchie pentru relații de urmărire, răspunsuri și mențiuni în tweet-uri). Asigurați-vă că doar caseta de selectare Follows este bifată, celelalte două sunt mai relevante pentru rețelele de informații, pe care le vom analiza mai târziu. De asemenea, asigurați-vă că este bifată caseta de selectare „Get both friends and followers” (Obțineți atât prieteni, cât și urmăritori), astfel încât să puteți colecta date despre toate alter-urile, nu doar despre prieteni sau urmăritori.

Mai jos, vi se prezintă lista derulantă „Get connections out to X degrees” (Obțineți conexiuni până la X grade). Selectați „1,5” în lista derulantă pentru a capta toți alterii dumneavoastră, precum și toate relațiile de urmărire și prietenie dintre ei. Acest din urmă set de relații este necesar pentru a observa prezența triadelor închise în rețeaua dvs. egocentrică. Apoi, asigurați-vă că sunt debifate căsuțele de selectare „Add statistic columns to the Vertices worksheet (slower)” (Adăugați coloane statistice la foaia de lucru Vertices (mai lent)” și „Add a Tweet column to the Vertices worksheet” (Adăugați o coloană Tweet la foaia de lucru Vertices). Acestea sunt extrem de utile pentru a colecta date despre activitatea Twitter în rețeaua dvs. egocentrică, dar, în scopul exemplului actual, ne concentrăm pe relații, nu pe activitate.

Ultimele două câmpuri de text vă permit să specificați un nume de utilizator și o parolă în cazul în care aveți un cont Twitter pe lista albă (discutat anterior). Indiferent dacă le completați sau nu, puteți apoi să faceți clic pe OK și să începeți procesul de import de date. Odată procesul finalizat, veți vedea din nou foaia de calcul, umplută cu rânduri de perechi de utilizatori Twitter și relațiile dintre ei. Este posibil să trebuiască să faceți clic pe „Refresh Graph” (Actualizați graficul) pentru a afișa acești utilizatori și aceste relații pe pânza de grafic. Observați că ego-ul se află în centru – în exemplul nostru, acesta este @vlad43210 – înconjurat de o multitudine de alteri. Imaginea de pe pânză seamănă cu o stea, deoarece @vlad43210 are mulți alteri care nu se urmăresc între ei. Aceștia sunt probabil legăturile sale sociale slabe, cei mai mulți dintre ei fiind complet străini (Fig. 10.13).

Figura 10.13. Rețeaua Twitter egocentrică de 1,5 grade a lui @vlad43210. Vertexul din centru este @vlad43210, numeroasele vertexuri de la margini reprezintă legăturile sociale slabe ale lui @vlad43210, cele mai multe dintre ele fiind complet străine.

Vă puteți concentra pe legăturile sociale mai puternice, căutând alterațiile din rețeaua egocentrică a lui @vlad43210 cu cel puțin două legături cu alte persoane (ambele legături pot fi cu aceeași persoană) în ambele direcții, prieten sau urmăritor. Toți cei despre care am colectat date vor avea cel puțin o legătură, cu @vlad43210. Alții cu cel puțin două legături vor avea fie o legătură cu un alt alter al lui @vlad43210 (ceea ce indică faptul că fac parte dintr-o triadă închisă), fie vor avea o legătură reciprocă de prietenie/follow cu @vlad43210. După cum am discutat anterior, ambii factori pot indica prezența unei relații sociale mai puternice între @vlad43210 și persoana în cauză. În reprezentarea grafică a rețelei, alter-urile cu două legături cu alte persoane vor fi reprezentate de vârfuri cu cel puțin două muchii (în ambele direcții) între ele și cel puțin un alt vârf. Pentru a vă concentra doar pe aceste verigi, trebuie mai întâi să calculați gradul de intrare și de ieșire. Faceți clic pe butonul „calculate graph metrics”, bifați „in-degree” și „out-degree” și faceți clic pe „Compute Metrics”.”

Acum să setăm vizibilitatea vertexurilor în grafic pe baza in-degree + out-degree > 1. Verticile care se încadrează în acest criteriu vor avea cel puțin doi prieteni, doi urmăritori sau un prieten și un urmăritor (care pot fi aceeași persoană), ceea ce este exact ceea ce căutăm. Pentru a face acest lucru, adăugați mai întâi o nouă coloană făcând clic pe celula de sub eticheta „Add your own Columns here” (Adăugați propriile coloane aici) din foaia de lucru Vertices (Vertici), apoi setați valoarea celulei ca fiind suma dintre C3 și D3 (corespunzătoare gradului de intrare și, respectiv, de ieșire). Restul celulelor din coloană se vor autocompleta cu aceeași formulă. Acum etichetați această nouă coloană ca fiind „Sum Degree” prin editarea etichetei coloanei. În cele din urmă, faceți clic pe Autofill Columns, faceți clic pe lista derulantă de lângă „Vertex Visibility”, faceți clic pe „Sum Degree”, apoi faceți clic pe butonul de lângă lista derulantă și tastați 1 în caseta de text pentru a indica faptul că doriți să afișați numai vârfurile cu in-degree + out-degree > 1. Faceți clic pe OK, apoi pe Autofill, apoi pe Refresh Graph. Observați că numărul de vârfuri a devenit mult mai mic, iar graficul nu mai arată ca o stea – în schimb, îl vedem pe @vlad43210 înconjurat de două grupuri de vârfuri conectate dens, cu câteva conexiuni între grupuri.

Figura 10.14 sugerează că rețeaua egocentrică a lui @vlad43210 are două grupuri distincte de alteri strâns conectate, sau clustere, de alteri. NodeXL poate ajuta la confirmarea acestei intuiții prin efectuarea unei detecții automate a clusterelor. Pentru a detecta clusterele, dați pur și simplu clic pe „Find Clusters” (Găsește clustere) în secțiunea Analysis (Analiză) din panglica de meniu NodeXL. NodeXL va căuta în mod automat clusterele și va atribui culori diferite vârfurilor din diferite clustere (aceste atribuiri prevalează asupra oricăror culori ale vârfurilor definite prin intermediul coloanelor Autofill sau prin editarea foii de lucru). Acum faceți clic pe „Refresh Graph” (Actualizați graficul) și noile culori ale vertexurilor vor apărea pe pânză.

Figura 10.14. Rețeaua Twitter egocentrică de 1,5 grade a lui @vlad43210. Am filtrat străinii compleți pentru a ne concentra pe legăturile sociale puternice ale lui @vlad43210 – prietenii și colegii săi. Apar două clustere (dreapta sus și stânga jos).

Acum puteți face clic pe vârfurile din diferite clustere pentru a vă da seama dacă clusterele reprezintă partiții semnificative ale rețelei Twitter egocentrice a lui @vlad43210. Într-adevăr, explorarea foii de lucru arată că clusterul violet corespunde alterilor care sunt colegii academici ai lui Vlad, în timp ce clusterul verde corespunde alterilor care sunt prietenii săi (în sensul comun al cuvântului, nu în sensul Twitter al utilizatorilor pe care @vlad43210 îi urmărește). Clusterele pot fi folosite pentru a crea două Liste pentru contul de Twitter al lui Vlad: una pentru comunicarea cu prietenii săi și una pentru comunicarea cu colegii săi.

Puteți folosi, de asemenea, noțiunile de centralitate a vectorilor proprii și de centralitate a întrepătrunderii, descrise anterior, pentru a analiza importanța relativă a actorilor din rețeaua Twitter egocentrică a lui @vlad43210, din perspectiva atenției și a informațiilor. După cum am discutat în secțiunea 10.3.1, actorii cu o centralitate eigenvector ridicată în rețeaua de prieteni/followers sunt centre de atenție, în timp ce actorii cu o centralitate betweenness ridicată în aceeași rețea sunt intermediari de informații. NodeXL ne permite să vizualizăm aceste două cantități în același timp prin maparea lor pe diferite proprietăți ale vârfurilor din pânza de graf.

Să mapăm culoarea vârfului pe centralitatea eigenvectorului și dimensiunea vârfului pe centralitatea întrepătrunderii.7 Pentru a face acest lucru, faceți mai întâi clic pe butonul Graph Metrics din secțiunea Analysis (Analiză) din panglica de meniu NodeXL, apoi bifați „Eigenvector centrality” (Centralitate eigenvectorică) și „Betweenness and closeness centralities” (Centralități întrepătrundere și apropiere) și faceți clic pe „Compute Metrics” (Calculați metricile). În continuare, faceți clic pe butonul Autofill Columns (Umplere automată a coloanelor) din meniul NodeXL, faceți clic pe lista derulantă de lângă „Vertex Color” (Culoarea vârfurilor) și selectați „Eigenvector Centrality” (Centralitatea vectorului propriu), faceți clic pe lista derulantă de lângă „Vertex Size” (Dimensiunea vârfurilor) și selectați „Betweenness Centrality” (Centralitatea de apropiere). Faceți clic pe „Autofill” (Umplere automată) și apoi pe butonul Refresh Graph (Reîmprospătare grafic) din panoul de afișare a graficului pentru a actualiza dimensiunile și culorile vertexurilor din tabloul grafic. Mai efectuați o ajustare înainte de a afișa graficul – deoarece @vlad43210 se află în centrul rețelei sale egocentrice prin definiție, centralizările lui Betweenness și eigenvector vor fi ridicate, dar nu ne vor spune nimic despre poziția lui @vlad43210 în rețeaua sa. Setați manual centralizările betweenness și eigenvector centralities ale lui @vlad43210 la 0 în foaia de lucru și apăsați din nou „Refresh Graph”.

Dacă comparați figurile 10.15 și 10.15.16, puteți vedea că colegii lui @vlad43210 sunt mai mult în centrul atenției decât prietenii săi, dar că cele două clustere sunt destul de echilibrate în ceea ce privește fluxul de informații (cu excepția lui @redlog, care are atât centralizări foarte mari ale vectorului propriu, cât și centralizări foarte mari ale întrepătrunderii și apare ca un nod verde mare în grafic).

Figura 10.15. Rețeaua Twitter egocentrică de 1,5 grade a lui @vlad43210 (doar legături sociale puternice). NodeXL identifică automat clusterele și le colorează diferit. Partea din dreapta sus (verde) corespunde prietenilor lui @vlad43210, iar partea din stânga jos (violet) corespunde colegilor săi universitari.

Figura 10.16. Rețeaua Twitter egocentrică de 1,5 grade @vlad43210. Verticile mai verzi au o centralitate mai mare a vectorilor proprii, iar verticile mai mari au o centralitate mai mare a întrepătrunderii.

În cele din urmă, să comparăm rețeaua egocentrică de prieteni și urmăritori a lui @vlad43210 cu rețeaua de @răspunsuri și mențiuni a lui @vlad43210. Rețineți că ambele rețele sunt egocentrice, dar alterii nu sunt neapărat aceiași în fiecare dintre ele. La momentul redactării acestui articol, NodeXL nu importă date detaliate despre @reply și mențiuni pentru utilizatori, însă API-ul Twitter permite o soluție rapidă. Utilizând API statusuri/mențiuni, puteți vizita URL-ul www.twitter.com/statuses/mentions.xml și înregistra manual numele tuturor prietenilor sau urmăritorilor lui @vlad43210 care i-au dat @replică sau i-au menționat numele de utilizator Twitter într-unul dintre tweet-urile lor, precum și numărul de @replici sau mențiuni pentru fiecare nume. Deoarece @vlad43210 nu primește multe @răspunsuri sau mențiuni, aceasta nu este o sarcină care necesită mult timp – pentru sarcini care necesită mai mult timp, o alternativă ar fi să scrieți un script care să înregistreze automat aceste nume. În continuare, pentru fiecare astfel de nume, găsiți în foaia de lucru „Edges” muchia care îl leagă pe @vlad43210 de un utilizator care i-a dat @replică sau l-a menționat. Setați manual lățimea acestor muchii la numărul de @răspunsuri sau menționări ale lui @vlad43210 de către utilizatorul respectiv. În cele din urmă, apăsați „Refresh Graph” pentru a reflecta aceste actualizări (Fig. 10.17).

Figura 10.17. Rețeaua Twitter egocentrică de 1,5 grade @vlad43210. Verticile mai verzi au o centralitate a vectorilor proprii mai mare, iar verticile mai mari au o centralitate a întrepătrunderii mai mare. Marginile mai groase corespund utilizatorilor care @răspund la @vlad43210 sau îi menționează numele de utilizator într-unul dintre tweet-urile lor.

Vezi că, deși colegii lui @vlad43210 sunt mai mult în centrul atenției decât prietenii săi, prietenii săi @răspund la @vlad43210 și îl menționează mai des decât o fac colegii săi. De asemenea, observați că, deși unele conexiuni de @răspunsuri și mențiuni îl leagă pe @vlad43210 de actori cu centrare ridicată, cum ar fi @redlog, altele îl leagă pe @vlad43210 de actori cu centrare scăzută. În mod clar, relațiile de informare și atenție din rețeaua egocentrică friends/followers a lui @vlad43210 nu au neapărat aceeași pondere în rețeaua sa egocentrică @replies/mentions.

Advanced Topic

Aligning the Vertices in a Graph

Să ne uităm pe scurt la figurile 10.9 și 10.10 (exemplele de rețea de informare/atenție și de rețea de centralitate). Să presupunem că doriți să aliniați un număr mic de vârfuri într-un mod care să arate clar grupările. Trebuie să fie mult de lucru să aliniați acele vârfuri atât de precis de mână, trăgându-le unul câte unul.

După cum am descris mai devreme în caseta „Advanced” (Avansat), puteți manipula rețelele NodeXL la fel ca foile de calcul obișnuite. Fila Vertici conține coloane numite „X” și „Y”, care conțin pozițiile vârfurilor în grafic. Există, de asemenea, o coloană numită „Locked?” (Blocat?), care controlează dacă pozițiile vârfurilor sunt blocate la locul lor sau dacă pot fi mutate atunci când graficul este redesenat.

După ce ați rearanjat vârfurile așa cum vă place, rulați următoarea macro pentru a le alinia perfect:

Sub Realign()

′ distanța la care se rotunjește fiecare locație

RDIST = 500

COL_VERTEX = 1

COL_LOCK = 21

COL_X = 19

.

COL_Y = 20

ROW_START = 3

Dim wksht As Worksheet

Set wksht = Sheets(„Vertices”)

current_row = ROW_START

While wksht.Cells(current_row, COL_VERTEX).Text > „”

′ asigurați-vă că poziția vertexului este blocată

wksht.Cells(current_row, COL_LOCK) = „Yes (1)”

′ rotunjește x și y

x = Round(wksht.Cells(current_row, COL_X) / RDIST) * RDIST

wksht.Cells(current_row, COL_X) = x

y = Round(wksht.Cells(current_row, COL_Y) / RDIST) * RDIST

wksht.Cells(current_row, COL_Y) = y

current_row = current_row + 1

Wend

End Sub

Acest macro trece în buclă prin fiecare vertex din grafic. Mai întâi blochează poziția vertexului, apoi rotunjește coordonatele X, Y la cei mai apropiați 500 de pixeli. Astfel, dacă două vârfuri se află unul lângă celălalt și coordonatele lor y sunt 1498 și 1502, fiecare va fi repoziționat la y = 1500. Acest lucru asigură că vârfurile sunt aliniate corect.

.

Lasă un comentariu