Betweenness Centrality

10.5.1 Ego Network

Jedním z běžných způsobů využití Twitteru je udržování kontaktu s osobní sociální sítí – rodinou, kolegy, známými apod. Někteří z vašich přátel a sledujících na Twitteru budou zcela jistě patřit k lidem, kteří jsou vám blízcí, zatímco jiní mohou být vzdálení známí nebo dokonce zcela cizí lidé. Soubor přátel a sledujících uživatele Twitteru označujeme jako jeho „egocentrickou síť“. Když mluvíme o egocentrické síti uživatele Twitteru, zmíněného uživatele často označujeme jako „ego“ a jeho přátele a následovníky jako „alters“ (ale stále používáme termín „friend“ nebo „follower“, když mluvíme konkrétně o jednom z těchto vztahů). V této části budeme používat termíny „ego“ a „alter“.

Některé vazby v egocentrické síti jsou reciproční – ego sleduje alter a alter sleduje ego, takže oba mohou zůstat informováni o aktualizacích stavu toho druhého. Výzkum recipročních vazeb v sociálních vědách naznačuje, že takové vazby častěji existují mezi blízkými přáteli a rodinou než mezi vzdálenými známými. V návaznosti na tento výzkum v této části předpokládáme, že síť s mnoha vzájemnými vazbami naznačuje soubor silných sociálních vztahů, kdy se obě osoby vzájemně zajímají o své aktualizace, zatímco síť s mnoha jednosměrnými vazbami naznačuje slabé sociální vazby, kdy ego nemusí sledovaného ani znát, jako v případě celebrit na Twitteru.

Dalším ukazatelem silných vazeb v sociální síti jsou „uzavřené triády“, což jsou vazby mezi dvěma altery ega. Stejně jako u recipročních vazeb výzkum uzavřených triád ukazuje, že těsná společenství silných sociálních vazeb obsahují více uzavřených triád než volná společenství slabých sociálních vazeb. V návaznosti na tento výzkum předpokládáme, že ego s mnoha uzavřenými triádami mezi svými altery je s větší pravděpodobností zakotveno v úzkém společenství, kde se všichni navzájem znají. Naopak ego, které má mezi svými alters málo uzavřených triád, je pravděpodobnější, že je osamělé nebo vůbec není individualitou. Například účty obchodníků na Twitteru mohou mít mnoho sledujících, kteří se zajímají o jejich produkty, ale tito sledující se často navzájem neznají.

Analýza egocentrických sítí může často vést k použitelným výsledkům, pokud chcete Twitter využít jako vývojovou nebo reklamní platformu. Například těsné komunity mohou mnohem pravděpodobněji přijmout produkt společně nebo vůbec, zatímco řídké egocentrické sítě s mnoha jednosměrnými spojeními mohou být silně ovlivněny chováním „středu“ sítě – uživatele Twitteru s mnoha sledujícími, ale málo přáteli. Zejména analýza egocentrických sítí celebrit na Twitteru nám umožňuje nahlédnout, jak dnešní bohatí a slavní využívají sociální média k oslovení tisíců (ne-li milionů) obdivovatelů.

Pomocí programu NodeXL můžete zkoumat relativní přítomnost či nepřítomnost vzájemných vazeb a uzavřených triád v egocentrické síti Twitter. Většina egocentrických sítí je směsí silných a slabých sociálních vazeb, takže shrnutí recipročních vazeb a triád do jednoho čísla často vede k nesprávným závěrům o vašem sociálním okruhu. Místo toho vám vizualizace vaší sociální sítě může poskytnout informace o vašich blízkých a vzdálených vazbách a o interakcích mezi vašimi blízkými přáteli a známými.

Mnoho uživatelů Twitteru vysílá události ve svém životě, od těch triviálních (stravovací návyky) až po ty důležité, jako je organizace cest, významné životní události apod. Tyto události jsou krátkodobě viditelné všem uživatelčiným sledujícím, kteří tvoří část její egocentrické sítě. Ve velmi malých egocentrických sítích (např. když se sledující uživatele omezují na jeho rodinu) je tato forma vysílání užitečná pro udržování kontaktu s příbuznými, kteří odcestovali do zahraničí nebo se odstěhovali. Mnoho aktivních uživatelů má však poměrně rozsáhlé egocentrické sítě a jejich tweety se často rozesílají lidem, kteří se o ně vůbec nezajímají. Zároveň je vzhledem k obrovskému počtu sledujících, které uživatel Twitteru nashromáždí, obtížné sledovat, kdo jeho tweety čte. NodeXL umožňuje poměrně snadno identifikovat různé skupiny v egocentrických sítích, například sledující, kteří jsou vašimi kolegy, oproti těm, kteří jsou vaší rodinou. Můžete využít novou funkci Seznamy Twitteru a uspořádat tyto skupiny do pohodlných seznamů pro sledování a odkazování ve vašich tweetech.

Prvním krokem při analýze vaší egocentrické sítě v NodeXL je shromáždění dat. Jedním ze způsobů, jak to udělat, je použít funkci Import > ze sítě uživatele Twitteru v aplikaci NodeXL. Po kliknutí na kartu NodeXL v nabídce aplikace Excel a poté na rozevírací seznam Import v levé části pásu NodeXL se zobrazí několik možností importu (ujistěte se, že je zaškrtnuto políčko „Nejprve vymazat sešit NodeXL“). V rozevíracím seznamu vyberte možnost Ze sítě uživatele Twitteru, načež se zobrazí dialogové okno (obr. 10.12).

Obrázek 10.12. Obrazovka importu sítě uživatele Twitteru v aplikaci NodeXL. Vybrané možnosti úrovní importují jak přátele a následovníky @vlad43210, tak i všechna spojení přátel/sledovatelů mezi nimi.

V horní části okna je textové pole pro uživatele Twitteru, jehož egocentrickou síť chcete shromáždit. Pro tento příklad použijeme jeden z vlastních účtů Twitter – @vlad43210. Pod textovým polem leží tři zaškrtávací políčka: Přidat okraj pro vztahy Follows, Replies-to a Mentions v tweetech. Ujistěte se, že je zaškrtnuto pouze políčko Follows, ostatní dvě jsou důležitější pro informační sítě, které budeme zkoumat později. Také se ujistěte, že je zaškrtnuto políčko „Získat přátele i následovníky“, abyste mohli shromažďovat údaje o všech alters, nejen o přátelích nebo následovnících.

Dále se vám zobrazí rozevírací seznam „Získat spojení do X stupňů“. V rozevíracím seznamu vyberte možnost „1,5“, abyste zachytili všechny své alters a také všechny vztahy následovníků a přátel mezi nimi. Posledně jmenovaná sada vztahů je nezbytná pro pozorování přítomnosti uzavřených triád ve vaší egocentrické síti. Dále se ujistěte, že políčka „Přidat statistické sloupce do pracovního listu Vrcholy (pomalejší)“ a „Přidat sloupec Tweet do pracovního listu Vrcholy“ nejsou zaškrtnutá. Ty jsou velmi užitečné pro shromažďování údajů o aktivitě na Twitteru ve vaší egocentrické síti, ale pro účely tohoto příkladu se zaměřujeme na vztahy, nikoli na aktivitu.

Závěrečná dvě textová pole umožňují zadat uživatelské jméno a heslo v případě, že máte účet na Twitteru na bílé listině (o čemž jsme hovořili dříve). Ať už je vyplníte, nebo ne, můžete dále kliknout na tlačítko OK a zahájit proces importu dat. Po dokončení procesu se opět zobrazí tabulka naplněná řádky s dvojicemi uživatelů Twitteru a vztahy mezi nimi. Možná budete muset kliknout na „Obnovit graf“, aby se tito uživatelé a vztahy zobrazily na plátně grafu. Všimněte si, že ego je uprostřed – v našem příkladu je to @vlad43210 – obklopeno množstvím alterů. Obrázek na plátně připomíná hvězdu, protože @vlad43210 má mnoho alters, kteří se navzájem nesledují. Jsou to pravděpodobně jeho slabé sociální vazby, většina z nich jsou úplně cizí lidé (obr. 10.13).

Obrázek 10.13. Egocentrická síť Twitteru @vlad43210 o velikosti 1,5 stupně. Vrchol ve středu je @vlad43210, mnoho vrcholů na okrajích představuje slabé sociální vazby @vlad43210, většina z nich jsou úplně cizí lidé.

Na silnější sociální vazby se můžete zaměřit tak, že se podíváte na alters v egocentrické síti @vlad43210 s alespoň dvěma vazbami na jiné lidi (obě vazby mohou být na stejnou osobu) v obou směrech, přítel nebo následovník. Každý, o kom jsme shromáždili údaje, bude mít alespoň jednu vazbu, a to na @vlad43210. Alters s alespoň dvěma vazbami budou mít buď vazbu na jiného altera @vlad43210 (což naznačuje, že jsou součástí uzavřené triády), nebo budou mít reciproční vazbu na přítele/sledovatele @vlad43210. Jak jsme uvedli dříve, oba tyto faktory mohou naznačovat přítomnost silnějšího sociálního vztahu mezi @vlad43210 a danou osobou. V grafovém znázornění sítě budou alters se dvěma vazbami na jiné osoby reprezentovány vrcholy s alespoň dvěma hranami (v obou směrech) mezi nimi a alespoň jedním dalším vrcholem. Abyste se mohli soustředit pouze na tyto vrcholy, musíte nejprve vypočítat vstupní a výstupní stupeň. Klepněte na tlačítko „vypočítat metriky grafu“, zaškrtněte „in-degree“ a „out-degree“ a klepněte na tlačítko „Vypočítat metriky“.

Nyní nastavíme viditelnost vrcholů v grafu na základě in-degree + out-degree > 1. Klepněte na tlačítko „vypočítat metriky grafu“, zaškrtněte „in-degree“ a „out-degree“ a klepněte na tlačítko „vypočítat metriky“. Vrcholy, které vyhovují tomuto kritériu, budou mít alespoň dva přátele, dva následovníky nebo jednoho přítele a jednoho následovníka (což může být tatáž osoba), což je přesně to, co hledáme. Chcete-li to provést, přidejte nejprve nový sloupec kliknutím na buňku pod nápisem „Add your own Columns here“ v pracovním listu Vertices a poté nastavte hodnotu buňky jako součet C3 a D3 (odpovídající stupni in- a out). Ostatní buňky ve sloupci se automaticky vyplní stejným vzorcem. Nyní tento nový sloupec označte jako „Součet stupňů“ úpravou popisku sloupce. Nakonec klikněte na tlačítko Autofill Columns (Automatické vyplňování sloupců), klikněte na rozevírací seznam vedle položky „Vertex Visibility“ (Viditelnost vrcholů), klikněte na položku „Sum Degree“ (Součet stupňů), pak klikněte na tlačítko vedle rozevíracího seznamu a do textového pole zadejte 1, čímž označíte, že chcete zobrazit pouze vrcholy se stupněm in + out > 1. Klikněte na tlačítko OK, poté na tlačítko Automatické vyplnění a poté na tlačítko Obnovit graf. Všimněte si, že počet vrcholů se výrazně zmenšil a graf již nevypadá jako hvězda – místo toho vidíme @vlad43210 obklopeného dvěma hustě propojenými skupinami vrcholů s několika spojeními mezi skupinami.

Obrázek 10.14 naznačuje, že egocentrická síť @vlad43210 má dvě samostatné hustě propojené skupiny nebo shluky alters. NodeXL může pomoci potvrdit tuto intuici provedením automatické detekce shluků. Pro detekci shluků stačí kliknout na „Najít shluky“ v části Analýza na pásu nabídky NodeXL. NodeXL automaticky vyhledá shluky a vrcholům v různých shlucích přiřadí různé barvy (tato přiřazení potlačí všechny barvy vrcholů definované prostřednictvím sloupců Automatické vyplnění nebo úpravou pracovního listu). Nyní klikněte na tlačítko „Obnovit graf“ a na plátně se objeví nové barvy vrcholů.

Obrázek 10.14: Obnovte graf. Egocentrická síť Twitteru @vlad43210 o velikosti 1,5 stupně. Odfiltrovali jsme zcela cizí osoby, abychom se zaměřili na silné sociální vazby @vlad43210 – jeho přátele a kolegy. Vznikají dva shluky (vpravo nahoře a vlevo dole).

Nyní můžete kliknout na vrcholy v různých shlucích a získat představu, zda shluky představují smysluplné rozdělení egocentrické sítě Twitter @vlad43210. Zkoumání pracovního listu skutečně ukazuje, že fialový shluk odpovídá alters, kteří jsou Vladovými akademickými kolegy, zatímco zelený shluk odpovídá alters, kteří jsou jeho přáteli (v běžném slova smyslu, nikoli ve smyslu uživatelů Twitteru, které @vlad43210 sleduje). Z těchto shluků lze vytvořit dva seznamy pro Vladův účet na Twitteru: jeden pro komunikaci s jeho přáteli a druhý pro komunikaci s jeho kolegy.

K pohledu na relativní důležitost aktérů v egocentrické síti @vlad43210 na Twitteru z hlediska pozornosti a informací lze také použít dříve popsané pojmy centralita vlastního vektoru a centralita mezi. Jak jsme uvedli v kapitole 10.3.1, aktéři s vysokou eigenvektorovou centralitou v síti přátel/sledovatelů jsou centry pozornosti, zatímco aktéři s vysokou betweenness centralitou v téže síti jsou zprostředkovateli informací. NodeXL nám umožňuje vizualizovat obě tyto veličiny současně tím, že je mapuje na různé vlastnosti vrcholů na plátně grafu.

Mapujme barvu vrcholu na centralitu vlastního vektoru a velikost vrcholu na centralitu mezilehlosti.7 Za tímto účelem nejprve klikněte na tlačítko Graph Metrics (Metriky grafu) v části Analysis (Analýza) na pásu nabídky NodeXL, poté zaškrtněte „Eigenvector centrality“ (Centralita vlastního vektoru) a „Betweenness and closeness centralities“ (Centralita mezilehlosti a centralita blízkosti) a klikněte na „Compute Metrics“ (Vypočítat metriky). Poté klikněte na tlačítko Autofill Columns (Automatické vyplňování sloupců) v nabídce NodeXL, klikněte na rozevírací seznam vedle „Vertex Color“ (Barva vrcholu) a vyberte „Eigenvector Centrality“ (Centralita vlastního vektoru), klikněte na rozevírací seznam vedle „Vertex Size“ (Velikost vrcholu) a vyberte „Betweenness Centrality“ (Centralita blízkosti). Kliknutím na tlačítko „Autofill“ a poté na tlačítko Refresh Graph (Obnovit graf) na panelu zobrazení grafu aktualizujte velikosti a barvy vrcholů na plátně grafu. Před zobrazením grafu proveďte ještě jednu úpravu – protože @vlad43210 je z definice ve středu své egocentrické sítě, jeho betweenness a eigenvector centrality budou vysoké, ale nebudou nám nic říkat o pozici @vlad43210 v jeho síti. V pracovním listu ručně nastavte betweenness a eigenvector centralities @vlad43210 na 0 a znovu stiskněte tlačítko „Obnovit graf“.

Pokud porovnáte obrázky 10.15 a 10.16, vidíte, že kolegové @vlad43210 jsou více středem pozornosti než jeho přátelé, ale že oba shluky jsou z hlediska toku informací poměrně vyrovnané (s výjimkou @redlog, který má jak velmi vysoké vlastní vektory, tak velmi vysoké centrality betweenness a v grafu se zobrazuje jako velký zelený uzel).

Obr. 10.15. Egocentrická síť Twitter @vlad43210 o 1,5 stupně (pouze silné sociální vazby). NodeXL automaticky identifikuje shluky a odlišuje je barvami. Pravý horní roh (zelený) odpovídá přátelům @vlad43210 a levý dolní roh (fialový) odpovídá jeho akademickým kolegům.

Obrázek 10.16. Egocentrická síť Twitteru @vlad43210 o velikosti 1,5 stupně. Zelenější vrcholy mají vyšší eigenvector centrality a větší vrcholy mají vyšší betweenness centrality.

Nakonec porovnejme egocentrickou síť přátel a sledujících @vlad43210 se sítí @replies a zmínek @vlad43210. Všimněte si, že obě tyto sítě jsou egocentrické, ale alters nemusí být v každé z nich stejné. NodeXL v době psaní tohoto článku neimportuje podrobné údaje o @odpovědích a zmínkách uživatelů, ale rozhraní Twitter API umožňuje rychlé řešení. Pomocí rozhraní API statusů/zmínek můžete navštívit adresu www.twitter.com/statuses/mentions.xml a ručně zaznamenat jména všech přátel nebo sledujících uživatele @vlad43210, kteří mu @odpověděli nebo zmínili jeho uživatelské jméno na Twitteru v některém ze svých tweetů, a také počet @odpovědí nebo zmínek na jméno. Protože @vlad43210 nedostává mnoho @odpovědí ani zmínek, nejedná se o časově náročný úkol – pro časově náročnější úkoly by bylo alternativou napsat skript, který by tato jména zaznamenával automaticky. Dále pro každé takové jméno najděte v pracovním listu Hrany hranu spojující @vlad43210 s uživatelem, který mu odpověděl nebo se o něm zmínil. Ručně nastavte šířku těchto hran na počet @odpovědí nebo zmínek o @vlad43210 příslušným uživatelem. Nakonec stiskněte tlačítko „Obnovit graf“, aby se tyto aktualizace projevily (obr. 10.17).

Obrázek 10.17. Egocentrická síť Twitter @vlad43210 o velikosti 1,5 stupně. Zelenější vrcholy mají vyšší eigenvector centrality a větší vrcholy mají vyšší betweenness centrality. Silnější hrany odpovídají uživatelům, kteří @vlad43210 odpovídají nebo zmiňují jeho uživatelské jméno v některém ze svých tweetů.

Je vidět, že ačkoli kolegové @vlad43210 jsou více středem pozornosti než jeho přátelé, jeho přátelé @vlad43210 odpovídají a zmiňují ho častěji než jeho kolegové. Všimněte si také, že ačkoli některá spojení @reply a mention spojují @vlad43210 s aktéry s vysokou centrálností, jako je @redlog, jiná spojují @vlad43210 s aktéry s nízkou centrálností. Je zřejmé, že vztahy informací a pozornosti v egocentrické síti přátel/sledovatelů @vlad43210 nemusí mít nutně stejnou váhu v jeho egocentrické síti @odpovědi/zmínky.

Pokročilé téma

Zarovnání vrcholů v grafu

Podívejme se krátce na obrázky 10.9 a 10.10 (příklady sítě informací/pozornosti a sítě centrality). Předpokládejme, že chcete seřadit malý počet vrcholů tak, aby bylo jasně vidět seskupení. Takto ostře seřadit tyto vrcholy ručním přetahováním jednoho po druhém musí dát hodně práce.

Jak jsme již popsali v rámečku „Pokročilé“, se sítěmi NodeXL můžete manipulovat stejně jako s běžnými tabulkami. Karta Vrcholy obsahuje sloupce nazvané „X“ a „Y“, které obsahují pozice vrcholů v grafu. Je zde také sloupec s názvem „Uzamčeno?“, který určuje, zda jsou pozice vrcholů uzamčeny na místě, nebo zda je lze při překreslování grafu přesouvat.

Po změně uspořádání vrcholů tak, jak se vám líbí, spusťte následující makro pro jejich dokonalé zarovnání:

Sub Realign()

′ vzdálenost pro zaokrouhlení každého umístění na

RDIST = 500

COL_VERTEX = 1

COL_LOCK = 21

COL_X = 19

.

COL_Y = 20

ROW_START = 3

Dim wksht As Worksheet

Set wksht = Sheets(„Vertices“)

current_row = ROW_START

While wksht.Cells(current_row, COL_VERTEX).Text > „“

′ ujistěte se, že je pozice vrcholu uzamčena

wksht.Cells(current_row, COL_LOCK) = „Yes (1)“

′ zaokrouhlete x a y

x = Round(wksht.Cells(current_row, COL_X) / RDIST) * RDIST

wksht.Cells(current_row, COL_X) = x

y = Round(wksht.Cells(current_row, COL_Y) / RDIST) * RDIST

wksht.Cells(current_row, COL_Y) = y

current_row = current_row + 1

Wend

End Sub

Toto makro prochází smyčkou každý vrchol v grafu. Nejprve uzamkne polohu vrcholu a poté zaokrouhlí souřadnice X, Y na nejbližších 500 pixelů. Pokud jsou tedy dva vrcholy vedle sebe a jejich souřadnice y jsou 1498 a 1502, každý z nich bude přemístěn na y = 1500. Tím je zajištěno správné zarovnání vrcholů.

.

Napsat komentář