Betweenness Centrality

10.5.1 The Ego Network

One common use of Twitter is keeping in touch with your personal social network-family, colleagues, acquaintances, and so on. Niektórzy z Twoich przyjaciół i zwolenników na Twitterze z pewnością należą do ludzi, z którymi jesteś blisko, podczas gdy inni mogą być dalecy znajomi lub nawet zupełnie obcy. Odnosimy się do zestawu przyjaciół i zwolenników użytkownika Twittera jako jego lub jej „egocentrycznej sieci”. Kiedy mówimy o egocentrycznej sieci użytkownika Twittera, użytkownik ten jest często określany jako „ego” i jego lub jej przyjaciół i zwolenników jako „alters” (ale nadal używać terminu „przyjaciel” lub „zwolennik”, gdy mówimy o jednym z tych relacji szczególnie). Będziemy używać terminów „ego” i „alter” w tej sekcji.

Niektóre więzi w sieci egocentrycznej są wzajemne – ego podąża za alter i alter podąża za ego, więc obie mogą pozostać świadome wzajemnych aktualizacji statusu. Badania nad wzajemnymi więziami w naukach społecznych sugerują, że takie więzi częściej występują między bliskimi przyjaciółmi i rodziną niż między dalekimi znajomymi. Podążając za tymi badaniami, w tej sekcji zakładamy, że sieć z wieloma wzajemnymi więziami wskazuje na zestaw silnych relacji społecznych, gdzie obie osoby są zainteresowane wzajemnymi aktualizacjami, podczas gdy sieć z wieloma jednokierunkowymi więziami wskazuje na słabe więzi społeczne, gdzie ego może nawet nie znać followera, jak w przypadku celebrytów Twittera.

Innym wskaźnikiem silnych więzi w sieci społecznej są „zamknięte triady”, które są więziami pomiędzy dwoma alterami ego. Podobnie jak w przypadku więzi wzajemnych, badania nad zamkniętymi triadami pokazują, że w ciasnych społecznościach o silnych więziach społecznych występuje więcej zamkniętych triad niż w luźnych społecznościach o słabych więziach społecznych. Podążając za tymi badaniami, zakładamy, że ego z wieloma zamkniętymi triadami wśród swoich alterów jest bardziej prawdopodobne, że jest osadzone w ciasnej społeczności, gdzie wszyscy się znają. Z kolei ego, które ma niewiele zamkniętych triad między swoimi alterami, jest bardziej prawdopodobne, że jest samotne lub w ogóle nie jest jednostką. Na przykład, Twitter konta dla marketerów biznesowych może mieć wiele zwolenników zainteresowanych w swoich produktach, ale ci zwolennicy często nie znają się nawzajem.

Analiza egocentrycznych sieci może często prowadzić do wyników działania, jeśli chcesz korzystać z Twittera jako rozwoju lub platformy reklamowej. Tight społeczności, na przykład, może być znacznie bardziej prawdopodobne, aby przyjąć produkt razem lub nie w ogóle, podczas gdy skąpe egocentryczne sieci z wielu jednokierunkowych połączeń może być pod silnym wpływem zachowania „hub” sieci-użytkownika Twittera z wielu zwolenników, ale niewielu przyjaciół. W szczególności analiza egocentrycznych sieci celebrytów na Twitterze daje nam wgląd w to, jak bogaci i sławni dzisiaj używać mediów społecznościowych, aby dotrzeć do tysięcy (jeśli nie milionów) fanów adoracji.

Z pomocą NodeXL, można zbadać względną obecność lub brak wzajemnych więzi i zamknięte triady w egocentrycznej sieci Twitter. Większość sieci egocentrycznych to mieszanka silnych i słabych więzi społecznych, więc podsumowanie wzajemnych więzi i triad w jednej liczbie często prowadzi do błędnych wniosków na temat Twojego kręgu społecznego. Zamiast tego, wizualizacja sieci społecznej może dać ci wgląd w bliskich i odległych więzi i interakcji między bliskimi przyjaciółmi i znajomymi.

Wielu użytkowników Twittera transmitować wydarzenia w swoim życiu, od trywialnych (nawyki żywieniowe) do ważnych, takich jak plany podróży, główne wydarzenia życiowe, i tak dalej. Wydarzenia te są w krótkim okresie widoczne dla wszystkich użytkowników zwolenników, które tworzą część jej egocentrycznej sieci. W bardzo małych sieciach egocentrycznych (np. gdy liczba followersów użytkownika ogranicza się do jego rodziny), taka forma przekazu jest przydatna do utrzymywania kontaktu z krewnymi, którzy wyjechali za granicę lub się wyprowadzili. Jednak wielu aktywnych użytkowników ma dość duże sieci egocentryczne, a ich tweety często trafiają do osób zupełnie nimi niezainteresowanych. W tym samym czasie, sama liczba zwolenników użytkownik Twitter amasses sprawia, że trudno jest śledzić, kto jest czytanie tweets. NodeXL sprawia, że stosunkowo łatwo zidentyfikować różne grupy w egocentrycznych sieci, takich jak zwolennicy, którzy są twoi koledzy kontra ci, którzy są twoją rodziną. Możesz skorzystać z nowej funkcji Twitter Lists, aby zorganizować te grupy w wygodne listy do naśladowania i odniesienia w swoich tweetach.

Pierwszym krokiem w analizie sieci egocentrycznej w NodeXL jest zbieranie danych. Jednym ze sposobów na to jest użycie funkcji Import > From Twitter User’s Network w NodeXL. Po kliknięciu na zakładkę NodeXL w menu Excel, a następnie na listę rozwijaną Importuj po lewej stronie wstążki NodeXL, pojawi się kilka opcji importu (upewnij się, że pole wyboru „Wyczyść najpierw NodeXL Workbook” jest zaznaczone). Z listy rozwijanej wybierz opcję From Twitter User’s Network, po czym zostanie wyświetlone okno dialogowe (rys. 10.12).

Rysunek 10.12. Ekran importu sieci użytkowników Twittera w programie NodeXL. Wybrane opcje poziomów zaimportują zarówno znajomych i zwolenników @vlad43210, jak i wszelkie połączenia znajomych/zwolenników między nimi.

Na górze okna znajduje się pole tekstowe dla użytkownika Twittera, którego sieć egocentryczną chcesz zebrać. Dla tego przykładu, będziemy używać jednego z naszych własnych kont Twitter-@vlad43210. Poniżej pola tekstowego znajdują się trzy pola wyboru: Add an edge for Follows, Replies-to, and Mentions relationships in tweets. Upewnij się, że tylko pole wyboru Follows jest zaznaczone, pozostałe dwa są bardziej istotne dla sieci informacyjnych, które będziemy badać później. Upewnij się również, że pole wyboru „Get both friends and followers” jest zaznaczone, abyś mógł zbierać dane o wszystkich alterach, a nie tylko o przyjaciołach lub followersach.

Dalej w dół, jesteś przedstawiony z listą rozwijaną „Get connections out to X degrees”. Wybierz „1.5” z listy rozwijanej, aby uchwycić wszystkich swoich alterów, jak również wszystkie relacje follow i friend między nimi. Ten ostatni zestaw relacji jest niezbędny do zaobserwowania obecności zamkniętych triad w Twojej sieci egocentrycznej. Następnie upewnij się, że pola wyboru „Add statistic columns to the Vertices worksheet (slower)” oraz „Add a Tweet column to the Vertices worksheet” są niezaznaczone. Są one bardzo przydatne do zbierania danych o aktywności Twittera w sieci egocentrycznej, ale dla celów bieżącego przykładu jesteśmy skoncentrowani na relacjach, nie activity.

Ostatnie dwa pola tekstowe pozwalają określić nazwę użytkownika i hasło, jeśli masz białego konta Twitter (omówione wcześniej). Niezależnie od tego, czy wypełnisz te pola, czy nie, możesz następnie kliknąć OK i rozpocząć proces importu danych. Po zakończeniu procesu, zobaczysz arkusz kalkulacyjny ponownie, wypełniony rzędami par użytkowników Twittera i relacji między nimi. Być może będziesz musiał kliknąć na „Odśwież wykres”, aby wyświetlić tych użytkowników i relacje na płótnie wykresu. Zauważ, że ego jest w centrum – w naszym przykładzie, to jest @vlad43210 – otoczony przez wiele alters. Obraz na płótnie przypomina gwiazdę, ponieważ @vlad43210 ma wiele alterów, które nie śledzą się nawzajem. Są to prawdopodobnie jego słabe więzi społeczne, większość z nich to zupełnie obcy ludzie (rys. 10.13).

Rysunek 10.13. 1,5-stopniowa egocentryczna sieć Twittera @vlad43210. Wierzchołek w centrum to @vlad43210, wiele wierzchołków na krawędziach reprezentuje słabe więzi społeczne @vlad43210, z których większość to zupełnie obcy ludzie.

Możesz skupić się na silniejszych więziach społecznych, patrząc na wierzchołki w sieci egocentrycznej @vlad43210 z co najmniej dwoma więziami z innymi ludźmi (oba mogą być do tej samej osoby) w obu kierunkach, przyjaciel lub zwolennik. Każdy, o kim zebraliśmy dane, będzie miał co najmniej jedno powiązanie, z @vlad43210. Altery z co najmniej dwoma powiązaniami będą miały albo powiązanie z innym alter-ego @vlad43210 (wskazując, że są częścią zamkniętej triady), albo będą miały wzajemne powiązanie friend/follow z @vlad43210. Jak omawialiśmy wcześniej, oba te czynniki mogą wskazywać na obecność silniejszej relacji społecznej pomiędzy @vlad43210 a daną osobą. W graficznej reprezentacji sieci, altery z dwoma powiązaniami z innymi ludźmi będą reprezentowane przez wierzchołki z co najmniej dwoma krawędziami (w dowolnym kierunku) pomiędzy nimi a co najmniej jednym innym wierzchołkiem. Aby skupić się tylko na tych wierzchołkach, musisz najpierw obliczyć stopień wejściowy i wyjściowy. Kliknij przycisk „oblicz metrykę grafu”, zaznacz „stopień wewnętrzny” i „stopień zewnętrzny”, a następnie kliknij „oblicz metrykę”

Teraz ustawmy widoczność wierzchołków w grafie na podstawie stopnia wewnętrznego + zewnętrznego > 1. Wierzchołki, które pasują do tego kryterium będą miały co najmniej dwóch przyjaciół, dwóch naśladowców lub jednego przyjaciela i jednego naśladowcę (którzy mogą być tą samą osobą), czyli dokładnie to, czego szukamy. Aby to zrobić, najpierw dodajemy nową kolumnę, klikając komórkę pod etykietą „Add your own Columns here” w arkuszu Vertices, a następnie ustawiamy wartość komórki jako sumę C3 i D3 (odpowiadającą odpowiednio stopniowi wejścia i wyjścia). Pozostałe komórki w kolumnie zostaną automatycznie wypełnione tą samą formułą. Teraz nadaj tej nowej kolumnie nazwę „Suma stopni”, edytując etykietę kolumny. Na koniec kliknij na przycisk Autouzupełnianie kolumn, kliknij na listę rozwijaną obok „Widoczność wierzchołków”, kliknij na „Suma stopni”, a następnie kliknij na przycisk obok listy rozwijanej i wpisz 1 w polu tekstowym, aby wskazać, że chcesz pokazać tylko wierzchołki z in-stopniem + out-stopniem > 1. Kliknij przycisk OK, następnie Autouzupełnianie, a potem Odśwież wykres. Zauważ, że liczba wierzchołków stała się znacznie mniejsza i wykres nie wygląda już jak gwiazda – zamiast tego widzimy @vlad43210 otoczonego przez dwie gęsto połączone grupy wierzchołków z kilkoma połączeniami między grupami.

Rysunek 10.14 sugeruje, że sieć egocentryczna @vlad43210 ma dwie oddzielne, ściśle połączone grupy lub klastry zmiennych. NodeXL może pomóc potwierdzić tę intuicję poprzez automatyczne wykrywanie klastrów. Aby wykryć klastry, po prostu kliknij na „Znajdź klastry” w sekcji Analiza na wstążce menu NodeXL. NodeXL automatycznie wyszuka klastry i przypisze różne kolory wierzchołkom w różnych klastrach (kolory te są nadrzędne w stosunku do kolorów wierzchołków zdefiniowanych w kolumnach Autouzupełniania lub w arkuszu roboczym). Teraz kliknij przycisk „Odśwież wykres”, a nowe kolory wierzchołków pojawią się na ekranie.

Rysunek 10.14. 1,5-stopniowa egocentryczna sieć Twittera @vlad43210. Odfiltrowaliśmy zupełnie obcych ludzi, aby skupić się na silnych więziach społecznych @vlad43210 – jego przyjaciołach i kolegach. Dwa klastry wyłaniają się (prawy górny i lewy dolny).

Możesz teraz kliknąć na wierzchołki w różnych klastrach, aby uzyskać poczucie, czy klastry reprezentują znaczące partycje egocentrycznej sieci Twittera @vlad43210. Rzeczywiście, eksploracja arkusza ujawnia, że fioletowy klaster odpowiada alterów, którzy są Vlad akademickich kolegów, podczas gdy zielony klaster odpowiada alterów, którzy są jego przyjaciele (w powszechnym znaczeniu tego słowa, nie w sensie Twitter użytkowników @vlad43210 następuje). Klastry te mogą być wykorzystane do stworzenia dwóch List dla konta Twittera Vlada: jednej do komunikacji z przyjaciółmi i jednej do komunikacji z kolegami.

Można również użyć pojęć centralności wektora własnego i centralności międzygałęziowej, opisanych wcześniej, aby przyjrzeć się względnej ważności aktorów w egocentrycznej sieci Twittera @vlad43210, z perspektywy uwagi i informacji. Jak omówiliśmy w sekcji 10.3.1, aktorzy o wysokiej centralności wektora własnego w sieci znajomych/śledzących są ośrodkami uwagi, podczas gdy aktorzy o wysokiej centralności międzycentralnej w tej samej sieci są brokerami informacji. NodeXL pozwala nam na wizualizację obu tych wielkości jednocześnie poprzez mapowanie ich na różne właściwości wierzchołków w grafie.

Mapujmy kolor wierzchołka na centralność wektora własnego, a rozmiar wierzchołka na centralność międzygałęziową.7 Aby to zrobić, najpierw kliknij przycisk Graph Metrics w sekcji Analysis wstążki menu NodeXL, następnie zaznacz „Centralność wektora własnego” i „Centralność międzygałęziowa i centralność bliskości” i kliknij „Compute Metrics”. Następnie kliknij na przycisk Autofill Columns w menu NodeXL, kliknij na listę rozwijaną obok „Vertex Color” i wybierz „Eigenvector Centrality”, kliknij na listę rozwijaną obok „Vertex Size” i wybierz „Betweenness Centrality”. Kliknij przycisk „Autofill”, a następnie przycisk Refresh Graph w okienku wyświetlania wykresu, aby zaktualizować rozmiary i kolory wierzchołków w oknie graficznym. Dokonaj jeszcze jednej korekty przed wyświetleniem wykresu – ponieważ @vlad43210 jest w centrum swojej sieci egocentrycznej z definicji, jego centralność betweenness i eigenvector będzie wysoka, ale nie powie nam nic o pozycji @vlad43210 w jego sieci. Ręcznie ustaw centralność międzysektorową i wektorową @vlad43210 na 0 w arkuszu i ponownie naciśnij „Odśwież wykres”.

Jeśli porównasz rysunki 10.15 i 10.16, można zauważyć, że koledzy @vlad43210 są bardziej w centrum uwagi niż jego przyjaciele, ale te dwa skupiska są dość równomiernie dopasowane pod względem przepływu informacji (z wyjątkiem @redlog, który ma zarówno bardzo wysoki wektor własny, jak i bardzo wysoką centralność międzygrupową i pojawia się jako duży zielony węzeł na wykresie).

Rysunek 10.15. Egocentryczna sieć Twittera @vlad43210 1,5 stopnia (tylko silne więzi społeczne). NodeXL automatycznie identyfikuje klastry i koloruje je w różny sposób. Górny prawy (zielony) odpowiada przyjaciołom @vlad43210, a dolny lewy (fioletowy) odpowiada jego kolegom akademickim.

Rysunek 10.16. 1,5-stopniowa egocentryczna sieć Twittera @vlad43210. Bardziej zielone wierzchołki mają wyższą centryczność wektora własnego, a większe wierzchołki mają wyższą centryczność międzygałęziową.

Wreszcie, porównajmy egocentryczną sieć przyjaciół i zwolenników @vlad43210 z siecią @odpowiedzi i wzmianek @vlad43210. Zauważ, że obie te sieci są egocentryczne, ale altery nie są koniecznie takie same w każdej z nich. NodeXL nie importuje szczegółowych danych @reply i mention dla użytkowników w czasie pisania tego tekstu, ale Twitter API pozwala na szybkie obejście tego problemu. Używając statusów/mentions API, możesz odwiedzić URL www.twitter.com/statuses/mentions.xml i ręcznie nagrać nazwy wszystkich przyjaciół @vlad43210 lub zwolenników, którzy @odpowiedzieli mu lub wspomnieli jego nazwę użytkownika Twittera w jednym z ich tweetów, jak również liczbę @odpowiedzi lub wzmianek na nazwę. Ponieważ @vlad43210 nie dostaje wielu @odpowiedzi lub wzmianek, nie jest to czasochłonne zadanie – dla bardziej czasochłonnych zadań alternatywą byłoby napisanie skryptu do automatycznego rejestrowania tych nazwisk. Następnie, dla każdego takiego nazwiska, znajdź krawędź w arkuszu Edges łączącą @vlad43210 z użytkownikiem, który @odpowiedział lub wspomniał o nim. Ręcznie ustaw szerokość tych krawędzi na liczbę @odpowiedzi lub wzmianek o @vlad43210 przez odpowiedniego użytkownika. Na koniec naciśnij „Odśwież wykres”, aby odzwierciedlić te aktualizacje (rys. 10.17).

Rysunek 10.17. 1,5-stopniowa egocentryczna sieć Twittera @vlad43210. Bardziej zielone wierzchołki mają wyższą centralność wektora własnego, a większe wierzchołki mają wyższą centralność międzygałęziową. Grubsze krawędzie odpowiadają użytkownikom, którzy @odpowiadają @vlad43210 lub wspominają jego nazwę użytkownika w jednym ze swoich tweetów.

Można zauważyć, że chociaż koledzy @vlad43210 są bardziej w centrum uwagi niż jego przyjaciele, jego przyjaciele @odpowiadają @vlad43210 i wspominają go częściej niż jego koledzy. Zauważ również, że chociaż niektóre @odpowiedzi i wzmianki łączą @vlad43210 z aktorami o wysokiej centralności, takimi jak @redlog, inne łączą @vlad43210 z aktorami o niskiej centralności. Wyraźnie widać, że informacje i relacje uwagi w egocentrycznej sieci przyjaciół/followers @vlad43210 niekoniecznie mają taką samą wagę w jego egocentrycznej sieci @replies/mentions.

Advanced Topic

Aligning the Vertices in a Graph

Przyjrzyjrzyjrzyjmy się pokrótce rysunkom 10.9 i 10.10 (przykładom sieci informacji/uwagi i sieci centryczności). Załóżmy, że chcesz ułożyć niewielką liczbę wierzchołków w taki sposób, aby wyraźnie pokazać ich podział na grupy. To musi być dużo pracy, aby ustawić te wierzchołki tak ostro ręcznie, przeciągając je jeden po drugim.

Jak opisaliśmy wcześniej w oknie „Zaawansowane”, możesz manipulować sieciami NodeXL tak jak zwykłymi arkuszami kalkulacyjnymi. Zakładka „Wierzchołki” zawiera kolumny o nazwach „X” i „Y”, które przechowują pozycje wierzchołków w grafie. Znajduje się tam również kolumna o nazwie „Zablokowane?”, która określa, czy pozycje wierzchołków są zablokowane w miejscu, czy też można je przesuwać podczas przerysowywania wykresu.

Po zmianie ułożenia wierzchołków, które nam odpowiada, uruchom poniższe makro, aby je idealnie wyrównać:

Sub Realign()

′ odległość, do której należy zaokrąglić każde położenie

RDIST = 500

COL_VERTEX = 1

COL_LOCK = 21

COL_X = 19

.

COL_Y = 20

ROW_START = 3

Dim wksht As Worksheet

Set wksht = Sheets(„Vertices”)

current_row = ROW_START

While wksht.Cells(current_row, COL_VERTEX).Text > „”

′ upewnij się, że pozycja wierzchołka jest zablokowana

wksht.Cells(current_row, COL_LOCK) = „Yes (1)”

′ zaokrąglij x i y

x = Round(wksht.Cells(current_row, COL_X) / RDIST) * RDIST

wksht.Cells(current_row, COL_X) = x

y = Round(wksht.Cells(current_row, COL_Y) / RDIST) * RDIST

wksht.Cells(current_row, COL_Y) = y

current_row = current_row + 1

Wend

End Sub

To makro zapętla się przez każdy wierzchołek w grafie. Najpierw blokuje pozycję wierzchołka, a następnie zaokrągla współrzędne X, Y do najbliższych 500 pikseli. Jeśli więc dwa wierzchołki znajdują się obok siebie, a ich współrzędne y wynoszą 1498 i 1502, każdy z nich zostanie przesunięty na y = 1500. To zapewnia, że wierzchołki są prawidłowo wyrównane.

Dodaj komentarz