Betweenness Centrality

10.5.1 The Ego Network

Yksi tavallisista Twitterin käyttökohteista on yhteyden pitäminen henkilökohtaiseen sosiaaliseen verkostoon – perheeseen, työtovereihin, tuttavuuksiin ja niin edelleen. Osa ystävistäsi ja seuraajistasi Twitterissä kuuluu varmasti ihmisiin, jotka ovat sinulle läheisiä, kun taas toiset voivat olla kaukaisia tuttavia tai jopa täysin tuntemattomia. Kutsumme Twitter-käyttäjän ystävien ja seuraajien joukkoa hänen ”egokeskeiseksi verkostokseen”. Kun puhutaan Twitter-käyttäjän egosentrisestä verkostosta, kyseiseen käyttäjään viitataan usein nimellä ”ego” ja hänen ystäviinsä ja seuraajiinsa nimellä ”alters” (mutta käytetään silti termiä ”ystävä” tai ”seuraaja”, kun puhutaan nimenomaan jostakin näistä suhteista). Käytämme tässä jaksossa termejä ”ego” ja ”alter”.

Jotkut egokeskeisen verkoston siteet ovat vastavuoroisia – ego seuraa alteria ja alter seuraa egoa, joten molemmat voivat pysyä tietoisena toistensa tilapäivityksistä. Sosiaalitieteiden vastavuoroisia siteitä koskevat tutkimukset viittaavat siihen, että tällaisia siteitä on useammin läheisten ystävien ja perheenjäsenten kuin kaukaisten tuttavien välillä. Tätä tutkimusta seuraten oletamme tässä jaksossa, että verkosto, jossa on paljon vastavuoroisia sidoksia, kertoo vahvoista sosiaalisista suhteista, joissa kumpikin on kiinnostunut toistensa päivityksistä, kun taas verkosto, jossa on paljon yksisuuntaisia sidoksia, kertoo heikoista sosiaalisista siteistä, joissa ego ei välttämättä edes tunne seuraajaa, kuten Twitter-julkkikset.

Toinen indikaattori vahvoista sidoksista sosiaalisessa verkostossa ovat ”suljetut triadit”, jotka ovat sidoksia egon kahden alterin välillä. Kuten vastavuoroisten siteiden kohdalla, suljettuja triadeja koskeva tutkimus osoittaa, että vahvoista sosiaalisista siteistä koostuvissa tiiviissä yhteisöissä on enemmän suljettuja triadeja kuin heikoista sosiaalisista siteistä koostuvissa väljissä yhteisöissä. Tämän tutkimuksen perusteella oletamme, että ego, jolla on paljon suljettuja triadeja alteriensa välillä, on todennäköisemmin sulautunut tiiviiseen yhteisöön, jossa kaikki tuntevat toisensa. Sitä vastoin minä, jolla on vain vähän suljettuja triadeja muinaistensa välillä, on todennäköisemmin yksinäinen tai ei lainkaan yksilö. Esimerkiksi yritysmarkkinoijien Twitter-tileillä voi olla paljon seuraajia, jotka ovat kiinnostuneita heidän tuotteistaan, mutta nämä seuraajat eivät useinkaan tunne toisiaan.

Egokeskeisten verkostojen analysointi voi usein johtaa käyttökelpoisiin tuloksiin, jos Twitteriä halutaan käyttää kehitys- tai mainosalustana. Tiiviit yhteisöt saattavat esimerkiksi omaksua tuotteen paljon todennäköisemmin yhdessä tai eivät lainkaan, kun taas harvat egosentriset verkostot, joissa on paljon yksisuuntaisia yhteyksiä, saattavat olla vahvasti verkoston ”keskuksen” – Twitter-käyttäjän, jolla on paljon seuraajia mutta vähän ystäviä – käyttäytymisen vaikutuksen alaisia. Erityisesti julkkisten egosentristen verkostojen analyysi Twitterissä antaa meille välähdyksen siitä, miten nykypäivän rikkaat ja kuuluisat käyttävät sosiaalista mediaa tavoittaakseen tuhansia (ellei jopa miljoonia) palvovia faneja.

NodeXL:n avulla voit tutkia vastavuoroisten siteiden ja suljettujen kolmioiden suhteellista läsnäoloa tai puuttumista egosentrisessä Twitter-verkostossasi. Useimmat egosentriset verkostot ovat sekoitus vahvoja ja heikkoja sosiaalisia sidoksia, joten vastavuoroisten sidosten ja triadien tiivistäminen yhteen lukuun johtaa usein virheellisiin päätelmiin sosiaalisesta piiristäsi. Sen sijaan sosiaalisen verkostosi visualisointi voi antaa sinulle tietoa läheisistä ja kaukaisista siteistäsi sekä läheisten ystäviesi ja tuttaviesi välisistä vuorovaikutussuhteista.

Monet Twitter-käyttäjät välittävät elämässään tapahtumia triviaaleista (ruokailutottumukset) tärkeisiin, kuten matkajärjestelyihin ja merkittäviin elämäntapahtumiin, ja niin edelleen. Nämä tapahtumat näkyvät lyhyellä aikavälillä kaikille käyttäjän seuraajille, jotka muodostavat osan hänen egosentrisestä verkostostaan. Hyvin pienissä egosentrisissä verkostoissa (esim. kun käyttäjän seuraajat rajoittuvat omaan perheeseen) tämä lähetysmuoto on hyödyllinen, kun halutaan pitää yhteyttä sukulaisiin, jotka ovat matkustaneet ulkomaille tai muuttaneet pois. Monilla aktiivisilla käyttäjillä on kuitenkin melko suuret egosentriset verkostot, ja heidän twiittinsä menevät usein ihmisille, jotka eivät ole lainkaan kiinnostuneita heistä. Samalla Twitter-käyttäjän keräämä seuraajamäärä vaikeuttaa sen seuraamista, kuka twiittejä lukee. NodeXL:n avulla on suhteellisen helppoa tunnistaa egokeskeisten verkostojen eri ryhmät, esimerkiksi seuraajat, jotka ovat kollegojasi, ja seuraajat, jotka ovat perhettäsi. Voit hyödyntää Twitterin uutta Luettelot-ominaisuutta järjestelläksesi nämä ryhmät käteviksi luetteloiksi, joita voit seurata ja joihin voit viitata twiiteissäsi.

Ensimmäinen askel egosentrisen verkostosi analysoimisessa NodeXL:ssä on tietojen kerääminen. Yksi tapa tehdä se on käyttää NodeXL:n Import > From Twitter User’s Network -ominaisuutta. Napsauttamalla Excel-valikossa NodeXL-välilehteä ja sitten NodeXL-nauhan vasemmassa reunassa olevaa Import (Tuo) -pudotusluetteloa saat useita tuontivaihtoehtoja (varmista, että valintaruutu ”Clear NodeXL Workbook First” (Tyhjennä ensin NodeXL-työkirja) on valittuna). Valitse pudotusvalikosta From Twitter User’s Network (Twitter-käyttäjän verkosta) -vaihtoehto, jolloin näyttöön tulee valintaikkuna (kuva 10.12).

Kuva 10.12. NodeXL:n Twitter-käyttäjän verkoston tuontiruutu. Valitut tasovaihtoehdot tuovat sekä @vlad43210:n ystävät ja seuraajat että heidän väliset ystävä-/seuraajayhteydet.

Ruudun yläreunassa on tekstikenttä Twitter-käyttäjälle, jonka egokeskeisen verkon haluat kerätä. Tässä esimerkissä käytämme yhtä omaa Twitter-tiliämme-@vlad43210. Tekstikentän alla on kolme valintaruutua: Add an edge for Follows, Replies-to, and Mentions relationships in tweets. Varmista, että vain Follows-valintaruutu on valittuna, kaksi muuta ovat merkityksellisempiä tietoverkkojen kannalta, joita tutkimme myöhemmin. Varmista myös, että ”Get both friends and followers” -valintaruutu on valittuna, jotta voit kerätä tietoja kaikista alteista, etkä vain ystävistä tai seuraajista.

Alempana avautuu ”Get connections out to X degrees” -pudotusvalikko. Valitse pudotusvalikosta ”1,5”, jos haluat kerätä kaikki alterisi sekä kaikki niiden väliset seuraamis- ja kaverisuhteet. Jälkimmäiset suhteet ovat välttämättömiä, jotta voidaan tarkkailla suljettujen triadien esiintymistä egosentrisessä verkostossasi. Varmista seuraavaksi, että valintaruudut ”Add statistic columns to the Vertices worksheet (slower)” (Lisää tilastosarakkeita Vertices-taulukkoon (hitaampi)) ja ”Add a Tweet column to the Vertices worksheet” (Lisää twiittaussarake Vertices-taulukkoon) ovat pois päältä. Nämä ovat erittäin hyödyllisiä kerättäessä tietoja Twitter-aktiivisuudesta egosentrisessä verkostossasi, mutta tässä esimerkissä keskitymme suhteisiin, emme aktiivisuuteen.

Kahdessa viimeisessä tekstikentässä voit määrittää käyttäjätunnuksen ja salasanan, jos sinulla on valkoiselle listalle merkitty Twitter-tili (käsitelty aiemmin). Riippumatta siitä, täytätkö nämä kentät vai et, voit seuraavaksi napsauttaa OK ja aloittaa tietojen tuontiprosessin. Kun prosessi on valmis, näet jälleen laskentataulukon, joka on täynnä rivejä Twitter-käyttäjäpareista ja niiden välisistä suhteista. Sinun on ehkä napsautettava ”Refresh Graph” (Päivitä kuvaaja) -painiketta, jotta nämä käyttäjät ja suhteet näkyvät kuvaajakankaalla. Huomaa, että ego on keskellä – esimerkissämme se on @vlad43210 – ja sen ympärillä on lukuisia alitekijöitä. Kuva kankaalla muistuttaa tähteä, sillä @vlad43210:llä on monia altereita, jotka eivät seuraa toisiaan. Nämä ovat todennäköisesti hänen heikkoja sosiaalisia sidoksiaan, joista useimmat ovat täysin vieraita (kuva 10.13).

Kuva 10.13. @vlad43210:n 1,5 asteen egosentrinen Twitter-verkosto. Keskellä oleva kärki on @vlad43210, reunoilla olevat monet kärjet edustavat @vlad43210:n heikkoja sosiaalisia siteitä, joista suurin osa on täysin tuntemattomia.

Voit keskittyä vahvempiin sosiaalisiin siteisiin tarkastelemalla @vlad43210:n egosentrisessä verkossa olevia altereita, joilla on vähintään kaksi sidettä toisiin ihmisiin (molemmat siteet voivat olla samaan henkilöön) jompaankumpaan suuntaan, ystävä- tai seuraajakuntaan. Kaikilla, joista olemme keränneet tietoja, on vähintään yksi sidos @vlad43210:een. Alttareilla, joilla on vähintään kaksi sidettä, on joko sidos @vlad43210:n toiseen alttariin (mikä osoittaa, että he ovat osa suljettua triadia) tai heillä on vastavuoroinen ystävä- tai seuraajasidos @vlad43210:een. Kuten aiemmin totesimme, molemmat näistä tekijöistä voivat viitata siihen, että @vlad43210:n ja kyseisen henkilön välillä on vahvempi sosiaalinen suhde. Verkon graafisessa esityksessä muuttajat, joilla on kaksi sidettä muihin henkilöihin, esitetään pisteillä, joilla on vähintään kaksi reunaa (kumpaankin suuntaan) niiden ja vähintään yhden muun pisteen välillä. Jotta voit keskittyä vain näihin huippuihin, sinun on ensin laskettava in- ja out-aste. Napsauta ”laske graafin metriikat” -painiketta, merkitse ”in-aste” ja ”out-aste” ja napsauta ”laske metriikat.”

Säädetään nyt graafin vertikaalien näkyvyys in-asteen + out-asteen perusteella > 1. Valitse ”laske graafin metriikat”. Verteksillä, jotka täyttävät tämän kriteerin, on vähintään kaksi ystävää, kaksi seuraajaa tai yksi ystävä ja yksi seuraaja (jotka voivat olla sama henkilö), mikä on juuri sitä, mitä etsimme. Tätä varten lisätään ensin uusi sarake napsauttamalla Vertices-taulukon ”Add your own Columns here” -merkinnän alla olevaa solua ja asettamalla solun arvoksi C3:n ja D3:n (jotka vastaavat vastaavasti in- ja out-astetta) summa. Sarakkeen muut solut täyttyvät automaattisesti samalla kaavalla. Merkitse nyt tämä uusi sarake nimellä ”Sum Degree” muokkaamalla sarakkeen nimikettä. Napsauta lopuksi Autofill Columns (Sarakkeiden automaattinen täyttö) -painiketta, napsauta ”Vertex Visibility” (Vertex-näkyvyys) -kohdan vieressä olevaa pudotusluetteloa, napsauta ”Sum Degree” (Summa-aste), napsauta sitten pudotusluettelon vieressä olevaa painiketta ja kirjoita tekstikenttään 1 osoittaaksesi, että tahdot näyttää vain ne kärkipisteet, joiden in-aste + out-aste > 1. Napsauta OK, sitten Autofill ja sitten Refresh Graph. Huomaa, että kärkipisteiden määrä on pienentynyt huomattavasti eikä graafi enää näytä tähdeltä – sen sijaan näemme @vlad43210:n ympärillä kaksi tiheästi toisiinsa kytkeytynyttä kärkipisteiden ryhmää, joiden välillä on vain vähän yhteyksiä.

Kuvio 10.14 viittaa siihen, että @vlad43210:n egosentrisessä verkossa on kaksi erillistä tiukasti toisiinsa kytkeytynyttä alteriryhmää tai klusteria. NodeXL voi auttaa vahvistamaan tämän intuition suorittamalla automaattisen klusteritunnistuksen. Jos haluat havaita klustereita, napsauta yksinkertaisesti ”Find Clusters” (Etsi klustereita) NodeXL:n valikkonauhan Analysis (Analyysi) -osiossa. NodeXL etsii automaattisesti klustereita ja määrittää eri värit eri klustereissa oleville kärkipisteille (nämä määritykset ohittavat kaikki Autofill-sarakkeiden tai työarkin muokkaamisen kautta määritetyt kärkipisteiden värit). Napsauta nyt ”Refresh Graph” (Päivitä kuvaaja) -painiketta, jolloin uudet kärkipisteiden värit näkyvät kankaalla.

Kuva 10.14. @vlad43210:n 1,5 asteen egosentrinen Twitter-verkko. Olemme suodattaneet täysin tuntemattomat pois keskittyäksemme @vlad43210:n vahvoihin sosiaalisiin siteisiin – hänen ystäviinsä ja kollegoihinsa. Esiin nousee kaksi klusteria (oikealla ylhäällä ja vasemmalla alhaalla).

Voit nyt napsauttaa eri klustereissa olevia kärkipisteitä saadaksesi käsityksen siitä, edustavatko klusterit mielekkäitä osioita @vlad43210:n egosentrisestä Twitter-verkosta. Työarkin tutkiminen paljastaa, että violetti klusteri vastaa muuntajia, jotka ovat Vladin akateemisia kollegoita, kun taas vihreä klusteri vastaa muuntajia, jotka ovat hänen ystäviään (sanan tavallisessa merkityksessä, ei @vlad43210:n seuraamien käyttäjien Twitter-mielessä). Klustereiden avulla voidaan luoda Vladin Twitter-tilille kaksi listaa: toinen ystävien ja toinen kollegoiden kanssa viestimiseen.

Voit myös käyttää aiemmin kuvattuja käsitteitä omavektorikeskittyneisyys (eigenvector centrality) ja välityskeskittyneisyys (betweenness centrality) tarkastellaksesi @vlad43210:n egosentrisen Twitter-verkoston toimijoiden suhteellista merkitystä huomion ja informaation näkökulmasta. Kuten kohdassa 10.3.1 käsiteltiin, toimijat, joilla on korkea omavektorikeskittyneisyys ystävä-/seuraajaverkossa, ovat huomion keskipisteitä, kun taas toimijat, joilla on korkea betweenness-keskittyneisyys samassa verkossa, ovat tiedon välittäjiä. NodeXL:n avulla voimme visualisoida näitä molempia suureita samanaikaisesti kartoittamalla ne graafikankaan kärkipisteiden eri ominaisuuksiin.

Kartoitetaan kärkipisteiden väri omavektorikeskittyneisyydeksi ja kärkipisteiden koko betweenness-keskittyneisyydeksi.7 Tehdäksesi tämän napsauta ensin Graph Metrics -painiketta NodeXL:n valikkonauhan Analysis (Analyysi) -osiossa, rastita sen jälkeen kohdat ”Eigenvector centrality (Omavektorikeskittyneisyys)” ja ”Betweenness and closeness centralities (Keskipisteiden väliset ja läheiset keskittyneisyydet (läheisyys))”, ja napsauta sitten kohdetta ”Compute Metrics (Laske metriikoita)”. Napsauta seuraavaksi NodeXL-valikon Autofill Columns -painiketta, napsauta ”Vertex Color” -kohdan vieressä olevaa pudotusluetteloa ja valitse ”Eigenvector Centrality”, napsauta ”Vertex Size” -kohdan vieressä olevaa pudotusluetteloa ja valitse ”Betweenness Centrality”. Napsauta ”Autofill” (Automaattinen täyttö) ja sitten ”Refresh Graph” (Päivitä kuvaaja) -painiketta kuvaajan näyttöruudussa päivittääksesi vertex-koot ja värit kuvaajan kankaalle. Tee vielä yksi säätö ennen kuvaajan näyttämistä – koska @vlad43210 on määritelmän mukaan egosentrisen verkkonsa keskipisteessä, hänen betweenness- ja eigenvektorikeskiarvonsa ovat korkeat, mutta ne eivät kerro mitään @vlad43210:n sijainnista verkossaan. Aseta @vlad43210:n betweenness- ja eigenvektorikeskiarvot manuaalisesti 0:ksi laskentataulukossa ja paina uudelleen ”Päivitä kuvaaja”.

Vertaamalla kuvioita 10.15 ja 10.16, näet, että @vlad43210:n työtoverit ovat enemmän huomion keskipisteitä kuin hänen ystävänsä, mutta että nämä kaksi klusteria ovat melko tasavertaisia informaatiovirran suhteen (lukuun ottamatta @redlogia, jolla on sekä erittäin korkeat eigenvektorikeskiarvot että erittäin korkeat betweenness-keskiarvot ja joka näkyy suurena vihreänä solmuna kuvaajassa).

Kuva 10.15. @vlad43210 1,5 asteen egosentrinen Twitter-verkosto (vain vahvat sosiaaliset siteet). NodeXL tunnistaa klusterit automaattisesti ja värittää ne eri tavoin. Oikealla ylhäällä (vihreä) vastaa @vlad43210:n ystäviä ja vasemmalla alhaalla (violetti) hänen akateemisia kollegoitaan.

Kuva 10.16. @vlad43210 1,5 asteen egosentrinen Twitter-verkosto. Vihreämmillä kärkipisteillä on korkeampi omavektorikeskittyneisyys, ja suuremmilla kärkipisteillä on korkeampi betweenness-keskittyneisyys.

Vertaillaan lopuksi @vlad43210:n egosentristä ystävä- ja seuraajaverkostoa @vlad43210:n @vastausten ja mainintojen verkkoon. Huomaa, että molemmat verkostot ovat egosentrisiä, mutta alterit eivät välttämättä ole samat kummassakaan. NodeXL ei tätä kirjoitettaessa tuo käyttäjien yksityiskohtaisia @reply- ja mainintatietoja, mutta Twitterin API mahdollistaa nopean kiertämisen. Statuses/mentions API:n avulla voit käydä URL-osoitteessa www.twitter.com/statuses/mentions.xml ja tallentaa manuaalisesti kaikkien niiden @vlad43210:n ystävien tai seuraajien nimet, jotka ovat @vastanneet hänelle tai maininneet hänen Twitter-käyttäjätunnuksensa jossakin twiitissään, sekä @vastausten tai mainintojen määrän nimeä kohti. Koska @vlad43210 ei saa paljon @vastauksia tai mainintoja, tämä ei ole aikaa vievä tehtävä – jos taas aikaa vieviin tehtäviin tarvitaan enemmän aikaa, vaihtoehtona olisi kirjoittaa skripti, joka tallentaa nämä nimet automaattisesti. Seuraavaksi etsitään kullekin tällaiselle nimelle särmä, joka yhdistää @vlad43210:n ja käyttäjän, joka on vastannut hänelle tai maininnut hänet. Aseta näiden reunojen leveys manuaalisesti @vlad43210:n @vlad43210-vastausten tai @vlad43210:n mainintojen lukumäärän mukaan. Paina lopuksi ”Refresh Graph” (Päivitä kuvaaja), jotta nämä päivitykset näkyvät (kuva 10.17).

Kuva 10.17. @vlad43210 1,5 asteen egosentrinen Twitter-verkko. Vihreämmillä kärkipisteillä on korkeampi omavektorikeskittyneisyys, ja suuremmilla kärkipisteillä on korkeampi betweenness-keskittyneisyys. Paksummat särmät vastaavat käyttäjiä, jotka @vlad43210:lle @vastailevat tai mainitsevat hänen käyttäjätunnuksensa jossakin twiitissään.

Voidaan nähdä, että vaikka @vlad43210:n työtoverit ovat enemmän keskipisteenä kuin hänen ystävänsä, hänen ystävänsä @vlad43210:lle @vlad43210:lle @vastaavat ja mainitsevat hänet useammin kuin hänen työtoverinsa. Huomaa myös, että vaikka jotkut @vastaus- ja mainintayhteydet linkittävät @vlad43210:n korkeakeskuksisiin toimijoihin, kuten @redlogiin, toiset linkittävät @vlad43210:n matalakeskuksisiin toimijoihin. On selvää, että @vlad43210:n ystävien/seuraajien egosentrisen verkon informaatio- ja huomiosuhteilla ei välttämättä ole samaa painoarvoa hänen @vastausten/mainintojen egosentrisessä verkostossaan.

Edistyneempi aihe

Graafin kärkipisteiden kohdistaminen

Katsotaanpa lyhyesti kuvioita 10.9 ja 10.10 (esimerkit informaatio/huomio-verkostosta ja sentraalisuusverkostosta). Oletetaan, että halutaan rivittää pieni määrä kärkipisteitä siten, että ryhmittymät näkyvät selvästi. On varmaan paljon työtä rivittää nuo kärkipisteet näin terävästi käsin vetämällä niitä yksi kerrallaan.

Kuten kuvailimme aiemmin kohdassa ”Lisätiedot”, voit käsitellä NodeXL-verkkoja aivan kuten tavallisia taulukkolaskentataulukoita. Vertices-välilehdellä on sarakkeita nimeltä ”X” ja ”Y”, jotka pitävät sisällään kärkipisteiden sijainnit kuvaajassa. Sarakkeessa on myös sarake nimeltä ”Locked?”, jolla säädetään, lukitaanko kärkipisteiden sijainnit paikoilleen vai voidaanko niitä siirtää, kun kuvaajaa piirretään uudelleen.

Kun olet järjestänyt kärjet uudelleen haluamallasi tavalla, suorita seuraava makro niiden kohdistamiseksi täydellisesti:

Sub Realign()

′ etäisyys, johon jokainen sijainti pyöristetään

RDIST = 500

COL_VERTEX = 1

COL_LOCK = 21

COL_X = 19

COL_Y = 20

ROW_START = 3

Dim wksht As Worksheet

Set wksht = Sheets(”Vertices”)

current_row = ROW_START

While wksht.Cells(current_row, COL_VERTEX).Text > ””

′ varmista, että verteksin sijainti on lukittu

wksht.Cells(current_row, COL_LOCK) = ”Yes (1)”

′ pyöristä x ja y

x = Round(wksht.Cells(current_row, COL_X) / RDIST) * RDIST

wksht.Cells(current_row, COL_X) = x

y = Round(wksht.Cells(current_row, COL_Y) / RDIST) * RDIST

wksht.Cells(current_row, COL_Y) = y

current_row = current_row + 1

Wend

End Sub

Tämä makro käy silmukoiden avulla läpi jokaisen graafin kärjen. Se lukitsee ensin verteksin sijainnin ja pyöristää sitten X- ja Y-koordinaatit lähimpään 500 pikseliin. Jos siis kaksi kärkeä on vierekkäin ja niiden y-koordinaatit ovat 1498 ja 1502, kumpikin siirretään asentoon y = 1500. Näin varmistetaan, että kärjet on kohdistettu oikein.

Jätä kommentti