Betweenness Centrality

10.5.1 The Ego Network

Yksi tavallisista Twitterin käyttökohteista on yhteyden pitäminen henkilökohtaiseen sosiaaliseen verkostoon – perheeseen, työtovereihin, tuttavuuksiin ja niin edelleen. Osa ystävistäsi ja seuraajistasi Twitterissä kuuluu varmasti ihmisiin, jotka ovat sinulle läheisiä, kun taas toiset voivat olla kaukaisia tuttavia tai jopa täysin tuntemattomia. Kutsumme Twitter-käyttäjän ystävien ja seuraajien joukkoa hänen ”egokeskeiseksi verkostokseen”. Kun puhutaan Twitter-käyttäjän egosentrisestä verkostosta, kyseiseen käyttäjään viitataan usein nimellä ”ego” ja hänen ystäviinsä ja seuraajiinsa nimellä ”alters” (mutta käytetään silti termiä ”ystävä” tai ”seuraaja”, kun puhutaan nimenomaan jostakin näistä suhteista). Käytämme tässä jaksossa termejä ”ego” ja ”alter”.

Jotkut egokeskeisen verkoston siteet ovat vastavuoroisia – ego seuraa alteria ja alter seuraa egoa, joten molemmat voivat pysyä tietoisena toistensa tilapäivityksistä. Sosiaalitieteiden vastavuoroisia siteitä koskevat tutkimukset viittaavat siihen, että tällaisia siteitä on useammin läheisten ystävien ja perheenjäsenten kuin kaukaisten tuttavien välillä. Tätä tutkimusta seuraten oletamme tässä jaksossa, että verkosto, jossa on paljon vastavuoroisia sidoksia, kertoo vahvoista sosiaalisista suhteista, joissa kumpikin on kiinnostunut toistensa päivityksistä, kun taas verkosto, jossa on paljon yksisuuntaisia sidoksia, kertoo heikoista sosiaalisista siteistä, joissa ego ei välttämättä edes tunne seuraajaa, kuten Twitter-julkkikset.

Toinen indikaattori vahvoista sidoksista sosiaalisessa verkostossa ovat ”suljetut triadit”, jotka ovat sidoksia egon kahden alterin välillä. Kuten vastavuoroisten siteiden kohdalla, suljettuja triadeja koskeva tutkimus osoittaa, että vahvoista sosiaalisista siteistä koostuvissa tiiviissä yhteisöissä on enemmän suljettuja triadeja kuin heikoista sosiaalisista siteistä koostuvissa väljissä yhteisöissä. Tämän tutkimuksen perusteella oletamme, että ego, jolla on paljon suljettuja triadeja alteriensa välillä, on todennäköisemmin sulautunut tiiviiseen yhteisöön, jossa kaikki tuntevat toisensa. Sitä vastoin minä, jolla on vain vähän suljettuja triadeja muinaistensa välillä, on todennäköisemmin yksinäinen tai ei lainkaan yksilö. Esimerkiksi yritysmarkkinoijien Twitter-tileillä voi olla paljon seuraajia, jotka ovat kiinnostuneita heidän tuotteistaan, mutta nämä seuraajat eivät useinkaan tunne toisiaan.

Egokeskeisten verkostojen analysointi voi usein johtaa käyttökelpoisiin tuloksiin, jos Twitteriä halutaan käyttää kehitys- tai mainosalustana. Tiiviit yhteisöt saattavat esimerkiksi omaksua tuotteen paljon todennäköisemmin yhdessä tai eivät lainkaan, kun taas harvat egosentriset verkostot, joissa on paljon yksisuuntaisia yhteyksiä, saattavat olla vahvasti verkoston ”keskuksen” – Twitter-käyttäjän, jolla on paljon seuraajia mutta vähän ystäviä – käyttäytymisen vaikutuksen alaisia. Erityisesti julkkisten egosentristen verkostojen analyysi Twitterissä antaa meille välähdyksen siitä, miten nykypäivän rikkaat ja kuuluisat käyttävät sosiaalista mediaa tavoittaakseen tuhansia (ellei jopa miljoonia) palvovia faneja.

NodeXL:n avulla voit tutkia vastavuoroisten siteiden ja suljettujen kolmioiden suhteellista läsnäoloa tai puuttumista egosentrisessä Twitter-verkostossasi. Useimmat egosentriset verkostot ovat sekoitus vahvoja ja heikkoja sosiaalisia sidoksia, joten vastavuoroisten sidosten ja triadien tiivistäminen yhteen lukuun johtaa usein virheellisiin päätelmiin sosiaalisesta piiristäsi. Sen sijaan sosiaalisen verkostosi visualisointi voi antaa sinulle tietoa läheisistä ja kaukaisista siteistäsi sekä läheisten ystäviesi ja tuttaviesi välisistä vuorovaikutussuhteista.

Monet Twitter-käyttäjät välittävät elämässään tapahtumia triviaaleista (ruokailutottumukset) tärkeisiin, kuten matkajärjestelyihin ja merkittäviin elämäntapahtumiin, ja niin edelleen. Nämä tapahtumat näkyvät lyhyellä aikavälillä kaikille käyttäjän seuraajille, jotka muodostavat osan hänen egosentrisestä verkostostaan. Hyvin pienissä egosentrisissä verkostoissa (esim. kun käyttäjän seuraajat rajoittuvat omaan perheeseen) tämä lähetysmuoto on hyödyllinen, kun halutaan pitää yhteyttä sukulaisiin, jotka ovat matkustaneet ulkomaille tai muuttaneet pois. Monilla aktiivisilla käyttäjillä on kuitenkin melko suuret egosentriset verkostot, ja heidän twiittinsä menevät usein ihmisille, jotka eivät ole lainkaan kiinnostuneita heistä. Samalla Twitter-käyttäjän keräämä seuraajamäärä vaikeuttaa sen seuraamista, kuka twiittejä lukee. NodeXL:n avulla on suhteellisen helppoa tunnistaa egokeskeisten verkostojen eri ryhmät, esimerkiksi seuraajat, jotka ovat kollegojasi, ja seuraajat, jotka ovat perhettäsi. Voit hyödyntää Twitterin uutta Luettelot-ominaisuutta järjestelläksesi nämä ryhmät käteviksi luetteloiksi, joita voit seurata ja joihin voit viitata twiiteissäsi.

Ensimmäinen askel egosentrisen verkostosi analysoimisessa NodeXL:ssä on tietojen kerääminen. Yksi tapa tehdä se on käyttää NodeXL:n Import > From Twitter User’s Network -ominaisuutta. Napsauttamalla Excel-valikossa NodeXL-välilehteä ja sitten NodeXL-nauhan vasemmassa reunassa olevaa Import (Tuo) -pudotusluetteloa saat useita tuontivaihtoehtoja (varmista, että valintaruutu ”Clear NodeXL Workbook First” (Tyhjennä ensin NodeXL-työkirja) on valittuna). Valitse pudotusvalikosta From Twitter User’s Network (Twitter-käyttäjän verkosta) -vaihtoehto, jolloin näyttöön tulee valintaikkuna (kuva 10.12).

Ruudun yläreunassa on tekstikenttä Twitter-käyttäjälle, jonka egokeskeisen verkon haluat kerätä. Tässä esimerkissä käytämme yhtä omaa Twitter-tiliämme-@vlad43210. Tekstikentän alla on kolme valintaruutua: Add an edge for Follows, Replies-to, and Mentions relationships in tweets. Varmista, että vain Follows-valintaruutu on valittuna, kaksi muuta ovat merkityksellisempiä tietoverkkojen kannalta, joita tutkimme myöhemmin. Varmista myös, että ”Get both friends and followers” -valintaruutu on valittuna, jotta voit kerätä tietoja kaikista alteista, etkä vain ystävistä tai seuraajista.

Alempana avautuu ”Get connections out to X degrees” -pudotusvalikko. Valitse pudotusvalikosta ”1,5”, jos haluat kerätä kaikki alterisi sekä kaikki niiden väliset seuraamis- ja kaverisuhteet. Jälkimmäiset suhteet ovat välttämättömiä, jotta voidaan tarkkailla suljettujen triadien esiintymistä egosentrisessä verkostossasi. Varmista seuraavaksi, että valintaruudut ”Add statistic columns to the Vertices worksheet (slower)” (Lisää tilastosarakkeita Vertices-taulukkoon (hitaampi)) ja ”Add a Tweet column to the Vertices worksheet” (Lisää twiittaussarake Vertices-taulukkoon) ovat pois päältä. Nämä ovat erittäin hyödyllisiä kerättäessä tietoja Twitter-aktiivisuudesta egosentrisessä verkostossasi, mutta tässä esimerkissä keskitymme suhteisiin, emme aktiivisuuteen.

Kahdessa viimeisessä tekstikentässä voit määrittää käyttäjätunnuksen ja salasanan, jos sinulla on valkoiselle listalle merkitty Twitter-tili (käsitelty aiemmin). Riippumatta siitä, täytätkö nämä kentät vai et, voit seuraavaksi napsauttaa OK ja aloittaa tietojen tuontiprosessin. Kun prosessi on valmis, näet jälleen laskentataulukon, joka on täynnä rivejä Twitter-käyttäjäpareista ja niiden välisistä suhteista. Sinun on ehkä napsautettava ”Refresh Graph” (Päivitä kuvaaja) -painiketta, jotta nämä käyttäjät ja suhteet näkyvät kuvaajakankaalla. Huomaa, että ego on keskellä – esimerkissämme se on @vlad43210 – ja sen ympärillä on lukuisia alitekijöitä. Kuva kankaalla muistuttaa tähteä, sillä @vlad43210:llä on monia altereita, jotka eivät seuraa toisiaan. Nämä ovat todennäköisesti hänen heikkoja sosiaalisia sidoksiaan, joista useimmat ovat täysin vieraita (kuva 10.13).

Voit keskittyä vahvempiin sosiaalisiin siteisiin tarkastelemalla @vlad43210:n egosentrisessä verkossa olevia altereita, joilla on vähintään kaksi sidettä toisiin ihmisiin (molemmat siteet voivat olla samaan henkilöön) jompaankumpaan suuntaan, ystävä- tai seuraajakuntaan. Kaikilla, joista olemme keränneet tietoja, on vähintään yksi sidos @vlad43210:een. Alttareilla, joilla on vähintään kaksi sidettä, on joko sidos @vlad43210:n toiseen alttariin (mikä osoittaa, että he ovat osa suljettua triadia) tai heillä on vastavuoroinen ystävä- tai seuraajasidos @vlad43210:een. Kuten aiemmin totesimme, molemmat näistä tekijöistä voivat viitata siihen, että @vlad43210:n ja kyseisen henkilön välillä on vahvempi sosiaalinen suhde. Verkon graafisessa esityksessä muuttajat, joilla on kaksi sidettä muihin henkilöihin, esitetään pisteillä, joilla on vähintään kaksi reunaa (kumpaankin suuntaan) niiden ja vähintään yhden muun pisteen välillä. Jotta voit keskittyä vain näihin huippuihin, sinun on ensin laskettava in- ja out-aste. Napsauta ”laske graafin metriikat” -painiketta, merkitse ”in-aste” ja ”out-aste” ja napsauta ”laske metriikat.”

Säädetään nyt graafin vertikaalien näkyvyys in-asteen + out-asteen perusteella > 1. Valitse ”laske graafin metriikat”. Verteksillä, jotka täyttävät tämän kriteerin, on vähintään kaksi ystävää, kaksi seuraajaa tai yksi ystävä ja yksi seuraaja (jotka voivat olla sama henkilö), mikä on juuri sitä, mitä etsimme. Tätä varten lisätään ensin uusi sarake napsauttamalla Vertices-taulukon ”Add your own Columns here” -merkinnän alla olevaa solua ja asettamalla solun arvoksi C3:n ja D3:n (jotka vastaavat vastaavasti in- ja out-astetta) summa. Sarakkeen muut solut täyttyvät automaattisesti samalla kaavalla. Merkitse nyt tämä uusi sarake nimellä ”Sum Degree” muokkaamalla sarakkeen nimikettä. Napsauta lopuksi Autofill Columns (Sarakkeiden automaattinen täyttö) -painiketta, napsauta ”Vertex Visibility” (Vertex-näkyvyys) -kohdan vieressä olevaa pudotusluetteloa, napsauta ”Sum Degree” (Summa-aste), napsauta sitten pudotusluettelon vieressä olevaa painiketta ja kirjoita tekstikenttään 1 osoittaaksesi, että tahdot näyttää vain ne kärkipisteet, joiden in-aste + out-aste > 1. Napsauta OK, sitten Autofill ja sitten Refresh Graph. Huomaa, että kärkipisteiden määrä on pienentynyt huomattavasti eikä graafi enää näytä tähdeltä – sen sijaan näemme @vlad43210:n ympärillä kaksi tiheästi toisiinsa kytkeytynyttä kärkipisteiden ryhmää, joiden välillä on vain vähän yhteyksiä.

Kuvio 10.14 viittaa siihen, että @vlad43210:n egosentrisessä verkossa on kaksi erillistä tiukasti toisiinsa kytkeytynyttä alteriryhmää tai klusteria. NodeXL voi auttaa vahvistamaan tämän intuition suorittamalla automaattisen klusteritunnistuksen. Jos haluat havaita klustereita, napsauta yksinkertaisesti ”Find Clusters” (Etsi klustereita) NodeXL:n valikkonauhan Analysis (Analyysi) -osiossa. NodeXL etsii automaattisesti klustereita ja määrittää eri värit eri klustereissa oleville kärkipisteille (nämä määritykset ohittavat kaikki Autofill-sarakkeiden tai työarkin muokkaamisen kautta määritetyt kärkipisteiden värit). Napsauta nyt ”Refresh Graph” (Päivitä kuvaaja) -painiketta, jolloin uudet kärkipisteiden värit näkyvät kankaalla.

Voit nyt napsauttaa eri klustereissa olevia kärkipisteitä saadaksesi käsityksen siitä, edustavatko klusterit mielekkäitä osioita @vlad43210:n egosentrisestä Twitter-verkosta. Työarkin tutkiminen paljastaa, että violetti klusteri vastaa muuntajia, jotka ovat Vladin akateemisia kollegoita, kun taas vihreä klusteri vastaa muuntajia, jotka ovat hänen ystäviään (sanan tavallisessa merkityksessä, ei @vlad43210:n seuraamien käyttäjien Twitter-mielessä). Klustereiden avulla voidaan luoda Vladin Twitter-tilille kaksi listaa: toinen ystävien ja toinen kollegoiden kanssa viestimiseen.

Voit myös käyttää aiemmin kuvattuja käsitteitä omavektorikeskittyneisyys (eigenvector centrality) ja välityskeskittyneisyys (betweenness centrality) tarkastellaksesi @vlad43210:n egosentrisen Twitter-verkoston toimijoiden suhteellista merkitystä huomion ja informaation näkökulmasta. Kuten kohdassa 10.3.1 käsiteltiin, toimijat, joilla on korkea omavektorikeskittyneisyys ystävä-/seuraajaverkossa, ovat huomion keskipisteitä, kun taas toimijat, joilla on korkea betweenness-keskittyneisyys samassa verkossa, ovat tiedon välittäjiä. NodeXL:n avulla voimme visualisoida näitä molempia suureita samanaikaisesti kartoittamalla ne graafikankaan kärkipisteiden eri ominaisuuksiin.

Kartoitetaan kärkipisteiden väri omavektorikeskittyneisyydeksi ja kärkipisteiden koko betweenness-keskittyneisyydeksi.7 Tehdäksesi tämän napsauta ensin Graph Metrics -painiketta NodeXL:n valikkonauhan Analysis (Analyysi) -osiossa, rastita sen jälkeen kohdat ”Eigenvector centrality (Omavektorikeskittyneisyys)” ja ”Betweenness and closeness centralities (Keskipisteiden väliset ja läheiset keskittyneisyydet (läheisyys))”, ja napsauta sitten kohdetta ”Compute Metrics (Laske metriikoita)”. Napsauta seuraavaksi NodeXL-valikon Autofill Columns -painiketta, napsauta ”Vertex Color” -kohdan vieressä olevaa pudotusluetteloa ja valitse ”Eigenvector Centrality”, napsauta ”Vertex Size” -kohdan vieressä olevaa pudotusluetteloa ja valitse ”Betweenness Centrality”. Napsauta ”Autofill” (Automaattinen täyttö) ja sitten ”Refresh Graph” (Päivitä kuvaaja) -painiketta kuvaajan näyttöruudussa päivittääksesi vertex-koot ja värit kuvaajan kankaalle. Tee vielä yksi säätö ennen kuvaajan näyttämistä – koska @vlad43210 on määritelmän mukaan egosentrisen verkkonsa keskipisteessä, hänen betweenness- ja eigenvektorikeskiarvonsa ovat korkeat, mutta ne eivät kerro mitään @vlad43210:n sijainnista verkossaan. Aseta @vlad43210:n betweenness- ja eigenvektorikeskiarvot manuaalisesti 0:ksi laskentataulukossa ja paina uudelleen ”Päivitä kuvaaja”.

Vertaamalla kuvioita 10.15 ja 10.16, näet, että @vlad43210:n työtoverit ovat enemmän huomion keskipisteitä kuin hänen ystävänsä, mutta että nämä kaksi klusteria ovat melko tasavertaisia informaatiovirran suhteen (lukuun ottamatta @redlogia, jolla on sekä erittäin korkeat eigenvektorikeskiarvot että erittäin korkeat betweenness-keskiarvot ja joka näkyy suurena vihreänä solmuna kuvaajassa).

10.5.1 The Ego Network

Edistyneempi aihe

Graafin kärkipisteiden kohdistaminen

Jätä kommentti Peruuta vastaus