Betweenness Centrality

10.5.1 The Ego Network

Um uso comum do Twitter é manter contato com sua rede social pessoal – família, colegas, conhecidos, e assim por diante. Alguns dos seus amigos e seguidores no Twitter certamente pertencerão a pessoas próximas a você, enquanto outros podem ser conhecidos distantes ou até mesmo completos estranhos. Nós nos referimos ao conjunto de amigos e seguidores de um usuário do Twitter como a sua “rede egocêntrica”. Quando falamos da rede egocêntrica de um usuário do Twitter, dito usuário é frequentemente referido como “ego” e seus amigos e seguidores como “alteradores” (mas ainda assim usamos o termo “amigo” ou “seguidor” quando estamos falando de um desses relacionamentos especificamente). Usaremos os termos “ego” e “alter” nesta seção.

Alguns laços na rede egocêntrica são recíprocos – ego segue alter e alter segue ego, assim ambos podem permanecer cientes das atualizações de status um do outro. Pesquisas sobre laços recíprocos nas ciências sociais sugerem que tais laços existem mais frequentemente entre amigos próximos e familiares do que entre conhecidos distantes. Seguindo esta pesquisa, nesta seção assumimos que uma rede com muitos laços mútuos indica um conjunto de fortes relações sociais, onde ambas as pessoas estão interessadas nas atualizações uma da outra, enquanto que uma rede com muitos laços unidirecionais indica laços sociais fracos, onde o ego pode até mesmo não conhecer o seguidor, como no caso das celebridades do Twitter.

Outro indicador de fortes laços em uma rede social é a “tríade fechada”, que são laços entre duas alterações de um ego. Como no caso dos laços recíprocos, as pesquisas sobre tríades fechadas mostram que comunidades fechadas de fortes laços sociais apresentam mais tríades fechadas do que comunidades soltas de laços sociais fracos. Após esta pesquisa, assumimos que um ego com muitas tríades fechadas entre suas tríades alterosas tem mais probabilidade de estar embutido em uma comunidade fechada, onde todos se conhecem uns aos outros. Em contraste, um ego com poucas tríades fechadas entre suas tríades alterosas tem mais probabilidade de ser solitário ou não ser um indivíduo de todo. Por exemplo, as contas do Twitter para comerciantes de negócios podem ter muitos seguidores interessados em seus produtos, mas esses seguidores muitas vezes não se conhecem.

Análise de redes egocêntricas pode muitas vezes levar a resultados acionáveis, se você quiser usar o Twitter como uma plataforma de desenvolvimento ou publicidade. Comunidades apertadas, por exemplo, podem ter muito mais probabilidade de adotar um produto em conjunto ou não adotar nenhum, enquanto redes egocêntricas esparsas com muitas conexões unidirecionais podem ser fortemente influenciadas pelo comportamento do “hub” da rede – o usuário do Twitter com muitos seguidores, mas poucos amigos. Em particular, a análise das redes egocêntricas de celebridades no Twitter nos dá um vislumbre de como os ricos e famosos de hoje usam as redes sociais para alcançar milhares (se não milhões) de fãs adoradores.

Com a ajuda do NodeXL, você pode investigar a relativa presença ou ausência de laços recíprocos e tríades fechadas na sua rede egocêntrica do Twitter. A maioria das redes egocêntricas são uma mistura de laços sociais fortes e fracos, de modo que resumir laços e tríades recíprocos em um único número muitas vezes leva a conclusões incorretas sobre o seu círculo social. Em vez disso, visualizar a sua rede social pode dar-lhe insights sobre os seus laços próximos versus distantes e as interações entre os seus amigos e conhecidos próximos.

Muitos usuários do Twitter transmitem eventos em suas vidas, desde os triviais (hábitos alimentares) até os importantes, tais como arranjos de viagem, grandes eventos da vida, e assim por diante. Estes eventos são visíveis a curto prazo para todos os seguidores do usuário, que fazem parte de sua rede egocêntrica. Em redes egocêntricas muito pequenas (por exemplo, quando os seguidores de um usuário são limitados à sua família), esta forma de transmissão é útil para manter contato com parentes que viajaram para o exterior ou se mudaram. No entanto, muitos usuários ativos têm redes egocêntricas bastante grandes, e seus tweets muitas vezes saem para pessoas completamente desinteressadas nelas. Ao mesmo tempo, o grande número de seguidores que um usuário do Twitter acumula torna difícil manter o registro de quem está lendo os tweets. O NodeXL torna relativamente fácil identificar diferentes grupos em suas redes egocêntricas, como seus seguidores que são seus colegas versus aqueles que são sua família. Você pode aproveitar o novo recurso de listas do Twitter para organizar esses grupos em listas convenientes para acompanhar e referenciar em seus tweets.

O primeiro passo para analisar sua rede egocêntrica no NodeXL é coletar os dados. Uma maneira de fazer isso é usar o recurso Importar > Da Rede de Usuários do Twitter no NodeXL. Clicando na guia NodeXL no menu Excel, depois na lista suspensa Importar à esquerda da fita do NodeXL, você verá várias opções de importação (certifique-se de que a caixa de seleção “Clear NodeXL Workbook First” esteja marcada). Selecione a opção Da Rede do Usuário do Twitter na lista suspensa, onde será apresentada uma caixa de diálogo (Fig. 10.12).

Figure 10.12. Tela de importação da Rede de Usuários do Twitter do NodeXL. As opções de níveis selecionadas irão importar tanto os amigos e seguidores do @vlad43210, como também qualquer conexão de amigos/seguidores entre eles.

No topo da caixa está um campo de texto para o usuário do Twitter cuja rede egocêntrica você deseja coletar. Para este exemplo, vamos utilizar uma das nossas próprias contas no Twitter-@vlad43210. Abaixo do campo de texto, há três caixas de seleção: Adicione uma borda para as relações Follows, Replies-to, e Mentions nos tweets. Verifique se apenas a caixa de seleção Follows está marcada, as outras duas são mais relevantes para as redes de informação, que iremos investigar mais tarde. Verifique também se a caixa de seleção “Obter amigos e seguidores” está marcada para que você possa coletar dados sobre todas as alterações, não apenas amigos ou seguidores.

Outros abaixo, você será presenteado com a lista suspensa “Obter conexões em X graus”. Selecione “1.5” na lista suspensa para capturar todos os seus alteradores, assim como todos os seguidores e relações de amizade entre eles. Este último conjunto de relacionamentos é necessário para observar a presença de tríades fechadas na sua rede egocêntrica. Em seguida, certifique-se de que as caixas de seleção “Adicionar colunas estatísticas à planilha de Vértices (mais lento)” e “Adicionar uma coluna Tweet à planilha de Vértices” estejam desmarcadas. Elas são altamente úteis para coletar dados sobre a atividade do Twitter na sua rede egocêntrica, mas para os propósitos do exemplo atual, estamos focados nos relacionamentos, não na atividade.

Os dois campos de texto finais permitem que você especifique um nome de usuário e senha caso você tenha uma conta do Twitter listada na lista branca (discutida anteriormente). Quer você os preencha ou não, você pode em seguida clicar em OK e iniciar o processo de importação de dados. Uma vez concluído o processo, você verá a planilha novamente, preenchida com linhas de pares de usuários do Twitter e os relacionamentos entre eles. Você pode ter que clicar em “Atualizar Gráfico” para exibir esses usuários e relacionamentos na tela do gráfico. Note que o ego está no centro – no nosso exemplo, que é @vlad43210 – rodeado por uma multidão de alterações. A imagem na tela se parece com uma estrela, pois @vlad43210 tem muitos alteradores que não se seguem uns aos outros. Estes são provavelmente os seus fracos laços sociais, a maioria deles completos estranhos (Fig. 10.13).

Figure 10.13. A rede egocêntrica @vlad43210 de 1,5 graus do Twitter. O vértice no centro é @vlad43210, os muitos vértices nas extremidades representam os fracos laços sociais de @vlad43210, a maioria deles completos estranhos.

Você pode se concentrar em laços sociais mais fortes olhando para as alterações na rede egocêntrica de @vlad43210 com pelo menos dois laços com outras pessoas (ambos os laços podem ser com a mesma pessoa) em qualquer direção, amigo ou seguidor. Todas as pessoas sobre as quais coletamos dados terão pelo menos um vínculo, com @vlad43210. Alters com pelo menos dois laços terão ou um empate com outro alter de @vlad43210 (indicando que fazem parte de uma tríade fechada), ou terão um empate recíproco amigo/seguinte a @vlad43210. Como discutimos anteriormente, ambos os fatores podem indicar a presença de uma relação social mais forte entre @vlad43210 e o indivíduo em questão. Na representação gráfica da rede, as alterações com dois laços com outras pessoas serão representadas por vértices com pelo menos dois vértices (em qualquer direção) entre eles e pelo menos um outro vértice. Para focar apenas nestes vértices, é necessário primeiro calcular o grau de entrada e saída. Clique no botão “calculate graph metrics”, marque “in-degree” e “out-degree” e clique em “Compute Metrics”.”

Agora vamos definir a visibilidade dos vértices no gráfico baseado no in-degree + out-degree > 1. Vértices que se encaixam neste critério terão pelo menos dois amigos, dois seguidores, ou um amigo e um seguidor (que pode ser a mesma pessoa), que é precisamente o que estamos procurando. Para fazer isso, primeiro adicione uma nova coluna clicando na célula sob o rótulo “Adicione suas próprias colunas aqui” na planilha Vertices, depois defina o valor da célula como a soma de C3 e D3 (correspondente a dentro e fora de grau, respectivamente). O restante das células da coluna será preenchido automaticamente com a mesma fórmula. Agora, rotule esta nova coluna como “Grau de Soma”, editando o rótulo da coluna. Finalmente, clique em Autofill Columns, clique na lista suspensa ao lado de “Vertex Visibility”, clique em “Sum Degree”, depois clique no botão ao lado da lista suspensa e digite 1 na caixa de texto para indicar que você quer mostrar apenas vértices com in-degree + out-degree > 1. Clique em OK, depois em Autofill e, em seguida, em Refresh Graph. Note que o número de vértices tornou-se muito menor e o gráfico não se parece mais com uma estrela – em vez disso, vemos @vlad43210 cercado por dois grupos de vértices densamente conectados com algumas conexões entre os grupos.

Figure 10.14 sugere que a rede egocêntrica de @vlad43210 tem dois grupos ou clusters de alter. O NodeXL pode ajudar a confirmar esta intuição, realizando a detecção automática de clusters. Para detectar clusters, basta clicar em “Find Clusters” na seção Análise do menu NodeXL ribbon. O NodeXL procurará automaticamente por clusters e atribuirá cores diferentes aos vértices em diferentes clusters (essas atribuições substituem qualquer cor de vértice definida através das colunas Autofill ou através da edição da planilha). Agora clique em “Atualizar Gráfico” e as novas cores dos vértices aparecerão na tela.

Figure 10.14. A rede egocêntrica de 1,5 graus do @vlad43210 no Twitter. Nós filtramos os estranhos completos para focar nos fortes laços sociais do @vlad43210 – seus amigos e colegas. Dois clusters emergem (canto superior direito e inferior esquerdo).

Você agora pode clicar em vértices em diferentes clusters para ter uma idéia se os clusters representam partições significativas da rede egocêntrica do @vlad43210 no Twitter. De fato, a exploração da planilha revela que o cluster roxo corresponde a alteradores que são colegas acadêmicos do Vlad, enquanto o cluster verde corresponde a alteradores que são seus amigos (no sentido comum da palavra, não no sentido do Twitter dos usuários @vlad43210 segue). Os clusters podem ser usados para criar duas Listas para a conta de Vlad no Twitter: uma para se comunicar com seus amigos e outra para se comunicar com seus colegas.

Você também pode usar as noções de centralidade eigenvectorial e de centralidade entre as duas, descritas anteriormente, para olhar para a importância relativa dos atores na rede egocêntrica de @vlad43210 no Twitter, a partir das perspectivas de atenção e informação. Como discutimos na seção 10.3.1, atores com alta centralidade egocêntrica na rede de amigos/seguidores são centros de atenção, enquanto que atores com alta centralidade entre as duas partes na mesma rede são corretores de informação. NodeXL permite-nos visualizar ambas estas quantidades ao mesmo tempo, mapeando-as para diferentes propriedades dos vértices na tela do gráfico.

Let’s map vertex color to eigenvector centrality and vertex size to betweenness centrality.7 Para fazer isto, primeiro clique no botão Graph Metrics na secção Analysis do menu NodeXL ribbon, depois verifique “Eigenvector centrality” e “Betweenness and closeeness centralities” e clique em “Compute Metrics”. Em seguida clique no botão Autofill Columns no menu NodeXL, clique na lista suspensa ao lado de “Vertex Color” e selecione “Eigenvector Centrality”, clique na lista suspensa ao lado de “Vertex Size” e selecione “Betweenness Centrality”. Clique em “Autofill” e depois no botão “Refresh Graph” no painel de visualização do gráfico para actualizar os tamanhos dos vértices e as cores na tela do gráfico. Faça mais um ajuste antes de exibir o gráfico – porque @vlad43210 está no centro de sua rede egocêntrica por definição, sua entrecruzamento e centralidades egocêntricas serão altas, mas não nos dirá nada sobre a posição de @vlad43210 em sua rede. Defina manualmente @vlad43210’s entre as centralidades de betweenness e eigenvector a 0 na folha de trabalho e carregue novamente em “Refresh Graph”.

Se comparar as figuras 10.15 e 10.16, você pode ver que os colegas de @vlad43210 são mais centros de atenção do que seus amigos, mas que os dois clusters são muito parecidos em termos de fluxo de informação (com exceção de @redlog, que tem tanto as centralidades de autovetor muito alto quanto as centralidades de entrelaçamento muito alto e aparece como um grande nó verde no gráfico).

Figure 10.15. A rede @vlad43210 egocêntrica Twitter de 1,5 graus (somente laços sociais fortes). O NodeXL identifica automaticamente os clusters e colore-os de forma diferente. O superior direito (verde) corresponde aos amigos de @vlad43210, e o inferior esquerdo (roxo) corresponde aos seus colegas acadêmicos.

Figure 10.16. A rede @vlad43210 egocêntrica de 1,5 graus do Twitter. Vértices mais verdes têm maior centralidade egocêntrica, e vértices maiores têm maior centralidade entre si.

Finalmente, vamos comparar a rede egocêntrica de amigos e seguidores @vlad43210 com a rede de @replies e menções de @vlad43210. Note que ambas estas redes são egocêntricas, mas as alterações não são necessariamente as mesmas em cada uma. O NodeXL não importa @reply detalhado e menciona dados para os usuários no momento de escrever, mas a API do Twitter permite uma rápida solução. Usando a API de status/menções, você pode visitar a URL www.twitter.com/statuses/mentions.xml e gravar manualmente os nomes de qualquer um dos amigos ou seguidores de @vlad43210 que @replicou a ele ou mencionou seu nome de usuário do Twitter em um de seus tweets, bem como o número de @replicações ou menções por nome. Como @vlad43210 não recebe muitas @replicações ou menções, esta não é uma tarefa demorada – para tarefas mais demoradas, uma alternativa seria escrever um script para gravar esses nomes automaticamente. Em seguida, para cada um desses nomes, encontre a borda na planilha Edges conectando @vlad43210 a um usuário que @replicou a ele ou o mencionou. Defina manualmente a largura dessas arestas para o número de @replies ou menções de @vlad43210 pelo usuário correspondente. Finalmente, pressione “Refresh Graph” para refletir estas atualizações (Fig. 10.17).

Figure 10.17. A rede @vlad43210 egocêntrica de 1,5 graus do Twitter. Os vértices mais verdes têm maior centralidade egocêntrica, e os vértices maiores têm maior centralidade entre si. Os vértices mais grossos correspondem aos usuários que @reply to @vlad43210 ou mencionam seu nome de usuário em um de seus tweets.

Você pode ver que embora os colegas de @vlad43210 sejam mais centros de atenção que seus amigos, seus amigos @reply to @vlad43210 e o mencionam com mais freqüência que seus colegas. Note também que embora alguns @reply e mencionam conexões ligam @vlad43210 a atores de alta centralidade como @redlog, outros ligam @vlad43210 a atores de baixa centralidade. Claramente, as relações de informação e atenção na rede egocêntrica de amigos/seguidores de @vlad43210 não têm necessariamente o mesmo peso nas suas @replies/mentions egocentric network.

Advanced Topic

Aligning the Vertices in a Graph

Vejamos brevemente as Figuras 10.9 e 10.10 (a rede de informação/atenção e os exemplos da rede de centralidade). Suponha que você queira alinhar um pequeno número de vértices de uma forma que mostre claramente os agrupamentos. Deve ser muito trabalho alinhar esses vértices de forma tão nítida à mão, arrastando-os um a um.

Como descrevemos na caixa “Avançado” anteriormente, você pode manipular as redes NodeXL da mesma forma que as planilhas regulares. A aba Vértices contém colunas chamadas “X” e “Y”, que mantêm as posições dos vértices no gráfico. Há também uma coluna chamada “Locked?” que controla se as posições dos vértices estão bloqueadas ou se elas podem ser movidas quando o gráfico é redesenhado.

Depois de rearranjar os vértices da forma que você gosta, rode a macro a seguir para alinhá-los perfeitamente:

Sub Realinhamento()

′ a distância para arredondar cada local para

RDIST = 500

COL_VERTEX = 1

COL_LOCK = 21

COL_X = 19

COL_Y = 20

ROW_START = 3

Dim wksht As Worksheet

Set wksht = Sheets(“Vertices”)

current_row = ROW_START

Wksht.Cells(current_row, COL_VERTEX).Text > “”

′ certifique-se que a posição do vértice está bloqueada

wksht.Cells(current_row, COL_LOCK) = “Yes (1)”

′ round the x and y

x = Round(wksht.Cells(current_row, COL_X) / RDIST) * RDIST

wksht.Cells(current_row, COL_X) = x

y = Round(wksht.Cells(current_row, COL_Y) / RDIST) * RDIST

wksht.Células(current_row, COL_Y) = y

current_row = current_row + 1

Wend

End Sub

Esta macro passa por cada vértice do gráfico. Primeiro trava a posição do vértice, depois arredonda as coordenadas X, Y para os 500 pixels mais próximos. Assim, se dois vértices estiverem próximos um do outro e suas coordenadas y forem 1498 e 1502, cada um será reposicionado para y = 1500. Isto assegura que os vértices estão devidamente alinhados.

Deixe um comentário