Centralité d’entre-deux

10.5.1 Le réseau de l’ego

Une utilisation courante de Twitter consiste à rester en contact avec votre réseau social personnel – famille, collègues, connaissances, etc. Certains de vos amis et followers sur Twitter appartiendront très certainement à des personnes dont vous êtes proche, tandis que d’autres peuvent être des connaissances éloignées ou même de parfaits inconnus. Nous appelons l’ensemble des amis et followers d’un utilisateur de Twitter son « réseau égocentrique ». Lorsque nous parlons du réseau égocentrique d’un utilisateur de Twitter, nous faisons souvent référence à cet utilisateur en tant qu' »ego » et à ses amis et followers en tant qu' »alters » (mais nous utilisons toujours le terme « ami » ou « follower » lorsque nous parlons spécifiquement de l’une de ces relations). Nous utiliserons les termes « ego » et « alter » dans cette section.

Certains liens dans le réseau égocentrique sont réciproques – l’ego suit l’alter et l’alter suit l’ego, de sorte que les deux peuvent rester au courant des mises à jour de statut de l’autre. La recherche sur les liens réciproques en sciences sociales suggère que de tels liens existent plus souvent entre des amis proches et la famille qu’entre des connaissances distantes. En suivant cette recherche, nous supposons dans cette section qu’un réseau avec de nombreux liens mutuels indique un ensemble de relations sociales fortes, où les deux personnes sont intéressées par les mises à jour de l’autre, tandis qu’un réseau avec de nombreux liens unidirectionnels indique des liens sociaux faibles, où l’ego peut même ne pas connaître le suiveur, comme dans le cas des célébrités Twitter.

Un autre indicateur de liens forts dans un réseau social est les « triades fermées », qui sont des liens entre deux altères d’un ego. Comme pour les liens réciproques, la recherche sur les triades fermées montre que les communautés serrées de liens sociaux forts comportent plus de triades fermées que les communautés lâches de liens sociaux faibles. En suivant cette recherche, nous supposons qu’un ego avec de nombreuses triades fermées parmi ses doubles est plus susceptible d’être intégré dans une communauté étroite, où tout le monde se connaît. En revanche, un ego avec peu de triades fermées entre ses alters est plus susceptible d’être solitaire ou de ne pas être un individu du tout. Par exemple, les comptes Twitter des spécialistes du marketing commercial peuvent avoir de nombreux followers intéressés par leurs produits, mais ces followers ne se connaissent souvent pas.

L’analyse des réseaux égocentriques peut souvent conduire à des résultats exploitables si vous souhaitez utiliser Twitter comme plateforme de développement ou de publicité. Les communautés serrées, par exemple, pourraient être beaucoup plus susceptibles d’adopter un produit ensemble ou pas du tout, tandis que les réseaux égocentriques clairsemés avec de nombreuses connexions à sens unique pourraient être fortement influencés par le comportement du « hub » du réseau – l’utilisateur Twitter avec beaucoup de followers mais peu d’amis. En particulier, l’analyse des réseaux égocentriques des célébrités sur Twitter nous donne un aperçu de la façon dont les riches et célèbres d’aujourd’hui utilisent les médias sociaux pour atteindre des milliers (voire des millions) de fans adorateurs.

Avec l’aide de NodeXL, vous pouvez étudier la présence ou l’absence relative de liens réciproques et de triades fermées dans votre réseau égocentrique Twitter. La plupart des réseaux égocentriques sont un mélange de liens sociaux forts et faibles, de sorte que résumer les liens réciproques et les triades en un seul chiffre conduit souvent à des conclusions incorrectes sur votre cercle social. Au lieu de cela, la visualisation de votre réseau social peut vous donner des indications sur vos liens étroits par rapport aux liens distants et sur les interactions entre vos amis proches et vos connaissances.

De nombreux utilisateurs de Twitter diffusent des événements de leur vie, des plus futiles (habitudes alimentaires) aux plus importants, comme les préparatifs de voyage, les événements majeurs de la vie, etc. Ces événements sont à court terme visibles par tous les followers de l’utilisateur, qui constituent une partie de son réseau égocentrique. Dans les réseaux égocentriques de très petite taille (par exemple, lorsque les suiveurs d’un utilisateur se limitent à sa famille), cette forme de diffusion est utile pour rester en contact avec des parents qui ont voyagé à l’étranger ou déménagé. Cependant, de nombreux utilisateurs actifs ont des réseaux égocentriques plutôt étendus et leurs tweets sont souvent envoyés à des personnes qui ne s’intéressent absolument pas à eux. En même temps, le nombre de followers qu’un utilisateur de Twitter accumule rend difficile de savoir qui lit ses tweets. NodeXL permet d’identifier assez facilement les différents groupes de vos réseaux égocentriques, par exemple les personnes qui vous suivent et qui sont vos collègues par rapport à celles qui sont votre famille. Vous pouvez profiter de la nouvelle fonction Listes Twitter pour organiser ces groupes en listes pratiques à suivre et à référencer dans vos tweets.

La première étape de l’analyse de votre réseau égocentrique dans NodeXL est de collecter les données. Une façon de le faire est d’utiliser la fonction Importer >du réseau de l’utilisateur de Twitter dans NodeXL. En cliquant sur l’onglet NodeXL dans le menu Excel, puis sur la liste déroulante Importer à gauche du ruban NodeXL, plusieurs options d’importation vous sont présentées (assurez-vous que la case  » Effacer le classeur NodeXL en premier  » est cochée). Sélectionnez l’option From Twitter User’s Network dans la liste déroulante, à ce moment-là, une boîte de dialogue vous est présentée (Fig. 10.12).

Figure 10.12. Écran d’importation du réseau de l’utilisateur de Twitter de NodeXL. Les options de niveaux sélectionnées importeront à la fois les amis et les followers de @vlad43210, ainsi que toutes les connexions d’amis/followers entre eux.

En haut de la boîte se trouve un champ de texte pour l’utilisateur Twitter dont vous voulez collecter le réseau égocentrique. Pour cet exemple, nous utiliserons l’un de nos propres comptes Twitter -@vlad43210. Sous le champ de texte se trouvent trois cases à cocher : Ajouter un bord pour les relations Follows, Replies-to et Mentions dans les tweets. Assurez-vous que seule la case Follows est cochée, les deux autres étant plus pertinentes pour les réseaux d’information, que nous étudierons plus tard. Assurez-vous également que la case  » obtenir à la fois les amis et les suiveurs  » est cochée afin de pouvoir collecter des données sur tous les alters, et pas seulement les amis ou les suiveurs.

Plus bas, la liste déroulante  » Obtenir des connexions jusqu’à X degrés  » vous est présentée. Sélectionnez « 1,5 » dans la liste déroulante pour capturer tous vos alters, ainsi que toutes les relations de followers et d’amis entre eux. Ce dernier ensemble de relations est nécessaire pour observer la présence de triades fermées dans votre réseau égocentrique. Ensuite, assurez-vous que les cases « Ajouter des colonnes de statistiques à la feuille de calcul Vertices (ralentissement) » et « Ajouter une colonne de Tweet à la feuille de calcul Vertices » ne sont pas cochées. Celles-ci sont très utiles pour collecter des données sur l’activité Twitter dans votre réseau égocentrique, mais pour les besoins de l’exemple actuel, nous nous concentrons sur les relations, et non sur l’activité.

Les deux derniers champs de texte vous permettent de spécifier un nom d’utilisateur et un mot de passe si vous avez un compte Twitter sur liste blanche (discuté précédemment). Que vous les remplissiez ou non, vous pouvez ensuite cliquer sur OK et commencer le processus d’importation des données. Une fois le processus terminé, vous verrez à nouveau la feuille de calcul, remplie de lignes de paires d’utilisateurs Twitter et des relations entre eux. Vous devrez peut-être cliquer sur « Rafraîchir le graphique » pour afficher ces utilisateurs et ces relations sur la toile du graphique. Notez que l’ego est au centre – dans notre exemple, il s’agit de @vlad43210 – entouré d’une multitude d’alters. L’image sur le canevas ressemble à une étoile, car @vlad43210 a de nombreux alters qui ne se suivent pas. Il s’agit probablement de ses faibles liens sociaux, la plupart d’entre eux étant de parfaits inconnus (Fig. 10.13).

Figure 10.13. Le réseau Twitter égocentrique à 1,5 degré de @vlad43210. Le sommet au centre est @vlad43210, les nombreux sommets sur les bords représentent les liens sociaux faibles de @vlad43210, la plupart d’entre eux étant de parfaits étrangers.

Vous pouvez vous concentrer sur les liens sociaux plus forts en examinant les alters du réseau égocentrique de @vlad43210 ayant au moins deux liens avec d’autres personnes (les deux liens peuvent être avec la même personne) dans un sens ou dans l’autre, ami ou suiveur. Toutes les personnes sur lesquelles nous avons collecté des données auront au moins un lien avec @vlad43210. Les alters ayant au moins deux liens auront soit un lien avec un autre alter de @vlad43210 (indiquant qu’ils font partie d’une triade fermée), soit un lien réciproque d’ami/suiveur avec @vlad43210. Comme nous l’avons vu précédemment, ces deux facteurs peuvent indiquer la présence d’une relation sociale plus forte entre @vlad43210 et l’individu en question. Dans la représentation graphique du réseau, les alters ayant deux liens avec d’autres personnes seront représentés par des sommets ayant au moins deux arêtes (dans les deux sens) entre eux et au moins un autre sommet. Afin de se concentrer uniquement sur ces sommets, vous devez d’abord calculer le degré d’entrée et de sortie. Cliquez sur le bouton « calculer les métriques du graphique », cochez « in-degré » et « out-degré », puis cliquez sur « calculer les métriques »

Maintenant, définissons la visibilité des sommets dans le graphique en fonction du in-degré + out-degré > 1. Les sommets qui répondent à ce critère auront au moins deux amis, deux suiveurs, ou un ami et un suiveur (qui peuvent être la même personne), ce qui est précisément ce que nous recherchons. Pour ce faire, ajoutez d’abord une nouvelle colonne en cliquant sur la cellule située sous l’étiquette « Add your own Columns here » dans la feuille de calcul Vertices, puis définissez la valeur de la cellule comme étant la somme de C3 et D3 (correspondant respectivement aux degrés d’entrée et de sortie). Les autres cellules de la colonne se rempliront automatiquement avec la même formule. Intitulez maintenant cette nouvelle colonne « Somme des degrés » en modifiant l’étiquette de la colonne. Enfin, cliquez sur Autofill Columns, cliquez sur la liste déroulante à côté de « Vertex Visibility », cliquez sur « Sum Degree », puis cliquez sur le bouton à côté de la liste déroulante et tapez 1 dans la zone de texte pour indiquer que vous voulez montrer uniquement les sommets avec in-degré + out-degré > 1. Cliquez sur OK, puis sur Autofill, et enfin sur Refresh Graph. Notez que le nombre de sommets est devenu beaucoup plus petit et que le graphe ne ressemble plus à une étoile – au lieu de cela, nous voyons @vlad43210 entouré de deux groupes de sommets densément connectés avec quelques connexions entre les groupes.

La figure 10.14 suggère que le réseau égocentrique de @vlad43210 a deux groupes distincts étroitement connectés, ou clusters, d’alters. NodeXL peut aider à confirmer cette intuition en effectuant une détection automatique des clusters. Pour détecter les clusters, il suffit de cliquer sur « Find Clusters » dans la section Analysis du ruban de menu de NodeXL. NodeXL recherchera automatiquement les clusters et attribuera des couleurs différentes aux sommets des différents clusters (ces attributions remplacent toutes les couleurs de sommets définies via les colonnes Autofill ou via l’édition de la feuille de travail). Cliquez maintenant sur « Rafraîchir le graphique » et les nouvelles couleurs des sommets apparaîtront sur le canevas.

Figure 10.14. Le réseau Twitter égocentrique à 1,5 degré de @vlad43210. Nous avons filtré les parfaits inconnus pour nous concentrer sur les liens sociaux forts de @vlad43210 – ses amis et ses collègues. Deux clusters émergent (en haut à droite et en bas à gauche).

Vous pouvez maintenant cliquer sur les sommets des différents clusters pour avoir une idée si les clusters représentent des partitions significatives du réseau Twitter égocentrique de @vlad43210. En effet, l’exploration de la feuille de travail révèle que le cluster violet correspond aux alters qui sont les collègues universitaires de Vlad, tandis que le cluster vert correspond aux alters qui sont ses amis (au sens commun du terme, et non au sens Twitter des utilisateurs que @vlad43210 suit). Les clusters peuvent être utilisés pour créer deux listes pour le compte Twitter de Vlad : une pour communiquer avec ses amis et une pour communiquer avec ses collègues.

Vous pouvez également utiliser les notions de centralité de vecteur propre et de centralité d’inter-communauté, décrites précédemment, pour examiner l’importance relative des acteurs dans le réseau Twitter égocentrique de @vlad43210, du point de vue de l’attention et de l’information. Comme nous l’avons vu à la section 10.3.1, les acteurs présentant une centralité de vecteur propre élevée dans le réseau des amis/suiveurs sont des centres d’attention, tandis que les acteurs présentant une centralité d’interférence élevée dans le même réseau sont des courtiers en information. NodeXL nous permet de visualiser ces deux quantités en même temps en les mettant en correspondance avec différentes propriétés des sommets dans le canevas du graphique.

Mettons en correspondance la couleur du sommet avec la centralité du vecteur propre et la taille du sommet avec la centralité de l’espacement.7 Pour ce faire, cliquez d’abord sur le bouton Métriques du graphique dans la section Analyse du ruban du menu NodeXL, puis cochez « Centralité du vecteur propre » et « Centralité de l’espacement et de la proximité » et cliquez sur « Calculer les métriques ». Cliquez ensuite sur le bouton « Autofill Columns » dans le menu NodeXL, cliquez sur la liste déroulante à côté de « Vertex Color » et sélectionnez « Eigenvector Centrality », cliquez sur la liste déroulante à côté de « Vertex Size » et sélectionnez « Betweenness Centrality ». Cliquez sur « Autofill » (remplissage automatique), puis sur le bouton Refresh Graph (rafraîchir le graphique) dans le volet d’affichage du graphique pour mettre à jour les tailles et les couleurs des sommets dans le canevas du graphique. Effectuez un dernier ajustement avant d’afficher le graphique : étant donné que @vlad43210 est au centre de son réseau égocentrique par définition, sa centralité d’interdépendance et ses centralités de vecteurs propres seront élevées mais ne nous diront rien sur la position de @vlad43210 dans son réseau. Réglez manuellement les centralités d’entrelacement et de vecteur propre de @vlad43210 à 0 dans la feuille de calcul et appuyez à nouveau sur  » Rafraîchir le graphique « .

Si vous comparez les figures 10.15 et 10.16, vous pouvez voir que les collègues de @vlad43210 sont plus des centres d’attention que ses amis, mais que les deux groupes sont assez bien assortis en termes de flux d’informations (à l’exception de @redlog, qui a à la fois des centralités de vecteur propre très élevées et des centralités d’interdépendance très élevées et qui apparaît comme un grand nœud vert dans le graphique).

Figure 10.15. Le réseau Twitter égocentrique à 1,5 degré de @vlad43210 (liens sociaux forts uniquement). NodeXL identifie automatiquement les clusters et les colore différemment. La partie supérieure droite (verte) correspond aux amis de @vlad43210, et la partie inférieure gauche (violette) correspond à ses collègues universitaires.

Figure 10.16. Le réseau Twitter égocentrique à 1,5 degré de @vlad43210. Les sommets plus verts ont une centralité de vecteur propre plus élevée, et les sommets plus grands ont une centralité d’interêt plus élevée.

Enfin, comparons le réseau égocentrique d’amis et de followers de @vlad43210 au réseau de @réponses et de mentions de @vlad43210. Notez que ces deux réseaux sont égocentriques, mais que les alters ne sont pas nécessairement les mêmes dans chacun. Au moment de la rédaction de ce document, NodeXL n’importe pas les données détaillées des @réponses et des mentions des utilisateurs, mais l’API de Twitter permet de contourner rapidement ce problème. En utilisant l’API statuses/mentions, vous pouvez visiter l’URL www.twitter.com/statuses/mentions.xml et enregistrer manuellement les noms de tous les amis ou followers de @vlad43210 qui lui ont @répondu ou ont mentionné son nom d’utilisateur Twitter dans l’un de leurs tweets, ainsi que le nombre de @réponses ou de mentions par nom. Comme @vlad43210 ne reçoit pas beaucoup de @réponses ou de mentions, cette tâche ne demande pas beaucoup de temps – pour les tâches plus longues, une alternative serait d’écrire un script pour enregistrer ces noms automatiquement. Ensuite, pour chacun de ces noms, trouvez dans la feuille de calcul Edges l’arête reliant @vlad43210 à un utilisateur qui lui a fait une @réponse ou une mention. Définissez manuellement la largeur de ces arêtes en fonction du nombre de @réponses ou de mentions de @vlad43210 par l’utilisateur correspondant. Enfin, cliquez sur « Rafraîchir le graphique » pour refléter ces mises à jour (Fig. 10.17).

Figure 10.17. Le réseau Twitter égocentrique à 1,5 degré de @vlad43210. Les sommets plus verts ont une centralité de vecteur propre plus élevée, et les sommets plus grands ont une centralité d’interêt plus élevée. Les arêtes les plus épaisses correspondent aux utilisateurs qui @répondent à @vlad43210 ou mentionnent son nom d’utilisateur dans l’un de leurs tweets.

Vous pouvez voir que bien que les collègues de @vlad43210 soient davantage des centres d’attention que ses amis, ses amis @répondent à @vlad43210 et le mentionnent plus souvent que ses collègues. Notez également que, bien que certaines connexions de type @reply et mention lient @vlad43210 à des acteurs à forte centralité tels que @redlog, d’autres lient @vlad43210 à des acteurs à faible centralité. Il est clair que les relations d’information et d’attention dans le réseau égocentrique amis/suiveurs de @vlad43210 n’ont pas nécessairement le même poids dans son réseau égocentrique @replies/mentions.

Sujet avancé

Alignement des sommets dans un graphique

Regardons brièvement les figures 10.9 et 10.10 (les exemples du réseau d’information/attention et du réseau de centralité). Supposons que vous vouliez aligner un petit nombre de sommets d’une manière qui montre clairement les groupements. Cela doit être beaucoup de travail d’aligner ces sommets si nettement à la main, en les faisant glisser un par un.

Comme nous l’avons décrit dans la boîte « Avancé » plus tôt, vous pouvez manipuler les réseaux NodeXL comme des feuilles de calcul régulières. L’onglet Vertices contient des colonnes appelées « X » et « Y », qui contiennent les positions des vertices dans le graphique. Il y a aussi une colonne appelée « Verrouillé ? » qui contrôle si les positions des sommets sont verrouillées en place ou si elles peuvent être déplacées lorsque le graphique est redessiné.

Après avoir réarrangé les sommets comme vous le souhaitez, exécutez la macro suivante pour les aligner parfaitement :

Sub Realign()

′ la distance à laquelle arrondir chaque emplacement

RDIST = 500

COL_VERTEX = 1

COL_LOCK = 21

COL_X = 19

.

COL_Y = 20

ROW_START = 3

Dim wksht As Worksheet

Set wksht = Sheets(« Vertices »)

current_row = ROW_START

While wksht.Cells(current_row, COL_VERTEX).Text > «  »

′ s’assurer que la position du sommet est verrouillée

wksht.Cells(current_row, COL_LOCK) = « Yes (1) »

′ arrondir les x et y

x = Round(wksht.Cells(current_row, COL_X) / RDIST) * RDIST

wksht.Cells(current_row, COL_X) = x

y = Round(wksht.Cells(current_row, COL_Y) / RDIST) * RDIST

wksht.Cells(current_row, COL_Y) = y

current_row = current_row + 1

Wend

End Sub

Cette macro boucle sur chaque sommet du graphe. Elle verrouille d’abord la position du sommet, puis arrondit les coordonnées X, Y aux 500 pixels les plus proches. Ainsi, si deux sommets sont l’un à côté de l’autre et que leurs coordonnées y sont 1498 et 1502, chacun sera repositionné à y = 1500. Cela garantit que les sommets sont correctement alignés.

Laisser un commentaire