sociographie.net

Aller au contenu | Aller au menu | Aller à la recherche

Tag - sociographie

Fil des billets - Fil des commentaires

vendredi 31 janvier 2014

parution de l'article : "Twitter et la politique affective des hashtags"

Je profite de ce billet pour annoncer la parution du papier "#mariagepourtous : Twitter et la politique affective des hashtags" que j'ai co-écrit avec Maxime Cervulle. Il prend place dans le dossier 'Émergences' du 4ème numéro de la Revue Française d'Information et de Communication (RFSIC). Cet article constitue la première présentation publique des analyses que nous menons sur les corpus que nous avons constitué durant l'hiver et le printemps 2013, au fur et à mesure des événements, et qui avaient déjà donné lieu à plusieurs billets plus ou moins techniques (et austères :) ) sur ce blog. Entre temps nous avons travailler à fournir un cadre analytique et théorique un peu plus étoffé à nos travaux, et, nous mettons actuellement au travail pour la suite (doucement...). Suivent les deux résumés en français et en anglais de notre article. Bonne lecture :-) !!!

Lire la suite...

lundi 15 juillet 2013

#twittology : collecter des tweets à partir d'une liste de hashtags

Dans le billet précédent, je suis revenu sur les conditions dans lesquelles il est intéressant de faire la sociologie d'un événement, de tenter de suivre ce qu'il se passe dans une situation d'ampleur et de voir ce qu'il est possible d'en comprendre au fur-et-à-mesure. j'ai repris ensuite les interventions du workshop just-in-time-sociology pour en lister, synthétiser les points méthodologiques et épistémologiques principaux que soulèvent les événements contemporains de plus en plus liés, soit dans leur développement soit dans leur couverture médiatique et le plus souvent les deux, aux technologies numériques, web et réseaux sociaux en première ligne. J'ai fini ce précédent billet en introduisant la collecte de tweets contenant les hashtags #manifpourtous et #mariagepourtous que j'ai engagée à la fin de l'hiver avec F. Clavert, collecte qui est en train de donner lieu à une petite étude menée en compagnie de M. Cervulle.

Lire la suite...

lundi 8 juillet 2013

#twittology : sociologie "just-in-time" et collecte de tweets

Cela fait environ un mois que Frédéric Clavert a publié un post sur son expérience printanière de collecte de tweets, et, ayant participé à cette collecte, je voulais ajouter quelques pierres au caïrn. je vais principalement reprendre les points qu'il a listés, mais en les augmentant un peu, et en les abordant du point de vue d'une enquête en train de se faire (lancée il y a tout juste quelques mois), plutôt que de celui d'un regard déjà plus large issu de sa préoccupation pour la construction des humanités numériques. Parler de cette collecte de tweets ici revient à aborder une situation à peu près inverse à celle des gros projets de recherche associant des équipes solides, aux compétences équilibrées et multiples, et qui peuvent concevoir très en amont la façon qu'elles auront de produire des données à analyser. Au contraire, je voudrais raconter comment, de manière un peu fragile, il arrive que pour pouvoir travailler sur ou autour d'un événement, faire une "sociologie du présent" (voir par exemple l'article de B. Paillard sur la sociologie de l'événement et la sociologie d'enquête chez Morin), on puisse se retrouver à improviser grâce-et-à-cause des données numériques. J'aimerais arriver à présenter ici comment il arrive qu'une étude se construise, en croisant les enjeux techniques, méthodologiques et théoriques qui s'y tressent, tout en listant, à l'occasion, quelques uns des problèmes spécifiques à la nature numérique d'une partie des données.

Lire la suite...

mardi 9 avril 2013

préparer un corpus de tweets avec open/google Refine pour le visualiser dans Gephi

Il existe différentes méthodes pour analyser le graphe documentaire/social issu des flux de tweets. Pegasusdata propose une méthode basée sur l'usage du logiciel de statistiques R et de la librairie Igraph dans un tutoriel réalisé par Yannick Rochat, Martin Magdinier, dans son blog dédié à la maitrise de Open/google Refine consacre plusieurs posts au traitement des tweets, dont un qui m'a longtemps servi pour manipuler les tweets sans utiliser d'expressions régulières, et un autre qui explique comment préparer les données pour gephi. Ce que je vais présenter plus loin, n'est pas une synthèse des deux posts, et offre une autre approche toujours sous Open/ggggle Refine, la première des solutions collectées par Martin étant trop lourde parfois, et la seconde ne permettant pas de produire un fichier très élaboré, offrant simplement un graphe trop sommaire à mon goût.

Celle que je présente ici me parait être la plus simple en nombre de manipulations, et la plus efficace si l'on ne connaît rien à R / Rstudio et si l'on travaille pourtant sur un fichier comportant un très grand nombre de lignes (autour de 500.000 tweets par ex.), dans la mesure où elle est économe sur l'usage des fonctions "split into several columns" & co, et n'étouffe pas l'ordinateur sous les opérations de calcul... Elle demande d'utiliser des expressions régulières, ce qui peut déstabiliser un instant ceux qui ignorent leur existence. En fait, comme beaucoup de choses, au début ça fait peur, mais en fait c'est pas grave... Pour ma part, je n'y connais pas grand chose, mais en tâtonnant, comme souvent avec l'informatique ou les maths, j'ai trouvé les deux ou trois regex qui me facilitaient le travail. C'est l'objet de ce post, fournir les expressions qu'il suffira de copier/coller dans Open/google Refine, ceci revenant à faire à peine plus que cliquer sur un bouton qui dirait "extrait tous les hashtags pour moi steuplé" ;-)


Prérequis, récupération du corpus de tweets et ouverture dans OpenRefine

prérequis : avoir installé gephi, mais surtout avoir installé open/gggle refine.

Concernant l'usage d'une base de données de tweets destinée à la production d'un graphe dans Gephi, la forme du fichier à produire est simple, il suffit juste d'anticiper deux ou trois choses : - il faut produire une table des relations avec une colonne 'Source' & une colonne 'Target' (avec des majuscules dès le départ, ça évite d'y revenir ensuite) - il faut conserver un identifiant unique pour chaque tweet,( c'est déjà le cas dans la base de données ou le phirehose de twitter) - il faut conserver la date pour pouvoir établir un graphe dynamique (au cas ou, la conserver ne prend pas énormément de place)

Lire la suite...

samedi 28 avril 2012

Parcours ethnographique en ligne et politiques d'accès aux documents

Voici le texte rédigé d'une communication que j'ai faite à l'automne dernier au congrès de l'AFEA. Elle s'insérait dans un panel qui traitait des ethnographies en ligne. La question, qui peut sembler entendue dans les web studies et les digital humanities ainsi qu'en socio et en info-com, a provoqué, à notre grande surprise, un mini-tollé en... ethnologie. Rien de grave, toutefois. Cette communication, alors même qu'elle fut plutôt poussive en live et que ce sont les questions des auditeurs qui la sauvèrent à mes yeux, m'a permis d'engager la réflexion qui a généré plus tard le plan de la conférence HiNT en mars 2012, et notamment l'idée qu'il est impossible de distinguer dispositif technique et matériau culturel, et de ne s'attache à l'étude que l'un des deux, dès lors que l'on travaille à une ethnographie du web.

Technology is neither good nor bad; nor is it neutral... technology's interaction with the social ecology is such that technical developments frequently have environmental, social, and human consequences that go far beyond the immediate purposes of the technical devices and practices themselves. M. Kranzberg (Kranzberg, 1986, p. 545) cité par d. boyd & K. Crawford (boyd & Crawford, 2011 p. 1)

I. Deux troubles ethnographiques et un parcours documentaire

Comment un ethnographe peut-il produire des données lorsqu'il enquête sur le web de l'intime, de la rencontre et de la pornographie ? Pour développer cette question de méthode, il me faut aborder entre les lignes l'existence de deux troubles liés profondément à l'activité des ethnographes. D'abord, un trouble lié au compte-rendu, à la description en ce qu'elle draine de vocabulaire, de rhétorique, d'enjeux à la représentation, etc. et, plus précisément, à l'accountability des ethnométhodologues qui implique que le terrain soit observable, rapportable, descriptible et « résumable à toute fin pratique » (Garfinkel, 2007). Grossièrement on peut illustrer ce point par la question de savoir ce que l'on décrit lorsque l'on « explore » un réseau social sur le web, et que pour cela, on se trouve seul face à l'écran d'un ordinateur. Le second trouble, lié au premier de façon assez directe dans le contexte du web, est celui de l'écriture (Jeanneret et al. 2003), et de la documentation (Georges, 2010, p.148) ou plutôt du « déjà-documenté » qui provient du fait que les pratiques en lignes ont quelque chose à voir avec la manipulation de documents, une manipulation supplémentaire et antérieure à celle qui caractérise l'activité ethnographique, ce qui, dans le fond, doit pousser l'ethnographe qui travaille en ligne à ne jamais se retrancher derrière un rôle passif d'archivage des données numériques, mais à interroger la possibilité et les manières mêmes de cet archivage.

Ces deux troubles ont à la fois paralysé et nourrit mon travail d'enquête et de compte rendu pendant de longues années parce qu'ils n'apparaissaient jamais directement comme les problèmes que je rencontrais sur le terrain, problèmes que j'associais toujours plutôt aux contenus des discours tenus par les internautes, affaires de sexualité, de conceptions de la relation amoureuse, de savoir/découvrir qui ment, qui est sincère, etc., qu'à des problèmes de documentation et de compte rendu ethnographique. D'une certaine façon, il m'a fallu considérer mon travail comme une activité ethnographique plutôt qu'une simple collecte de données pour pouvoir enfin commencer à rendre compte du terrain ; avant cela, avec la meilleure volonté du monde, je ne trouvais jamais la bonne manière de présenter dans son ensemble le corpus que j'étais en train de produire, et me contentait d'en présenter des portions minuscules.

Faire une ethnographie en ligne, c'est d'abord se donner pour objectif d'effectuer un parcours en ligne avec des moyens à peu près équivalents à ceux dont disposent la majorité des internautes (« no bigdata, no backoffice, just a mouse, my eyes and a keyboard »). Il s'agit donc d'avancer de page web en page web, de profil en discussion, de site perso en plateforme de partage ou en réseau social, au point de comprendre que l'activité des internautes, comme celle de l'ethnographe, peut être interprétée comme une suite de circulations (Boutet, 2008, p.448-449), de parcours de documentation. Surtout, en procédant ainsi, on réalise qu'il leur arrive régulièrement d'interpréter eux-mêmes leur parcours comme lié à de la documentation, et à d'autres moments d'être confrontés à ce type d'interprétation par d'autres internautes ou bien par les interfaces des sites web, sans qu'ils l'aient choisie de leur plein gré.

Lire la suite...

- page 1 de 2