sociographie.net

Aller au contenu | Aller au menu | Aller à la recherche

mardi 3 septembre 2013

Je vais au congrès, je discute, je tweete #AFS13

Nous voici au premier jour du congrès de l'afs, qui est le rassemblement probablement le plus important, avec l'aislf, de sociologues français et/ou francophones. Tout le monde arrive petit à petit, puis cours derrière son programme, sa chambre d'hotel, ses tickets de bus, etc. Les participants sont gentiment accueillis, ils savent ce qu'ils doivent chercher et demander, les personnes chargées de l'organisation du congrès savent ce qu'elles doivent indiquer et répondre. Les informations techniques et d'organisations sont-elles les seules informations à devoir circuler de façon globale (entendu ici transversalement aux RT et GT et réseaux personnels) dans ce type de congrès ? Qu'en dit-on sur twitter ? Une telle question peut paraître étrange, et a priori, même, on s'en moque. Pourtant elle permet de faire le point sur une suite de pratiques propres, dans une certaine mesure, au monde scientifique et qui me semblent tout à fait intéressantes à observer et réfléchir.

Qu'en dit twitter, donc ? Et, bien sur, pourquoi twitter ? Sur ce site, on échange de très courts messages (140 caractères max.), on y suit, entre autres choses, des listes thématiques générées par l'indexation intentionnelle des messages par leurs auteurs. Les messages se voient attribuer des mots-clés, des hashtags, qui prennent la forme d'un mot précédé d'un dièse (comme #sociologie, par exemple). L'importance des hashtags indexant les messages est aisée à concevoir lorsque l'on remet en contexte le fait d'envoyer un message sur twitter : des millions de messages vont être envoyés dans l'heure qui suit, aussi, il faut bien pouvoir trier et distinguer notre message de tous les autres.

L'idée que l'on puisse commenter et échanger des messages autour d'un congrès n'est pas dénuée d'intérêt. En effet, déjà, certains des participants ont depuis des années déjà une pratique de blogging scientifique, soit qu'ils travaille sur des plateformes institutionnelles comme hypothèses.org ou culturevisuelle.org pour celles que je connais le mieux, soit qu'ils tiennent leur blog de façon indépendante (soit, assez souvent, les deux...),. Souvent, ces personnes possèdent aussi un compte sur la plateforme de micro-blogging et de réseautage twitter.com, et y évoquent entre autres choses très variées certaines des sessions auxquelles ils assistent lorsqu'ils se rendent à un congrès, comme il le font sur leur blog par ailleurs (ici l'ex. de P. Mercklé à grenoble en 2011) : ils en font le commentaire, ils ajoutent des liens concernant l'intervention qu'ils sont en train de suivre, forment ainsi une sorte de bibliographie parallèle, il en restranscrivent les contenus (#scriptodiffusion, ils se font les Léon Zitrone de la session en quelque sorte), comme s'ils partageaient leurs prises de notes, mais en live, on appelle cette pratique un live-tweet, un LT. D'autres, tout simplement, utilisent twitter pour savoir ce qu'il se passe dans une session à laquelle ils n'ont pas pu assister, qu'ils le fassent durant la session même, ou bien juste après, pour rattraper, et comptent donc sur le fait que les premiers auront bien partagé leurs notes ou leurs remarques.

Lire la suite...

lundi 15 juillet 2013

#twittology : collecter des tweets à partir d'une liste de hashtags

Dans le billet précédent, je suis revenu sur les conditions dans lesquelles il est intéressant de faire la sociologie d'un événement, de tenter de suivre ce qu'il se passe dans une situation d'ampleur et de voir ce qu'il est possible d'en comprendre au fur-et-à-mesure. j'ai repris ensuite les interventions du workshop just-in-time-sociology pour en lister, synthétiser les points méthodologiques et épistémologiques principaux que soulèvent les événements contemporains de plus en plus liés, soit dans leur développement soit dans leur couverture médiatique et le plus souvent les deux, aux technologies numériques, web et réseaux sociaux en première ligne. J'ai fini ce précédent billet en introduisant la collecte de tweets contenant les hashtags #manifpourtous et #mariagepourtous que j'ai engagée à la fin de l'hiver avec F. Clavert, collecte qui est en train de donner lieu à une petite étude menée en compagnie de M. Cervulle.

Lire la suite...

lundi 8 juillet 2013

#twittology : sociologie "just-in-time" et collecte de tweets

Cela fait environ un mois que Frédéric Clavert a publié un post sur son expérience printanière de collecte de tweets, et, ayant participé à cette collecte, je voulais ajouter quelques pierres au caïrn. je vais principalement reprendre les points qu'il a listés, mais en les augmentant un peu, et en les abordant du point de vue d'une enquête en train de se faire (lancée il y a tout juste quelques mois), plutôt que de celui d'un regard déjà plus large issu de sa préoccupation pour la construction des humanités numériques. Parler de cette collecte de tweets ici revient à aborder une situation à peu près inverse à celle des gros projets de recherche associant des équipes solides, aux compétences équilibrées et multiples, et qui peuvent concevoir très en amont la façon qu'elles auront de produire des données à analyser. Au contraire, je voudrais raconter comment, de manière un peu fragile, il arrive que pour pouvoir travailler sur ou autour d'un événement, faire une "sociologie du présent" (voir par exemple l'article de B. Paillard sur la sociologie de l'événement et la sociologie d'enquête chez Morin), on puisse se retrouver à improviser grâce-et-à-cause des données numériques. J'aimerais arriver à présenter ici comment il arrive qu'une étude se construise, en croisant les enjeux techniques, méthodologiques et théoriques qui s'y tressent, tout en listant, à l'occasion, quelques uns des problèmes spécifiques à la nature numérique d'une partie des données.

Lire la suite...

mardi 9 avril 2013

préparer un corpus de tweets avec open/google Refine pour le visualiser dans Gephi

Il existe différentes méthodes pour analyser le graphe documentaire/social issu des flux de tweets. Pegasusdata propose une méthode basée sur l'usage du logiciel de statistiques R et de la librairie Igraph dans un tutoriel réalisé par Yannick Rochat, Martin Magdinier, dans son blog dédié à la maitrise de Open/google Refine consacre plusieurs posts au traitement des tweets, dont un qui m'a longtemps servi pour manipuler les tweets sans utiliser d'expressions régulières, et un autre qui explique comment préparer les données pour gephi. Ce que je vais présenter plus loin, n'est pas une synthèse des deux posts, et offre une autre approche toujours sous Open/ggggle Refine, la première des solutions collectées par Martin étant trop lourde parfois, et la seconde ne permettant pas de produire un fichier très élaboré, offrant simplement un graphe trop sommaire à mon goût.

Celle que je présente ici me parait être la plus simple en nombre de manipulations, et la plus efficace si l'on ne connaît rien à R / Rstudio et si l'on travaille pourtant sur un fichier comportant un très grand nombre de lignes (autour de 500.000 tweets par ex.), dans la mesure où elle est économe sur l'usage des fonctions "split into several columns" & co, et n'étouffe pas l'ordinateur sous les opérations de calcul... Elle demande d'utiliser des expressions régulières, ce qui peut déstabiliser un instant ceux qui ignorent leur existence. En fait, comme beaucoup de choses, au début ça fait peur, mais en fait c'est pas grave... Pour ma part, je n'y connais pas grand chose, mais en tâtonnant, comme souvent avec l'informatique ou les maths, j'ai trouvé les deux ou trois regex qui me facilitaient le travail. C'est l'objet de ce post, fournir les expressions qu'il suffira de copier/coller dans Open/google Refine, ceci revenant à faire à peine plus que cliquer sur un bouton qui dirait "extrait tous les hashtags pour moi steuplé" ;-)


Prérequis, récupération du corpus de tweets et ouverture dans OpenRefine

prérequis : avoir installé gephi, mais surtout avoir installé open/gggle refine.

Concernant l'usage d'une base de données de tweets destinée à la production d'un graphe dans Gephi, la forme du fichier à produire est simple, il suffit juste d'anticiper deux ou trois choses : - il faut produire une table des relations avec une colonne 'Source' & une colonne 'Target' (avec des majuscules dès le départ, ça évite d'y revenir ensuite) - il faut conserver un identifiant unique pour chaque tweet,( c'est déjà le cas dans la base de données ou le phirehose de twitter) - il faut conserver la date pour pouvoir établir un graphe dynamique (au cas ou, la conserver ne prend pas énormément de place)

Lire la suite...

vendredi 21 décembre 2012

Fucksonomy : l'identité sexuelle next-door. (par @cultord)

Voici, en #cadeaubonux, la copie du texte rédigé par P. Grosdemouge sur son blog (entre temps hacké) à l'occasion de la diffusion d'une émission "Place de la Toile" sur france culture où j'étais intervenu aux côté de M. Cervulle pour parler des transformations esthétiques du porno à l'heure du web et du numérique. Je copie le post de PG. tel quel, c'est avant tout par souci d'archivage que je le poste ici, le temps qu'il relance son propre blog.

Le 19 Mars 2010 était diffusé sur France Culture l'émission "Place de la Toile", ayant pour thème : "Porno sur internet : esthétique de l'amateurisme".

Il a bien été question d'une influence esthétique des pratiques amateur sur la pornographie. Mais les intervenants ont également défendu l'idée selon laquelle l'influence de l'amateurisme peut se caractériser d'avantage encore par l'efficacité de ses procédures. J'aimerais insister sur ce point puisqu'il croise mes propres questionnements : la pornographie en ligne fournit une occasion de voir ces procédures amateur à l'œuvre, au travers notamment de leur impact sur l'organisation même des documents à caractère sexuels, et plus largement sur la construction et la répartition des identités sexuelles.

Lire la suite...

- page 2 de 5 -