Parler du numérique sans investisseurs ni techno-gourous :

Pour commencer, une question bête : qui était absent lors de ces journées ? Manquaient à l'appel des gens qui utilisent des logiciels commerciaux (donc de vrai.e.s chercheur.e.s confirmé.e.s et crédibles ?), des hommes (pourtant toujours en majorité dès que l'on parle de numérique), des gens qui s'intéressent avant tout autre chose aux technologies numériques (au point de ne s'intéresser paradoxalement à pas grand chose d'autre). Et, honnêtement, je le dis ici pour une fois, il m'a été fort agréable de pouvoir écouter des chercheur.e.s intéressé.e.s par le numérique, sans devoir subir les concours de celui qui designe le service le plus hype, qui innove de la manière la plus acceptable, de ceux qui confondent sociologie et marketing, et j'en passe, à coup de e-bidules et de i-trucs. C'est certes anecdotique, mais, vraiment, le cadre théorique qui se noue autour du numérique lors de ces raouts techno-mercantiles devient particulièrement perceptible et particulièrement fumeux, une fois mis à distance de la sorte. j'en remercie, donc, encore, les organisatrices.

Des intérêts et des savoir-faire bien genrés :

En premier lieu, est apparu une distinction très nette entre des personnes qui manipulent des logiciels et de traitement automatisé des données et des personnes qui se posent des questions autour des discours sur le genre. Chose intéressante : ces deux groupes sont particulièrement genrés eux-mêmes : les personnes qui collectent et manipulent les données avec des procédés automatisés sont très majoritairement des hommes, les personnes qui interrogent les catégories de genre sont très majoritairement des femmes. Quelques exceptions de chercheurs se positionnant à l'intersection des deux, venant d'un côté ou de l'autre et retravaillant leurs compétences pour mieux avancer dans les travaux : je prendrai comme exemple l'équipe des jeunes doctorants du LERASS (Carbou G., Christophe T. Ducos A) à Toulouse qui a présenté une analyse des commentaires des vidéos de Conchita Wurtz sur youtube, qui, d'abord, faisait entièrement mentir la répartition genrée que je viens de décrire (h/informatique - f/théories&analyses), mais en plus était très fine dans son analyse.

Des logiciels libres et accessibles :

On a vu des présentations construites à l'aide d'outils d'analyse informatiques récurrents : on retient notamment une omniprésence du logiciel d'analyses du discours iramuteQ (implémentation libre de la méthode Alceste, maintenu par P. Ratinaud du LERASS à Toulouse) et une présence en demie teinte de Gephi, sachant que toutefois les données relationnelles n'étaient pas du tout au centre des débats lors de ces journées (j'ai hâte que ça arrive ;-) un jour!). Pour le coup, N. Smyrnaïos nous a présenté un usage combiné de gephi et iRamuteQ sur le repérage de corrélations entre les classes lexicales et les communautés autour du hashtag #mariagepourtous en 2013 particulièrement prometteur. Il n'est peut-être pas anodin de constater une forte présence des logiciels libres puisque ceux-ci ont des propriétés d'usages assez spécifiques et qui répondent bien à la situation institutionnelle des chercheur.e.s présent.e.s lors de ces journées : ce sont des logiciels dont les chercheur.e.s peuvent s'emparer plus ou moins facilement, mais toujours sans risque financier ni investissement faramineux, ce qui est important dans la constitution d'un champ de recherche qui n'en est qu'à ses débuts. Ce sont aussi des logiciels qui font l'objet d'un suivi et d'une documentation en ligne plutôt efficace, plutôt que de reposer sur des circuits de formations payants, et le plus souvent hors-de prix. Peut-être que c'est l'appel à communication des journées qui a "trié" ce type d'association chercheurs/logiciels, c'est en tout cas une question à creuser et à ne surtout pas négliger dans le développement ultérieur de ce champ de recherches... Une mention spéciale pour des méthodes, certes bien peu adaptées à des corpus géants, mais qui ont largement fait leurs preuves sur des corpus "smalldata" comme l'archivage de captures d'écran, archivage et analyse qui demandent une rigueur et une logistique tout à fait conséquentes pour être efficace (avec la précision sans faille de l'analyse qu'elle nous a présentée, AC. Husson saura sûrement tirer profit de tels corpus).

Une forme techno-discursive adaptée à un type de recherche, et vice-versa :

On a assisté au compte-rendu de différents travaux portant sur des données issues de twitter : le format des tweets, en plus peut-être aussi d'une certaine disposition culturelle/de classe des chercheur.e.s à s'y intéresser, semble avoir suscité un intérêt particulier pour une bonne part des intervenant.e.s : sa facilité à être manipulé fait de lui un objectif qui n'effraie pas les débutants en analyse informatisée des discours... Toutefois, il ne leur refuse pas quelques résistances à l'instar de l'ensemble des dispositifs de production de données numériques qui ne sont pas le fruit direct des travaux des chercheurs. Le numérique permet à la fois de "récupérer" des données facilement, sans presque aucune infrastructure de recherche, tout en rendant nécessitant des compétences nouvelles pour les traiter, appelant à de nouvelles collaborations. Le fait de s'inscrire dans des projets subventionnés et planifiées institutionnellement, ou, au contraire, pas du tout (l'étude des commentaires sur Conchita Wurtz par les doctorants toulousains, ou encore ma propre étude sur twitter, le #mariagepourtous et le débat à l'Assemblée, avec M.Cervulle et J.Chibois), pose le rapport aux données numériques de manière complètement différente : soit on peut prévoir et anticiper les types de données, soit on doit improviser et construire nos questions à partir des données collectées, des formats qui nous ont été imposés par les plateformes ou par les événements (sur le principe de la just-in-time sociology)... C'est un point intéressant qui agit sur la recherche en la contraignant de façon très très différente suivant les cas, et finalement, assez peu nombreux ont été les projets présentés qui produisaient et contenaient leurs données dans un environnement sur lequel ils avaient la maîtrise complète.

Le besoin d'un cadre épistémologique adéquat :

Le fait que ces journées d'études aient été orientées sur la méthodologie d'enquête, et la collecte des données, me pousse à préciser l'importance que peut prendre, selon moi, le développement d'un cadre théorique spécifique/adéquate au croisement de travaux sur les rapports sociaux de genre, de sexualité, de race, de classe, et la prise en compte de leur déploiement dans les espaces numériques. Plusieurs raisons à cela :

- les logiciels qui permettent le traitement automatisé des données sont construits suivant des modèles théoriques (du langage, des interactions, des relations, etc.) qui ne sont pas toujours explicités, ou que l'importance que prendre pour les chercheur.e.s la prise en main même du logiciel et la conformation des données peut faire passer en second plan. Or, ce cadre théorique inhérent à un logiciel est essentiel pour comprendre les résultats, et pour "situer" l'analyse qui va en dériver... Les rapports sociaux sont des objets qui eux-mêmes nécessitent un cadre théorique et épistémologique particulier pour être appréhendés. Les rapports sociaux, sont les agents de différenciation entre des individus ou des groupes suivant des rapports de domination ou d'affection variables. Le développement d'un ancrage dans l'analyse informatisée des rapports sociaux doit passer par la mise en cohérence des cadres théoriques à la fois des outils et des analyses.

- Que ce soit l'analyse critique des catégories opérées par les études de genre, le réglage des logiciels ( par les dictionnaires, les lemmatisations, etc.) où encore le calage ou le choix appropriés des catégories, tous ces éléments participent à déterminer la description des populations ou des phénomènes observés. Aussi, dans un contexte où une partie croissante des études inclue une part de terrains numériques, ces trois dimensions de l'enquête requièrent de penser à nouveau l'usage et la lecture que les chercheurs font des catégories de genre, de race, de classe, de sexualité, etc. C'est un point qui est toujours autant épistémologique que méthodologique, dès lors que la numérisation des données touche les chercheurs autant dans leurs outils que dans les données qu'ils collectent.

Cela pourrait constituer un objectif pour une deuxième journée d'étude, que chaque personne puisse déployer la cohérence méthodologique et théorique de son travail (il faudrait laisser un peu plus que 20min / tête, sinon ça peut difficilement être clair dans un temps aussi compressé ;-). L'articulation avec d'autres méthodologies d'enquête pourrait devenir un enjeu aussi, sachant qu'à plusieurs reprises nous avons terminé nos interventions par un "là nous n'avons pas encore fait d'entretiens" ou encore "bon je suis en train de préparer la portion ethnographique de mon étude". Le fait de placer l'analyse de données numériques avant ou après un terrain ethno/socio engageant des exigences relativement distinctes en terme de management de la recherche.

Une petite frustration en guise de conclusion :

Peut-être est-ce du au fait que je me trouve, depuis plus de dix ans maintenant pour mes propres travaux, à la croisée des deux champs de recherche qui se rencontraient lors de ces journées, mais j'ai été surpris par le manque de références tantôt méthodologiques et tantôt théoriques dont certain.e.s d'entre nous faisaient preuve : ça ne circule pas, les bibliographies, pas plus que les anecdotes et les savoir-faire les plus prosaïques, ne traversent les "petits mondes" scientifiques. La constitution d'une bibliographie commune est une base incontournable pour des collaborations futures, mais aussi, simplement, pour permettre une entrée dans le sujet relativement rapide pour les débutants de l'usage des logiciels, mais aussi des questionnements sur les rapports sociaux (que, par ailleurs, je serai d'avis détendre très rapidement à d'autres perspectives que celle des genres et des sexualités). S'il est question de générer et partager des savoir-faire adéquats aux interrogations sur différents types de rapports sociaux, il faut engager des transformations dans nos propres manières de faire relativement lourdes, l'apprentissage d'outils informatiques comme théoriques ne se faisant jamais sans un temps de digestion particulièrement conséquent parfois. En plus de cela, il serait certainement intéressant d'inclure, dès à présent, des travaux d'étudiants plus jeunes amenés à construire leurs études directement à cheval sur ces deux ensembles de questions méthodologiques et théoriques au point de ne pas souffrir le moins du monde de leur relative imperméabilité jusque là.