J'avais complètement oublié de mentionner ici la traduction du texte "6 provocations for bigdata" de d boyd et K Crawford, effectuée en septembre 2011 en compagnie de P Grosdemouge et d'internautes bénévoles, le tout, featuré par L Allard. Cette traduction a été publiée sur Internetactu, puis sur Framasoft (je n'en retrouve pas le lien, du coup, je doute...). En voici les premiers paragraphes :

L’ère de Big Data a commencé. Les informaticiens, physiciens, économistes, mathématiciens, politologues, bio-informaticiens, sociologues, et beaucoup d’autres réclament l’accès aux quantités massives d’informations produites par et à propos des gens, des choses, et de leurs interactions. Divers groupes discutent des coûts et des bénéfices de l’analyse de l’information issue de Twitter, Google, Verizon, 23andMe, Facebook, Wikipedia, et de tous les espaces dans lesquels de grands nombres de personnes laissent des traces numériques et déposent des données. D’importantes questions émergent. Les analyses de l’ADN à grande échelle aideront-elles à guérir les maladies ? Ou bien cela aboutira-t-il à une nouvelle vague d’inégalités médicales ? L’analyse des données rendra-t-elle l’accès des gens à l’information plus efficace et effectif ? Ou sera-t-elle plutôt utilisée pour pister les manifestants dans les rues des grandes villes ? Améliorera-t-elle la manière dont nous étudions la communication et la culture humaine, ou va-t-elle rétrécir la palette des options qui s’offrent à la recherche et altérer ce que “recherche” veut dire ? Tout ou partie de ces possibilités ?

Parler en termes de Big Data est, de bien des manières, restrictif. Comme l’observe Lev Manovitch (2011), ce terme a été utilisé en sciences pour désigner les ensembles de données suffisamment grands pour nécessiter des super-ordinateurs, et bien que, désormais, de grands ensembles de données puissent être analysés sur des ordinateurs de bureau avec des logiciels standards. Il n’y a aucun doute sur le fait que les quantités de données disponibles aujourd’hui soient en effet très grandes, mais ce n’est pas la caractéristique la plus pertinente de ce nouvel écosystème des données. Les Big Data sont remarquables, non en raison de leurs tailles, mais pour leurs capacités à être articulées à d’autres données. En raison des efforts pour exploiter et agréger les données, Les Big Data sont fondamentalement liées aux réseaux. Leurs valeurs viennent des patterns qui peuvent être tirés du fait de connecter entre eux des jeux de données, concernant un individu, des individus liés à d’autres, des groupes de gens, ou simplement concernant la structure de l’information elle-même.

Plus encore, les Big Data sont importantes parce qu’elles renvoient à des analyses ayant cours à la fois à l’université et dans l’industrie. Au lieu de suggérer un terme nouveau, nous utilisons le terme Big Data ici en raison de sa prégnance populaire et parce que c’est le phénomène entourant les Big Data que nous souhaitons aborder. Ces Big Data amènent certains chercheurs à croire qu’ils peuvent tout voir d’une hauteur de 30 000 pieds. C’est le genre de données qui encourage la pratique de l’apophénie : voir des tendances là où il n’y en a aucune, simplement parce que des quantités massives de données peuvent offrir des connexions qui irradient dans toutes les directions. Pour cette raison, il est crucial de commencer à interroger les hypothèses qui vont gouverner l’analyse, les cadres méthodologiques, et les préjugés qui sous-tendent le phénomène Big Data.

la suite ici est donc sur Internetactu...