Shell and data : le risque de l’obsession du « tout est donnée »

L’article de Danah Boyd traduit sur internetactu a éclairé quelques une de mes préoccupations du moment. Je dois notamment écrire un article introspectif sur mon blog et je m’interroge sur comment étudier les blogs scientifiques dans la durée du fait de leur évolution et des systèmes d’archivage qui ont tendance à privilégier que des données brutes et peu éditorialisées. Supercomputing
Creative Commons License photo credit: Idaho National Laboratory
Boyd note que l’obsession de cumuler des données présente en effet un important problème : celui de les considérer comme étant toutes d’un poids équivalent. Effectivement, les grandes données offrent des perspectives parfois colossales avec le risque de déformations tout aussi conséquentes.
Mais placer les données au centre de l’étude scientifique et même toute stratégie d’organisation de l’information (avec le web de données par exemple) pose un problème épistémologique de taille : l’oubli de la question de la coquille, c’est-à-dire du support mais aussi des techniques utilisées.
Boyd montre qu’il y a un effet à risque à privilégier des approches informatiques au point de tomber dans le travers de Chris Anderson qui considère que les chiffres sont le reflet de la réalité, qu’ils parlent d’eux-mêmes, qu’ils sont automatiquement compréhensibles, et que par conséquent plusieurs sciences- sous entendues sociales et humaines- sont vouées à disparaître.
Clairement, c’est à nouveau l’idéologie du calcul, du ratio, de la société de l’information qui est en train de nous bouffer face au bon usage de la raison. Une nouvelle fois, ce n’est pas l’homme qui crée le cyborg, mais bien l’inverse. Une idéologie du tout calculable tente de nous « cyborguiser » dans la moindre de nos actions et activités. Ce serait quand même fortement inquiétant si cette idéologie devait définitivement emporter les débats en matière scientifique.  Même les humanités numériques (digital humanities) ne semblent pas à l’abri de cette tentation. La position de Milad Doueihi , qui préfère le terme d’humanisme numérique, permet de sortir de l’idée que tout n’est que data.  Humanisme car c’est la robotique qui prend le dessus de manière inattendue. On est pas si loin de l’idée de Hans Moravec de l’uploading, que notre cerveau pour être téléchargé. Un risque que j’ai décrit dans Print Brain technology.
Jean Michel Salaün a donc bien raison de répéter depuis quelques temps que les archivistes ont beaucoup à nous apporter et je crois que cela ne concerne pas que les sciences de l’information. Le support est clairement un élément à ne pas négliger. Etrangement, il semble qu’on oublie totalement la coquille (the shell) qui entoure les data.  Si on devait examiner ce blog et seulement son contenu depuis ces 12 dernières années, on ne pourrait pas clairement percevoir son évolution.  Le site n’a eu de cesse d’avoir des évolutions éditoriales, des mises en forme différentes, des langages et des codes également divers. Pour un archiviste, la reliure, le papier utilisé sont déjà pleinement des documents et des éléments riche en informations notamment en matière d’évaluation. La vision du «  tout data » conduit à négliger l’éditorialité.
Peut-on imaginer traiter des archives des siècles précédents avec seulement les retranscriptions sous un traitement de texte ? Insipide n’est-ce pas ? On se retrouve dans une division assez proche de la dichotomie corps et esprit.  On a à nouveau l’impression que la matérialité est négligeable, en tout cas pas noble, pas digne d’intérêt. Pourtant, Yves Jeanneret nous avait déjà alertés sur ce risque  dans son fameux « Y-a-t-il vraiment des nouvelles technologies de l’information ».  Le document a toujours partie liée avec des supports et des formes éditoriales, des architextes et il lui faut un interprète comme révélateur d’une relation sociale. Négliger, la coquille, c’est sans doute aussi négliger l’esprit.
Du data à la cata, il n’y a qu’un pas.
Creative Commons License photo credit: Idaho National Laboratory