J’ai réalisé il y a quelques semaines un document à destination de mes étudiants pour le cours d’analyse documentaire, cours pendant lequel il s’agit surtout de produire des résumés indicatifs et informatifs. L’essentiel d’ailleurs reposant un gros travail d’exercices sur des textes pour produire des résumés informatifs. Mes étudiants ont une moyenne d’âge de 18-19 ans puisqu’il s’agit de première année de DUT avec quelques années spéciales en DUT Infonum. J’avais noté que les étudiants n’avaient pas pris le réflexe d’aller voir les concepts inconnus, mais aussi les identités des personnes citées dans les articles qui figurent dans le corpus de documents de travail. J’avais incité dès lors à ce qu’ils prennent le réflexe de devenir des professionnels de l’information en allant vérifier systématiquement les éléments qu’ils ne connaissaient pas. Jusque-là finalement, rien de nouveau à cette vieille habitude scolaire qui s’exerçait davantage dans la consultation du dictionnaire il y a 25 ans. L’analyse documentaire n’est en rien un art révolutionnaire, mais c’est une pratique extensive qui doit s’exercer finalement avec des documents issus du web. J’avais prévenu mes étudiants que ce manque de réflexe quant à la vérification des faits était gênant et que j’aurais pu produire des textes faux dans le corpus. J’avais ajouté que j’allais sans doute un jour les piéger.
Et j’ai tenu parole… plusieurs semaines après en leur confiant à la fin d’un cours, un document de travail pour qu’il puisse à nouveau s’exercer. Or ce document est totalement faux. J’ai pris soin de mettre en ligne sur Medium ce document afin d’obliger quelque peu les étudiants à aller voir plus loin. Mais au bout de quelques jours, aucun d’entre eux n’avait relevé la supercherie. Pire, une étudiante m’avait rendu le travail de résumé sur ce document complètement faux. Je pris alors la décision d’alerter via le hashtag #infonum que je leur avais fait une petite blague et qu’il serait temps de mener l’enquête. Je rencontre de nouveaux usages et comportements avec mes nouveaux étudiants cette année, des dispositifs qui fonctionnaient jusque-là, comme la correction collective des travaux avec un pad collaboratif projeté a bien du mal à fonctionner sans doute par manque de projection collective. J’ai été contraint pour maintenir l’attention et la motivation, de donner des points bonus lors de bonnes réponses à des questions. Ce genre de situation les stimule. De là, à ce que je sois contraint d’installer des buzzers…
Du coup, c’est en relançant l’intérêt sur twitter que les étudiants se sont mis à chercher et se sont penchés sur le texte pour découvrir enfin la supercherie.
Il est vrai que le texte présente en apparence toutes les logiques d’une démonstration et semble fondé sur une véracité liée à des observations, des rencontres et des entretiens par un auteur qui semble être spécialiste.
Cela ressemble à du vrai… et il faut bien aussi prendre en considération qu’on imagine mal un professeur confier un faux document. J’avais pris soin de ne pas entrer dans les logiques de pourrissement qui consistent à venir polluer un travail collectif et collaboratif comme sur Wikipédia. L’objectif est clairement pédagogique, et j’ai donc décidé de conserver l’article en ligne, mais avec une mention explicative, notamment pour quiconque voudrait reproduire l’expérience en s’inspirant de ce texte. La pratique du faux s’inscrivait aussi en prolongation du cours de culture de l’information donnée par un de mes collègues qui leur avait montré d’ailleurs des cas exemplaires.
Pourtant, j’avais laissé des éléments assez grossiers, mais qui culturellement n’était pas si aisés à identifier notamment pour des questions générationnelles.
J’en donne les clefs ici.
Premièrement, l’auteur Belbo Corrigane que je présente comme « Ancien ingénieur en systèmes d’information, désormais consultant et observateur des évolutions digitales. Actuellement en investigation dans la Silicon Valley. » est une invention dans le genre, « plus c’est gros, plus ça passe » avec des éléments bibliographiques dans le style des plus grands mythomanes de Linkedin. Et pourtant, tout indique que Belbo est tout petit… Il y a bien sûr l’homophonie Belbo, Bilbo, référence à Tolkien bien connue de tous. Les Bretons connaissent les korrigans et les korriganes, ces petits êtres malicieux qui peuvent vous faire perdre le temps et bien plus encore durant des danses infinies. Le patronyme Corrigane renforçait drôlement le prénom. Mais si j’ai choisi Belbo plutôt que Bilbo… c’est par référence à Umberto Eco et le Pendule de Foucault, donc un des personnages principaux est Jacopo… Belbo, un éditeur qui participe à la fabrique du faux complot. Le lecteur intéressé pourra aller voir du coup du côté de Casaubon qui a inspiré le nom du personnage principal du même livre. Rien que le nom de l’auteur pouvait placer le lecteur avisé sur la piste d’une aventure, encore fallait-il en avoir envie. Bref, n’est pas Gandalf qui veut, je dois bien le constater.
Pour le concept de captabilité, j’ai inventé un concept qui finalement peut paraître vraisemblable et qui n’est pas totalement idiot à la lecture. Moche probablement, mais on pouvait s’y méprendre, surtout quand on l’accole avec de la disruption à la mode.
J’ai ajouté des images sur le document en ligne. Elles ne figurent pas sur le document papier que j’ai confié à mes étudiants. Elles sont aussi des moyens de constater en utilisant un moteur d’images comme Tineye ou Google qu’il y a comme un problème… (j’avais évoqué ces outils comme moyen d’évaluer l’information il y a quelques années.
Admettons qu’on pouvait encore y croire jusque-là…J’évoque une société dont le nom est Morlay & Toons… Un nom étrange pour le moins, tout droit sorti d’un monde fictionnel comme l’indique les Toons… et dont l’homophonie avec Eugène Tooms, ce serial killer de X-Files résonne formidablement bien avec Morlay… ou plutôt Morley la marque que fume le « smoker » de la même série.
Pour clore le tout dans cette affaire, les noms des chercheurs et créateurs d’entreprise impliqués finissaient par révéler la supercherie : le professeur Motoei Shinzawa de l’Université de Santa Barbara, Patrick Persavon et Luis Perenna.
C’est le nom du professeur qui a mis la puce à l’oreille aux étudiants… qui ont découvert qu’il existait un mangaka du même nom… celui qui a créé « le collège fou fou fou », ce qui ne pouvait que confirmer qu’on était vraiment dans un article de fiction. Pour contribuer à la triade bidonnée figurait Patrick Persavon qu’on pourrait imaginer comme fils du fameux Paul Persavon… auteur des paroles de nombreux génériques de dessins animés comme Cobra par exemple et qui dissimule en fait … Antoine De Caunes.
Enfin, les amateurs de héros de la littérature française connaissent Luis Perenna ou plutôt Don Luis Perenna… qui est l’anagramme d’Arsène Lupin dans le roman Les dents du tigre !
Au final, l’objectif était de donner une forme de leçon au travers d’un document. Une nouvelle fois, l’évaluation de l’information passe pour beaucoup par l’étude des documents, une condition qui devrait replacer le résumé de documents à un niveau plus important dans la hiérarchique des exercices, plutôt que de vouloir en passer encore et toujours par la dictée.
Étiquette : document
Quels tératologues documentaires ?
De plus en plus les documents que nous consultons sont aussi consultés par des robots, non pas au sens d’Asimov, mais davantage en tant que bots qui collectent, cumulent et indexent l’information. Cette présence des machines dans les circuits documentaires est peu prise en compte au final par les disciplines du document, d’autant que les robots et les systèmes automatisés permettent également la création de documents. On oublie également que la structuration des documents numériques et des bases de données permet de générer de nouveaux documents par le biais de requêtes à partir d’autres données structurées. Mais il s’agit de plus en plus d’aller plus loin. Si les premiers textes du web sémantique nous plaçaient dans le développement potentiel des agents intelligents, ces derniers s’avéraient à la fin du siècle précédent des sortes de gadgets bien loin du Jarvis d’Iron Man. Vous savez que de tels dispositifs reviennent à l’ordre du jour, que ce soit dans nos environnements ou dans une science-fiction qui nous place dans des évolutions prochaines. Cependant, on reste bien souvent au niveau du fantasme et de la dystopie, alors qu’il devrait dorénavant s’agit d’études bien plus concrètes.
Ce que je veux défendre ici, c’est que la tradition conceptuelle documentaire a souvent considéré que le document n’existait que dans une relation qui mettait en scène deux acteurs humains. La tradition notamment depuis Meyriat est d’insister sur le fait que le document ne peut exister que dans le cadre d’un récepteur interprète. La théorie de la documentalité de Ferraris qui renouvelle la réflexion reste inscrite également dans cette mise en relation d’au moins deux personnes. À mon sens, cette situation ne change pas véritablement actuellement, si ce n’est qu’il faille élargir nos représentations en considérant que l’interprète des éléments microdocumentaires et macro-documentaire peuvent être également des robots et des agents intelligents. Ces agents peuvent également interpréter l’information pour prendre une décision. C’était déjà le point de vue exposé par Berners-Lee qui envisageait d’ailleurs des médiations réalisées entre des agents intelligents pour prendre les meilleures décisions après la consultation d’informations. Cela signifie que les robots ne sont pas seulement des collecteurs d’information et de données, et qu’ils vont de plus en plus produire des éléments documentaires. Cela signifie aussi qu’ils vont de plus en plus devenir des objets d’évaluation informationnelle avec des indices de crédibilité et de confiance.
Par conséquent, le processus documentaire classique pourrait de plus en plus mettre en scène des entités nouvelles issues des développements des différents types d’intelligence artificielle dont le but n’est pas de raisonner strictement comme des humains ou de s’apparenter à eux, mais davantage d’opérer des échanges d’informations et de données sans avoir à passer par la communication humaine.
Cela signifie que le test de Turing n’a au final aucune importance, et ce d’autant que les intelligences artificielles ont beau pouvoir essayer d’imiter la conversation humaine, nos capacités de détection du fake et du bot se sont également accrues. Dès lors, l’enjeu du test de Turing n’est pas uniquement la capacité de la machine à se faire passer pour un humain, mais davantage la compétence de l’humain à détecter s’il converse ou pas avec une machine, et s’il peut au final lui faire accorder une certaine crédibilité. Seulement, il ne s’agit pas de traquer des Nexus comme dans la nouvelle de Phillipe K Dick, mais de comprendre le rôle des bots dans ces processus.
À mon sens, c’est ici qu’il apparaît important pour les sciences de l’information et notamment la documentation d’amorcer une nouvelle réflexion qui fasse suite à Roger Pédauque, car les mutations du digital se poursuivent. J’avais plaidé il y a près de 10 ans pour une réflexion en ce qui concerne la tératogenèse documentaire qui faisait que le document sur le web s’avérait monstrueux à double titre:
– Il ne correspond pas pleinement aux traditions du papier en étant souvent hors-norme et évolutif, ce qui remet en cause la vision du document comme anti-évènement d’Escarpit avec le développement d’un document-flux peut aisé à saisir.
– Il est devenu monstrueux, car il n’est pas véritablement un instrument de connaissance, mais davantage un document à montrer et donc qu’il faut avoir vu. Cette logique de monstration se complexifie et embrasse dorénavant l’extension de la documentalité qui oblige sans cesse à la production de documents qui fasse preuve. Phénomène qui ne cesse de prendre de l’ampleur dans les sphères bureaucratiques et notamment universitaires.
Parmi cette tératogenèse figurent désormais les robots, si ce n’est qu’ils opèrent de façon finalement plus discrète et qu’ils ne sont donc pas si simples à voir… sans mettre un minimum les mains et doigts dans la technique. Ce sont davantage des instruments de démonstration que de monstration. Les acteurs des humanités digitales ont déjà depuis longtemps pris conscience de l’outillage machine qui leur permet de collecter et de traiter différents types d’éléments microdocumentaires ou macro-documentaires.
C’est dans ce cadre qu’il me semble essentiel d’envisager une tératologie documentaire d’une nouvelle ampleur qui implique d’examiner les mécanismes des nouveaux modes d’existence documentaires dans une lecture moins sentimentale et bien plus scientifique.
A propos de la trilogie d’Antoine Bello : le storytelling et la vérité
Shell and data : le risque de l’obsession du « tout est donnée »
L’article de Danah Boyd traduit sur internetactu a éclairé quelques une de mes préoccupations du moment. Je dois notamment écrire un article introspectif sur mon blog et je m’interroge sur comment étudier les blogs scientifiques dans la durée du fait de leur évolution et des systèmes d’archivage qui ont tendance à privilégier que des données brutes et peu éditorialisées.
photo credit: Idaho National Laboratory
Boyd note que l’obsession de cumuler des données présente en effet un important problème : celui de les considérer comme étant toutes d’un poids équivalent. Effectivement, les grandes données offrent des perspectives parfois colossales avec le risque de déformations tout aussi conséquentes.
Mais placer les données au centre de l’étude scientifique et même toute stratégie d’organisation de l’information (avec le web de données par exemple) pose un problème épistémologique de taille : l’oubli de la question de la coquille, c’est-à-dire du support mais aussi des techniques utilisées.
Boyd montre qu’il y a un effet à risque à privilégier des approches informatiques au point de tomber dans le travers de Chris Anderson qui considère que les chiffres sont le reflet de la réalité, qu’ils parlent d’eux-mêmes, qu’ils sont automatiquement compréhensibles, et que par conséquent plusieurs sciences- sous entendues sociales et humaines- sont vouées à disparaître.
Clairement, c’est à nouveau l’idéologie du calcul, du ratio, de la société de l’information qui est en train de nous bouffer face au bon usage de la raison. Une nouvelle fois, ce n’est pas l’homme qui crée le cyborg, mais bien l’inverse. Une idéologie du tout calculable tente de nous « cyborguiser » dans la moindre de nos actions et activités. Ce serait quand même fortement inquiétant si cette idéologie devait définitivement emporter les débats en matière scientifique. Même les humanités numériques (digital humanities) ne semblent pas à l’abri de cette tentation. La position de Milad Doueihi , qui préfère le terme d’humanisme numérique, permet de sortir de l’idée que tout n’est que data. Humanisme car c’est la robotique qui prend le dessus de manière inattendue. On est pas si loin de l’idée de Hans Moravec de l’uploading, que notre cerveau pour être téléchargé. Un risque que j’ai décrit dans Print Brain technology.
Jean Michel Salaün a donc bien raison de répéter depuis quelques temps que les archivistes ont beaucoup à nous apporter et je crois que cela ne concerne pas que les sciences de l’information. Le support est clairement un élément à ne pas négliger. Etrangement, il semble qu’on oublie totalement la coquille (the shell) qui entoure les data. Si on devait examiner ce blog et seulement son contenu depuis ces 12 dernières années, on ne pourrait pas clairement percevoir son évolution. Le site n’a eu de cesse d’avoir des évolutions éditoriales, des mises en forme différentes, des langages et des codes également divers. Pour un archiviste, la reliure, le papier utilisé sont déjà pleinement des documents et des éléments riche en informations notamment en matière d’évaluation. La vision du « tout data » conduit à négliger l’éditorialité.
Peut-on imaginer traiter des archives des siècles précédents avec seulement les retranscriptions sous un traitement de texte ? Insipide n’est-ce pas ? On se retrouve dans une division assez proche de la dichotomie corps et esprit. On a à nouveau l’impression que la matérialité est négligeable, en tout cas pas noble, pas digne d’intérêt. Pourtant, Yves Jeanneret nous avait déjà alertés sur ce risque dans son fameux « Y-a-t-il vraiment des nouvelles technologies de l’information ». Le document a toujours partie liée avec des supports et des formes éditoriales, des architextes et il lui faut un interprète comme révélateur d’une relation sociale. Négliger, la coquille, c’est sans doute aussi négliger l’esprit.
Du data à la cata, il n’y a qu’un pas.
photo credit: Idaho National Laboratory