La fabrique du faux, l’invention de Belbo Corrigane

J’ai réalisé il y a quelques semaines un document à destination de mes étudiants pour le cours d’analyse documentaire, cours pendant lequel il s’agit surtout de produire des résumés indicatifs et informatifs. L’essentiel d’ailleurs reposant un gros travail d’exercices sur des textes pour produire des résumés informatifs. Mes étudiants ont une moyenne d’âge de 18-19 ans puisqu’il s’agit de première année de DUT avec quelques années spéciales en DUT Infonum. J’avais noté que les étudiants n’avaient pas pris le réflexe d’aller voir les concepts inconnus, mais aussi les identités des personnes citées dans les articles qui figurent dans le corpus de documents de travail. J’avais incité dès lors à ce qu’ils prennent le réflexe de devenir des professionnels de l’information en allant vérifier systématiquement les éléments qu’ils ne connaissaient pas. Jusque-là finalement, rien de nouveau à cette vieille habitude scolaire qui s’exerçait davantage dans la consultation du dictionnaire il y a 25 ans. L’analyse documentaire n’est en rien un art révolutionnaire, mais c’est une pratique extensive qui doit s’exercer finalement avec des documents issus du web. J’avais prévenu mes étudiants que ce manque de réflexe quant à la vérification des faits était gênant et que j’aurais pu produire des textes faux dans le corpus. J’avais ajouté que j’allais sans doute un jour les piéger.
Et j’ai tenu parole… plusieurs semaines après en leur confiant à la fin d’un cours, un document de travail pour qu’il puisse à nouveau s’exercer. Or ce document est totalement faux. J’ai pris soin de mettre en ligne sur Medium ce document afin d’obliger quelque peu les étudiants à aller voir plus loin. Mais au bout de quelques jours, aucun d’entre eux n’avait relevé la supercherie. Pire, une étudiante m’avait rendu le travail de résumé sur ce document complètement faux. Je pris alors la décision d’alerter via le hashtag #infonum que je leur avais fait une petite blague et qu’il serait temps de mener l’enquête. Je rencontre de nouveaux usages et comportements avec mes nouveaux étudiants cette année, des dispositifs qui fonctionnaient jusque-là, comme la correction collective des travaux avec un pad collaboratif projeté a bien du mal à fonctionner sans doute par manque de projection collective. J’ai été contraint pour maintenir l’attention et la motivation, de donner des points bonus lors de bonnes réponses à des questions. Ce genre de situation les stimule. De là, à ce que je sois contraint d’installer des buzzers…
Du coup, c’est en relançant l’intérêt sur twitter que les étudiants se sont mis à chercher et se sont penchés sur le texte pour découvrir enfin la supercherie.
Il est vrai que le texte présente en apparence toutes les logiques d’une démonstration et semble fondé sur une véracité liée à des observations, des rencontres et des entretiens par un auteur qui semble être spécialiste.
Cela ressemble à du vrai… et il faut bien aussi prendre en considération qu’on imagine mal un professeur confier un faux document. J’avais pris soin de ne pas entrer dans les logiques de pourrissement qui consistent à venir polluer un travail collectif et collaboratif comme sur Wikipédia. L’objectif est clairement pédagogique, et j’ai donc décidé de conserver l’article en ligne, mais avec une mention explicative, notamment pour quiconque voudrait reproduire l’expérience en s’inspirant de ce texte. La pratique du faux s’inscrivait aussi en prolongation du cours de culture de l’information donnée par un de mes collègues qui leur avait montré d’ailleurs des cas exemplaires.
Pourtant, j’avais laissé des éléments assez grossiers, mais qui culturellement n’était pas si aisés à identifier notamment pour des questions générationnelles.
J’en donne les clefs ici.
Premièrement, l’auteur Belbo Corrigane que je présente comme « Ancien ingénieur en systèmes d’information, désormais consultant et observateur des évolutions digitales. Actuellement en investigation dans la Silicon Valley. » est une invention dans le genre, « plus c’est gros, plus ça passe » avec des éléments bibliographiques dans le style des plus grands mythomanes de Linkedin. Et pourtant, tout indique que Belbo est tout petit… Il y a bien sûr l’homophonie Belbo, Bilbo, référence à Tolkien bien connue de tous. Les Bretons connaissent les korrigans et les korriganes, ces petits êtres malicieux qui peuvent vous faire perdre le temps et bien plus encore durant des danses infinies. Le patronyme Corrigane renforçait drôlement le prénom. Mais si j’ai choisi Belbo plutôt que Bilbo… c’est par référence à Umberto Eco et le Pendule de Foucault, donc un des personnages principaux est Jacopo… Belbo, un éditeur qui participe à la fabrique du faux complot. Le lecteur intéressé pourra aller voir du coup du côté de Casaubon qui a inspiré le nom du personnage principal du même livre. Rien que le nom de l’auteur pouvait placer le lecteur avisé sur la piste d’une aventure, encore fallait-il en avoir envie. Bref, n’est pas Gandalf qui veut, je dois bien le constater.
Pour le concept de captabilité, j’ai inventé un concept qui finalement peut paraître vraisemblable et qui n’est pas totalement idiot à la lecture. Moche probablement, mais on pouvait s’y méprendre, surtout quand on l’accole avec de la disruption à la mode.
J’ai ajouté des images sur le document en ligne. Elles ne figurent pas sur le document papier que j’ai confié à mes étudiants. Elles sont aussi des moyens de constater en utilisant un moteur d’images comme Tineye ou Google qu’il y a comme un problème… (j’avais évoqué ces outils comme moyen d’évaluer l’information il y a quelques années.
Admettons qu’on pouvait encore y croire jusque-là…J’évoque une société dont le nom est Morlay & Toons… Un nom étrange pour le moins, tout droit sorti d’un monde fictionnel comme l’indique les Toons… et dont l’homophonie avec Eugène Tooms, ce serial killer de X-Files résonne formidablement bien avec Morlay… ou plutôt Morley la marque que fume le « smoker » de la même série.
Pour clore le tout dans cette affaire, les noms des chercheurs et créateurs d’entreprise impliqués finissaient par révéler la supercherie : le professeur Motoei Shinzawa de l’Université de Santa Barbara, Patrick Persavon et Luis Perenna.
C’est le nom du professeur qui a mis la puce à l’oreille aux étudiants… qui ont découvert qu’il existait un mangaka du même nom… celui qui a créé « le collège fou fou fou », ce qui ne pouvait que confirmer qu’on était vraiment dans un article de fiction. Pour contribuer à la triade bidonnée figurait Patrick Persavon qu’on pourrait imaginer comme fils du fameux Paul Persavon… auteur des paroles de nombreux génériques de dessins animés comme Cobra par exemple et qui dissimule en fait … Antoine De Caunes.
Enfin, les amateurs de héros de la littérature française connaissent Luis Perenna ou plutôt Don Luis Perenna… qui est l’anagramme d’Arsène Lupin dans le roman Les dents du tigre !
Au final, l’objectif était de donner une forme de leçon au travers d’un document. Une nouvelle fois, l’évaluation de l’information passe pour beaucoup par l’étude des documents, une condition qui devrait replacer le résumé de documents à un niveau plus important dans la hiérarchique des exercices, plutôt que de vouloir en passer encore et toujours par la dictée.

Les humanités digitales : un renouveau pédagogique ?

Je publie ici ce travail initialement destiné à une revue de vulgarisation de la recherche, mais qui a finalement été refusé pour des motifs inconnus. Je préfère le mettre ici en ligne : il s’adresse à un public élargi car les initiés des humanités digitales n’y apprendront rien de particulier. J’espère néanmoins que l’année 2016 verra davantage de publications et de manifestations sur cette thématique (d’après mes infos, cela devrait être davantage le cas !)

Le contexte des humanités est d’abord celui d’une interrogation des processus et méthodes de recherche avec l’utilisation de plus en plus fréquente d’outils issus de l’informatique. Parmi les définitions les plus générales et consensuelles, celle issue du manifeste du ThatCamp[1] de Paris 2010 apparaît comme étant la plus claire et la plus efficace :

« 1. Le tournant numérique pris par la société modifie et interroge les conditions de production et de diffusion des savoirs.

  1. Pour nous, les digital humanities concernent l’ensemble des Sciences humaines et sociales, des Arts et des Lettres. Les digital humanities ne font pas table rase du passé. Elles s’appuient, au contraire, sur l’ensemble des paradigmes, savoir-faire et connaissances propres à ces disciplines, tout en mobilisant les outils et les perspectives singulières du champ du numérique.
  2. Les digital humanities désignent une transdiscipline, porteuse des méthodes, des dispositifs et des perspectives heuristiques liés au numérique dans le domaine des Sciences humaines et sociales »[2]

Si la dimension orientée recherche et les réflexions épistémologiques qui l’entourent sont dominantes, la question pédagogique a été évoquée également en parallèle, tant il s’agit de faire évoluer l’ensemble des fonctions académiques. La question pédagogique souvent mise au second plan dans les mondes universitaires possède cependant des aspects intéressants d’autant qu’ils mêlent plus aisément justement recherche et enseignement. En effet, une des pistes les plus opportunes porte sur l’inclusion d’outils numériques au sein des cours et des dispositifs. Mais c’est principalement la question de la formation précoce des étudiants à des questions de recherche qui mérite d’être également évoquée. Si cet aspect est abordé dans le temps des humanités digitales[3], nous souhaitons ici présenter quelques actions potentielles. Le sujet a donné lieu à un ouvrage sur cette question[4] et a intéressé quelques ThatCamp dédiés à cette question[5]. A suivre également sur GitHub, la plateforme de gestion des projets informatiques, un travail collectif qui vise à publier des ressources réutilisables et remixables pour des projets pédagogiques liés aux humanités digitales[6] mais qui est encore en cours de constitution.

Le choix d’évoquer des humanités digitales permet également de mieux prendre en considérant des aspects matériels que les discours simplistes de la matérialisation ont pu minimiser. Si beaucoup des possibilités proposées dans cet article se déroulent à l’Université, il est fort possible de les envisager également au niveau secondaire. Kelly Mills [7]qui a intégré la pédagogie numérique vis-à-vis de ses étudiants en histoire insiste sur la nécessité d’offrir une liberté d’expérimenter pour augmenter leur engagement et leur motivation. Dans tous les cas, il s’agit de concevoir les aspects pratiques des humanités digitales en encourageant à faire et à pratiquer[8] pour développer des compétences qui doivent s’intégrer de façon plus précoce. Le projet Humanlit[9] (Humanités numériques et littératies) mettait en avant le besoin d’intégrer les humanités digitales au plus tôt dans les cursus, c’est-à-dire au niveau de la licence. L’enquête mettait également en avant le besoin de pouvoir s’appuyer sur une culture numérique en construction qui repose sur des compétences et littératies acquises au niveau du secondaire.

Nous pouvons lister quelques pistes évoquées dans des projets de recherche avec des déclinaisons pédagogiques :

La participation à la transcription. Dans le cas du fameux projet Bentham[10] qui a consisté à numériser l’œuvre du philosophe, il a été nécessaire de faire appel à un collectif d’amateurs pour les inciter à transcrire les documents du fait des limites de l’océrisation[11]. Le projet de recherche s’est appuyé sur une communauté de passionnés qui a pu trouver des éléments de motivation supplémentaires via un processus de gamification qui recense et quantifie toutes les actions effectuées avec notamment un classement final avec des récompenses. On retrouve ces possibilités de transcription sur wikipédia où la communauté est telle qu’elle peut opérer rapidement des opérations de transcription ou de correction du texte numérisé comme ce fut le cas pour le traité de documentation de Paul Otlet en janvier 2015 suite à son arrivée dans le domaine public. Cette opération de transcription apparaît intéressante dans la mesure où il s’agit d’un bon moyen de se confronter au document original numérisé pour vérifier la qualité de la transcription ou le transcrire intégralement. L’étudiant apporte alors son travail à l’ensemble du collectif tout en travaillant sur des sources originales. De façon pratique, il est possible d’effectuer des projets de ce type avec le logiciel Omeka[12] (qui permet de gérer des collections de documents et des expositions virtuelles) et son plugin Scripto[13].

La cartographie : Le but est d’utiliser les techniques de cartographie avec des outils type openstreetmap ou google maps pour cartographier par exemple l’ensemble des lieux cités dans un œuvre littéraire. Ce travail a par exemple été réalisé pour l’œuvre Ulysse de James Joyce[14]. Ces possibilités cartographiques sont décrites dans le chapitre de Chris Johanson and Elaine Sullivan Teaching Digital Humanities through Digital Cultural Mapping[15] dans l’ouvrage dirigé par Hirsch. Le but est d’apprendre aux étudiants à utiliser toutes les possibilités offertes par les systèmes d’information géographique. Plusieurs objectifs pédagogiques sont mis en avant :

  • Enseigner aux étudiants comment comprendre, utiliser et critiquer les outils et les technologies liées au web, les systèmes d’information géographique plus particulièrement et ce afin de développer une culture numérique.
  • Fournir aux étudiants les outils technologiques afin d’évaluer et de contribuer à des projets de cartographie numérique dans les sciences humaines
  • Enseigner une visée professionnelle qui permette de développer des capacités d’analyse critique au sein d’espace de visualisation complexe tout en comprenant les questions liées aux formats des données.

Mathieu Noucher[16] en France travaille particulièrement sur les enjeux de la participation à la fabrique cartographique pour en montrer notamment ses apports citoyens. La cartographie peut aussi être évoquée dans l’utilisation de logiciels qui travaillent sur les aspects réseaux sociaux et les liens du web notamment en récupérant des outils de crawl pour réaliser des cartes sur le logiciel gephi. Cependant, ce type de cartographie requiert des compétences plus avancées. Toutefois, il est possible de faire participer les étudiants à la collecte des sites sur une thématique précise notamment en utilisant des outils de signets sociaux comme diigo où il sera possible d’ajouter des tags, des annotations et des commentaires. La participation à des recueils de données constitue une étape clef car cela permet aux étudiants de prendre part à la réalisation d’un corpus. Le lien est donc possible avec les outils d’annotation qu’offrent déjà les signets sociaux.

L’annotation

 L’annotation reste historiquement une des bases du travail sur document et des premières logiques historiques des humanités digitales. Évidemment, l’objectif est d’envisager un système d’annotations collaboratives. Si le plus simple est de pouvoir travailler à partir de dispositifs type google doc, il existe des outils comme co.ment[17] qui permettent d’annoter un document type mémoire ou un article afin de faire travailler un collectif d’étudiants. Pour l’instant, ces dispositifs sont bien souvent expérimentaux et intéressent plutôt les chercheurs eux-mêmes. Nous pouvons citer dans ce cadre l’expérimentation menée autour de la version numérique de l’ouvrage debates in digital humanities[18] qui est accessible gratuitement en ligne et qu’il est possible d’annoter de façon collaborative via le logiciel open source disponible sur github[19].

Par le passé, on se rappellera que les textes collaboratifs du collectif Rtp-doc (Roger Pédauque) avaient fonctionné sur des dispositifs quasi similaires pour produire les réflexions autour du document numérique. L’écriture collaborative fait pleinement partie des potentialités pédagogiques des humanités digitales qu’il faudrait davantage développer.

La description documentaire.

La description des documents via des systèmes de métadonnées en TEI ou en Dublin Core. Là aussi, tout dépend du niveau de compétences que l’on souhaite transmettre, mais il apparaît plus motivant pour les étudiants de participer à un travail d’indexation de corpus existant que de demeurer sur de simples exercices. Les corpus en humanités digitales sont souvent encodés avec des systèmes de métadonnées élaborées. Outre des métadonnées Dublin Core qui sont plus aisément interopérables et qui sont relativement faciles à appréhender, le plus célèbre système de métadonnées dédiées à l’indexation des corpus et œuvres notamment littéraires est la fameuse Texte Encoding Initiative (TEI)[20]. On songe ici notamment aux élèves de l’école des Chartes qui travaillent sur de tels dispositifs depuis bien longtemps, ce qui explique d’ailleurs que le président Hollande a choisi d’évoquer la question des humanités numériques dans ces lieux en octobre 2015.

La fouille de texte

Les outils de textométrie sont très utilisés pour traiter des corpus massifs de données et offrent des lectures distanciées qui mettent en avant certains points que la lecture exhaustive ne repère pas toujours. Les outils comme TXM, Alceste, Iramuteq sont parfois enseignés dans les cursus mais de façon souvent tardive. Pourtant, leur utilisation permettrait de réaliser des analyses intéressantes notamment pour montrer aux étudiants l’intérêt des occurrences et des co-occurrences. Si beaucoup connaissent des outils comme Wordle, d’autres logiciels bien plus puissants permettent de traiter des corpus bien plus vastes. On mesure aussi ici l’intérêt de former également de nombreux enseignants des séries littéraires à ces questions si on veut véritablement concrétiser l’hypothèse d’un futur bac H, pour humanités digitales.

La valorisation.

Le logiciel Omeka (qui vous l’aurez compris permet de faire beaucoup de choses !) permet aisément d’organiser des expositions virtuelles[21]. Cet aspect permet d’inclure les étudiants dans la logique de la valorisation du travail scientifique via sa communication à un public élargi. Mieux encore lorsque les documents de base sont dans le domaine public, la meilleure piste est alors celle du hacking et donc de la transformation des collections dans un esprit proche de celui de Muséomix[22].

Les pistes sont celles d’une recherche en action qui permet de rendre la recherche plus attractive en l’intégrant davantage aux cursus, ce qui permet une formation précoce et une meilleure relation entre théorie et pratique. En cela, les humanités digitales posent la question d’une formation davantage technicienne dans des domaines où la tendance était de se situer dans l’apprentissage théorique. Il faut également songer que les pistes de manipulation d’objets 3D, depuis des logiciels dédiés pour des reconstitutions historiques jusqu’à leurs impressions pour la réalisation de maquettes sont également des éléments qui allient théorie, pratiques et un fort engagement et une forte motivation. Les récents travaux autour du port de Nantes dans le projet Nantes 1900[23] mené entre autres par Jean Louis Kerouanton constituent un bon exemple.

[1] Les ThatCamp (The Humanities and Technology Camp) sont des manifestations qui veulent renouveler l’organisation traditionnelle des colloques scientifiques en incitant les inscrits à participer davantage.

[2] Manifeste des digital humanities. http://tcp.hypotheses.org/318

[3] Olivier Le Deuff (dir.)(2014) Le temps des humanités digitales (dir.) Fyp éditions

[4] Hirsch, B. D. (2012). Digital Humanities Pedagogy: Practices, Principles and Politics. Open Book Publishers. (version en ligne disponible ici : http://www.openbookpublishers.com/htmlreader/DHP/toc.html)

[5] http://pedagogy2011.thatcamp.org/

[6] https://github.com/curateteaching/digitalpedagogy/blob/master/description.md

[7] Kelly, T. M. (2013). Teaching History in the Digital Age. University of Michigan Press.

[8] Berra, A. (2012). Faire des humanités numériques. OpenEdition Press. Disponible sur : http://books.openedition.org/oep/238

[9] Les résultats de l’enquête sont consultables et librement réutilisables ici : http://humanlit.hypotheses.org/206

[10] http://blogs.ucl.ac.uk/transcribe-bentham/

[11] Causer, T., & Wallace, V. (2012). Building A Volunteer Community: Results and Findings from Transcribe Bentham, 6(2). Retrieved from http://www.digitalhumanities.org/dhq/vol/6/2/000125/000125.html

[12] https://omeka.org/

[13] https://omeka.org/codex/Plugins/Scripto

[14] https://sites.google.com/site/notesonjamesjoyce/home

[15] http://www.openbookpublishers.com/htmlreader/DHP/chap05.html#ch05

[16] Par exemple, dans cet article : Matthieu Noucher. De la cartographie critique à la cartographie participative, de la carte à la fabrique cartographique. Journées d’étude de géographie critique, Apr 2015, Lyon, France. <halshs-01187076>

[17] http://www.co-ment.com/fr/

[18] Gold, M. K. (2012). Debates in the Digital Humanities. University of Minnesota Press.

Disponible sur : http://dhdebates.gc.cuny.edu/

[19] https://github.com/castiron/didh

[20] Burnard, L. (2014). What is the Text Encoding Initiative? : How to add intelligent markup to digital resources. Marseille: OpenEdition Press. Retrieved from http://books.openedition.org/oep/426

[21] Nous menons un projet de ce type avec l’équipe du projet Mauriac en ligne. http://mauriac-en-ligne.u-bordeaux-montaigne.fr/

[22] http://www.museomix.org/

[23] http://www.chateaunantes.fr/fr/nantes-1900