Donner du sens aux données : les ruses du numérique
Les disciplines du document face à la métis du calcul Making sense of data: the ruses of the digital. The disciplines of the document facing the metis of computation

Bruno BACHIMONT 

https://doi.org/10.25965/interfaces-numeriques.4838

Le numérique introduit un régime documentaire inédit, alliant présentisme du support et arbitraire du contenu. Toujours renouvelé pour rester accessible, le support n’est plus le gage de l’origine du document. De même, non seulement son encodage est arbitraire puisque seulement manipulatoire, mais il est en permanence renouvelé pour rester en phase avec les systèmes techniques du moment. Cette mutabilité principielle du numérique permet de modifier librement et sans trace les contenus, compromettant tant son authenticité, son aura et finalement sa fiabilité. Mais le numérique n’est pas un simple code, il est ancré via des formats et des applications dans des pratiques effectives et inscrit dans un système technique. Ces ancrages et inscriptions permettent d’aborder, par de nouveaux moyens, les documents numériques dans l’authenticité qui les caractérise, l’aura qu’ils manifestent, la vérité qu’ils peuvent véhiculer.

Digital technology introduces a new documentary regime, combining the presentism of the medium and the arbitrariness of the content. Always renewed to remain accessible, the support is no longer the guarantee of the origin of the document. In the same way, not only its encoding is arbitrary since it is only manipulative, but it is permanently renewed to remain in phase with the technical systems of the moment. This principal mutability of the digital allows to modify freely and without trace the contents, compromising so much its authenticity, its aura and finally its reliability. But the digital is not a simple code, it is anchored via formats and applications in effective practices and inscribed in a technical system. These anchorings and inscriptions allow to approach, by new means, the digital documents in the authenticity which characterizes them, the aura which they manifest, the truth which they can convey.

Sommaire
Texte intégral

1. Introduction

Dès lors qu’un contenu n’est plus considéré dans l’immanence même de la situation qui a permis de le produire et qu’il prétend décrire, la question se pose de savoir l’interpréter et de valider ses informations. Comment contrôler et confirmer que ce que dit un document est vérace et fiable ? Comment peut-on faire confiance aux inscriptions documentaires ?

Cette question est fort ancienne, elle caractérise même les classiques sciences auxiliaires de l’histoire et plus généralement les sciences du document comme par exemple la diplomatique (Kriegel, 1988 ; Mabillon, 1990) et la philologie (Bédier, 2010 ; Cerquiglini, 1989 ; Timpanaro, 2016 [La genesi del metodo del Lachmann, 1963]). On retiendra ici pour les caractériser que la diplomatique est l’art d’établir l’authenticité des documents et la philologie comme l’art d’établir leur version de référence. Disciplines d’investigation et d’étude devant confirmer la confiance que l’on peut avoir en nos documents.

Si l’authenticité est bien le fait pour un document d’être ce qu’il prétend être, la diplomatique ne permettra pas de confirmer ce que dit le document, mais de confirmer qu’on a affaire au bon document : le vrai document à défaut d’un document qui dit le vrai. La philologie pourra concomitamment établir à partir des différentes versions disponibles d’un contenu la version de référence qui sera la meilleure hypothèse pour savoir ce que le document prétend dire ou montrer. Enfin, il faudra mobiliser les ressources de l’herméneutique, ou art de l’interprétation, pour comprendre la valeur de ce qu’il dit ou montre, et établir le régime de vérité associé s’il y a lieu. Ces trois regards sont complémentaires et travaillent de conserve, puisqu’il faut bien interpréter pour établir l’authenticité et le contenu, de même que l’interprétation dépend de ce à quoi on pense avoir affaire et de la version qu’on a sous les yeux. La philologie est ainsi mobilisée pour établir si un document est un faux, à témoin le célèbre travail de Lorenzo Valla à propos de la non moins fameuse donation de Constantin (Valla, 2016 [1442]).

Les technologies numériques ont transformé nos manières de produire, concevoir, transmettre, recevoir et lire les contenus. En particulier, un document numérique est issu de multiples manipulations qui rendent plus ou moins opaques tant l’origine que le contenu : savoir ce qu’est un document et ce qu’il dit sont plus que jamais des tâches cruciales et difficiles. S’il n’est pas d’usage de parler de diplomatique ou philologie du numérique ou des contenus numériques, pour privilégier des termes s’inspirant du contexte de la criminologie (digital forensics), ce sont bien les mêmes enjeux qui traversent nos pratiques documentaires : comment savoir ce qu’est un document, comment établir ce qu’il prétend dire, comment interpréter et évaluer son contenu.

Les difficultés qu’on a l’habitude désormais de rassembler sous l’appellation des fakenews s’inscrivent dans ce contexte et lui donnent une actualité particulièrement brûlante. Comment reconnaître qu’un document ne dit pas le vrai, qu’il n’est pas ce qu’il prétend être, et donc qu’il colporte des événements ou des nouvelles qui n’ont jamais eu lieu ? Les possibilités de manipulation numérique renforcent les possibilités de falsification et de travestissement. Pour donner du sens aux contenus numériques et aux données manipulées, il convient de surmonter et dépasser les ruses du numériques. L’authenticité contre la métis digitale autrement dit.

Pour aborder ce problème nous procéderons en trois temps : nous nous inscrirons tout d’abord dans la tradition documentaire et du traitement des données pour confronter les documents comme traces de l'événement d'une part et données pour le traitement calculatoire d’autre part. Dans un second temps, nous rappellerons en quoi le numérique est un support qui par nature permet la mutabilité du contenu inscrit : support d’inertie sémantique nulle, le numérique permet par principe une falsification qui n’a pour limite que celle du calcul. En effet, le codage numérique est une convention arbitraire d’écriture, les symboles comme les 0 et 1 du codage binaire ne représentent rien en particulier par eux-mêmes : ils n’opposent aucune résistance au fait de vouloir les lire selon une autre convention, même si cela remet en cause l’intelligibilité du contenu. Un fichier binaire peut indifféremment être lu comme un texte, un son ou une vidéo selon la convention de lecture adoptée ; on verra ou entendra quelque chose même si cela ne présente aucun sens. De ce point de vue, l’inscription numérique a une inertie sémantique nulle puisqu’elle ne résiste pas à un changement de codage, c’est-à-dire d’interprétation sémantique du code. Nous montrerons également que, par l’un des nombreux paradoxes dont le numérique a le secret, cette mutabilité permettant aux contenus numériques de se transformer à loisir est la source d’un présentisme de ces contenus, qui ne connaissent ni passé ni avenir, mais seulement le présent de leur actualisation et transformation numériques. Nous rechercherons dans un troisième temps les conditions sous lesquelles il est possible d’aborder l’interprétation d’un contenu numérique, entre enquête technique de la matérialité numérique du contenu et interprétation qui doit dépasser le paradoxe de Ménon ou l’abduction paresseuse. En effet, ce paradoxe, issu d’un célèbre dialogue de Platon (Platon, 1999), repose sur l’idée qu’il est impossible d’acquérir une connaissance nouvelle : si elle est nouvelle, on ne peut l’identifier comme telle et la reconnaître, et si on peut la reconnaître, c’est qu’elle n’est pas nouvelle. Toute connaissance est une reconnaissance (ce qui renvoie des théories de la connaissance plus proches de nous comme (Schlick, 2005 [1925])). En pratique, cela renvoie au fait qu’on interprète un contenu non pour ce qu’il pourrait nous apprendre, par exemple à partir de l’algorithme qui l’a produit et des données sur lesquelles il est mis en œuvre, mais à partir de ce qu’on reconnaît en lui depuis nos propres interprétants : une abduction où l’on explique le résultat par nos préjugés habituels. La complexité des processus et la massification induisant des résultats inexplicables, ils sont dès lors compris par une abduction les renvoyant à nos connaissances préalables et donc explication la plus probable.

A l’instar des disciplines classiques que nous avons évoquées au début de notre propos, il s’agira donc d’élaborer à nouveaux frais une tradition critique d’analyse des contenus.

2. Traces et données : le document comme enregistrement

Le document se construit tout d’abord comme une lutte avec le passage du temps. A l’événement éphémère, qui n’existe qu’autant qu’il ne dure pas, ce qui fait événement étant une rupture avec ce qui le précède et ce qui lui succède, le document répond par une permanence qui fixe dans son inscription matérielle pérenne la mémoire de l’événement (Delsalle, 2000). Le document est la trace de l’événement, ce qui reste, persiste et subsiste de la survenue de l’événement. Le document peut être créé volontairement ou non. En effet, comme l’ont montré Paul Otlet (2015 [1934]) et Suzanne Briet (1951), un document est une preuve à l’appui d’un fait, une source d’information étayant une affirmation. Or, un objet quelconque peut acquérir cette propriété à tout moment, dès l’instant qu’on le considère et l’interprète dans sa relation avec l’événement ou le fait dont il serait la trace et qu’ainsi il documenterait. Autrement dit, un objet devient document au moment où il documente un fait, une situation, un événement et qu’il peut alors étayer ou soutenir une assertion quelconque à leur endroit. Le document peut être créé intentionnellement dès son origine en tant que document, ou l’acquérir ultérieurement : l’amphore retrouvée immergée dans une galère antique au fond de la Méditerranée n’était qu’un récipient plus ou moins commode à l’origine, mais devient une trace et un document de la culture antique quand on l’a retrouvée.

Si le document est une trace, c’est qu’il porte une relation avec le passé. Cette relation est essentiellement causale, ou quasi-causale, au sens où elle ne doit pas être soumise à l’arbitraire d’une interprétation ou d’une intervention subjective. Le document est alors l’enregistrement de ce qui s’est passé. Trace et enregistrement sont deux notions essentielles pour comprendre la fonction du document et ce qu’on peut lui demander. Précisons tout d’abord ces notions, en pointant leurs différences, pour ensuite aborder la question de la véracité, à savoir le fait d’avoir le bon document au service de la bonne interprétation de ce dernier.

La question, en butte aux caractères révolu du passé et éphémère de l’événement, est de se souvenir de ce qui n’est plus. Le premier concept qui se présente pour répondre à cette question est celui de « trace », à savoir ce qui reste, le résidu du passage de l’événement. La trace, c’est une présence, une actualité, un « ce qui est », une survivance de ce qui n’est plus. Mais comment repérer une trace parmi les autres objets qui l’environnent ? Comment dégager l’actualité de la trace parmi celles des autres objets du moment ? Comment savoir que l’amphore retrouvée n'est pas à utiliser comme récipient mais comme vestige ? La trace se repère comme telle dans la mesure où elle se détache de son environnement comme n’y appartenant pas, comme étant une intruse dans la cohérence causale et globale de l’environnement où elle se présente. La trace appartient au passé et c’est pour cela qu’elle n’appartient pas au présent et s’en démarque. C’est en cela qu’elle est une survivance, une évadée d’une réalité révolue, un témoin qui a vu ou vécu par lui-même (l’autopsie dont parle François Hartog (2005), la seule manière selon Thucydide d’être un historien, à savoir de raconter ce que l’on a vu soi-même) ce passé révolu.

La trace possède le statut de l’indice, au sens de l’enquête policière, ce qui permet de renvoyer à l’événement passé parce qu’elle constitue le détail insolite qui ne cadre pas, ne s’inscrit pas dans le contexte actuel. De la branche cassée par le gibier et repérée par le chasseur, de résidus de substance analysés par la police scientifique, du détail esthétique singulier dégagé par l’expert en histoire de l’art pour établir l’authenticité d’une œuvre, l’indice est une trace qui appartient à une causalité et une phénoménalité qui ne sont plus et qui sont en rupture avec les actualités ou réalités qui l’environnent.

Elle est donc un vestige, ce qui reste, et à ce titre elle ne s’intègre pas à son environnement. L’inactualité de la trace se détache et se dégage, se révèle à travers l’actualité de sa présence. Mais il faut alors être réceptif à cette adresse, à cette révélation : la trace n’est trouvée que parce qu’elle est sélectionnée, repérée, voire inventée, pour reprendre l’acception des historiens de l’art ou de la religiosité.

En cela, la trace se distingue de l’enregistrement. En effet, la trace fait partie de son environnement d’origine et constitue le vestige résiduel, ce qui n’est transformé que par le passage du temps. L’enregistrement implique une transformation de nature, autre que la simple évolution physique et matérielle de la trace. L’enregistrement projette en une réalité autre un événement. Par conséquent, l’enregistrement transforme, reconfigure et d’une certaine manière, dénature l’événement pour en faire ce qu’on ne peut plus appeler, sinon de manière impropre, une trace.

L’enregistrement est une transformation mécanique, naturelle, d’un événement en une naturalité autre. Par conséquent, l’enregistrement pose la question de ce qui est enregistré et la fidélité à ce qui est enregistré, c’est-à-dire la capacité à exploiter l’enregistrement comme trace de quelque chose, l’enquête permettant de reconstruire ou redéfinir ce dont il y a trace. Si l’enregistrement est encore une trace, c’est à travers ce lien à l’origine, cette orientation vers l’événement passé. Mais il faut désormais l’analyser non comme ce qui reste, mais comme la reconstruction de ce qui s’est passé. On oublie souvent cette caractéristique de l’enregistrement car ce dernier a été créé au moment de la survenue de l’événement, et non dans l’après coup. Cette simultanéité pare, à tort, l’enregistrement des mêmes vertus d’authenticité que la trace et le vestige. Mais pour avoir été tous deux contemporains de l’événement, l’enregistrement n’en est pas moins, contrairement à la trace, une reconstruction. Ainsi, l’enregistrement conservé est une trace de l’enregistrement qu’il fut au moment de sa création, mais n’est pas une trace de l’événement enregistré, car c’est son enregistrement.

D’où ce double processus qui permet à la fois de relier le document à son origine, mais aussi de contester et interroger ce lien : d’une part, l’invention de la trace, d’autre part la construction de l’enregistrement. L’interprétation de la trace consiste à restituer l’inactualité présente de la trace à l’actualité qui fut la sienne, l’interprétation de l’enregistrement consiste à déduire la nature de l’événement du fait de la transformation qui l’a constitué.

Le document aura, du fait de sa nature de trace et/ou d’enregistrement plusieurs propriétés qui le parent, comme vestige, d’un prestige jamais démenti :

  • l’aura, comme trace d’un passé évanoui ;

  • l’authenticité comme rapport vérace à l’origine : le document est bien ce qui reste (trace) ou ce qui a été construit (enregistrement) à partir de l’événement ; il est ce qu’il prétend être pour reprendre la définition habituelle car il y a un lien de rémanence ou de causalité ;

Or, ces propriétés seront remises en cause avec la numérisation des contenus : sans origine ou passé qu’ils portent avec eux, car constamment transformés, et donc sans authenticité gagée sur leur lien à l’origine. C’est avec de nouveaux moyens qu’il faudra s’interroger sur les contenus numériques.

3. Le numérique, entre présentisme et amnésie

Le numérique repose sur un principe techno-scientifique, le calcul. Ce dernier consiste dans le fait de poser dans un espace virtuel, idéal, des entités formelles vides de sens, discrètes (étymologiquement, séparées, donc disposées dans l’espace) que l’on peut manipuler, c’est-à-dire redisposer dans cet espace, selon des règles elles-mêmes vides de sens. La seule propriété qui est demandée aux entités formelles, est d’une part d’être distinguables selon leur forme matérielle, et d’autre part cette distinction repose sur des différences de types. Ainsi posera-t-on un type 0 et un type 1, et quand on rencontre une entité manipulée, on sait dire sans ambiguïté si on a affaire à un 0 (une occurrence de type 0) ou à un 1 (une occurrence de type 1). « Sans ambiguïté » voulant dire ici qu’un simple procédé mécanique pourrait le faire.

Cette caractéristique du calcul implique que le comportement d’un processus calculatoire ne repose sur aucune considération autre ou extérieure à ces entités et règles. C’est ce qui permet de dire qu’il n’y a aucune sémantique propre à un tel système, aucune correspondance privilégiée pour les interpréter et les comprendre. On pourrait certes considérer, à l’instar du structuralisme (Greimas, 1986), que ces différences de type, puisque ce sont des différences, instaurent un sens, une signification. Mais, c’est ce qui est important ici, une telle signification ne serait qu’interne au système, sans rien dire sur de quelconques réalités externes.

Ces valeurs calculatoires comme différences de types peuvent recevoir, de manière conventionnelle, toutes sortes de sémantiques ou interprétations, selon des correspondances librement établies. C’est ce que font nos formats, par exemple textuels, qui instaurent entre séquences binaires et lettres des correspondances, ou des intensités lumineuses, ou des positions sur une page, etc. Un même fichier binaire peut ainsi être lu par une convention pour en faire une image (un player image) ou un son (un player son) : même si le résultat sera improbable, on verra ou on entendra quelque chose.

Outre son indifférence à l’interprétation qu’on peut en faire, le calcul est également indifférent à la matérialisation qu’on peut lui donner. Peu importe le support physique, le calcul ne se définit pas par la matérialité des entités manipulées, mais seulement par la manipulation effectuée.

Cette double indifférence, que nous appelons aussi double coupure (Bachimont, 2017), implique que le calcul n’a pas d’ancrage matériel ni sémiotique, il est son propre monde indépendamment de tout monde physique pour le réaliser et de monde culturel pour l’interpréter. Cela ne veut évidemment pas dire que le calcul pourrait se définir et se réaliser sans matière manipulée, mais la nature du calcul en tant que tel, ce qu’il fait en tant qu’il est un calcul, est indifférent à la matière qui l’implémente et qui est manipulée ; mais il y a toujours une matérialisation du calcul pour qu’il y ait calcul.

Mais si le calcul se définit seulement comme manipulation aveugle de symboles vides de sens, il ne sera guère utile. Il est nécessaire de caractériser ce qui est calculé, ce pour quoi sont posés les symboles manipulés (les 0 et les 1) pour qu’il y ait un sens au calcul mené et un intérêt à le mettre en œuvre. Il faudra donc entreprendre une implémentation et une interprétation pour sortir le calcul de son splendide isolement pour en faire quelque chose d’effectif et d’utile. L’implémentation matérielle renvoie aux choix techniques, de conception, permettant d’avoir un dispositif effectif de manipulation, où l’espace de calcul n’est plus seulement virtuel mais bien celui d’un disque dur, d’une mémoire RAM, etc. Pour avoir un calcul utile, il faudra l’interpréter selon différents niveaux où l’on comprend d’une part la cohérence des manipulations effectuées, et d’autre part à quoi cela peut renvoyer quand on veut manipuler non seulement des entités formelles virtuelles, mais des entités effectives comme des pixels ou des caractères. Le code est un premier niveau de compréhension, où l’on aborde la manipulation selon la logique algorithmique et mathématique. Le format est un second niveau où il s’agit de se mettre en correspondance avec des domaines du réel. Enfin les applications (logiciels) s’inscrivent dans des réalités situationnelles et concrètes, des logiques d’usage où le calcul doit apporter son aide technique.

Implémentation, code, format, application sont des notions qui découlent du numérique comme calcul et qui auront leur importance quand on voudra réinterroger les contenus numériques quant à leur éventuel aura et authenticité.

Car, si on réalise la portée de ces propriétés, on en déduit quelques conséquences qui remettent en cause les principes mêmes du document comme trace et enregistrement : en effet, le principe même du code qui établit une convention arbitraire entre le réel et sa représentation implique que le code ne repose pas sur une exigence de conformité avec le réel lors sa création ni de coévolution par la suite. C’est une rupture forte avec les paradigmes précédents de la connaissance et de la représentation. Schématiquement on peut dégager trois époques de la représentation :

  • L’époque antique et médiévale, selon laquelle la représentation doit être à la ressemblance de ce qu’elle représente. Ainsi le concept mental est-il fidèle à ce qu’il vise dans la mesure où il lui ressemble : c’est la théorie des espèces sensibles et intelligibles (species) au Moyen-Âge, ou des formes sensibles imprimées à la sensibilité par la perception chez Aristote (Hamou, 2002 ; Simon, 2003).

  • L’époque classique, selon laquelle, avec Descartes, nos idées ne sont plus des ressemblances mais des conséquences causales de ce qu’elles représentent. La véracité et la conformité d’une idée ne s’évaluent plus à ce qu’elle montre, mais par son origine et la covariation qu’elle démontre avec cette origine (Guenancia, 2000).

  • L’époque contemporaine, selon laquelle, avec les systèmes numériques et le codage de et par l’information, la représentation ne ressemble pas à son origine ni ne covarie de manière nécessaire avec elle, mais en est un codage dont la manipulation calculée n’impose pas que le résultat soit une conséquence du comportement de l’objet ou réalité qui est codée.

Cet arbitraire du code se retrouve dans l’indifférence au support, qui n’est donc plus un témoin pour interroger l’origine ou l’histoire du contenu. De ce fait, l’authenticité du document numérique ne pourra donc plus être gagée sur l’intégrité matérielle du support puisque les deux ont désormais un destin séparé, le contenu pouvant être recopié bit à bit sur un nouveau support, l’inscription numérique restant identique ou plutôt invariante, le support ayant changé. Or, la pratique documentaire a toujours fondé sur l’intégrité matérielle du support l’attestation de l’authenticité du contenu : s’il est désormais inscrit de manière numérique sur un support matériel désormais indifférent et toujours renouvelé dans une jouvence des supports permettant de garantir l’accès, le document ne peut plus gager son authenticité sur l’intégrité, mais par d’autres moyens.

De même, l’aura documentaire, fondée sur la singularité du document comme objet matériel, comme porteur d’une origine perdue et révolue, nimbant la consultation documentaire de nostalgie d’une part mais aussi d’un sentiment d’emprise et de victoire sur le passage du temps d’autre part, n’a plus lieu d’être. A ce « goût de l’archive » (Farge, 1997), le numérique substitue un présentisme du support matériel et une permanence de l’inscription.

Le document n’est désormais plus une trace comme résidu, permanence, subsistance qui manifeste la présence du passé par une actualité (le document est ) qui ne peut être contemporaine (mais il ne peut appartenir à ce qui m’est contemporain), mais il est bien plutôt une donnée numérique qui s’instaure via un support matériel renouvelé, dans des formats de lecture adaptés aux contraintes du moment. Le document numérique n’est pas une trace, mais une donnée qu’on se donne et qui sera traitée et mobilisée pour aborder un traitement d’information.

4. Refonder l’herméneutique documentaire

Comment dès lors, dans cette refonte numérique des contenus documentaires, les aborder comme témoins d’un passé révolu ou d’événements distants ? Comment le présentisme documentaire peut-il être porteur d’une vérité portant sur ce qui n’est plus ou n’est pas ici ? Quelle confiance peut-on avoir sur ce qui est montré comme trace de ce qui a été ? Comme nous l’avons suggéré naguère (Bachimont, 2017), le noème du numérique n’est plus le « ça a été » de Barthes dans La chambre claire (Barthes, 1980), mais le « ça a été manipulé » du calcul. Le numérique étant une inscription codée sur un support indifférent, ce code est librement manipulable et décodable pour un coût matériel nul : le numérique est un support à inertie nulle, dans la mesure où il n’offre aucune résistance aux changements et manipulations que l’on veut opérer.

On peut alors envisager de surmonter l’inertie nulle du numérique et le présentisme qu’il instaure en faisant appel à ce qui contribue précisément à sortir le numérique de son isolement, à savoir son indifférence au support et l’arbitraire du codage. En effet, si l’on s’en tient uniquement à l’inscription binaire, la cause est entendue et définitive, le binaire restera toujours inscrutable dans son origine et sa véracité ou conformité. Mais un simple contenu binaire n’a de ce fait aucun intérêt. Tout l’enjeu des sciences informatiques est de négocier des manières d’ancrer le numérique comme inscription binaire dans des réalités s’intégrant dans nos intérêts et pratiques. C’est ici que nous retrouvons les 3 niveaux du numérique que nous avons identifiés plus haut, le code, le format et l’application :

  • Au premier niveau, celui du code, le numérique s’interprète de manière formelle en algorithme, modèles mathématiques et logiques, où la manipulation binaire aveugle se comprend comme un calcul et une preuve opérant sur une logique symbolique. C’est le niveau des théoriciens du calcul, de l’informatique théorique, et de l’algorithmique.

  • Au second niveau, celui des formats, le code s’interprète selon des conventions permettant de le mettre en correspondance avec des domaines du réel : le binaire correspondra à des nombres, à des caractères, à des pixels, à des points d’impression, etc. A ce niveau, technique et logique, le code n’est plus seulement une réalité mathématique et formelle permettant d’interpréter ce qui se passe dans les registres binaires, mais devient une manipulation du réel où l’on voit des écrans afficher des contenus, des textes se manipuler, des sons se produire.

  • Au troisième niveau, celui des applications, les formats se mobilisent dans des systèmes logiciels s’intégrant dans des logiques métiers, des usages, des pratiques. Un système est conçu pour permettre un usage.

A ces trois niveaux, il convient d’en ajouter un, ou de le penser de manière sous-jacente, c’est celui de la concrétisation matérielle et physique de la machine informatique, qui définira une architecture, un code machine natif (un microprocesseur), qui sera la base sous-tendant toutes les autres opérations.

Or, faisant ainsi, on introduit de l’inertie, car on fait des choix qu’il devient coûteux de révoquer, et une historicité, car les conceptions ont leur histoire, les formats également, ainsi que les pratiques pour lesquelles les applications sont conçues.

On aura donc plusieurs voies d’accès pour interroger les contenus numériques pour retrouver une historicité que de prime abord ils masquent dans le présentisme insolent défiant le passage du temps et dans une affirmation faisant fi de la véracité. Ces volets sont :

  • Une codicologie du numérique, qui serait l’histoire des machines, des langages, des formats, des applications. On peut situer dans le temps un support, un format, une manière d’afficher et de configurer les données. Ainsi, si le web paraît bien être une incarnation du présentisme que nous évoquions, il suffit de consulter une archive de web pour voir combien le style graphique des pages permet de situer temporellement un contenu. De même, les formats, lus ou non lus, sont également des indices de l’origine.

  • Une diplomatie du numérique, qui serait les moyens d’établir l’authenticité du contenu, et donc la condition sous lesquelles on peut se fier à ce dernier. Ce domaine est en plein essor sous des appellations diverses, la plus notable étant les digital forensics, en particulier les video forensics (Milani et al., 2012).

  • Une philologie du numérique qui serait l’art de confronter les variantes d’un contenu pour établir une version de référence.

On notera qu’il s’agit à chaque fois non d’instrumenter ces antiques disciplines par le numérique, mais de les mobiliser au contraire sur cet objet qu’est le numérique, ce dernier étant non pas l’outil porteur de solution mais l’objet problématique à traiter par ces approches.

5. Conclusion

Le numérique introduit un régime documentaire inédit, alliant présentisme du support et arbitraire du contenu. Toujours renouvelé pour rester accessible, le support n’est plus le gage de l’origine du document. De même, non seulement son encodage est arbitraire puisque seulement manipulatoire, mais il est en permanence renouvelé également pour rester en phase avec les systèmes techniques du moment. Le document numérique ne porte pas en lui-même les conditions ou confirmations de sa véracité ou fiabilité. C’est que le numérique introduit un principe inédit d’inscription dont l’inertie est nulle, c’est-à-dire n’offrant aucune résistance au changement. C’est ce qui explique ce renouvellement permanent des formats qui restent ainsi en phase avec les usages qu’ils suscitent et qui les transforment.

Cette mutabilité principielle du numérique permet de modifier librement et sans trace les contenus. C’est ce que l’on pourrait penser dans un premier temps. Mais si l’on s’en tient qu’un principe du numérique et de sa mutabilité, on ne pourra faire que de la manipulation aveugle d’éléments vides de sens. C’est la raison pour laquelle un code numérique binaire devient un calcul algorithmique manipulant des formats l’ancrant dans un réel et permettant des applications l’inscrivant dans des pratiques. Or, ce réel et ces pratiques n'ont pas une inertie nulle, ils sont une histoire, ils introduisent une pesanteur que la manipulation aveugle pouvait faire oublier.

Cette pesanteur permet d’aborder, par de nouveaux moyens, les documents numériques dans l’authenticité qui les caractérise, l’aura qu’ils manifestent, la vérité qu’ils peuvent véhiculer. Cela donne lieu à autant de chantier dont la terminologie est classique mais le contenu nouveau : des codicologie, diplomatique, philologie du numérique qui désormais tient lieu de problème et non de solution. Ces domaines sont actifs sous différentes appellations comme les digital video forensics, et font appel à différents types de techniques pour tracer un contenu, ses transformations, ses travestissements éventuels. De même que l’écrit a permis de reconfigurer la parole en la sortant de son immanence et l’inscrivant dans la transformation hors de son contexte initial, le numérique permet de congédier l’inertie du support et du codage. Et de même que la culture de l’écrit fut le creuset pour penser les sciences critiques du document, il est temps de penser les sciences critiques du numérique.