Des expériences visuelles aux énoncés linguistiques
contribution de la théorie des graphes

Francis Edeline

Groupe µ - Université de Liège

https://doi.org/10.25965/as.1696

Index

Articles du même auteur parus dans les Actes Sémiotiques

Mots-clés : images scientifiques, perception visuelle, théorie des graphes, verbalisation

Auteurs cités : Émile BENVENISTE, Brenton Campbell, André Deledicq, Francis ÉDELINE, Claus Emmeche, Michel Gondran, Algirdas J. GREIMAS, Harald Höffding, Jesper Hoffmeyer, Arnold Kaufmann, Gérardin Lucien, Richard Masland, Georges Miller, Michel Minoux, Edgar MORIN, Jean Piaget, Karl POPPER, Maurice Pradines, Lubert Stryer, André Warfusel

Plan
Texte intégral

Le Groupe µ a l’ambition de contribuer au développement d’une sémiotique cognitive. Pour ce faire il faut explorer toutes les étapes d’un processus qui part des faisceaux de rayonnements électromagnétiques émanant du monde naturel, et aboutit aux phrases prononcées par un être humain : une ekphrasis au sens large.

Note de bas de page 1 :

 Francis Edeline, « La Fonction de Transfert Optique (FTO »), conférence présentée à Urbino, 2007, à paraître dans Visible, n°5, 2008.

Au cours de leur cheminement à travers l’espace, les rayonnements en question (et d’autres) subissent diverses transformations et dégradations, dont la nature est aujourd’hui assez bien connue. Un critère numérique appelé FTO (Fonction de Transfert Optique) permet de mesurer ces altérations. Ceux qui ont assisté cet été aux conférences d’Urbino ont pu m’y entendre détailler la nature et l’usage de ce critère1.

Le maillon suivant de la chaîne est celui qui nous occupera aujourd’hui. Pour ne parler ici que des images et des phénomènes optiques, nous noterons d’abord que l’œil est le dernier dispositif franchi par les rayons en tant que tels, et qu’il apporte lui aussi son contingent de déformations et d’aberrations. Quoi qu’il en soit le faisceau restant se projette sur la rétine et y forme une image que nous appellerons planaire bien que la rétine ne soit pas strictement plane.

A cet endroit tout change. Quittant le domaine des signaux émis par le monde naturel, nous franchissons une interface qui donne accès au système nerveux, où les ondes électromagnétiques ont été traduites en phénomènes électriques. Le modèle proposé autrefois par la Gestaltpsychologie considérait que toute la chaîne était unie par un isomorphisme, jusques et y compris dans le cerveau. Dans sa forme naïve ce modèle, on le sait, s’est révélé faux. La Fig.1 montre à quel point cette interface fait intervenir des modifications capitales, captées selon divers vocabulaires, les aspects les plus importants de la transformation qui s’y opère étant la disparition de la spatialité et la conservation de l’information, malgré le brutal changement. Nous proposerons de ce changement un modèle inspiré de la théorie des graphes.

Fig.1 – Transformations à l’interface

Fig.1 – Transformations à l’interface

1 – Structure de base des énoncés visuels

Note de bas de page 2 :

 Ou plus exactement, comme on préfère l’exprimer aujourd’hui, les réponses aux cellules L, M et S.

Note de bas de page 3 :

 Ibidem, 2008.

Note de bas de page 4 :

 Francis Edeline, « Sur la connaissance visuelle », TLE (Théorie, Littérature, Enseignement)n°9, 1991, pp. 97-112.

Note de bas de page 5 :

 Lucien Gérardin, La Bionique, Paris, Hachette, coll. L'Univers des Connaissances , 1968.

La perception de l’image planaire projetée sur le fond de la rétine met en jeu les diverses cellules photoréceptrices de l’œil (il y en a en moyenne 100.000 par mm² !), ainsi que les réseaux extrêmement complexes d’interconnexions entre les axones issus de ces cellules. Il est donc clair qu’au départ l’image perçue ne présente aucune continuité : elle est une mosaïque de points affectés d’un jeu de valeurs (coordonnées de position, intensité, proportion de R,V,B2…) tout comme un vulgaire écran de télévision. La continuité que nous éprouvons (l’impression de surface) est une pure construction de l’appareil. Ledit appareil est ainsi agencé qu’il compare les valeurs de points voisins. Si l’écart entre eux est inférieur à un certain seuil, les points sont groupés et considérés comme formant une entité unique. Les petits écarts sont négligés et la plage est « égalisée ». C’est ce qu’on a appelé, en Gestaltpsychologie, une qualité « translocale ». Si à présent l’écart dépasse le seuil, il est au contraire amplifié par l’appareil, donnant naissance à une limite, point de départ de la sémiotique de la ligne3. Lorsque toute la surface de l’image a été ainsi analysée, nous restons en présence d’une image segmentée (Fig.2). Dans une certaine mesure le seuil est modifiable par la volonté. Le fait de pouvoir distinguer deux plages d’une image sur base de caractères différentiels donne naissance à une connaissance visuelle élémentaire4, mais le mécanisme est général : toute perception est contrastuelle. Un pionnier de la Bionique comme L. Gérardin5 confirme effectivement qu’ « une surface à illumination absolument uniforme ne contient aucune information ; un comportement à l’égard de l’univers extérieur sous-entend obligatoirement que cet univers extérieur est varié. ».

Fig. 2 – Image visuelle segmentée

Fig. 2 – Image visuelle segmentée

Note de bas de page 6 :

Jesper Hoffmeyer & Claus Emmeche, « From language to nature - the semiotic metaphor in biology ». Semiotica, n°84,1991, pp. 1-42.

Sans vouloir ici faire une trop longue digression philosophique ou épistémologique, il est bon néanmoins de souligner le rapprochement frappant que l’on peut faire entre ces constatations et les plus récentes réflexions sur ce qu’est la vie. Le groupe de Biosémiotique de Copenhague écrit en effet, par la plume de Jesper Hoffmeyer et Claus Emmeche6 :

Fondamentalement la vie est une différence, au sens de « distinction par rapport à l’uniformité », une sorte d’ajournement de l’uniformité, laquelle implique le flux entropique vers la mort, considérée comme une distinction entre deux modes d’être : entre l’être permanent dépourvu d’information, c’est-à-dire la mort, et une mort temporairement différée, c’est-à-dire une différence, ou une poussée, dans la matière, qui permet de distinguer la matière morte de la vivante, c’est-à-dire la vie (ma traduction).

Alors, sémiotique = science de la vie ? Sans insister davantage, on laissera le lecteur méditer sur les implications de cette interpellante définition.

Incidemment il faut soulever également la question très importante du choix entre les diagrammes de Venn ou de Carroll pour représenter les ensembles ségrégés. Ils mènent à des analyses totalement différentes du champ, notamment en ce que le premier (ici adopté) comporte une relation d’inclusion, et contient donc en germe le concept de hiérarchie. Mais ceci sera examiné dans un autre lieu, à l’occasion d’une théorisation de la notion de catégorie.

2 – Structure de base des énoncés linguistiques

Note de bas de page 7 :

 Francis Edeline, « Contribution de la rhétorique à la sémantique générale », VS, 1972, pp. 69-78.

Note de bas de page 8 :

 Emile Benveniste, Problèmes de linguistique générale,Paris, Gallimard, 1974.

Note de bas de page 9 :

 Brenton Campbell, « Linguistic meaning », Linguistics33,1967, pp. 5-23.

Note de bas de page 10 :

 Harald Höffding, La pensée humaine. Ses formes et ses problèmes (trad. française de l’original allemand de 1902) Paris, Félix Alcan,1911.

On a déjà souligné7 à quel point le langage reflète le processus par lequel nous acquérons une connaissance élémentaire par la voie des sens. Benveniste8conseillait la prudence vis-à-vis de cette approche : « …le problème métaphysique de l’accord entre l’esprit et le monde, problème que le linguiste sera peut-être un jour à même d’aborder avec fruit, mais qu’il fera mieux pour l’instant de délaisser. » Les psychologues cependant n’hésitaient pas, comme stimuli de leurs tests, à remplacer des figures par des mots. Mais on parlait tout au plus de « parallélisme approximatif » entre « the structure of extralinguistic world and the structure of language »9. Paradoxalement c’est Höffding10 qui, dès 1911, osait formuler une thèse précise selon laquelle il existe une analogie absolue « entre le rapport du sujet au prédicat et le rapport des choses aux qualités sensibles ». Ce serait donc dans la forme prédicative du syntagme élémentaire qu’on pourrait trouver le reflet évoqué ci-dessus. La théorie esquissée plus loin donnera un contenu précis à l’expression étrange « analogie absolue ».

Note de bas de page 11 :

 Maurice Pradines, Traité de psychologie générale, Paris, PUF, 1948.

Note de bas de page 12 :

 Algirdas Julien Greimas, Du sens - Essais sémiotiques,Paris, Seuil, 1970.

La théorie prédicative du langage11 est reprise et formalisée par Greimas12, qui considère qu’un message élémentaire consiste en l’association d’un actant et d’un prédicat. Par actant il faut entendre un sémème (ensemble de sèmes) « discret », posé comme objet unitaire et substantiel. Par prédicat on entend un sémème « intégré », ensemble de déterminations sémiques. On retrouve, sous ces appellations, l’association perceptive entre une entité et une qualité distinctive, qui se définissent l’une l’autre dans l’acte de perception.

La forme linguistique de l’entité est le nom, le nom substantif qui sera l’actant de Greimas (homme, soleil, feu…). La manifestation linguistique de la qualité, correspondant au prédicat de Greimas, peut avoir deux formes :

  • le verbe s’il s’agit d’un invariant temporel (le soleil brille, la rivière coule…)

  • l’adjectif s’il s’agit d’un invariant spatial (le pavot est rouge…)

Mais ces formulations ne rappellent pas que le mouvement de l’eau n’est perçu que par contraste avec l’immobilité des berges, ni que le rouge du pavot est ce qui le distingue du souci ou de la pervenche. Incomplètes, elles mènent à des énoncés bancals qui ne font pas justice au caractère contrastif de la perception, lequel exige deux entités à comparer. Pour nous le syntagme minimal doit prendre la forme d’une fonction propositionnelle à deux variables (appelées couples). La relation R, malgré son aspect positif, est en fait la marque d’une différence ou d’une altérité, conformément à la définition saussurienne négative du signe. On pourra la rapprocher également de l’axe sémantique de Greimas, qui souligne bien que les différences en question se manifestent sur un fond d’équivalence : le rouge et le vert se distinguent, mais ce sont néanmoins deux couleurs.

3 – La théorie des graphes

Note de bas de page 13 :

 Arnold Kaufmann, Des points et des flèches... la théorie des graphes, Paris, Dunod, 1965.

Note de bas de page 14 :

André Warfusel, Les nombres et leurs mystères, Paris, Seuil, 1980.

Pour Kaufmann13 « la théorie des graphes n’est pas autre chose que le domaine de la théorie des ensembles qui concerne les relations binaires d’un ensemble avec lui-même. » Nous y découvrons donc déjà le concept de relation. Commençons par revenir à une définition simple d’un ensemble, que nous prendrons par exemple chez Warusfel14 : « Un ensemble est un amas de choses fort diverses, objets matériels ou spirituels (idées, concepts, etc.) dont les éléments possèdent :

a) une propriété caractéristique qu’ils ont tous, et qui n’est observée chez aucun élément étranger à l’ensemble, et

b) une individualité qui permet de les distinguer les uns des autres à l’intérieur de l’ensemble. »

Dans un graphe, on représentera les éléments par des points appelés noeuds ou sommets, et les relations qui les unissent par des arêtes ou arcs. Dans le cas général les arcs sont orientés et traduisent ainsi la direction des relations entre sommets, mais il existe aussi des graphes non orientés : ce sont ceux qui nous intéressent dans le cas des images, où les limites entre plages n’ont aucune vectorialité.

Il existe déjà aujourd’hui une technologie de reconnaissance des formes s’appliquant aux images et qui nous servira d’exemple. Pour toute image elle admet trois modes de représentation : le casier, le tableau et le graphe (Fig.3a,b,c), contenant exactement la même information. Dans ces graphes, à la fois planaires et non orientés, il est possible aisément de définir des concepts tels que voisinage, distance (dite « de Hamming »), ou séparabilité entre deux images. Très important également pour notre utilisation prochaine : l’extérieur compte pour une face.

Fig. 3 a, b, c – Une même image, dans ses trois modes de représentation.

Fig. 3 a, b, c – Une même image, dans ses trois modes de représentation.

On conçoit qu’il est possible d’augmenter la définition de l’image en augmentant le nombre de carrés élémentaires dans le casier, ou encore d’augmenter la taille de l’image en augmentant celle de la cellule élémentaire. Par lui-même le graphe n’a aucune dimension : il doit être accompagné d’une sorte d’échelle arbitraire. De même on n’est pas limité à des carrés à deux valeurs telles que Noir et Blanc. On peut introduire une échelle de gris ou même une échelle de couleurs, comportant des seuils aussi rapprochés qu’on le souhaite. On aura reconnu le mode Bitmap de nos ordinateurs.

Cet exemple des machines à reconnaissance de formes ne doit cependant pas nous entraîner sur de fausses pistes. Il s’agit de machines et non de récepteurs humains. En outre la grille qui forme le casier est arbitraire, elle est extérieure au signal et lui est appliquée délibérément, alors que dans la perception les segmentations sont intrinsèques au signal. Enfin on ne peut considérer sans plus le graphe comme un analogue de l’image car dans un graphe seuls comptent les arcs et les sommets : les surfaces délimitées par ces tracés n’ont aucune pertinence, alors qu’elles sont la base même de notre perception des images.

Note de bas de page 15 :

 On peut toujours déformer un polyèdre convexe de façon à ce qu’il n’ait qu’une seule face cachée.

C’est donc plutôt vers une extension de la théorie des graphes que nous nous tournerons pour rendre compte des phénomènes de l’interface : celle des graphes topologiques ou géométriques. Dans l’étude générale des polyèdres, on a déterminé les relations qui lient entre eux les nombres de sommets, d’arêtes et de faces (la fameuse loi d’Euler). On a également établi une méthode simple pour représenter en 2D ces solides à 3D (Fig.4) grâce à des déformations continues. La correspondance topologique est parfaite, à condition d’admettre que l’unique15 face arrière s’ouvre à partir d’un point et se déploie vers l’extérieur (face dite infinie). On obtient ainsi un graphe planaire non orienté, mais où cette fois les faces (plus généralement appelées régions) correspondent bien à des faces de la réalité. Toutefois ni leur forme ni leur taille n’ont été conservées.

Fig. 4 – Représentation d’un cube sous forme de graphe, et son dual. (le carré central représente la face proximale du cube)

Fig. 4 – Représentation d’un cube sous forme de graphe, et son dual. (le carré central représente la face proximale du cube)

Note de bas de page 16 :

 André Deledicq, Mathématiques buissonnières, Paris, CEDIC, 1975.

Le point essentiel sur lequel nous nous appuierons est l’existence, pour chacun de ces graphes planaires non orientés G, d’un graphe correspondant G* appelé son dual (Fig.4). Pour le construire on se base sur la réversibilité face Image5 sommet. Sur chaque face de G on dispose un point qui sera un sommet de G*. Les sommets de ce nouveau graphe, unis par des arcs, délimitent de nouvelles faces, mais on peut dire que les faces du premier sont déspatialisées. Par construction les arcs de G* joignent ses sommets en traversant les limites qui séparent deux faces adjacentes de G. On démontre facilement que G* contient exactement la même information que G : il suffit d’inverser G* à son tour pour retrouver intégralement G. Ce fait est clairement exprimé par cette conclusion de Deledicq16 : « relativement à un système de référence donné, G et G*, étant isomorphes, sont deux expressions identiques d’un même être ambivalent ».

4 – Retour au problème de l’interface

Note de bas de page 17 :

 Richard Masland, « L'architecture fonctionnelle de la rétine », Les mécanismes de la vision, Galifret Yves (éd), Paris, Belin ,1990, pp. 69-84.

Note de bas de page 18 :

 Lubert Stryer, « Les molécules de la vision », Les mécanismes de la vision, Galifret Yves (éd) , Pour la science, Belin, 1989, pp. 43-56.

Le lieu physique précis de l’interface est bien connu, de même que les phénomènes dont il est le siège17. Il s’agit de la molécule d’opsine (une protéine), disposée en ± 2000 feuillets ou disques, empilés de façon à former un cylindre allongé dans les « bâtonnets » ou un cône plus court dans les « cônes ». Cette protéine est associée à un groupe moléculaire plus court : le cis – 11 – rétinal, capable d’absorber un photon en se transformant en son isomère trans. Ce léger changement agit comme signal chimique modifiant la protéine (opsine) et amorçant une cascade de réactions chimiques, dont l’étape ultime est l’établissement d’un potentiel électrique à la membrane cellulaire. A partir de ce moment la transmission des signaux se fait exclusivement par diverses voies électriques, le long des fibres nerveuses, et sous forme de trains d’impulsions nerveuses identiques et cadencés18 ou, plus précisément, de « séries de potentiels d’action ».

Note de bas de page 19 :

 George Miller, « The magical number seven, plus or minus two : some limits on our capacity for processing information », The Psychological Review, 63, n°2, 1956, pp. 81-97.

On ignore encore, et sans doute pour longtemps, comment ces signaux électriques finissent par produire des mots, mais on peut néanmoins hasarder quelques conjectures plausibles concernant les maillons aval de la chaîne. En particulier, pour des raisons d’économie, il doit intervenir, malgré l’impression de continuité, une agrégation des fragments distincts d’information en « quignons » ou chunks19, correspondant aux sémèmes intégrés de Greimas. L’existence de termes comme zig-zag, dégradé, modelé etc. en témoigne, qui reprennent sous une dénomination unique une séquence de segmentations analogues, en nombre élevé ou même infini. De même une architecture sémantique doit se mettre en place (sous une forme hiérarchique ou non) à partir d’opérations de catégorisation.

Mais cette situation hautement conjecturale, tout importante qu’elle soit, ne change rien à notre problème central, qui est de comprendre comment, à cette transformation physico-chimique dans l’interface, peut correspondre la traduction sans perte d’un champ perceptif segmenté en un jeu de syntagmes minimaux. L’hypothèse ici avancée est qu’il s’agit de la transformation d’un graphe en son dual.

La théorie du graphe dual a été établie pour étudier la topologie des polyèdres réguliers convexes, mais peut être généralisée à des solides comportant un nombre quelconque de faces, elles-mêmes de forme irrégulière et non nécessairement planes. A toute image donc correspondra un graphe non orienté G comprenant autant de faces qu’il y a de zones segmentées ou régions, en comptant que l’extérieur représente la face distale. Ces zones segmentées sont séparées par des limites, qui sont le lieu des discontinuités perçues.

Mieux encore, l’appareil visuel est adapté à la perception d’objets à 3D à partir de signaux rétiniens distribués en 2D. La conscience d’une troisième dimension ne peut donc résulter que d’un calcul. Tout objet perçu comporte une face non vue, que notre graphe généralisé rend visible en l’ouvrant et en la déployant vers l’extérieur. Elle devient ce que nous appelons le fond, appellation logique puisqu’elle est en fait derrière. Ainsi s’expliquerait de façon satisfaisante notre impression que ledit fond passe derrière l’objet et que celui-ci avance par rapport au fond, bien qu’en toute rigueur l’image rétinienne soit strictement bidimensionnelle. Par défaut, la partie non visible d’un solide est supposée convexe.

Nous poserons qu’au graphe dual de G correspond un ensemble de syntagmes minimaux, chacun relatif à un arc joignant deux sommets de G* (Fig.5). Les faces de G sont ainsi ramenées à des points de G*, et sont de ce fait déspatialisées. Chacun de ces points sera un actant (au sens de Greimas) ou un nom substantif (au sens courant). Les arcs traversant les limites seront les relations entre faces voisines sur G, relations qu’elles prennent en charge en explicitant la nature des contrastes qui permettent de les distinguer, et qui prennent la forme linguistique du syntagme élémentaire.

Fig. 5 – Le graphe (= l’image) et son dual (= le langage)

Fig. 5 – Le graphe (= l’image) et son dual (= le langage)

Note de bas de page 20 :

 Il s’agit d’une description des surfaces perçues ; un second volet de la théorie, trop long pour être présenté ici, concerne la perception des formes.

Note de bas de page 21 :

 Jean Piaget, Traité de logique. Essai de logique opératoire, Paris, Armand Colin, 1949.

La description complète20 d’un champ d’image comportera autant de syntagmes élémentaires qu’il y a de limites traversées entre faces, sans oublier la « face externe », qui devient le « fond ». L’exemple de la Fig.5 exige ainsi 6 syntagmes, mais on imagine bien que dans des cas pratiques le nombre de syntagmes nécessaires et suffisants devient vite extrêmement élevé. Ces syntagmes n’envisagent que deux à deux les plages segmentées. Mais les relations qui les constituent peuvent être composées entre elles (pour reprendre la terminologie de Piaget21) et fournir une description des rapports entre plages disjointes.

En résumé les règles de la transformation sont les suivantes :

Note de bas de page 22 :

 Au maximum : dans certains cas particuliers, non abordés ici, deux syntagmes peuvent être identiques.

  • propriété exploitée : la dualité face / sommet ;

  • compte pour une limite celle qui sépare deux entités adjacentes ;

  • toutes les limites doivent être traversées ;

  • le système prend en charge les relations avec le fond, qui compte pour une face ;

  • le nombre de syntagmes nécessaires pour définir complètement un champ est égal22 au nombre de limites à traverser.

Note de bas de page 23 :

 Karl Popper, Un univers de propensions, deux études sur la causalité et l'évolution, Combas (France), Ed. de l'Eclat, 1992.

Théoriquement cette transformation ne provoque aucune perte d’information. Je n’ignore pas que cette affirmation pourra susciter des réticences chez certains philosophes (les pragmatistes et les positivistes logiques), pour qui toute correspondance entre « du discours » et « de la réalité » est une idée obscure. Le mécanisme que je propose ici semble justement de nature à dissiper cette obscurité23.

Note de bas de page 24 :

 Groupe µ, Rhétorique de la poésie, Bruxelles, Complexes, 1977.

Sur le plan des processus physiques il y a lieu de remarquer que la déspatialisation s’accompagne d’une séquentialisation. L’image qui était donnée synchroniquement à la rétine (image dite « fixe ») se trouve transmise séquentiellement au cerveau. Toute réflexion ultérieure sur cette image (en son absence) devra faire intervenir un acte de mémoire. C’est sans doute le moment d’évoquer cette autre dualité, entre l’espace et le temps, que le Groupe µ a bien mise en évidence dans son binôme lecture linéaire / lecture tabulaire24 (Groupe µ, 1977).

5 – Réversibilité du processus de sémiose

Note de bas de page 25 :

 Edgar Morin, L'Homme et la Mort dans l'histoire,Paris, Corrêa, 1951.

Le passage d’un graphe à son dual éclaire une transformation jusqu’ici assez mystérieuse et peu étudiée. Il permet désormais de comprendre l’économie de tout le système, et éclaire particulièrement le lieu où démarre la sémiose, mais il ne rend compte que de la partie du langage concernant la saisie du monde naturel par la voie des sens. En 1951, l’essayiste Edgar Morin25 a eu cette formule heureuse : « Le langage est notre cosmos de poche ». Mais la question n’a été abordée que dans le sens du passage du réel au langage, que l’on pourrait appeler anasémiose. Tout aussi important est le mouvement inverse, la reconstruction inférentielle du réel, par laquelle du langage peut à son tour se transformer en réel… mais ceci, la catasémiose, est le sujet d’un autre travail.