Aide à la conception de descripteurs non-acoustiques pour une sonothèque
quels outils sémiologiques ?

Gérard Chandès

CeReS, Université de Limoges

https://doi.org/10.25965/as.2840

Index

Articles du même auteur parus dans les Actes Sémiotiques

Auteurs cités : Jean-François d’Augoyard, Charles Sanders PEIRCE, Georges Simondon, Henri Torgue, Norbert Wiener

Texte intégral

Cette intervention fait retour sur les deux faits qui sont à l’origine du colloque « Les mots du son » et de la collaboration avec le Centre de Recherches Sémiotiques : a) l'installation à la Fondation La Borie de la sonothèque de Louis Dandrel, soit dix mille séquences sonores pour lesquelles des descripteurs sont nécessaires afin d’en permettre l’accès et l’exploitation ; b) une demande, formulée par Louis Dandrel : inventer des descripteurs. Ceux-ci doivent être capables de satisfaire trois conditions :

Note de bas de page 1 :

 J.-Fr. Augoyard & H. Torgue, A l'écoute de l'environnement. Répertoire des effets sonores, Marseille, Parenthèses, 1995, pour les effets sonores en général.

  • ne pas seulement se référer à la source sonore (fonction référentielle) ; de telles sonothèques existent déjà ; on peut les consulter et les exploiter sur internet ;

  • ne pas s’en tenir aux descripteurs qui réfèrent aux sources et aux causes, ni aux descripteurs techniques de l’acoustique ;

  • exploiter les ressources intellectuelles de la sémiotique. La recherche en acoustique et psycho-acoustique n’ignore pas la question du sens. Elle développe une sémantique et une sémiologie1 en tant qu’étude de systèmes de signes. La sémiotique porte, de son côté, sur l’étude des systèmes de relations, relations internes à l’objet signifiant et qui le constituent comme tel, relation également des signes à leur « récepteur ».

Telle est donc la « commande » : construire un métadiscours sémiotique du son, spécifiquement du son non tonal. Autre façon de le dire : établir une sémiotique des effets de sens produits par l’audition d’un son, et la traduire en mots-clefs. Si ces prémisses étaient inexactes, tout ce qui va suivre serait invalide.

La suite de mon intervention se limitera à une position possible du problème. Nous sommes ici pour tracer les bases d’une recherche au long cours. Les savoirs sont encore à constituer, en interaction et en équipe. Si bien que les autres conférences sont susceptibles de me conduire à modifier le présent discours, encore que je ne prenne guère de risque : il s’agira surtout de questions, et peu de réponses. Plus encore, la question qui constitue le titre de mon intervention n’implique pas nécessairement que la réponse soit définitive...

Cet intitulé de forme interrogative est, au fond, moins un début que l’aboutissement provisoire de questions antérieures. Qui sont, pour commencer et s’en tenir à elles, au nombre de trois : 1. quelles définition et délimitation d’une unité sonore dans une sonothèque ; - 2 quelles incidences sur la rédaction des descripteurs proviennent de la fugacité du son par opposition à la permanence de l’image ; - 3 à quoi sert une sonothèque ?

La première question concerne le découpage de ce qu’on nomme le « son » stocké dans la banque documentaire. Je propose en première instance de ne pas s’interroger sur la pertinence des unités ou des ensembles sonores réunis dans la phonothèque. Nous disposons d’objets construits par un découpage empirique et subjectif du réel. Ils constituent une base de données objective. L’analyse des critères qui ont conditionné l’extraction de telle ou telle unité dans le continuum sonore (point de départ, durée, point d’arrêt) relèvent d'un autre objectif d’étude.

Note de bas de page 2 :

G. Simondon, L'individuation  psychique  et collective,  Paris, Aubier,  2007.

Constatons pour l’instant que la sonothèque contient des sons provenant d’individus isolés sur fond neutre (un bruit de moteur, de machine à coudre) et des « scènes » c’est-à-dire des sons produits par des phénomènes naturels (l’orage, la pluie...) ou des activités humaines (une rue d'une ville, un atelier d’imprimerie). Une scène peut se confondre avec un « récit » lorsqu’elle réfère à un processus évolutif (fabrication d’une liqueur dans une distillerie). Mais quelle que soit sa dimension concrète, le son sera considéré – je reformule ici une affirmation précédente – non comme un objet acoustique mais comme un individu, l'individu étant « l'être qui apparaît lorsqu’il y a signification » (Simondon2). Décrire l’individu par sa signification, sans construire un métadiscours et sous la contrainte de brièveté - contraction et concision maximales dans l’énonciation du texte descripteur, des mots-clefs, des syntagmes simples -, tel est le défi.

Note de bas de page 3 :

 Cf. D. Deshays, De l'écriture sonore, Marseille, Entre/Vues, 1999, pp. 69-71.

Note de bas de page 4 :

 Cf. Andrea Valle, « Ecoute toucher son : pour une sémiotique du temps », Applied Semiotics/Sémiotique appliquée, 4 : 10 (2000), 107.

La seconde question pourrait se formuler ainsi : le fait que le son est une présence instable3, c’est à dire une position de réel atténuée – sinon amenuisée – par rapport au fait d’évidence stable qui est celui de l'image4 « en pleine lumière », a-t-il une incidence sur la construction des descripteurs non-référentiels ? La question se pose avec d’autant plus d’acuité que, le son étant invisible, sa décontextualisation et son incarcération dans une base documentaire, loin de son « sémiotope », peuvent rendre problématique son intelligibilité, du moins dans sa dimension référentielle et dans ce qui fait son individuation. Exemples.

1. Le vent de l’atmosphère de Titan, inidentifiable en écoute décontextualisée, alors qu’il s'agit d’un événement civilisationnel : le premier bruit d’une atmosphère extraterrestre, saisi par la sonde Huyghens.

2849

2. le signal sonar envoyé par cette sonde au cours de sa descente jusqu’au moment où elle touche la surface : la fréquence de signal augmente en proportion où diminue la distance au sol, la hauteur du son monte progressivement jusqu’à l’aigu.

2850

Note de bas de page 5 :

 C.S. Peirce, Collected Papers, Cambridge (Mass.), Harvard Univ. Pr., 1978, t. 2, § 228.

Note de bas de page 6 :

 Séminaire du CeReS,

Dans ces exemples, une analyse rapide fondée sur les concepts et la terminologie de Peirce attribuerait à la séquence sonore, en cette situation obligée d’écoute non causale, un caractère affirmé de « priméité », catégorie de l’indéterminé et du potentiel. Plusieurs interprétations semblent possibles, en effet, dans ces cas précis, car ils ne comportent pas d’indication référentielle. Certains auditeurs pourraient même ne proposer aucune identification. La séquence sonore reste un « representamen ». Il faut l’indication de la source pour faire la faire passer de la condition de « representamen » à celle « d’objet » défini comme ce "dont il [le signe] présuppose la connaissance afin d’apporter une information supplémentaire à son sujet"5 en actualisant, ce faisant, le caractère de « secondéité ». La secondéité est la catégorie de la limitation, de la délimitation, de l’existence émergeant de l’indétermination. C’est ainsi que la sémiose sonore est particulièrement sensible à l’indication de la source, pour émerger de la priméité. Ce que confirme L. Dandrel6 : « dans le domaine du son, le descripteur nous échappe ; on le décrit naturellement par sa causalité ». L’univers sémiotique de Peirce est triadique. Une troisième catégorie, la « terceité » implique la présence de l’interprétant, système de valeurs et de codages assimilés par l’interprète. On ne le confondra pas avec l’interprète et ses singularités individuelles. On peut comprendre l’interprétant comme cet agent médiateur par lequel le signe (ici la séquence sonore) devient texte et la signification devient un ingrédient du sens. Dans le premier exemple, le texte est le récit d’un trajet dans une atmosphère, trajet qui fait événement dans un programme de conquête spatiale, programme qui pose à son tour des questions techniques, financières et culturelles, qu’elles soient philosophiques ou anthropologiques. Le second exemple fait lui aussi événement et s’inscrit dans le même programme, mais l’actualisation de la tercéité est piégée : le passage du grave à l'aigu est universellement codé et perçu comme une montée, alors qu’il est chargé de figurer dans ce cas une descente physique, celle de l'atterrissage : dissonance radicale entre l’orientation du mouvement sonore et celle du mouvement physique que la première est chargée de représenter.

On perçoit clairement que l'entreprise amorcée collectivement ici équivaut à l’invention d’une nouvelle géométrie.

à quoi sert une sonothèque ? Telle est la troisième question, qui est en réalité la première. Autrement dit, quelles sont les utilisations possibles et prévisibles ? Cette question concerne la visée au service de laquelle est mis le recours à la banque de données. Une précaution consiste donc, pour l’analyste universitaire lorsqu’il se veut conseiller en création de descripteurs, à faire le deuil d’une visée centrée sur ses seuls objectifs pour se mettre à la place de l’usager, dont l'horizon de visée comme le mode de saisie ne sont pas nécessairement homologues. On n'oubliera pas en effet qu'entre les gestionnaires d’une base documentaire et les utilisateurs de cette base en situation d’écoute focalisée doit exister un « contrat de lecture » : le vouloir- et le pouvoir-dire des concepteurs doivent se caler sur le vouloir et le pouvoir lire (les descripteurs) des usagers.

  1. Usage « carte postale » : retrouver en situation acousmatique des sons familiers ou étranges, connus ou étrangers, endotiques ou exotiques. La logique (logique : mode d'intelligibilité) de cognition et celle d'usage sont hédoniques, c'est-à-dire que le sens vient au son en fonction du plaisir ou du déplaisir que procure la perception. Ces logiques peuvent être également qualifiées de « mythiques » : la saisie du son active des valeurs qui réfèrent à l’imaginaire, qu’elles soient esthétiques, symboliques ou mythiques stricto sensu. L’expérience produite par l’écoute est affective et passionnelle. Le mode d’accès passe nécessairement pas l’indication de la source, mais peut-être pas exclusivement. Peut-on envisager une taxonomie fondée sur de grandes bases structurantes de l’imaginaire, des « régimes » héroïque/diurne, mystique/nocturne, synthétique/interactionnel ?

  2. Usage « documentaire » : s'informer sur la réalité des sons, dans tel ou tel domaine, pour les exploiter dans une action spécifique : le romancier qui veut décrire et créer des ambiances, le concepteur de jeux vidéo qui veut donner une touche réaliste au récit (par exemple en utilisant le son d'une auto d'époque ou d'une arme à feu). La logique de cognition est, en première instance, informative, la logique d’usage est pratique. Le mode d’accès passe nécessairement par la source. L’usage documentaire est un usage référentiel.

  3. Usage « démonstration », « argumentation » en géographie, histoire, histoire des sciences, sociologie, ethnologie, anthropologie... : par exemple les sons « collectifs » des différentes villes, le son de la première machine à coudre, l’écho radar de la sonde Cassini-Huyghens en approche du sol de Titan. La logique de cognition est critique, en ce sens que l’objectif est de comprendre, d’élucider, sinon de dévoiler le caché. Par conséquent, la logique d'usage est technique. Mode d’accès : par la source, dont le lieu, sur la base de typologies existantes et propres à la spécialité concernée. Exemple : ville/campagne pour les géographes, artefact mécanique/travail à la main pour les anthropologues et ethnologues.... Autrement dit, le critère d’extraction, en usage documentaire, se fera aussi par le centre d’intérêt de l’usager.

  4. Usage « manipulation », destiné à produire des réactions affectives, sur le mode le plus élémentaire, tel qu’attirer l’attention (session d’ordinateur, par exemple, téléphonie), inciter à la patience (attentes téléphoniques) ou sur des modes plus complexes, lorsque l’on cherche à produire des effets esthétiques : design sonore, bruitage au théâtre, au cinéma, à la TV, à la radio, dans les expositions d’art, sur le web. La manipulation peut rechercher des effets émotifs non esthétiques, générateurs de comportements dont l’enjeu est, à la limite, vital. Ainsi la société Sound Fishing propose des constructions sonores à usage médical pour des thérapies sensorielles, de l’hypnothérapie, des bandes sons « de sociabilisation et de sensibilisation » à destination des élevages canins et d’oiseaux, ainsi que des répulsifs sonores pour oiseaux.

  5. Usage « méta » : la saisie et la visée sont focalisées sur le son en lui-même, comme objet d’étude. en perspective acoustique, sémiologique et sémiotique. Dans ce dernier cas, la sémiotique du son sera un « département » de la sémiotique des flux, encore à construire, en complément de la sémiotique des objets, déjà fort attestée et exploitée en perspective d’innovation mercatique.
    Les frontières entre ces usages ne sont pas hermétiques. L'usage manipulation », sous les espèces de la création en design sonore, en conception architecturale, présuppose un usage « méta ».

  6. Usage autocentré : l’utilisation de la banque-son pour créer du texte-son qui porte sa propre fin, telles les séquences sonores mise en ligne sur Arte-Radio, ou les productions scolaires du DJ Mozart.

Note de bas de page 7 :

 G. Simondon, L’individuation  psychique  et collective, idem, p. 89. « L’activité perceptive est médiation entre la qualité et la quantité ; elle est intensité, saisie et organisation des intensités dans la relation du monde au sujet. »

On peut penser avec G. Simondon que « le sujet perçoit de manière à accroître non la quantité de signaux d’information, ni la qualité d’information, mais l’intensité d’information, le potentiel d’information d’une situation7 », « situation » étant commutable avec « échantillon sonore ». L’affirmation sera sans doute à nuancer : les intentions d’écoute documentaires et démonstratives exigent aussi la perception de la quantité et la qualité de l’information nécessaires et suffisantes. Mais, qu’il s'agisse de présence efficiente ou de primauté avérée, l’attente de potentiel d’information vaut pour les différentes logiques d’écoute ainsi que pour toutes les postures d’utilisateur : par imprégnation et écoute flottante, par navigation butinante ou organisée dans la base de données, ou encore par réflexion objectivante. N’est-ce pas ce potentiel d’information que les descripteurs sémiotiques devraient expliciter et énoncer.

Note de bas de page 8 :

G.  Simondon, L'individuation  psychique  et collective, ibidem : cette assertion n'est pas en contradiction avec la précédente, note 7, puisque s'il ne s'agit pas d’« accroître » la quantité de signaux d’information, il s’agit de « retenir » la plus grande quantité disponible hic et nunc.

L’ajustement de la recherche aux différentes visées d'usage conduit à la réflexion sur le terrain de la sémiopragmatique. Elle implique une réflexion sur les modes de saisie par l’utilisateur de tel ou tel son individué. Le sémioticien verra alors que la sémiotique impliquée, en première approche, serait plutôt celle de Peirce, puisqu’elle incorpore dans le processus global de sémiose le rapport entre les signes et le récepteur – ici l’auditeur – ainsi que le contexte : la situation de réception, dont le conditionnement culturel du récepteur... La théorie de l’information sera celle de N. Wiener revue par G. Simondon , qui n’est pas en contradiction avec Peirce : « percevoir est retenir8 la plus grande quantité de signaux possible dans les formes les plus profondément ancrées dans le sujet ».

Note de bas de page 9 :

 Auteur : Jean Fisette. Notice provisoire en ligne, http://www.flsh.unilim.fr/ditl/

Mais si cet ancrage profond dans le sujet est ce qui permet une certaine communauté des significations dans des groupes d’extension variable, et par conséquent ce qui permet la cohérence et la stabilité de l’interprétant, le sujet apporte avec lui ses conditions singulières, donc l’imprévisibilité. L’une des conditions de la sémiose est que, je cite la notice provisoire Sémiosis/sémiose du « Dictionnaire International des Termes Littéraires »9, « le sens du signe ou du mot est donné » comme « un lieu dialectique diversement marqué par des énonciateurs ou des usages concomitants et qui reste toujours sujet à des modifications ou à des transformations plus importantes qui sont, par définition, imprévisibles ». L’imprévisibilité à la réception, bien étudiée depuis l’âge de la « nouvelle communication », est donc une première contrainte pour des signaux qui, à la différence des signaux visuels, toujours plus ou moins directifs même dans le cas d’œuvres artistiques abstraites, laissent un forte place à la subjectivité du récepteur dans la construction de la signification, puis du sens.

Ainsi, un étudiant engagé dans un syndicat d'extrême-gauche interprète le rapport des graves et des aigus dans le « Vrai chant des boîtes » de Philippe Delerm comme une représentation de ce qu'il estime être l’« oppression » exercée par le patronat sur ses employés. 0r, il existe beaucoup d’autres séquences sonores qui présentent des contrastes forts quant à la hauteur et à la rythmique : des bruits de nature nocturne par exemple. Mais dans ce dernier cas, l’identification par l’action de l’interprétant est aisée. L’interprétant, dispose des « compétences » nécessaires, il est opérationnel. Dans le cas du « chant des boîtes », séquence exotique, il n’y a pas d’indication ni de prescription de lecture ; l’interprétant laisse la place à l’interprète et à ses prescriptions propres, issues de ses déterminations personnelles.

L’imprévisibilité concerne également l’émission des descripteurs du son, comme nous l’avons entendu avec les exemples en vigueur dans le bureau d’études acoustique de l’entreprise Renault. C’était patent, on n'était pas toujours d'accord avec la dénomination adoptée par les acousticiens. Ce n’est pas que, dans ce cas, le système d’élaboration des descripteurs ne soit pas pertinent, mais la pertinence ne se maintient que dans le seule mesure où l’usage reste interne, confiné, pour un public restreint, connivent et homogène – en famille, en somme. Dès que le descripteur va quitter ce cercle restreint pour concerner d’autres zones de public, l’efficacité déictique peut diminuer. On voit, par conséquent, que le choix de descripteurs dépend, en partie et en fin de compte, de l’étendue du public visé. Et donc, à l’origine, en amont, à la source, d’une stratégie explicite de médiation culturelle. Stratégie dont l’élaboration revient à la Fondation La Borie.

Cependant, la singularité de l’interprétation n’est pas inexploitable. Il est possible de percevoir et de décrire une séquence sonore comme un « système de forces » (Simondon), système interne à la séquence mais aussi système créé dans et par l’interaction entre la séquence et l’auditeur. Dans le cas cité précédemment, le concept commun au document sonore et à l’état propre de l’auditeur serait celui de la séparation, de l’écartement, le schème imaginaire sera celui de l’opposition des contraires. Le lexique les prendra en charge par la préfixation /dis-/. Pour revenir au modèle de catégorisation Augoyard/Torque, l’effet sémantique initial serait celui de la disjonction. Est-il réaliste d’envisager une entrée « disjonction sémantique », qui renverrait aux échantillons dont le rapport entre les composantes de densité, de masse, de plan, de grain seraient jugées fortement contrastées et contrastives ?

Conclusion

Un fait me paraît acquis : si l’élimination du concept d’objet sonore est fondée en théorie, il n'est pas possible de l’évacuer dans la pratique : l’accès public au son exige sa délimitation et son objectivation – qui est une objectalisation.

En toute première intention, j'avais envisagé la recherche des apports des différents modèles sémiotiques à la conception de descripteurs. Cela a donné le titre, maintenant trompeur, de cette communication. En fin de compte, de mon point de vue, qui est certainement provisoire et résulte à coup sûr d’une réflexion insuffisante pour aller plus loin et répondre à la question posée par le titre, il apparaît que les différents modèles sémiotiques peuvent au moins contribuer à donner la position précise du problème.

Il faudra affiner l’analyse. La sémiotique de Peirce, qui propose une typologie très complexe mais très fine du signe, devra être appliquée à des cas sonores précis. C’est une autre étude. Est-elle pertinente pour permettre d’inventer de nouveaux mots-clefs sémantiques, qui prolongent la typologie de Schaeffer, celle d’Augoyard/Torgue, qui présentent d’autres voies d’accès complémentaires à celles de la psycho-acoustique ? C’est ce qu’il faudra prouver.

Peut-être faudra-t-il la compléter par d’autres heuristiques. Je pense en particulier à l’archétypologie de l’imaginaire, à laquelle j’ai fait allusion, qui manipule les concepts de schèmes, d’archétypes et des symboles, mais aussi d’images matérielles, concept bachelardien dont il faudrait voir s’il est applicable à la matière sonore. Ainsi un bruit de décollage d’avion relèvera du régime héroïque/diurne de l’imaginaire. Il signifiera « envol » (niveau symbolique), « ascension » (schème), et selon ce modèle anthropologique de l’imaginaire, « transcendance » (archétype). Autant d’entrées possibles.

bip