Accueil    Types d'études    Domaines   L'Idoscope®    Publications et travaux   Presse    Références


XXIVe journées d'études

 

Association de Psychologie Scientifique

de Langue Française

 

15, 16, 17 septembre 1993

 

APSLF AIX 93

CREPCO - URA CNRS 182

Université de Provence

29, avenue Robert Schuman

Aix-en-Provence

THEME DU COLLOQUE

 

UNIVERSEL ET DIFFERENTIEL EN PSYCHOLOGIE



"L'Idoscope®, outil d'aide à la recherche en psychologie :

la mesure du même et de l'autre"

 

Communicatiotion de

JEAN-CLAUDE GOMEL

Psychologue

Institut SYNTHESE

 

 

Il y a aujourd'hui effervescence autour des applications de l'informatique aux scien­ces du lan­gage (Intelligence Artificielle, systèmes experts, etc…). Les probléma­ti­ques débordent du cadre linguistique pour poser la question de l'utilisa­tion pos­si­ble des résultats de ces re­cherches par d'autres disciplines. Il semble que nous vi­vions une période semblable, mutatis mutandis, à celle de l'appropriation des outils statistiques, naguère, par les Sciences Humaines et Sociales. Dans une commu­nica­tion faite au colloque "Sciences Sociales et Intelligence Artificielle" (Aix-en-Provence, Bibliothèque Méjanes) en Avril 1992, Mme Anne Fauchois, chercheur à l'Institut Syn­thèse, avait situé la démarche de l'Institut Synthèse dans le cadre géné­ral de la re­cherche langage/ordinateur, et de son intérêt à l'égard des besoins actuels des cher­cheurs en SHS. Il s'agit aujourd'hui d'en spécifier concrètement les propriétés auprès des psychologues, sous l'angle de la mesure de la différenciation.

 

Rappelons que la matière que travaille l'Idoscope® est un ensemble de textes en lan­gage natu­rel, oral ou écrit, composante essentielle des matériaux bruts recueillis par les psychologues dans leurs activités de recherche ou d'intervention. Ces textes sont par exemple, des entretiens libres, des entretiens non-directifs avec questions de re­lance, des en­tretiens semi-directifs, des réponses à des questions ouvertes. Pour l'écrit, il s'agit d'articles de presse, de comptes-rendus, de rapports, de protocoles d'expérimentation (pour leur partie non codée), de rapports d'expertise, etc…. Il est à noter que les corpus peuvent comprendre un grand nombre de textes : l'Institut a traité depuis 1986 plusieurs dizaines de milliers de textes, qui constituent une ban­que de données considérable. Par ailleurs, les délais de traitement doivent suivre les exigences des utilisateurs, parfois quelques jours.

 

L'Idoscope® de l'Institut SYNTHESE relève de la psychologie cognitive, et plus spé­cialement du modèle propositionnel. Au travers du langage recueilli, la procédure vise, par un jeu de transformation, à rendre compte des états mentaux des locuteurs sous les espèces d'un ensemble structuré et quantifié de formes propositionnelles, qui se veulent l'expression du langage interne ou "mentalais", selon le terme de Da­niel Andler. Il s'intéresse en premier lieu à la cognition, c'est-à-dire aux proposi­tions qui font la représentation, quel que soit leur rapport à la vérité. C'est par un deuxième processus, s'il y a lieu, que l'on peut explorer la connaissance. Ce travail, que nous ne développerons pas ici, porte sur les seules propositions sémantiquement assertives, qui sont alors évaluées en valeur de vérité sous le double critère de la conformité aux faits ou de la validité du raisonnement.

 

Dans le processus de traitement de l'Idoscope®, le discours est considéré comme une séquence d'éléments de sens, les unités sémantiques, considérées comme la molécule de base de l'analyse. La structure de l'unité sémantique est propositionnelle ; chaque unité fait l'objet d'une fiche informatique soumise au processus de traitement décrit ci-après.

 

La particularité de la méthode tient en ce qu'elle ne part pas, dès l'abord, d'une ana­lyse lexicométrique. L'analyste effectue, assisté de l'ordinateur, un "saut sémantique" du texte au sens. Pour ce faire, il met en jeu un métalangage, qui a la propriété du langage des mathématiques et des sciences physiques, c’est-à-dire une définition expli­cite et surtout monosémique de chacun des termes.

 

Le discours est donc considéré comme une séquence d'Unités sémantiques (un seul entretien peut en comporter plus de 300)[1]. Une des difficultés que nous avions à ré­soudre provenait du fait que l'unité de sens n'est congrue avec aucune forme gram­maticale (phrase, proposition, para­graphe, que saurait reconnaître automatique­ment l'ordinateur). Il est clair que l'énoncé "J'ai encore peur" inclut deux modalités tempo­relles (passé et présent), et révèle non une, mais deux Unités sémantiques, que l'on doit traduire par "J'ai peur maintenant", "J'avais peur auparavant".

 

Les termes de la métalangue sont structurés hiérarchiquement par des opérations taxino­miques, emboîtant autant de niveaux d'hyponymes/hyperonymes que le de­mande la finesse de l'analyse (en général deux ou trois).

 

Précisons que les "mots" de ce métalangage appartiennent eux-mêmes au langage na­turel, ce qui a pour avantage de faciliter la communication entre les chercheurs de l'Institut, les cher­cheurs associés, et les utilisateurs. Les résultats des travaux sont ainsi exploitables presque sans médiation.

 

Le système qui gère l'analyse est un SGBDR (Système de Gestion de Bases de Don­nées Relationnelles). Ces progiciels ont un certain degré de congruence avec le fonc­tion­nement de l'intellect. Jusqu'où ? C'est le modèle qu'emprunte Andrew Wood­field, dans son article "Un modèle à deux étapes de la formation des concepts", in "Intro­duction aux sciences cognitives"., décrivant le processus de formation des concepts d'une enfant, il y note : "Supposons que l'intellect de Suzie soit…doté en outre d'une mémoire à long terme (LTM) comprenant des fichiers de données et un système de gestion de base de données".

 

La structure de la base de données, quelle que soit l'étude menée par Idoscope®, est identique. Mais, selon l'objet, elle est aménagée et spécifiée au niveau des fichiers de la base et au niveau des rubriques.

 

L'analyste, pour chaque unité sémantique, préalablement saisie, ou bien traitée par OCR, renseigne la fiche en valeurs de variables, par un jeu itératif entre les fichiers liés et le fichier principal d'analyse.

 

.

 

La finesse différenciatrice est obtenue par la richesse du métalangage : dans ses caté­gories principales, la thématique peut comporter plus de 400 termes, le repérage prédicatif plus de 600, les référentiels une trentaine, les valeurs modales et tempo­relles une dizaine, les locali­sations spatiales, temporelles, ou les circonstances situa­tionnelles plusieurs dizaines. C'est donc sur une palette très riche que va se fixer précisément chaque unité de sens.

 

Autre propriété du métalangage : il n'est pas donné a priori. Chaque étude spécifi­que com­mence tabula rasa : les grilles conceptuelles, vierges, se constituent au fur et à me­sure de l'analyse des premiers textes. Le travail taxinomique intervient périodi­que­ment, par mise en ordre et catégorisation à l'intérieur de chacun des fichiers. Le cher­cheur ne s'impose donc pas une vue du monde délimitée par des constructs a priori, qui enserreraient le nouveau dans le déjà su, mais réinvente l'univers du sens dans chaque nouvelle situation.

 

Une fois effectuée la conversion au métalangage, l'ordinateur effectue alors aisément ce qu'il sait bien faire : trier, classer, compter, comparer. Chaque unité sémantique étant automatique­ment liée au locuteur, la mesure fait précisément apparaître, dans leur nature et leur quantité, les similitudes et les différences entre les individus, selon leurs éléments signalétiques : âge, sexe, niveau d'études, situation familiale, et selon toute carac­téristique objectivante ou heuristique que l'on aura voulu se donner. De la même ma­nière, on notera les convergences, ce qui permet de faire émerger d'éven­tuelles typo­logies.

 

Les différenciations sont synchroniques. Elles sont aussi diachroniques, dans la me­sure où une population est suivie dans le temps. L'individu ou le groupe est alors comparé à lui-même dans l'intervalle temporel, et les écarts sont comparés entre eux.

 

Cette comparaison s'effectue au moyen de deux mesures conjointes.

1° Les variables sémantiques sont évaluées en termes de fréquence. À quelque niveau de la catégorisation qu'elles appartiennent, les fréquences les plus élevées indiquent un relief dans la représentation. Nous sommes très proches ici de la notion de gra­dient de typicalité.

2° De plus, chaque unité sémantique fait l'objet d'une notation marquant l'attitude du locuteur vis-à-vis de son énoncé. Cette notation en trois points : positif, négatif, neutre, marque des indices de polarité. Nous entendons par polarité le caractère "eu" (au sens le plus englobant de "bien"), ou "dus" (au sens de "mal, mauvais") attribué à l'unité sémantique par son énonciateur. Selon la valeur-attribut, cette variable dis­crète fixe la proposition sur un axe faveur/défaveur, bonheur/malheur, réus­site/échec, beau/laid, bien/mal (selon l'éthique). La polarité nous semble un as­pect extrêmement important des représentations, formant avec la typicalité des pré­dicats l'essentiel du contenu des états mentaux.

 

Le logiciel convertit ces indices en 0 pour négatif, 20 pour positif, 10 pour neutre, ce qui permet un calcul de moyennes permettant une appréhension immédiate et glo­bale des résultats.

 

En voici un exemple : il s'agit ici de quelques résultats d'une étude publiée, portant sur les représentations du tiers-monde dans la presse écrite et audiovisuelle fran­çaise.[2].

 

Sur les graphiques combinés qui suivent, les fréquences des valeurs de variables sont repré­sentées par les histogrammes (échelle de gauche), et les moyennes de polarité par des points reliés par une courbe (échelle de droite). La somme des fréquences n'est pas égale à 100%, car on n'a représenté que les 8 thèmes généraux principaux sur 26, et les 8 champs prédi­catifs sur 17.

 

Le tiers-monde, dans les médias en général, c'est le Politique, négativement perçu (8,5). Par degré de typicalité décroissant, les huit principaux thèmes généraux condensent la thématique du tiers-monde dans les médias français. A noter l'impor­tance et la faveur du thème de la Culture.

 

Si l'on considère maintenant la représentation sous l'angle des attributs, ou des "traits-valeurs-d'attribut", pour utiliser la for­mule de J.-F. Le Ny, la typicalité des champs prédicatifs est encore plus nette.

 

 

Il s'agit là de valeurs moyennes, portant sur tout le corpus. L'intérêt, dans le cadre de cette communication, est de mesurer les différenciations thématiques et prédica­ti­ves. Elles sont aisément obtenues par sélection d'un sous-ensemble du corpus, par média, par journaliste, par pays concerné, par locuteur, etc…, comme le montre en exemple le tableau suivant :

 

 

On a souligné les champs prédicatifs les plus importants par média, indices de la co­loration particulière qu'il présente à ses lecteurs. Le tiers-monde est marqué par la fa­talité et la souffrance pour la plupart. Paris-Match en évoque, à part égale, le pitto­resque. Le Monde, à rebours, en fournit une explication contextuelle, et en men­tionne parallèlement les évolutions positives (deuxième champ prédicatif), alors que ce trait n'appa­raît pas du tout pour TF1. Les conséquences pour l'action sont évi­dentes : si l’on souhaite modifier durablement les représentations, il faut agir, en LTM, sur les prédicats. Nous développerons ailleurs la théorie et les moyens de cette action.

 

Les applications cognitives de l'Idoscope® couvrent une grande partie du champ de la psychologie, dont presque toutes les disciplines s'appuient sur la matière même du discours : psychologie sociale, psychologie des organisations, psychologie écono­mique, psychopédagogie[3]. Par analogie avec l'histoire, l'Idoscope® peut être une "méthode auxiliaire" comme les techniques physico-chimiques de datation ou d'au­thentification des documents pri­maires. L'Institut Synthèse met ses moyens, dans le cadre d'études conventionnées, à la disposition de chercheurs d'autres la­boratoires.



[1] "Nous savons maintenant, d'une façon certes incomplète, mais dont il est exclu qu'elle soit démentie par les développements futurs de la recherche, que l'intelligence humaine est faite de petits morceaux, de composants fonctionnels. Composants des processus, que nous appelons souvent des « opérations élémentaires », et composants des connaissances, que nous appelons souvent des « représentations », ou des fragments de représentations (des schémas perceptifs, des propositions, des règles, des concepts, des composants sémantiques, etc.)." in J.-F. Le Ny. Science cognitive et compréhension du langage (83).

[2] "BarOsud, image du tiers-monde dans les médias". Étude menée par Idoscope®, financée par les Ministères de la Coopération et des Affaires Etrangères, et publiée à la Documentation Française, qui met en évidence, sur des graphiques commentés, les composantes convergentes et différenciées, par pays et par médias, de la représentation du Sud dans la presse française.

[3]  Et d'autres, comme l'ethnopsychiatrie. L'Idoscope® introduit la notion de niveaux différentiels, adaptée à des analyses rapportées dans "Psychologie Française 36/4" page 310, par Marie Rose Moro, où une divergence du sens à un premier niveau révèle une similitude sémantique dès lors que l'on restitue le cadre référentiel : l'Afrique Noire pour l'une des propositions, le Maghreb pour l'autre.

Accueil    Types d'études    Domaines   L'Idoscope®    Publications et travaux   Presse    Références