Agence Universitaire de la Francophonie

 

INITIATIVES 2001

Colloque « Ethique et nouvelles technologies, l’appropriation des savoirs en question »

Les 25 et 26 septembre 2001, à Beyrouth (Liban)

  

L’appropriation du savoir dans les cultures multilingues : le dilemme des interfaces homme-machine franco-arabes

 

Mokhtar BEN HENDA

 

ISD, Université La Manouba, TUNISIE

CEM-GRESIC, Université Bordeaux 3, France

Mokhtar.Benhenda@isd.rnu.tn

 

RESUME

 

Langues et cultures associées à l’outil technologique constituent encore un champ de controverse important vue les effets stratégiques qu’ils induisent et les apports culturels et scientifiques qu’ils engendrent. Les langues informatisées assurent en quelque sorte leurs pérennités. Sauf qu’à des strates plus évoluées, quand il ne s’agit plus de survie, c’est plutôt une question d’identité, de suprématie, voire même de dominance. La polémique pour nous n’est pas à ce niveau uniquement. Nous l’observons plutôt d’un point de vue essentiellement scientifique et technique pour établir un constat de l’internationalisation et de la localisation des outils et des systèmes d’information multilingues et voir à quel degré de compatibilité ils s’accordent avec les cultures et les langues locales. Nous prenons le contexte arabo-latin comme champs d’action spécifique pour l’évaluation des interfaces homme-machine multilingues comme vecteur de l’appropriation du savoir et de l’accès à la connaissance multilingue.

 

المستخلص

 

لا يزال اندماج اللغة و الثقافة مع العنصر التكنولوجي يمثل مجالا جدليا هاما نظرا للاعتبارات الإستراتيجية التي يثيرها و الأبعاد الثقافية و العلمية التي يوفرها. فاللغات المحوسبة تضمن استمراريتها بالعنصر التكنولوجي. غير أن الأمر يفوق ذلك بكثير إذا فاقت المسألة مفهوم الاستمرارية ليصبح الأمر متعلقا بمفهوم الهوية أو التفوق و حتى الهيمنة العالمية. غير أن المعضلة بالنسبة لنا لا تكمن في هذا البعد الإستراتيجي بقدر ما هي تتفاعل مع البعد العلمي و التقني بغية التوقف على ما وصلت إليه سياسات و برامج العولمة و المحلية  الإلكترونية للتطبيقات و البرامج و النظم المحوسبة متعددة اللغات و التمعن في مدى التطابق الحاصل بينها و بين اللغات و الثقافات المحلية. نأخذ لنا في هذا المجال المحيط اللغوي العربي  اللاتيني لمعاينة و تقييم واجهات التطبيقات المحوسبة متعددة اللغات كأداة فاعلة في امتلاك المعرفة و التمكن من المعلومات.

 

Introduction

 

J’ai voulu commencer cette intervention par une citation de Guy Bertrand, directeur scientifique de CEVEIL[1], « le multilinguisme sur Internet est la conséquence logique et naturelle de la diversité des populations humaines »[2].

 

J’éviterais de commencer, comme il est coutume de faire chaque fois que le thème des langues sur Internet est soulevé, de me lancer dans une discussion devenue obsolète, celle de l’hégémonie de la langue anglaise et de sa main mise sur le contexte Internet d’un point de vue outils, services et ressources. « Le tout anglais n’est pas une fatalité » le précise bien Bernard CASSEN[3].

 

Je voudrais plutôt aller dans le sens de la complémentarité et de la richesse culturelle et scientifique que devrait normalement engendrer le multilinguisme aujourd’hui quand il s’agit de l’appropriation du savoir et de l’accès à la connaissance.

 

De façon plus objective, abstraite ou concrète, le multilinguisme, par définition ou à travers les chiffres et les statistiques, est une réalité incontournable, présente et forte par les enjeux culturels, stratégiques voire même politiques qu’il engendre ; car les langues ne sachent  « se réduire à des simples instruments de communication extérieurs à la personnalité et à la culture des peuples, elles deviennent rapidement le symbole apparemment linguistique de la dominance politique, économique et sociale »[4].

 

Or, ce que l’on entend par multilinguisme dans sa forme la plus abstraite, surtout en traitement de l’information et de l’acquisition et de la diffusion du savoir, c’est la capacité d’accéder, d’utiliser et de communiquer de l’information dans les langues de l’émetteur (source) et celle du récepteur (lecteur) sans considérations du support technique. La perspective est idéaliste et l’objectif est noble si l’on ne considère pas deux facteurs essentiels : d’une part la profondeur de la diversité linguistique etd’autre part la complexité des outils à mettre en place pour garantir une transparence et une complémentarité tant voulues entre les langues et par conséquent entre les cultures du monde.

 

Il suffit de voir les statistiques rapportées par le Summer Institue of Linguistics[5] élaborées sur un total de 6703 langues du monde contemporains, pour se rendre compte de la grande diversité entre ces langues sur des plans géographiques, statuts sociaux, nombre de locuteurs ainsi que les paradoxes que suscitent les croisements de ces critères.

 

En définitive, le facteur du multilinguisme n’est pas aussi simple, ni banal comme certains veulent le démontrer, surtout si l’on considère, selon le Summer Institue of Linguistics que 91,2% des états du monde englobant autant de pourcentage de la population mondiale sont dans une situation de multilinguisme plus ou moins accentué. Des polémiques sont déjà posées :

 

 

Tous ces questionnements qui cachent des enjeux de tout ordre (culturel, économiques, politiques …) soulèvent indéniablement un autre questionnement important : quel rôle joue la technologie dans tout cela ?

 

Problématique :

 

Le questionnement qu’on essaie de soulever en général dans ce document est d’ordre socioculturel et plus particulièrement linguistique : dans la confluence de la grande multitude de langues qui caractérise la communauté humaine de notre temps, comment cette mondialisation gère ce phénomène multilingue pour asseoir le principe d’I18n au sein des modèles, des mécanismes et des outils technologiques qu’elle essaie de fournir sur une base d’équilibre et d’équité à toutes les identités socioculturelles et linguistiques présentes ? En d’autres termes, comment l’outil technologique, en tant que maître d’œuvre de cette mondialisation, a-t-il fait face à cette diversité pour satisfaire toutes les aspirations et répondre à toutes les attentes des communautés linguistiques du monde ?

 

Le travail dans cette étude de terrain focalise le concept du multilinguisme arabo-latin pour étudier les niveaux de concordance et les points de divergence entre les solutions technologiques proposées et les soubassements cognitifs et socioculturels des utilisateurs arabophones. L’état de la question constitue un complément expérimental à des études précédentes qui ont étudié la profondeur à laquelle la langue arabe a été prise en considération dans les solutions multilingues que la communauté internationale a mises à sa disposition.

 

En d’autres termes, nous essayons de mettre l’accent sur les rapports entre technologie et culture (à travers la langue) pour voir le rôle de complémentarité ou d’obstacle que joue l’un et l’autre dans l’affinité optimale de l’acquisition du savoir et l’accès à la connaissance.

 

La question qu’on se pose d’emblée :  le multiculturalisme et les NTICs sont-ils en symbiose ou au contraire ils sont en conflit ? La question semble être anodine et obsolète surtout aujourd’hui, là où l’on parle d’Unicode et de d’ISO 10646, du développement considérable de l’ingénierie linguistique et des systèmes experts, de la traduction en ligne t à la volée, bref de la désintégration progressive des barrières linguistiques.

 

La réponse par contre, n’est pas si évidente si on lui donne une dimension plus profonde de part et d’autre du facteur technologique et culturel et des points de rencontre qui les unissent sous forme d’interfaces électroniques d’accès et de communication de l’IST.

 

L’objectif direct de notre étude met en exergue cette forme de rapport à travers les interfaces homme-machine arabo-latines pour voir le degré de concordance entre LE technique universel de la machine et LE culturel local de l’utilisateur ; un croisement qui sera qualifié à travers les usages et l’interaction psycho-cognitives chez les utilisateurs multilingues.

 

1 – La dimension technologique du multilinguisme : le développement des outils

 

Les origines anglo-saxonnes de l’outil informatique des réseaux et des protocoles qui les gèrent étaient considérées pour longtemps une fatalité que le monde entier devait subir. Or, les champs de la recherche ont encore démontré que leurs limites sont vastes. On se souvient encore aujourd’hui, bien que cela ne soit pas très éloigné sur l’axe du temps, de nos frustrations devant l’impossibilité de lire ou d’écrire un diacritique ou tout un jeu de caractères en entier (scripts non latins) ou tout simplement à ne pas comprendre les commandes en langue anglaise d’un logiciel ou d’un message d’erreur quelconque. La progression du monolinguisme vers la multiplicité des langues a connu des étapes progressives. C’était d’abord une évolution vers les langues latines puis vers toutes les langues du monde ; le but étant de « permettre aux utilisateurs d’une langue non latine (arabe, perse, hébreu, chinois, etc.) d’accéder, dans leurs propres langues, à un système d’exploitation ou d’applicatif, et ceci en essayant de respecter une collection de normes, parfois insuffisants voire contradictoires »[6].

 

L’élément technologique dans cette dimension multilingue concerne essentiellement les applications et les protocoles des systèmes sur lesquels elles tournent. L’infrastructure informatique et des télécommunications n’est en fait qu’un outil véhiculaire. L’état de l’art démontre que « loin d’imposer une monoculture, l’informatique pouvait être, à condition que nous le voulions, un formidable outil de connaissance de la langue et de son traitement »[7].

 

En effet, quand on l’a voulu (pour des raisons diverses), le génie humain a trouvé la solution (bien qu’encore incomplète). Les acquis du multilinguisme au niveau applicatif sont désormais présents à travers les protocoles, les programmes et les normes qui délibèrent le contexte universel du monopole de la langue anglaise, pour asseoir une diversité linguistique relativement équilibrée : les extensions multilingues des techniques de codage, en l’occurrence Unicode et ISO 10646, l’internationalisation des langages de structuration des documents électroniques (SGML, HTML, XML etc.), l’internationalisation des protocoles de communication (MIME) n’en sont que témoins de cette volonté d’aller vers l’universel multilingue. Le chemin est encore long car il y a d’autres perspectives de développement vers une internationalisation plus exhaustive. Le cas tout particulier de l’internationalisation des noms des domaines sur Internet (DNS) est à titre d’exemple l’une des préoccupations de la communauté multilingue internationale. Déjà certaines langues non latines comme le chinois, ont déjà franchi ce pas. L’AINC (Arabic Internet Names Consortium[8]) est en train de faire des grands pas dans ce sens pour les langues basées sur le caractère arabe.

 

En définitive, il faut bien admettre que « la multiplication des langues présentes sur Internet est inévitable et ne peut que bénéficier aux échanges multiculturels. Pour que ces échanges prennent place dans un environnement optimal, il convient encore de développer des outils qui amélioreront les compatibilités »[9].

 

Marie Lebert[10] avance 5 critères essentiels pour garantir la percée multilingue des outils informatiques et la mise en place d’un Web multilingue :

 

1.       La popularisation des technologies de l’information. Ceci permettrait de sortir du carcan des élites techniciennes grâce aux interfaces graphiques et intuitives, d’échapper aux milieux élitistes des « haves » et atteindre les pouvoirs d’achat des « Have Nots », de se libérer des contraintes de l’ASCII anglo-saxon pour toucher une large panoplie de langues. L’outil informatique subira ainsi un effet de popularisation et d’universalité.

2.       La concurrence sur le marché mondial. La popularisation a engendré le phénomène de l’universalité, ce qui a impliqué à son tour un effet de marketing et de concurrence économique pour l’occupation des marchés mondiaux. La localisation des logiciels et du matériel s’est alors révélé comme un atout considérable dans cette course.

3.       Les innovations technologiques. L’adaptation progressive des outils en fonction des profils linguistiques de la communauté cible est un facteur de réussite. Unicode en est un exemple concret d’innovation qui a permis une extension massive de l’informatique dans des zones linguistiques initialement exclues par les limites linguistiques des outils informatiques d’antan : ASCII, ISO 8859-X.

4.       La démocratie linguistique. Le fait de faire de la langue anglaise une langue officielle et exclusive d’Internet, pour des raisons de primauté historique et frustrant à l’égard de ceux qui ne maîtrisent pas cette langue.

5.       Le commerce électronique. Tirant profit des systèmes ouverts des réseaux électroniques, la vente des produits et des services trouve sa voie vers internet. Les opérateurs économiques et les vendeurs doivent souvent faire usage des langues de leurs clients multilingues.

 

A ces 5 points nous rajoutons un élément fondamental à notre sens : le développement de l’ingénierie linguistique qui mettrait chaque langue dans le contexte global du multilinguisme universel pour s’ouvrir sur les autres cultures qui véhiculent actuellement le savoir scientifique et technologique. L’un des objectifs majeurs de l’ingénierie linguistique en termes d’accès à l’IST est de permettre la recherche et la récupération de l’information multilingue à partir d’un seul élément de formulation dans une seule langue. Tout utilisateur peut s’informer sur Internet sans que le facteur linguistique soit un obstacle dans l’accès à la connaissance même si elle est exprimée dans une autre langue que la sienne. Une ingénierie linguistique très lourde est alors à déployer pour accomplir les tâches intermédiaires de traduction, de traitement morphologique, d’analyse syntaxiques etc. Déjà des projets sont en cours, d’autres sont déjà en phase d’exploitation. Le MuST Multilingual Information Retrieval, Summerization and Translation System[11], est l’un de ces produits capables de rechercher en anglais sur un corpus de textes multilingues (anglais, japonais, arabe, espagnol, indonésien etc.).

 

2 – La dimension culturelle du multilinguisme

 

Si le volet technologique joue un rôle déterminant dans l’internationalisation des systèmes d’information et de communication planétaire, en amont de ce processus le facteur culturel est non moins important.

 

Les gens ont toujours tendance à écrire dans leurs propres langues pour des considérations diverses, conscientes ou inconscientes : commodité, discrétion, communications locales. Enfin de compte, la langue maternelle, comme le signale Michel Elie, « permet une finesse d’expression impossible dans une langue étrangère moins bien maîtrisée »[12].

 

Ce qui constitue un acteur de complexité important pour les écrits dans des langues minoritaires est leur intégration dans le réservoir de la connaissance humaine majoritairement codé et traité sur la base d’une codification et d’une représentation linguistique dominante. Or la popularisation d’Internet fait venir davantage d’usagers qui n’ont pas l’anglais ou le français comme langue maternelle. Ceux-ci acceptent de moins en moins la dépendance et la suprématie anglaise et tendront par conséquent à prévaloir leurs propres langues.

 

Nous touchons à ce niveau un élément associatif entre la culture et la langue ; celle-ci étant retenue par tous comme un vecteur culturel d’expression de l’identité. Le rapport est intrinsèque bien que d’autres facteurs démographiques, géographiques, économiques, politiques et idéologiques jouent un rôle fondamental dans le prestige d’une langue. D’ailleurs, on voit bien intervenir le rôle de ces considérations autres que culturelles dans l’échelle de la hiérarchie des langues les plus privilégiées (anglais, espagnol, français, russe, arabe). Le grand avantage est attribué à l’anglais grâce au nombre important de ses locuteurs (322 millions) ainsi qu’à sa primauté historique. Le français est moins important à cause du nombre réduit de ses locuteurs (72 millions). L’espagnol souffre des facteurs économiques et militaires. L’arabe subit pour sa part le retard dans la culture scientifique.

 

Cette association langue-culture va certainement avoir de l’impact considérable sur tout le mécanisme de l’appropriation du savoir et l’accès à la connaissance.

 

Ceci allait se refléter au niveau des mécanismes de communication de l’IST et tout particulièrement au niveau des interfaces homme-machine pour l’accès et la diffusion de l’IST.

 

C’est à ce niveau que  nous avançons le noyau central de notre intervention : à quel degré les IHM contribuent-elles dans le processus de l’appropriation du savoir ? Ont-elles un rôle dynamique ou plutôt contraignant dans ce processus ? Le cas présenté ici est celui du contexte arabo-latin tout particulièrement conditionné par deux facteurs essentiels que j’identifie sous le terme « Multilinguisme lourd » par opposition au multilinguisme souple (i.e. latin/latin). La particularité du multilinguisme lourd sont les deux caractéristiques du rendu graphique (polices de caractères) différent et la directionnalité diamétralement opposée des systèmes d’écriture et d’affichage. Si le multilinguisme latin dans les pays européens est beaucoup plus transparent qu’un multilinguisme arabo-latin, c’est largement tributaire de l’absence de ces deux critères (relative au niveau de quelques différences de glyphes). Où réside alors la polémique dans tout cela ?

 

Si l’on part du fait que « plusieurs pays en voie de développement se sont lancés dans des programmes gigantesques de modernisation linguistiques sans tenir compte des traditions et des sensibilités naturelles propres aux communautés linguistiques pluralistes »[13], on peut prévoir que dans la culture arabe orientaliste, un phénomène de discordance entre l’outil et la culture peut bien exister surtout que le phénomène multilingue est souvent hérité des périodes coloniales plutôt qu’un choix réfléchi et préparé. Une dialectique particulière peut alors exister entre le système (donc interface) et la culture (donc utilisateur).

 

A chacun ses origines et son référent : l’homme à dominance culturelle orientale (malgré son occidentalisation) face à la machine à dominance technologique occidentale (malgré son orientalisation). Le cognitif de l’homme fait face au procédural de la machine. La question est donc de savoir à quel degré d’adaptation les deux protagonistes parviennent-ils à créer l’harmonie du système d’information utilisé ; les solutions multilingues arabo-latines sont-elles greffées dans un univers qui apparemment les subit sans pouvoir les rejeter ou sont-elles au contraire introduites sur la base d’une équité objective entre les langues universelles ?

 

3 – L’enquête

 

A toutes ces questions correspondent des analyses et des commentaires qui se basent essentiellement sur un travail d’enquête menée auprès d’un échantillon d’individus particulièrement choisis parmi une tranche de population active, celle des jeunes en phases finales d’études ou en début de carrière professionnelle. L’objectif de ce choix est de cerner les aptitudes et les réactions cognitives d’une catégorie d’utilisateurs qui d’une part vit pleinement la métamorphose technologique de la société multilingue et qui d’autre part se confronte à une montée en valeur de la langue locale dans les milieux officiels de l’administration, de l’enseignement et des techniques. L’enquête a ciblé une centaine d’individus auxquels ont été soumises des situations problématiques de manipulation de plates-formes informatiques multilingues (arabo-française) dans l’objectif d’étudier deux phénomènes essentiels : d’une part l’interaction psycho-cognitive et culturelle de cette population cible avec un système informatique conçu et développé dans une dimension linguistique et culturelle autre, en l’occurrence occidentale ; et d’autre part le taux d’adéquation des solutions multilingues universelles (i.e. Microsoft) avec les caractéristiques phonologiques, morphologiques et syntaxiques propres à la langue locale.

 

3.1 Cadre général de lenquête :

 

L’enquête menée vise essentiellement d’étudier le concept de l’utilisabilité de la langue arabe au niveau des interfaces multilingues arabe/latin par une tranche de la population active tunisienne. L'objectif de ce questionnement est de soulever les problématiques des différentes formes d'inadaptation entre cette catégorie d'interfaces et les utilisateurs potentiels.

 

Nous avons été sensibles tout au long de nos travaux de recherche à l'absence d'une littérature abondante et spécialisée axée sur la culture informatique arabe ; sur le questionnement des solutions informatiques proposées actuellement comme consensus implicite et leur confrontation avec les standards de fait de la langue, de ses modes d'usage tels qu'ils sont culturellement établis dans la perception collective et cognitive de ses usagers potentiels.

 

Généralement conçues par des concepteurs étrangers à la langue ou du moins partiellement connaisseurs des règles linguistiques, calligraphiques et culturelles de la langue arabe, les IHM arabe/latin présentent à notre sens un degré assez important d'incohérence et d'inadéquation entre le système multilingue et l'utilisateur arabophone. Ces incohérences peuvent avoir à notre sens de grandes répercussions sur l'acceptabilité, l'utilisabilité et l'efficacité même de l'interface. Par la soumission de ces solutions ad hoc aux mécanismes linguistiques de fait et d'usage, nous soulèverons beaucoup d'anomalies dont certaines sont justifiées par le référent socioculturel des usagers et d'autres sont induites par l’influence et l’interférence de disciplines connexes (sociolinguistique, transfert de technologies, politiques culturelles...).

 

3.2 Contexte conceptuel de l’enquête

 

Le questionnaire est structuré en zones qui retracent les grands axes de l’expérience. Après un prélèvement des caractéristiques du profil du sujet d’un point de vue formation et maîtrise de l’environnement linguistique et informatique, le questionnaire prévoit une série de zones de difficultés qui ciblent successivement le paramétrage de l’interface bilingue et les modalités de saisie et d’organisation des contenus d’information bilingue.

 

Ces épreuves de difficultés ont été orientées sur quatre thèmes fondamentaux qui constituent la problématique fondamentale de l’interaction de l’utilisateur arabophone avec une interface bilingue comme conçue actuellement par Microsoft :

 

Caractères neutres et chiffres contextuels

 

Par caractères neutres il est fait référence aux caractères qui n'ont pas une directionnalité propre, et qui s'alignent par conséquent en fonction de la direction globale du texte. Les caractères neutres prennent les attributs des caractères qui les entourent et s'affiche donc dans une directionnalité relative. Les caractères neutres sont classés en trois catégories distinctes[[1]] : les symboles de ponctuation avec le caractère d'espacement et les paires de caractères symétriques, les chiffres et les séparateurs décimaux et enfin les symboles de traçage de lignes ou de boites.

 

Effet de Swapping sous MS Excel

Les chiffres constituent également un élément de difficulté majeure dans le processus de saisie et de traitement informatique. Même s'ils prennent la direction du mode maître actif, le mécanisme d’organisation interne des chiffres reste fidèle à la directionnalité gauche-droite définie par les algorithmes internes des machines ; ce qui rend leur traitement ambiguë dans un mode maître arabe à directionnalité Droite-Gauche

 

Incises et bris de texte : gestion Bidi

 

Les incises sont les textes dans une langue déterminée insérés au milieu d’un texte d’une langue différente. Le phénomène apparaît tout à fait normal entre deux écritures d’un alphabet commun et d’une directionnalité identique (i.e. Français, Anglais), mais il devient beaucoup plus complexe quand il s’agit d’alphabets de formes de caractères (glyphes) différents et de directionnalité opposée (i.e. Français, Arabe). Deux directions opposées, deux modes d'édition opposés, deux modes de justification opposés... sont d'ordre à rendre le traitement multilingue simultané quelque peu difficile.

 

Le pivotement sémantique des chiffres dans une suite arabe

L'exemple « A » illustre une incise arabe avec un bloc chiffré dans un mode maître latin qui inclut la même série de chiffres. La forme du curseur qui annonce la direction de la suite au niveau des chiffres relève que le mode d'affichage actif est un mode visuel.

 

Dans l'exemple « B », un espacement est introduit entre les trois derniers chiffres du nombre en mode latin. Le résultat est un décalage vers la droite des trois chiffres. La directionnalité gauche-droite des chiffres et des lettres reste ainsi intacte.

 

La même opération est effectuée sur le même nombre en mode arabe. Le résultat est un pivotement des trois chiffres isolés vers la gauche du bloc restant des chiffres.

 

L'explication de ce phénomène est l'insertion d'un caractère espace entre les chiffres. L'espace est un caractère neutre qui, une fois inséré, divise la chaîne des chiffres en deux blocs non contigus. En mode latin, les deux blocs résultants se suivent dans une orientation gauche-droite normale. En mode arabe, les deux blocs de chiffres séparés par l'espace inséré sont invertis pour respecter la directionnalité droite-gauche de l'incise arabe tout en gardant leur structure interne d'une directionnalité standard de gauche à droite.

 

L'exemple « C » présente une segmentation en plus du bloc de chiffres. Si la linéarité est sauvegardée en mode latin, le mode arabe force une inversion supplémentaire pour rejeter le nouveau bloc de chiffres à gauche de la suite chiffrée.

 

Sélection de texte, modes logique et visuel

 

La sélection de texte dans un document multilingue constitue également une complexité souvent incompréhensible par l’utilisateur. Un texte bilingue dans lequel s’associent les bris de texte, les bris des chiffres, les caractères neutres etc. est parfois un calvaire pour un utilisateur profane qui n’a aucune idée sur le fonctionnement interne du système qu’il est en train d’utiliser.

 

 

Unicité directionnelle Gauche à Droite des chiffres en MML

L’une des constantes du traitement informatique des données est l’unicité directionnelle des chiffres de gauche à droite (GAD) dans les deux modes maîtres arabe et latin. D’emblée, cette unicité directionnelle des chiffres est en faveur du texte latin qui constituerait ainsi un prolongement directionnel uniforme de l’acte graphique ou de traitement. Ce qui n’est pas le cas pour le texte arabe qui doit dans ce cas de figure traiter les chiffres d’une manière opposée à sa direction normale de droite à gauche (DAG). Ainsi, dans l’exemple suivant édité en mode maître latin, les chiffres gardent leur unicité directionnelle. Une opération de sélection serait plus compliquée du coté du texte arabe que celui du latin.

 

Conversion, sauvegarde et formats des fichiers

 

L’autre aspect de complexité de l’usage des textes arabes est la diversité des formats de sauvegarde des données. Bien que ce soit un phénomène général qui dépend de tout utilisateur sans considération du support linguistique, la langue arabe fait intervenir dans ce contexte une exception particulière due à la diversité des codes de formatage des documents. Les utilisateurs ont toujours tendance à sauvegarder leurs fichiers dans le format standard proposé par le logiciel utilisé ; en l’occurrence le format Word. Or ce format résulte inadéquat si le texte est prévu pour être échangé sur Internet, envoyé dans une base de données tournant sous un environnement DOS, ou tout simplement pour être utilisé par un autre logiciel (i.e. Word Perfect) ou une autre plate-forme (i.e. Macintosh ou Unix). Certes, les filtres de conversion sont opérationnels du coté de la source ou de la destination, mais il est toujours recommandé de créer à la source des documents adaptés (ou portables) par défaut à toute alternatives de changement de plate-forme ou d’application. Cet aspect reste également énormément inexploré par une grande marge d’utilisateurs.

 

Les différents formats de sauvegarde d’un texte arabe sous Windows

 

3.3 Le constat

 

Caractères neutres et chiffres contextuels :

 

Il a été demandé au sujet de rédiger le paragraphe suivant sur une plate-forme multilingue avec un menu latin et une directionnalité de départ Droite – Gauche.

 

 

Mon numéro de téléphone portable est 9123456. Il constitue 71,3 % de mes frais de communication. Son code d’ouverture est 123BT ou 123بت.

رقم هاتفي الجوال 9123456. وهو يمثل 71،3 ٪ من تكاليف اتصالاتي الهاتفية. شفرة استخدامه هي 123BT أو 123بت.

 

Il a été reporté dans l’exemple du texte Bidi précédent qu’au niveau du code du téléphone dans le texte latin (123بت), 94% des sujets ont tapé les 2 lettres arabes avant les chiffres. Une déduction principale en découle : le phénomène de la bidirectionnalité sémantique n’est pas implicite chez le interviewés sinon ils auraient implicitement déduit que le code est une unité sémantique arabe, donc soumise à une directionnalité Droite-Gauche. Ceci se confirme avec la partie opposée de l’exemple : au niveau du code du téléphone dans le texte arabe (123BT), 62% des sujets ont tapé les 2 lettres latines après les chiffres. L’explication plausible ne peut être que le déclenchement du processus cognitif chez les sujets à partir de l’exemple précédent pour tenir compte de la bidirectionnalité sémantique. 

 

La difficulté majeure dans cet exercice était sans doute le pivotement des chiffres à cause des caractères neutres. Nous avons demandé aux sujets de séparer les blocs du numéro de téléphone par un tiret après le chiffre 9 et un point entre les chiffres 123 et 456 afin de lui donner l’apparence d’un numéro de téléphone avec un indicatif et deux blocs de trois chiffres. Si l’opération s’est déroulée convenablement dans le texte latin, c’est parce que les chiffres ont une directionnalité absolue de Gauche à Droite. L’insertion des caractères neutres comme le tiret ou le point n’a eu aucun effet sur la directionnalité des chiffres qui reste ainsi conforme à celle du texte latin. Par contre, dans le texte arabe, le tiret derrière le chiffre 9 fait pivoter ce dernier à droite du reste des chiffres le traitant ainsi comme un bloc de chiffres indépendant du reste. Le point entre 123 et 456 engendre aussi un effet de pivotement (Swapping) pour les convertir en 456.123. C’est à ce niveau que nous avons voulu voir l’attitude des sujets pour essayer de garder la valeur réelle du numéro de téléphone tout en le séparant en blocs comme prévu. Nous avons observé que pour s’y faire, 48% ont essayé de changer de langue active ; 20% ont essayé vainement la fonction « couper/coller » et 9% seulement ont essayé de réécrire le chiffre formaté en mode maître latin. Ce qui est notoire cependant c’est que 67% d’entre eux n’ont réussi à bien faire la modification qu’à la quatrième tentative. Toutefois 10% seulement ont réussi la transformation dès le premier coup.

 

Une fois de plus, cet exemple confirme l’ignorance totale des sujets des valeurs directionnelles des chiffres et des caractères neutres dans un environnement bilingue. Ceci dénote d’une  interactivité surfacique entre l’utilisateur et la machine qui se limite à un niveau d’interactivité visuelle simpliste.

 

Incises et bris de textes

 

L’expérience a continué en deuxième phase avec les difficultés Bidi des incises et des bris de textes bilingues. Les deux situations suivantes leurs ont été proposées : insérer un texte arabe dans un texte latin.

 

 

Les textes multilingues présentent des difficultés de direction et d’affichage. تشكل النصوص متعددة اللغات إشكاليتين تتعلق باتجاه الكتابة و بأشكال محارفها.

 

Et insérer un texte latin dans un texte arabe.

 

 

إن القراءة  الآلية للحروف العربية لا تزال تشكل عائقا كبيرا لبرامج إنشاء المكتبات الافتراضية.La reconnaissance optique des caractères constitue encore un problème majeur pour les projets des bibliothèques virtuelles.

 

 

La série d’expériences menées pour analyser les réactions de sujets au moment des insertions ou des bris des textes a démontré qu’à ce niveau, il y a une uniformité de comportement. La question était de savoir si dans les deux cas de figures, les sujets allaient d’une part changer de mode maître actif ou rester au mode maître initial pour ajouter l’incise et d’autre part essayer d’aligner le bris selon sa directionnalité d’origine. Les statistiques se rapprochent beaucoup dans ce sens bien qu’elles divisent en deux le nombre des personnes agissant de manières opposées. Ceci met davantage en doute la clarté de la bidirectionnalité graphique dans le mental des sujets.

 

3.2.3 Sélection de texte : mode logique et mode visuel

 

La sélection du texte constitue aussi une difficulté majeure pour les utilisateurs des interfaces bilingues car elle met en pratique un traitement bilingue interne dans les registres de la mémoire de la machine (mode logique) opposé à l’effet qu’elle donne au niveau de l’interface utilisateur (mode visuel).

 

Pour mener cette expérience, nous avons commencé par demander aux sujets la rédaction du  texte bilingue suivant composé de chiffres et de lettres dans les deux alphabets arabe et latin sans aucune spécification préalable de l’environnement de travail.

 

رقم الهاتف : 123456 Le numéro de téléphone est : 123456

 

L’observation a donné lieu à un chiffre surprenant : dans 78% des cas, les sujets ont commencé la rédaction du texte avec les chiffres de gauche. 

 

Le cas est surprenant car il confirme définitivement que l’analyse sémantique du texte au moment de la rédaction est quasi-absente du mental des utilisateurs. C’est le visuel graphique qui domine le psycho-cognitif de l’utilisateur au moment de la rédaction. Ce que nous n’avons pas prévu de confirmer c’est si ce phénomène est exclusif à la bidirectionnalité de l’écrit ou s’il est unanime pour toutes les langues.

 

Or, le deuxième exercice confirme une grande partie de cette constatation. Nous avons demandé aux sujets de faire une sélection à la souris de la partie arabe du texte. 54% ont commencé à partir du premier caractère arabe tout en évoluant vers la gauche ; 34% ont commencé la sélection à partir du chiffre 1 dans la partie arabe. Le premier chiffre confirme le mécanisme de l’apprentissage et de l’éveil des facultés cognitives à partir d’expériences précédentes pour se mettre en position de veille et par conséquent renforcer l’analyse sémantique chez les sujets. Le deuxième chiffre reproduit par contre le modèle de la mémoire visuelle graphique ancrée chez certains dans leur interactivité avec le texte Bidi. Les deux cas ne font que démontrer une fois de plus que les principes de fonctionnement des systèmes bidirectionnels restent très flous dans le psychocognitif des sujets échantillons de notre enquête.

 

3.2.4 Le formatage et la sauvegarde des fichiers

 

A la fin de notre enquête, nous avons voulu confirmer les pronostics que nous avons envisagés par une question d’ordre plutôt technique que psychocognitive. Nous avons demandé la sauvegarde du travail réalisé par le sujet en format texte pour savoir à quelle profondeur il dispose d’une culture des systèmes informatiques qu’il utilise. C’était prévu comme complément à la première partie d’évaluation de sa propre maîtrise de l’interface bilingue qu’il utilise. Notre doute était bien fondé car la culture informatique des sujets au niveau système est beaucoup plus pauvre.

 

22% n’ont pas compris la question du tout. Pour eux sauvegarder un texte sous Word consiste à suivre la commande « Enregistrer Sous » puis à spécifier un nom.  Déjà 6% d’entre eux n’ont aucune idée sur l’usage de la zone « Type de fichier » dans la fenêtre de sauvegarde. 44% ont choisi le mode Texte sans se soucier des autres modes texte comme « Texte MS-DOS », « Texte avec saut de ligne » etc.

 

Quand nous avons demandé de sauvegarder en « Mode Texte » dans l’une des pages de codes appropriées à la langue arabe (i.e. ISO 709, ISO 720, ASMO 449 etc.), 96% nous ont regardé de travers, 4% ont essayé sans pouvoir trouver l’astuce.

 

 

Conclusion

 

Parmi les éléments que cette enquête a pu fournir pour argumenter les aboutissements de l’étude analytique citée portant sur ce même thème, nous analysons les deux points suivants :

 

  1. Les utilisateurs d’un environnement bilingue arabe-latin sont généralement soumis à un phénomène de perte de repères linguistiques et culturels devant une interface bilingue. La population cible, choisie pour mener cette enquête, constitue en fait un maillon social transitoire entre deux époques et deux générations de dominances culturelles différentes. Après une époque durant laquelle la langue française était une langue de culture et d’enseignement, les nouvelles générations subissent un phénomène d’arabisation massive des enseignements et une hybridation intense des langages de communication. Pris entre deux courants linguistiques mal entretenus, cette tranche de la population a perdu les performances linguistiques des ressortissants des écoles françaises du début du siècle et la notoriété culturelle arabe des érudits et des ulémas zeitouniens. Nous avons pu observer dans cette enquête le phénomène de l’apprentissage « à la carte » que subit un sujet sur une zone de difficulté pour savoir traiter une difficulté similaire suivante. Ceci démontre une absence d’un référentiel culturel ou linguistique qui opère instinctivement pour la résolution des situations bilingues.

 

  1. L’approche des outils proposés pour le traitement bilingue est aussi une partie prenante dans la désorientation des sujets soumis à l’enquête : nous avons pu constater que toutes les solutions bilingues s’accordent sur le traitement Gauche-droite des chiffres sans considération du mode maître actif. Ceci contredit à la source la structure interne des chiffres qui évoluent normalement de Droite à Gauche  dans leur traitement arithmétique (unités, dizaines, centaines etc.), leurs modes de prononciation en arabe littéraire (unités, dizaines, centaines etc.) et par conséquent leur mode de transcription qui doit suivre cette directionnalité originelle (unités, dizaines, centaines etc.). Toute l’histoire cette confusion dans le traitement des chiffres est que le système décimal, mis au point par les hindous et repris par les Arabes dans une directionnalité Droite-Gauche à été repris par les occidentaux qui l’ont adapté à leur directionnalité Gauche-Droite et qui nous l’ont retransmis tel-quel. Au lieu de remettre le mécanisme des chiffres dans ses formes d’origine pour correspondre à notre langue arabe, nous avons repris le système doublement transformé ; ce qui engendre automatiquement l’effet de pivotement (Swapping)  et la non contiguïté des zones de sélection des textes bilingues qui perturbent le confort des utilisateurs dans leur interaction avec les interfaces bilingues.

 

La morale de l’histoire dans cette polémique d’interfaces bilingues et du rôle attribué à la langue arabe dans l’accès et la diffusion de l’information locale est beaucoup plus profonde qu’elle n’en a l’air. Nous la situons déjà dans un domaine de recherche fondamentale plutôt que dans la recherche appliquée. Peu s’interrogent en réalité sur cette problématique car déjà les solutions pour la manipulation de la langue arabe existent déjà. Nous étions intrigués dans notre questionnement de ce problème d’interfaces par l’inadéquation et la non-conformité de ces solutions avec les exigences linguistiques et culturelles de la langue arabe. Or par la simple observation de deux facteurs fondamentaux technique et économique, il est possible de s’arrêter sur les origines du problème et de la nécessité d’opter pour une alternative radicale.

 

Le facteur technique se résume dans le positionnement secondaire de la langue arabe dans toutes les tables de codes des systèmes informatiques du monde : ISO 8859-6, rangée 6 du BMP d’Unicode, etc. face à une domination des caractères latins (et particulièrement anglo-saxons) qui se positionnent en tête de liste et par conséquent restent omniprésents dans toutes les solutions informatiques mêmes universalistes (Unicode et ISO 10646).

 

Le facteur commercial est bien évident à travers les gourous de l’informatique mondiale comme Microsoft, qui par un phénomène d’économie d’échelle parviennent à dominer le monde par leurs solutions informatiques qui parfois ne correspondent pas aux réalités et culturelles des zones linguistiques concernées. La littérature spécialisée a toujours parlé de solutions ici et là développées par des PME qui proposent des alternatives d’arabisation. Seulement, même si elles peuvent apporter des solutions plus proches de la réalité linguistique concernée, elles ont beaucoup de difficulté, voire même il leur est impossible, d’entrer dans une logique de concurrence commerciale avec les barons du logiciel et des systèmes informatiques du marché mondial.

 

La langue arabe et sa présence dans le contexte informatique international dépendront à notre sens des apports de la recherche fondamentale qui orientera la recherche appliquée vers des solutions plus souples. Elle dépendra aussi d’une prédisposition socioculturelle à renforcer le rôle de la langue arabe au niveau de l’enseignement et des usages.

 


 

Notes



[1] Microsoft MS DOS User's Guide : Arabic Supplement. Microsoft Corporation, 1988. p.18



[1] http://ceveil.qc.cq/

[2] LEBERT Marie. Le Multilinguisme sur le Web. http://www.ceveil.qc.ca/multifr2.htm. Visité le 20 septembre 2001.

[3] CASSEN Bernard. Le Tout-anglais n'est pas une fatalité. Le Monde Diplomatique : Manière de voir, octobre 1996, pp.81-82

[4] Le Multilinguisme : une source de conflit. http://www.ciral.ulaval.ca/alx/amlxmonde/Langues/3cohabitation_sources_conflits.htm Visité le 20 septembre 2001.

[5] Summer Institute Of Linguistics. http://

[6] Le Multilinguisme en traitement de l’information. http://www.shadid.com/html/multilinguisme.html. Visité le 20 septembre 2001.

[7] HERNANDEZ Jean-Alain. Internet et le multilinguisme. http://www.bibliotheque.refer.org/biennale95/hernan.htm. Visité le 20 septembre 2001

[8] Arabic Intenet Names Consortium. http://www.arabicdomainname.com/ (visité le 15 juillet 2001)

[9] LEBERT Marie. Le Multilinguisme sur le Web. Op. Cit.

[10] LEBERT Marie. Le Multilinguisme sur le Web. Op. Cit.

[11] MuST Multilingual Information Retrieval, Summarization, and Translation System. http://www.isi.edu/~cyl/must/must_prototype.htm Visité le 10 juin 2001

[12] ELIE Michel. Pour le multilinguisme sur lnternet. Le Monde Interactif. Mercredi 21 février 2001. http://interactif.lemonde.fr/article/0,5611,3044--148967-0,FF.html. Visité le 20 juin 2001.

[13] Le Multilinguisme : une source de conflit. Op. cit.