Agence Universitaire de la Francophonie
INITIATIVES 2001
Colloque « Ethique et nouvelles technologies, l’appropriation des savoirs en question »
Les 25 et 26 septembre 2001, à Beyrouth (Liban)
L’appropriation
du savoir dans les cultures multilingues : le dilemme des interfaces
homme-machine franco-arabes
Mokhtar BEN HENDA
ISD, Université La Manouba, TUNISIE
CEM-GRESIC, Université Bordeaux 3, France
Mokhtar.Benhenda@isd.rnu.tn
Langues et cultures associées à l’outil technologique constituent encore un champ de controverse important vue les effets stratégiques qu’ils induisent et les apports culturels et scientifiques qu’ils engendrent. Les langues informatisées assurent en quelque sorte leurs pérennités. Sauf qu’à des strates plus évoluées, quand il ne s’agit plus de survie, c’est plutôt une question d’identité, de suprématie, voire même de dominance. La polémique pour nous n’est pas à ce niveau uniquement. Nous l’observons plutôt d’un point de vue essentiellement scientifique et technique pour établir un constat de l’internationalisation et de la localisation des outils et des systèmes d’information multilingues et voir à quel degré de compatibilité ils s’accordent avec les cultures et les langues locales. Nous prenons le contexte arabo-latin comme champs d’action spécifique pour l’évaluation des interfaces homme-machine multilingues comme vecteur de l’appropriation du savoir et de l’accès à la connaissance multilingue.
لا
يزال اندماج
اللغة و
الثقافة مع
العنصر التكنولوجي
يمثل مجالا
جدليا هاما
نظرا للاعتبارات
الإستراتيجية
التي يثيرها و
الأبعاد الثقافية
و العلمية
التي يوفرها.
فاللغات المحوسبة
تضمن
استمراريتها
بالعنصر
التكنولوجي.
غير أن الأمر
يفوق ذلك
بكثير إذا فاقت
المسألة
مفهوم
الاستمرارية
ليصبح الأمر متعلقا
بمفهوم
الهوية أو
التفوق و حتى
الهيمنة
العالمية. غير
أن المعضلة
بالنسبة لنا
لا تكمن في
هذا البعد
الإستراتيجي
بقدر ما هي
تتفاعل مع
البعد العلمي
و التقني بغية
التوقف على ما
وصلت إليه
سياسات و
برامج
العولمة و
المحلية
الإلكترونية
للتطبيقات و
البرامج و
النظم
المحوسبة
متعددة
اللغات و
التمعن في مدى
التطابق
الحاصل بينها
و بين اللغات
و الثقافات
المحلية. نأخذ
لنا في هذا
المجال المحيط
اللغوي
العربي
اللاتيني
لمعاينة و
تقييم واجهات
التطبيقات
المحوسبة
متعددة اللغات
كأداة فاعلة
في امتلاك
المعرفة و
التمكن من
المعلومات.
J’ai
voulu commencer cette intervention par une citation de Guy Bertrand, directeur
scientifique de CEVEIL[1], « le multilinguisme sur Internet est
la conséquence logique et naturelle de la diversité des populations
humaines »[2].
J’éviterais
de commencer, comme il est coutume de faire chaque fois que le thème des
langues sur Internet est soulevé, de me lancer dans une discussion devenue
obsolète, celle de l’hégémonie de la langue anglaise et de sa main mise sur le
contexte Internet d’un point de vue outils, services et ressources. « Le
tout anglais n’est pas une fatalité » le précise bien Bernard CASSEN[3].
Je
voudrais plutôt aller dans le sens de la complémentarité et de la richesse
culturelle et scientifique que devrait normalement engendrer le multilinguisme
aujourd’hui quand il s’agit de l’appropriation du savoir et de l’accès à la
connaissance.
De
façon plus objective, abstraite ou concrète, le multilinguisme, par définition
ou à travers les chiffres et les statistiques, est une réalité incontournable,
présente et forte par les enjeux culturels, stratégiques voire même politiques
qu’il engendre ; car les langues ne sachent « se
réduire à des simples instruments de communication extérieurs à la personnalité
et à la culture des peuples, elles deviennent rapidement le symbole apparemment
linguistique de la dominance politique, économique et sociale »[4].
Or,
ce que l’on entend par multilinguisme dans sa forme la plus abstraite, surtout
en traitement de l’information et de l’acquisition et de la diffusion du
savoir, c’est la capacité d’accéder, d’utiliser et de communiquer de
l’information dans les langues de l’émetteur (source) et celle du récepteur
(lecteur) sans considérations du support technique. La perspective est
idéaliste et l’objectif est noble si l’on ne considère pas deux facteurs
essentiels : d’une part la profondeur de la diversité linguistique
etd’autre part la complexité des outils à mettre en place pour garantir une
transparence et une complémentarité tant voulues entre les langues et par
conséquent entre les cultures du monde.
Il
suffit de voir les statistiques rapportées par le Summer Institue of
Linguistics[5] élaborées sur un total de 6703 langues du
monde contemporains, pour se rendre compte de la grande diversité entre ces
langues sur des plans géographiques, statuts sociaux, nombre de locuteurs ainsi
que les paradoxes que suscitent les croisements de ces critères.
En
définitive, le facteur du multilinguisme n’est pas aussi simple, ni banal comme
certains veulent le démontrer, surtout si l’on considère, selon le Summer
Institue of Linguistics que 91,2% des états du monde englobant autant de
pourcentage de la population mondiale sont dans une situation de multilinguisme
plus ou moins accentué. Des polémiques sont déjà posées :
Tous
ces questionnements qui cachent des enjeux de tout ordre (culturel,
économiques, politiques …) soulèvent indéniablement un autre questionnement
important : quel rôle joue la technologie dans tout cela ?
Le
questionnement qu’on essaie de soulever en général dans ce document est d’ordre
socioculturel et plus particulièrement linguistique : dans la confluence
de la grande multitude de langues qui caractérise la communauté humaine de
notre temps, comment cette mondialisation gère ce phénomène multilingue pour
asseoir le principe d’I18n au sein des modèles, des mécanismes et des outils
technologiques qu’elle essaie de fournir sur une base d’équilibre et d’équité à
toutes les identités socioculturelles et linguistiques présentes ? En
d’autres termes, comment l’outil technologique, en tant que maître d’œuvre de
cette mondialisation, a-t-il fait face à cette diversité pour satisfaire toutes
les aspirations et répondre à toutes les attentes des communautés linguistiques
du monde ?
Le
travail dans cette étude de terrain focalise le concept du multilinguisme
arabo-latin pour étudier les niveaux de concordance et les points de divergence
entre les solutions technologiques proposées et les soubassements cognitifs et
socioculturels des utilisateurs arabophones. L’état de la question constitue un
complément expérimental à des études précédentes qui ont étudié la profondeur à
laquelle la langue arabe a été prise en considération dans les solutions
multilingues que la communauté internationale a mises à sa disposition.
En
d’autres termes, nous essayons de mettre l’accent sur les rapports entre
technologie et culture (à travers la langue) pour voir le rôle de
complémentarité ou d’obstacle que joue l’un et l’autre dans l’affinité optimale
de l’acquisition du savoir et l’accès à la connaissance.
La
question qu’on se pose d’emblée :
le multiculturalisme et les NTICs sont-ils en symbiose ou au contraire
ils sont en conflit ? La question semble être anodine et obsolète surtout
aujourd’hui, là où l’on parle d’Unicode et de d’ISO 10646, du développement
considérable de l’ingénierie linguistique et des systèmes experts, de la
traduction en ligne t à la volée, bref de la désintégration progressive des
barrières linguistiques.
La
réponse par contre, n’est pas si évidente si on lui donne une dimension plus
profonde de part et d’autre du facteur technologique et culturel et des points
de rencontre qui les unissent sous forme d’interfaces électroniques d’accès et
de communication de l’IST.
L’objectif
direct de notre étude met en exergue cette forme de rapport à travers les
interfaces homme-machine arabo-latines pour voir le degré de concordance entre
LE technique universel de la machine et LE culturel local de
l’utilisateur ; un croisement qui sera qualifié à travers les usages et
l’interaction psycho-cognitives chez les utilisateurs multilingues.
Les
origines anglo-saxonnes de l’outil informatique des réseaux et des protocoles
qui les gèrent étaient considérées pour longtemps une fatalité que le monde
entier devait subir. Or, les champs de la recherche ont encore démontré que
leurs limites sont vastes. On se souvient encore aujourd’hui, bien que cela ne
soit pas très éloigné sur l’axe du temps, de nos frustrations devant
l’impossibilité de lire ou d’écrire un diacritique ou tout un jeu de caractères
en entier (scripts non latins) ou tout simplement à ne pas comprendre les
commandes en langue anglaise d’un logiciel ou d’un message d’erreur quelconque.
La progression du monolinguisme vers la multiplicité des langues a connu des
étapes progressives. C’était d’abord une évolution vers les langues latines
puis vers toutes les langues du monde ; le but étant de « permettre
aux utilisateurs d’une langue non latine (arabe, perse, hébreu, chinois, etc.)
d’accéder, dans leurs propres langues, à un système d’exploitation ou
d’applicatif, et ceci en essayant de respecter une collection de normes,
parfois insuffisants voire contradictoires »[6].
L’élément
technologique dans cette dimension multilingue concerne essentiellement les
applications et les protocoles des systèmes sur lesquels elles tournent.
L’infrastructure informatique et des télécommunications n’est en fait qu’un
outil véhiculaire. L’état de l’art démontre que « loin d’imposer une
monoculture, l’informatique pouvait être, à condition que nous le voulions, un
formidable outil de connaissance de la langue et de son traitement »[7].
En
effet, quand on l’a voulu (pour des raisons diverses), le génie humain a trouvé
la solution (bien qu’encore incomplète). Les acquis du multilinguisme au niveau
applicatif sont désormais présents à travers les protocoles, les programmes et
les normes qui délibèrent le contexte universel du monopole de la langue
anglaise, pour asseoir une diversité linguistique relativement
équilibrée : les extensions multilingues des techniques de codage, en l’occurrence
Unicode et ISO 10646, l’internationalisation des langages de structuration des
documents électroniques (SGML, HTML, XML etc.), l’internationalisation des
protocoles de communication (MIME) n’en sont que témoins de cette volonté
d’aller vers l’universel multilingue. Le chemin est encore long car il y a
d’autres perspectives de développement vers une internationalisation plus
exhaustive. Le cas tout particulier de l’internationalisation des noms des
domaines sur Internet (DNS) est à titre d’exemple l’une des préoccupations de
la communauté multilingue internationale. Déjà certaines langues non latines
comme le chinois, ont déjà franchi ce pas. L’AINC (Arabic Internet Names
Consortium[8])
est en train de faire des grands pas dans ce sens pour les langues basées sur
le caractère arabe.
En
définitive, il faut bien admettre que « la multiplication des langues
présentes sur Internet est inévitable et ne peut que bénéficier aux échanges
multiculturels. Pour que ces échanges prennent place dans un environnement optimal,
il convient encore de développer des outils qui amélioreront les compatibilités »[9].
Marie
Lebert[10]
avance 5 critères essentiels pour garantir la percée multilingue des outils
informatiques et la mise en place d’un Web multilingue :
1.
La popularisation des
technologies de l’information. Ceci permettrait de sortir du carcan des élites
techniciennes grâce aux interfaces graphiques et intuitives, d’échapper aux
milieux élitistes des « haves » et atteindre les pouvoirs d’achat des
« Have Nots », de se libérer des contraintes de l’ASCII anglo-saxon
pour toucher une large panoplie de langues. L’outil informatique subira ainsi
un effet de popularisation et d’universalité.
2.
La concurrence sur le
marché mondial. La popularisation a engendré le phénomène de l’universalité, ce
qui a impliqué à son tour un effet de marketing et de concurrence économique
pour l’occupation des marchés mondiaux. La localisation des logiciels et du
matériel s’est alors révélé comme un atout considérable dans cette course.
3.
Les innovations technologiques.
L’adaptation progressive des outils en fonction des profils linguistiques de la
communauté cible est un facteur de réussite. Unicode en est un exemple concret
d’innovation qui a permis une extension massive de l’informatique dans des
zones linguistiques initialement exclues par les limites linguistiques des
outils informatiques d’antan : ASCII, ISO 8859-X.
4.
La démocratie
linguistique. Le fait de faire de la langue anglaise une langue officielle et
exclusive d’Internet, pour des raisons de primauté historique et frustrant à
l’égard de ceux qui ne maîtrisent pas cette langue.
5.
Le commerce
électronique. Tirant profit des systèmes ouverts des réseaux électroniques, la
vente des produits et des services trouve sa voie vers internet. Les opérateurs
économiques et les vendeurs doivent souvent faire usage des langues de leurs
clients multilingues.
A
ces 5 points nous rajoutons un élément fondamental à notre sens : le
développement de l’ingénierie linguistique qui mettrait chaque langue dans le
contexte global du multilinguisme universel pour s’ouvrir sur les autres
cultures qui véhiculent actuellement le savoir scientifique et technologique.
L’un des objectifs majeurs de l’ingénierie linguistique en termes d’accès à
l’IST est de permettre la recherche et la récupération de l’information
multilingue à partir d’un seul élément de formulation dans une seule langue.
Tout utilisateur peut s’informer sur Internet sans que le facteur linguistique
soit un obstacle dans l’accès à la connaissance même si elle est exprimée dans
une autre langue que la sienne. Une ingénierie linguistique très lourde est
alors à déployer pour accomplir les tâches intermédiaires de traduction, de
traitement morphologique, d’analyse syntaxiques etc. Déjà des projets sont en
cours, d’autres sont déjà en phase d’exploitation. Le MuST Multilingual
Information Retrieval, Summerization and Translation System[11],
est l’un de ces produits capables de rechercher en anglais sur un corpus de
textes multilingues (anglais, japonais, arabe, espagnol, indonésien etc.).
Si
le volet technologique joue un rôle déterminant dans l’internationalisation des
systèmes d’information et de communication planétaire, en amont de ce processus
le facteur culturel est non moins important.
Les
gens ont toujours tendance à écrire dans leurs propres langues pour des
considérations diverses, conscientes ou inconscientes : commodité,
discrétion, communications locales. Enfin de compte, la langue maternelle,
comme le signale Michel Elie, « permet une finesse d’expression
impossible dans une langue étrangère moins bien maîtrisée »[12].
Ce
qui constitue un acteur de complexité important pour les écrits dans des
langues minoritaires est leur intégration dans le réservoir de la connaissance
humaine majoritairement codé et traité sur la base d’une codification et d’une
représentation linguistique dominante. Or la popularisation d’Internet fait
venir davantage d’usagers qui n’ont pas l’anglais ou le français comme langue
maternelle. Ceux-ci acceptent de moins en moins la dépendance et la suprématie
anglaise et tendront par conséquent à prévaloir leurs propres langues.
Nous
touchons à ce niveau un élément associatif entre la culture et la langue ;
celle-ci étant retenue par tous comme un vecteur culturel d’expression de
l’identité. Le rapport est intrinsèque bien que d’autres facteurs
démographiques, géographiques, économiques, politiques et idéologiques jouent
un rôle fondamental dans le prestige d’une langue. D’ailleurs, on voit bien intervenir
le rôle de ces considérations autres que culturelles dans l’échelle de la
hiérarchie des langues les plus privilégiées (anglais, espagnol, français,
russe, arabe). Le grand avantage est attribué à l’anglais grâce au nombre
important de ses locuteurs (322 millions) ainsi qu’à sa primauté historique. Le
français est moins important à cause du nombre réduit de ses locuteurs (72
millions). L’espagnol souffre des facteurs économiques et militaires. L’arabe
subit pour sa part le retard dans la culture scientifique.
Cette
association langue-culture va certainement avoir de l’impact considérable sur
tout le mécanisme de l’appropriation du savoir et l’accès à la connaissance.
Ceci
allait se refléter au niveau des mécanismes de communication de l’IST et tout particulièrement
au niveau des interfaces homme-machine pour l’accès et la diffusion de l’IST.
C’est
à ce niveau que nous avançons le noyau
central de notre intervention : à quel degré les IHM contribuent-elles
dans le processus de l’appropriation du savoir ? Ont-elles un rôle
dynamique ou plutôt contraignant dans ce processus ? Le cas présenté ici
est celui du contexte arabo-latin tout particulièrement conditionné par deux
facteurs essentiels que j’identifie sous le terme « Multilinguisme
lourd » par opposition au multilinguisme souple (i.e. latin/latin). La
particularité du multilinguisme lourd sont les deux caractéristiques du rendu
graphique (polices de caractères) différent et la directionnalité
diamétralement opposée des systèmes d’écriture et d’affichage. Si le
multilinguisme latin dans les pays européens est beaucoup plus transparent
qu’un multilinguisme arabo-latin, c’est largement tributaire de l’absence de
ces deux critères (relative au niveau de quelques différences de glyphes). Où
réside alors la polémique dans tout cela ?
Si
l’on part du fait que « plusieurs pays en voie de développement se sont
lancés dans des programmes gigantesques de modernisation linguistiques sans
tenir compte des traditions et des sensibilités naturelles propres aux communautés
linguistiques pluralistes »[13],
on peut prévoir que dans la culture arabe orientaliste, un phénomène de
discordance entre l’outil et la culture peut bien exister surtout que le
phénomène multilingue est souvent hérité des périodes coloniales plutôt qu’un
choix réfléchi et préparé. Une dialectique particulière peut alors exister
entre le système (donc interface) et la culture (donc utilisateur).
A
chacun ses origines et son référent : l’homme à dominance culturelle
orientale (malgré son occidentalisation) face à la machine à dominance
technologique occidentale (malgré son orientalisation). Le cognitif de l’homme
fait face au procédural de la machine. La question est donc de savoir à quel
degré d’adaptation les deux protagonistes parviennent-ils à créer l’harmonie du
système d’information utilisé ; les solutions multilingues arabo-latines
sont-elles greffées dans un univers qui apparemment les subit sans pouvoir les
rejeter ou sont-elles au contraire introduites sur la base d’une équité
objective entre les langues universelles ?
A
toutes ces questions correspondent des analyses et des commentaires qui se
basent essentiellement sur un travail d’enquête menée auprès d’un échantillon
d’individus particulièrement choisis parmi une tranche de population active,
celle des jeunes en phases finales d’études ou en début de carrière
professionnelle. L’objectif de ce choix est de cerner les aptitudes et les
réactions cognitives d’une catégorie d’utilisateurs qui d’une part vit
pleinement la métamorphose technologique de la société multilingue et qui
d’autre part se confronte à une montée en valeur de la langue locale dans les
milieux officiels de l’administration, de l’enseignement et des techniques.
L’enquête a ciblé une centaine d’individus auxquels ont été soumises des
situations problématiques de manipulation de plates-formes informatiques
multilingues (arabo-française) dans l’objectif d’étudier deux phénomènes
essentiels : d’une part l’interaction psycho-cognitive et culturelle de
cette population cible avec un système informatique conçu et développé dans une
dimension linguistique et culturelle autre, en l’occurrence occidentale ;
et d’autre part le taux d’adéquation des solutions multilingues universelles
(i.e. Microsoft) avec les caractéristiques phonologiques, morphologiques et
syntaxiques propres à la langue locale.
L’enquête
menée vise essentiellement d’étudier le concept de l’utilisabilité de la langue
arabe au niveau des interfaces multilingues arabe/latin par
une tranche de la population active tunisienne. L'objectif de ce questionnement
est de soulever les problématiques des différentes formes d'inadaptation entre
cette catégorie d'interfaces et les utilisateurs potentiels.
Nous
avons été sensibles tout au long de nos travaux de recherche à l'absence d'une
littérature abondante et spécialisée axée sur la culture informatique arabe ; sur le questionnement des solutions
informatiques proposées actuellement comme consensus implicite et leur
confrontation avec les standards de fait de la langue, de ses modes d'usage
tels qu'ils sont culturellement établis dans la perception collective et
cognitive de ses usagers potentiels.
Généralement
conçues par des concepteurs étrangers à la langue ou du moins partiellement
connaisseurs des règles linguistiques, calligraphiques et culturelles de la
langue arabe, les IHM arabe/latin présentent à notre sens un degré
assez important d'incohérence et d'inadéquation entre le système multilingue et
l'utilisateur arabophone. Ces incohérences peuvent avoir à notre sens de
grandes répercussions sur l'acceptabilité, l'utilisabilité et l'efficacité même
de l'interface. Par la soumission de ces solutions ad hoc aux mécanismes
linguistiques de fait et d'usage, nous soulèverons beaucoup d'anomalies dont
certaines sont justifiées par le référent socioculturel des usagers et d'autres
sont induites par l’influence et l’interférence de disciplines connexes
(sociolinguistique, transfert de technologies, politiques culturelles...).
Le questionnaire est structuré en zones qui retracent
les grands axes de l’expérience. Après un prélèvement des caractéristiques du
profil du sujet d’un point de vue formation et maîtrise de l’environnement
linguistique et informatique, le questionnaire prévoit une série de zones de
difficultés qui ciblent successivement le paramétrage de l’interface bilingue
et les modalités de saisie et d’organisation des contenus d’information
bilingue.
Ces épreuves de difficultés ont été orientées sur
quatre thèmes fondamentaux qui constituent la problématique fondamentale
de l’interaction de l’utilisateur arabophone avec une interface bilingue comme
conçue actuellement par Microsoft :
Par caractères neutres il est fait référence aux
caractères qui n'ont pas une directionnalité propre, et qui s'alignent par
conséquent en fonction de la direction globale du texte. Les caractères neutres
prennent les attributs des caractères qui les entourent et s'affiche donc dans
une directionnalité relative. Les caractères neutres sont classés en trois
catégories distinctes[[1]] : les symboles de ponctuation avec le caractère
d'espacement et les paires de caractères symétriques, les chiffres et les
séparateurs décimaux et enfin les symboles de traçage de lignes ou de boites.
Effet de Swapping sous MS Excel
Les chiffres constituent également un élément de difficulté majeure dans le processus de saisie et de traitement informatique. Même s'ils prennent la direction du mode maître actif, le mécanisme d’organisation interne des chiffres reste fidèle à la directionnalité gauche-droite définie par les algorithmes internes des machines ; ce qui rend leur traitement ambiguë dans un mode maître arabe à directionnalité Droite-Gauche
Les incises sont les textes dans une langue déterminée
insérés au milieu d’un texte d’une langue différente. Le phénomène apparaît
tout à fait normal entre deux écritures d’un alphabet commun et d’une
directionnalité identique (i.e. Français, Anglais), mais il devient beaucoup
plus complexe quand il s’agit d’alphabets de formes de caractères (glyphes)
différents et de directionnalité opposée (i.e. Français, Arabe). Deux
directions opposées, deux modes d'édition opposés, deux modes de justification
opposés... sont d'ordre à rendre le traitement multilingue simultané quelque
peu difficile.
Le pivotement sémantique des chiffres dans une suite arabe
L'exemple « A » illustre une incise arabe
avec un bloc chiffré dans un mode maître latin qui inclut la même série de
chiffres. La forme du curseur qui annonce la direction de la suite au niveau
des chiffres relève que le mode d'affichage actif est un mode visuel.
Dans l'exemple « B », un espacement est
introduit entre les trois derniers chiffres du nombre en mode latin. Le
résultat est un décalage vers la droite des trois chiffres. La directionnalité
gauche-droite des chiffres et des lettres reste ainsi intacte.
La même opération est effectuée sur le même nombre en
mode arabe. Le résultat est un pivotement des trois chiffres isolés vers la
gauche du bloc restant des chiffres.
L'explication de ce phénomène est l'insertion d'un
caractère espace entre les chiffres. L'espace est un caractère neutre qui, une
fois inséré, divise la chaîne des chiffres en deux blocs non contigus. En mode
latin, les deux blocs résultants se suivent dans une orientation gauche-droite
normale. En mode arabe, les deux blocs de chiffres séparés par l'espace inséré
sont invertis pour respecter la directionnalité droite-gauche de l'incise arabe
tout en gardant leur structure interne d'une directionnalité standard de gauche
à droite.
L'exemple « C » présente une segmentation en
plus du bloc de chiffres. Si la linéarité est sauvegardée en mode latin, le
mode arabe force une inversion supplémentaire pour rejeter le nouveau bloc de
chiffres à gauche de la suite chiffrée.
La sélection de texte dans un document multilingue constitue également une complexité souvent incompréhensible par l’utilisateur. Un texte bilingue dans lequel s’associent les bris de texte, les bris des chiffres, les caractères neutres etc. est parfois un calvaire pour un utilisateur profane qui n’a aucune idée sur le fonctionnement interne du système qu’il est en train d’utiliser.
Unicité directionnelle Gauche à Droite des chiffres en MML
L’une des constantes du traitement informatique des
données est l’unicité directionnelle des chiffres de gauche à droite (GAD) dans
les deux modes maîtres arabe et latin. D’emblée, cette unicité directionnelle
des chiffres est en faveur du texte latin qui constituerait ainsi un
prolongement directionnel uniforme de l’acte graphique ou de traitement. Ce qui
n’est pas le cas pour le texte arabe qui doit dans ce cas de figure traiter les
chiffres d’une manière opposée à sa direction normale de droite à gauche (DAG).
Ainsi, dans l’exemple suivant édité en mode maître latin, les chiffres gardent
leur unicité directionnelle. Une opération de sélection serait plus compliquée
du coté du texte arabe que celui du latin.
L’autre aspect de complexité de l’usage des textes
arabes est la diversité des formats de sauvegarde des données. Bien que ce soit
un phénomène général qui dépend de tout utilisateur sans considération du
support linguistique, la langue arabe fait intervenir dans ce contexte une
exception particulière due à la diversité des codes de formatage des documents.
Les utilisateurs ont toujours tendance à sauvegarder leurs fichiers dans le
format standard proposé par le logiciel utilisé ; en l’occurrence le
format Word. Or ce format résulte inadéquat si le texte est prévu pour être
échangé sur Internet, envoyé dans une base de données tournant sous un
environnement DOS, ou tout simplement pour être utilisé par un autre logiciel
(i.e. Word Perfect) ou une autre plate-forme (i.e. Macintosh ou Unix). Certes,
les filtres de conversion sont opérationnels du coté de la source ou de la
destination, mais il est toujours recommandé de créer à la source des documents
adaptés (ou portables) par défaut à toute alternatives de changement de
plate-forme ou d’application. Cet aspect reste également énormément inexploré
par une grande marge d’utilisateurs.
Les différents formats de sauvegarde d’un texte arabe sous Windows
Il a été demandé au sujet de rédiger le paragraphe suivant sur une plate-forme multilingue avec un menu latin et une directionnalité de départ Droite – Gauche.
Mon numéro de téléphone portable est 9123456. Il constitue 71,3 % de mes frais de communication. Son code d’ouverture est 123BT ou 123بت.
رقم هاتفي الجوال 9123456. وهو يمثل 71،3 ٪ من تكاليف اتصالاتي الهاتفية. شفرة استخدامه هي 123BT أو 123بت.
Il a été
reporté dans l’exemple du texte Bidi précédent qu’au niveau du code du
téléphone dans le texte latin (123بت),
94% des sujets ont tapé les 2 lettres arabes avant les chiffres. Une déduction
principale en découle : le phénomène de la bidirectionnalité sémantique
n’est pas implicite chez le interviewés sinon ils auraient implicitement déduit
que le code est une unité sémantique arabe, donc soumise à une directionnalité
Droite-Gauche. Ceci se confirme avec la partie opposée de l’exemple : au
niveau du code du téléphone dans le texte arabe (123BT), 62% des sujets ont
tapé les 2 lettres latines après les chiffres. L’explication plausible ne peut
être que le déclenchement du processus cognitif chez les sujets à partir de
l’exemple précédent pour tenir compte de la bidirectionnalité sémantique.
La difficulté
majeure dans cet exercice était sans doute le pivotement des chiffres à cause
des caractères neutres. Nous avons demandé aux sujets de séparer les blocs du
numéro de téléphone par un tiret après le chiffre 9 et un point entre les
chiffres 123 et 456 afin de lui donner l’apparence d’un numéro de téléphone
avec un indicatif et deux blocs de trois chiffres. Si l’opération s’est
déroulée convenablement dans le texte latin, c’est parce que les chiffres ont
une directionnalité absolue de Gauche à Droite. L’insertion des caractères
neutres comme le tiret ou le point n’a eu aucun effet sur la directionnalité
des chiffres qui reste ainsi conforme à celle du texte latin. Par contre, dans
le texte arabe, le tiret derrière le chiffre 9 fait pivoter ce dernier à droite
du reste des chiffres le traitant ainsi comme un bloc de chiffres indépendant
du reste. Le point entre 123 et 456 engendre aussi un effet de pivotement
(Swapping) pour les convertir en 456.123. C’est à ce niveau que nous avons
voulu voir l’attitude des sujets pour essayer de garder la valeur réelle du
numéro de téléphone tout en le séparant en blocs comme prévu. Nous avons
observé que pour s’y faire, 48% ont essayé de changer de langue active ;
20% ont essayé vainement la fonction « couper/coller » et 9%
seulement ont essayé de réécrire le chiffre formaté en mode maître latin. Ce
qui est notoire cependant c’est que 67% d’entre eux n’ont réussi à bien faire
la modification qu’à la quatrième tentative. Toutefois 10% seulement ont réussi
la transformation dès le premier coup.
Une fois de
plus, cet exemple confirme l’ignorance totale des sujets des valeurs
directionnelles des chiffres et des caractères neutres dans un environnement
bilingue. Ceci dénote d’une
interactivité surfacique entre l’utilisateur et la machine qui se limite
à un niveau d’interactivité visuelle simpliste.
L’expérience
a continué en deuxième phase avec les difficultés Bidi des incises et des bris
de textes bilingues. Les deux situations suivantes leurs ont été
proposées : insérer un texte arabe dans un texte latin.
Les textes multilingues présentent des difficultés de direction et
d’affichage. تشكل
النصوص
متعددة
اللغات
إشكاليتين
تتعلق باتجاه
الكتابة و
بأشكال
محارفها.
Et insérer un
texte latin dans un texte arabe.
إن
القراءة الآلية
للحروف
العربية لا
تزال تشكل
عائقا كبيرا
لبرامج إنشاء
المكتبات
الافتراضية.La reconnaissance optique des caractères constitue
encore un problème majeur pour les projets des bibliothèques virtuelles.
La série
d’expériences menées pour analyser les réactions de sujets au moment des
insertions ou des bris des textes a démontré qu’à ce niveau, il y a une
uniformité de comportement. La question était de savoir si dans les deux cas de
figures, les sujets allaient d’une part changer de mode maître actif ou rester
au mode maître initial pour ajouter l’incise et d’autre part essayer d’aligner
le bris selon sa directionnalité d’origine. Les statistiques se rapprochent
beaucoup dans ce sens bien qu’elles divisent en deux le nombre des personnes
agissant de manières opposées. Ceci met davantage en doute la clarté de la
bidirectionnalité graphique dans le mental des sujets.
La sélection
du texte constitue aussi une difficulté majeure pour les utilisateurs des
interfaces bilingues car elle met en pratique un traitement bilingue interne
dans les registres de la mémoire de la machine (mode logique) opposé à l’effet
qu’elle donne au niveau de l’interface utilisateur (mode visuel).
Pour mener
cette expérience, nous avons commencé par demander aux sujets la rédaction
du texte bilingue suivant composé
de chiffres et de lettres dans les deux alphabets arabe et latin sans aucune
spécification préalable de l’environnement de travail.
رقم
الهاتف : 123456 Le
numéro de téléphone est : 123456
L’observation
a donné lieu à un chiffre surprenant : dans 78% des cas, les sujets ont
commencé la rédaction du texte avec les chiffres de gauche.
Le cas est
surprenant car il confirme définitivement que l’analyse sémantique du texte au
moment de la rédaction est quasi-absente du mental des utilisateurs. C’est le
visuel graphique qui domine le psycho-cognitif de l’utilisateur au moment de la
rédaction. Ce que nous n’avons pas prévu de confirmer c’est si ce phénomène est
exclusif à la bidirectionnalité de l’écrit ou s’il est unanime pour toutes les
langues.
Or, le
deuxième exercice confirme une grande partie de cette constatation. Nous avons
demandé aux sujets de faire une sélection à la souris de la partie arabe du
texte. 54% ont commencé à partir du premier caractère arabe tout en évoluant
vers la gauche ; 34% ont commencé la sélection à partir du chiffre 1 dans
la partie arabe. Le premier chiffre confirme le mécanisme de l’apprentissage et
de l’éveil des facultés cognitives à partir d’expériences précédentes pour se
mettre en position de veille et par conséquent renforcer l’analyse sémantique
chez les sujets. Le deuxième chiffre reproduit par contre le modèle de la
mémoire visuelle graphique ancrée chez certains dans leur interactivité avec le
texte Bidi. Les deux cas ne font que démontrer une fois de plus que les
principes de fonctionnement des systèmes bidirectionnels restent très flous
dans le psychocognitif des sujets échantillons de notre enquête.
A la fin de
notre enquête, nous avons voulu confirmer les pronostics que nous avons
envisagés par une question d’ordre plutôt technique que psychocognitive. Nous
avons demandé la sauvegarde du travail réalisé par le sujet en format texte
pour savoir à quelle profondeur il dispose d’une culture des systèmes
informatiques qu’il utilise. C’était prévu comme complément à la première
partie d’évaluation de sa propre maîtrise de l’interface bilingue qu’il utilise.
Notre doute était bien fondé car la culture informatique des sujets au niveau
système est beaucoup plus pauvre.
22% n’ont pas
compris la question du tout. Pour eux sauvegarder un texte sous Word consiste à
suivre la commande « Enregistrer Sous » puis à spécifier un nom. Déjà 6% d’entre eux n’ont aucune idée sur
l’usage de la zone « Type de fichier » dans la fenêtre de sauvegarde.
44% ont choisi le mode Texte sans se soucier des autres modes texte comme
« Texte MS-DOS », « Texte avec saut de ligne » etc.
Quand nous
avons demandé de sauvegarder en « Mode Texte » dans l’une des pages
de codes appropriées à la langue arabe (i.e. ISO 709, ISO 720, ASMO 449 etc.),
96% nous ont regardé de travers, 4% ont essayé sans pouvoir trouver l’astuce.
Parmi les éléments que cette enquête a pu fournir pour
argumenter les aboutissements de l’étude analytique citée portant sur ce même
thème, nous analysons les deux points suivants :
La morale de l’histoire dans cette polémique d’interfaces
bilingues et du rôle attribué à la langue arabe dans l’accès et la diffusion de
l’information locale est beaucoup plus profonde qu’elle n’en a l’air. Nous la
situons déjà dans un domaine de recherche fondamentale plutôt que dans la
recherche appliquée. Peu s’interrogent en réalité sur cette problématique car
déjà les solutions pour la manipulation de la langue arabe existent déjà. Nous
étions intrigués dans notre questionnement de ce problème d’interfaces par
l’inadéquation et la non-conformité de ces solutions avec les exigences
linguistiques et culturelles de la langue arabe. Or par la simple observation
de deux facteurs fondamentaux technique et économique, il est possible de
s’arrêter sur les origines du problème et de la nécessité d’opter pour une
alternative radicale.
Le facteur technique se résume dans le positionnement
secondaire de la langue arabe dans toutes les tables de codes des systèmes
informatiques du monde : ISO 8859-6, rangée 6 du BMP d’Unicode, etc. face
à une domination des caractères latins (et particulièrement anglo-saxons) qui
se positionnent en tête de liste et par conséquent restent omniprésents dans
toutes les solutions informatiques mêmes universalistes (Unicode et ISO 10646).
Le facteur commercial est bien évident à travers les
gourous de l’informatique mondiale comme Microsoft, qui par un phénomène
d’économie d’échelle parviennent à dominer le monde par leurs solutions
informatiques qui parfois ne correspondent pas aux réalités et culturelles des
zones linguistiques concernées. La littérature spécialisée a toujours parlé de
solutions ici et là développées par des PME qui proposent des alternatives
d’arabisation. Seulement, même si elles peuvent apporter des solutions plus
proches de la réalité linguistique concernée, elles ont beaucoup de difficulté,
voire même il leur est impossible, d’entrer dans une logique de concurrence
commerciale avec les barons du logiciel et des systèmes informatiques du marché
mondial.
La langue arabe et sa présence dans le contexte
informatique international dépendront à notre sens des apports de la recherche
fondamentale qui orientera la recherche appliquée vers des solutions plus
souples. Elle dépendra aussi d’une prédisposition socioculturelle à renforcer
le rôle de la langue arabe au niveau de l’enseignement et des usages.
[2] LEBERT Marie. Le Multilinguisme sur le Web. http://www.ceveil.qc.ca/multifr2.htm. Visité le 20 septembre 2001.
[3] CASSEN Bernard. Le Tout-anglais n'est pas une fatalité. Le Monde Diplomatique : Manière de voir, octobre 1996, pp.81-82
[4] Le Multilinguisme : une source de conflit. http://www.ciral.ulaval.ca/alx/amlxmonde/Langues/3cohabitation_sources_conflits.htm Visité le 20 septembre 2001.
[5] Summer Institute Of Linguistics. http://
[6] Le Multilinguisme en traitement de l’information. http://www.shadid.com/html/multilinguisme.html. Visité le 20 septembre 2001.
[7] HERNANDEZ Jean-Alain. Internet et le multilinguisme. http://www.bibliotheque.refer.org/biennale95/hernan.htm. Visité le 20 septembre 2001
[8] Arabic Intenet Names Consortium. http://www.arabicdomainname.com/ (visité le 15 juillet 2001)
[9] LEBERT Marie. Le Multilinguisme sur le Web. Op. Cit.
[10] LEBERT Marie. Le Multilinguisme sur le Web. Op. Cit.
[11] MuST Multilingual Information Retrieval, Summarization, and Translation System. http://www.isi.edu/~cyl/must/must_prototype.htm Visité le 10 juin 2001
[12] ELIE Michel. Pour le multilinguisme sur lnternet. Le Monde Interactif. Mercredi 21 février 2001. http://interactif.lemonde.fr/article/0,5611,3044--148967-0,FF.html. Visité le 20 juin 2001.
[13] Le Multilinguisme : une source de conflit. Op. cit.