VERS UNE NORMALISATION DES PRATIQUES DE COMMUNICATION DANS LE CONTEXTE D'UN MULTILINGUISME INTEGRAL (ARABE-LATIN)
Entre la diversité des usages et les contraintes technologiques

Mokhtar BEN HENDA

1997

Institut Supérieur de Documentation, Tunis. 10 Rue Kélibia 1025 Tunis-Tunisie
CEM-GRESIC, Université de Bordeaux 3
Téléphone : +216.1.790.305 / Fax : +216.1.794.117
Mail : Mokhtar.Benhenda@isd.rnu.tn / benhenda@excite.com
URL : http://www.chez.com/benhenda/


RESUME

La problématique de cette intervention prend sa source dans le paradoxe observé entre la généralisation des technologies de l'information et la précarité de leur usage dans des contextes sociolinguistiques hétérogènes, en l'occurrence les contextes multilingues à partie ou intégralement non latins et en particulier le contexte arabe/latin.
C'est une tentative pour rechercher le maillon perdu d'une chaîne qui apparemment regroupe toutes les composantes nécessaires pour ériger ces dits contextes à l'état de partenaires à part entière dans l'actuelle société de l'information mais qui en raison de certains opérateurs directs et indirects cherche encore à travers les normes et les usages une fixation de ses propres repères techniques et culturels.
Que prévoient alors les normes et que laissent entrevoir les usages pour la mise en place de systèmes d'information et de communication basés sur un bilinguisme arabe/latin intégral et transparent ?

1. Information-technologies-communication-langage

C'est dans la confluence de ces concepts même, là où se joignent l'infrastructure de communication, les services d'information et les valeurs socio-culturelles, que l'effort de cette présentation sera conduit.

A priori un effort de composition entre deux outils de profils différents est déjà acquis; soit une information qui depuis l'aube des temps à démontré son importance pour la survie de l'humanité et un support technologique qui, en fil conducteur, véhicule cette information dans des aires plus vastes, de manières plus efficaces, vers des usages composites.

Ce qui reste à confirmer c'est en fait les aboutissements d'une pareille fusion et l'envergure de leurs mise en application. S'il est certain que les inventions technologiques ont eu vite raison des cloisonnements civilisationnels et des rejets culturels parfois manifestes au sein de certains milieux actuellement consommateurs de cette technologie, l'information n'est pas au même seuil d'universalité et d'acceptation. Dans sa portée universelle, enrobée d'une parure culturelle, spirituelle et parfois mystique, l'information fait souvent face à une prise de position de la part du réceptacle, contrairement au support matériel qui est souvent pris dans sa dimension catalysante, inoffensive, impartiale et surtout maîtrisable.

Cependant, dans cette optique globalisante des rapports modernes entre un contenant prétendu passif et un contenu dynamique, vivant et à valeur ajoutée, souvent identifiée comme une source de pouvoir et d'autorité, il demeure indispensable de saisir, dans sa plus profonde réalité, la nature des contextes dans lesquels s'exerce cette dualité et cette complémentarité mitigée de l'information et de sa nouvelle technologie d'usage. Car c'est dans la dimension des modes d'usage que cette symbiose entre ces deux protagonistes de natures différentes suscite les polémiques du culturel face au technologique, du spirituel face au pragmatique et de l'abstrait face au palpable.

A travers les modes et les contextes d'usage, un certain nombre de milieux et de pratiques sont actuellement identifiés comme environnements naturels dans lesquels se développent normalement des rapports d'usage et de complémentarité entre information et technologie. Il s'agit généralement de contextes linguistiques à dominance latine et plus particulièrement anglophone qui, depuis l'origine de l'outil informatique, l'ont orienté vers leurs propres contextes informationnels et communicationnels sur des critères culturels et linguistiques qui leur sont appropriés. Les normes ISO, d'origines anglo-saxonnes, ont été pour longtemps loin de satisfaire la majeure partie des langues existantes, même les latines d'entre elles, et ce pour des raisons d'inadaptation du code ISO définissant le jeu de caractère, même dans sa variante française AFNOR. Le cas le plus flagrant à cette inadéquation reste la difficulté de produire des caractères accentués ou des symboles monétaires autres que le $ sur un Minitel.

Il a été donc indispensable, " pour manipuler une langue donnée, de sélectionner un ensemble minimal d'éléments représentatifs pour la saisie (clavier), le stockage et le traitement (code interne) puis d'engendrer à l'aide d'un analyseur de contexte, le graphisme exact du caractère à visualiser à partir de l'ensemble des éléments affichables propres à la langue (visualisation) "[1]. Il a été question, à titre d'exemple, d'étendre les codes de représentation des caractères au delà de l'ASCII standard à des limites linguistiques plus vastes pour couvrir les particularités propres à d'autres langues de la même famille (i.e. les diacritiques, les symboles monétaires...).

Cette adaptation s'est vue également concrétisée par le confluent des langues et de l'informatique dans une nouvelle discipline, en l'occurrence l'ingénierie linguistique, dont l'objectif est de promouvoir un nouveau domaine d'investigation, celui des industries de la langue.

L'universalité aujourd'hui observé autour de l'outil informatique ainsi que d'une grande partie de l'information surtout scientifique et technique n'a été assurée que suite à ces multiples tentatives de prendre en compte les caractéristiques linguistiques et scripturales de toutes les langues et de leur adaptation à leurs réalités socio-culturelles propres.

Dans d'autres contextes linguistiques encore plus complexes, les polémiques précitées émergent dans une logique plus conflictive. A part les divergences morpho-syntaxiques et sémantiques qui identifient leurs rapports avec les nouvelles technologies et ressources d'information associées (tel est le cas de toutes les langues latines autres que l'anglais), les valeurs scripto-graphiques accentuent cette opposition par l'usage d'une graphie radicalement diverse et totalement opposée dans son processus de traitement. C'est le cas des contextes linguistiques asiatiques, arabes, hébreux ... où des initiatives et des programmes nationaux garantissent leur universalité par leur adaptation à un multilinguisme transparent et assurent la conservation de leurs identités culturelles à travers l'adaptation progressive d'origine technique de leurs langues nationales aux exigences universelles d'échange et de partage de l'information.

Les solutions à ce multilinguisme intégral qui couvrent la totalité des systèmes en question d'un point de vue morphologique, syntaxique, sémantique et scriptural étaient indiscutablement plus hargneuses à atteindre pour assurer une cohabitation (bi)multilingue dans un même système informatique prévu dans ses origines à des valeurs linguistiques latines et plus précisément anglophones.

La communication de l'information constitue aussi un vecteur également influençable par la dimension linguistique imposée par l'intrinsèque liaison qui l'unie à ses deux "congénères", en l'occurrence l'information et les technologies qui leur sont associées. Toute information à vocation générale ou spécialisée, n'a aucune valeur réelle si elle n'est pas communiquée dans les règles que le contexte techno-culturel dicte. Ces règles constituent au fait une série de paramètres qui reflètent, en terme d'optimisation de l'efficacité et de la rentabilité de l'acte de communication, l'état des rapport d'usage et d'accoutumance entre information, technologie et langage de communication.

En effet, l'aspect linguistique dans l'acte de la communication prend progressivement de l'ampleur surtout en cette deuxième moitié du XXème siècle suite aux tentations nationalistes qui sont directement associées à l'identité linguistique capable à elle seule de dresser dans l'esprit collectif des populations, des barrières plus sensibles que les frontières politiques.

Il est primordial, comme le confirme A. DANZIN chef de groupe de réflexion stratégique pour la Commission des Communautés Européennes, que " le défi linguistique devait être considéré sur le plan économique et social comme un phénomène aussi important que le furent, au cours de la décennie 1960, les apparitions de la micro-électronique et les industries des logiciels informatiques "[2].

L'objet de ce document est en fait de voir de plus près les caractéristiques d'un contexte régis par un multilinguisme lourd, en l'occurrence arabe/latin et de sonder la profondeur des obstacles auxquels font face les actes de gestion et de communication de l'information scientifique et technique dans un contexte où les utilisateurs cherchent encore une stabilité des normes et une fixation des usages d'une langue vernaculaire encore inadaptée à une technologie qui lui reste étrangère.

2. LE BILINGUISME ARABE/LATIN

Une première interrogation dans ce sens s'adresse à la nature des solutions techniques apportées à des strates différentes du processus communicationnel pour surpasser l'obstacle purement linguistique. Face à cette expansion et généralisation des systèmes ouverts et distribués, comment le bilinguisme " lourd " (codage, typographie, morphologie, syntaxe, sémantique et surtout direction d'écriture), par opposition au bilinguisme " souple " (codage, typographie, morphologie, syntaxe et sémantique), trouve-t-il progressivement sa voie dans les systèmes hybrides actuels d'information et de communication ?

La réponse à cette question générale passe obligatoirement par la réponse à des questions plus pointues : faudrait-il adapter la langue aux critères technologiques des outils de traitement des données ou au contraire faudrait-il que ces derniers se plient aux caractéristiques particulières de chaque langue ? Faudrait-il repenser à la source les structures originales des systèmes informatiques pour y apporter les solutions multilingues ou faudrait-il plutôt procéder à l'extension des systèmes monolingues (latins) existants pour en faire des plates-formes bilingues?

Face à cette dernière question la pratique a démontré que si la tendance tourne progressivement vers la première alternative bien que plus coûteuse, les procédures d'extension de systèmes anglo-saxons déjà opérationnels sont encore fréquentes pour les transformer en systèmes bilingues. A part l'économie dans les coûts de mise à jour, et l'effet de marketing dont jouissent déjà les systèmes latins, le savoir faire de ces derniers, conçus au sein des compagnies occidentales de haute qualité professionnelle, profite aux langues vernaculaires prévues pour l'intégration dans les systèmes bilingues.

La langue arabe, encore débutante dans le domaine du bilinguisme systémique, à été l'objet, comme le signale la littérature spécialisée, de plusieurs essais d'intégration ou de conversion vers des systèmes informatiques multilingues. Les projets de systèmes bilingues arabe/latin abondent dans la littérature scientifique. Seulement, pour des raisons de divergences d'approches conceptuelles des dits systèmes, ni les uns adaptant la langue à l'outil informatique (approche exogène) ni les autres effectuant la procédure inverse (approche endogène), ne parvinrent à établir une règle définitive [3]. Il a fallu attendre l'intervention des gourous de l'informatique et des grands manitous du marché du logiciel pour voir les grandes firmes comme Microsoft et Alis Technologies, imposer des normes d'arabisation aux niveaux du matériel [4] et des logiciels [5] issues de leurs propres études du milieu et conformément à leurs propres perceptions du bilinguisme.

2.1. Arabisation et bilinguisme

L'arabisation des systèmes informatiques monopostes ou multiutilisateurs concerne en effet, les deux aspects fondamentaux des composantes matérielles d'une part et des programmes incluant les langages de programmation, les utilitaires, les progiciels d'application et les systèmes opératoires de l'autre.

Il est à rappeler dans ce sens que l'arabisation ne se contente pas d'afficher et d'imprimer le caractère arabe comme c'est le cas des langues latines. Il s'agit plutôt de rendre la machine contrôlable simultanément et de façon transparente par les deux ou plusieurs langues utilisées. Ceci " nécessitera la réalisation d'une couche inhibant la gestion initiale du caractère par une nouvelle gestion prenant en charge les deux langues : l'arabe et le latin "[6].

En fait, le principe d'arabisation signifie implicitement un bilinguisme arabe/latin basé sur le principe de la transparence. Par transparence, il est communément admis que les applications latines devraient accepter, sans aucune modification de leurs routines et procédures de représentation, les données latines, arabes ou mixtes dans des zones prévues au départ pour des données exclusivement latines. Selon M. EZZEDINE, " l'arabisation transparente se présente comme une interface bilingue sous le système d'exploitation. Dans le cas de MS/DOS, le système est intact; seul l'interpréteur de commandes est adapté à la langue arabe. L'utilisateur peut dialoguer avec le système d'exploitation dans sa propre langue. Seules les entrées/sorties BIOS sont modifiés "[7].

En définitive, l'arabisation est plutôt orientée vers l'accomplissement des objectifs suivantes :

L'accomplissement de ces objectifs a toujours été confronté à des problèmes liés à l'intégration des fonctions d'arabisation que ce soit au niveau du système d'exploitation ou au niveau des dispositifs d'entrée-sorties de présentation [8].

Parmi ces problèmes, certains ont leur origine dans la langue arabe elle même; d'autres sont issues de la nécessité de mixer la langue arabe avec d'autres langues d'origines latines, d'autres proviennent directement du champs d'application des normes et des codes de représentation.

2.1.1. Caractéristiques et problèmes de la langue arabe

Parmi les caractéristiques qui distinguent la langue arabe des autres langues latines et qui, en conséquence, engendrent des difficultés dans un cadre de bilinguisme, retenons les suivantes :

L'écriture arabe se compose de 28 caractères de base extensibles dans leurs diverses variations à 78 formes graphiques [9].

Une écriture cursive : les différents caractères formant le mot sont liés entre eux, dans un mode manuscrit ou imprimé, selon des propriétés calligraphiques et des règles de ligature propres qui causent souvent des problèmes au niveau de l'affichage, de l'impression et de la reconnaissance optique des caractères (). GHOZAL attribue cet handicap au fait que la langue arabe n'a pas été adaptée à l'outil d'impression comme c'est le cas du caractère latin [9]. En effet, bien que ce dernier est présenté sous forme cursive rattachée dans une transcription manuscrite, il reprend une forme basée sur le principe d'une seule forme pour un seul caractère dans une matrice unique.

A ces caractéristiques s'ajoutent les problèmes de représentation et de codification des caractères arabes qui devrait s'adapter à l'environnement original latin du matériel informatique.

2.1.2. Codage, langages et normalisation

La technologie, comme nous l'avons déjà signalé, est un vecteur de suprématie d'une culture donnée, en l'occurrence le monde à dominance linguistique latine et plus particulièrement anglo-saxon. L'information, dans ce cas particulier ne saurait échapper à cette contrainte du support qui conditionne en quelque sorte l'usage de la langue de l'outil véhiculaire. On assistait depuis lors à des obstacles qui relèvent des domaines de la codification électronique des données, de la normalisation des procédés de transcription et d'échange.

En effet, la situation générale démontre qu'aujourd'hui, tout fonctionne majoritairement dans un mode latin dominé par la langue de la ressource et/ou du serveur d'information. Dans des systèmes latins hétérogènes (français, anglais, espagnol ...), la solution du multilinguisme s'est faite possible grâce à une extension banale des codes de représentation et de l'interposition d'artefacts qui relèvent du domaine de l'ingénierie linguistique (i.e. TAO).

Cependant, la présence des langues non latines (i.e. arabe, hébreux, chinois, cyrillique ...) est, à des degrés variés, exceptionnelle surtout au niveau des opérations de transfert et d'échange des données. Dans de pareilles situations, le recours à des techniques adjacentes comme le traitement des langues naturelles, la traduction assistée par ordinateur, la reconnaissance optique des caractères ... ont contribué jusqu'à une certaine limite à l'intégration des langues non latines dans l'univers des systèmes d'information universels et distribués.

Cette intégration qui, depuis l'univers assez limité des systèmes monopostes, a pris forme d'un enrichissement (extension) des techniques de codage des 128 caractères de base (ascii) a permis à des langues non latines comme le chinois, l'arabe, le cyrillique, le hébreu ... de s'établir comme langues d'interfaçage courantes. Avec leurs transition vers le monde des systèmes distribués et des architectures client-serveur, cette élasticité linguistique s'est trouvée consolidée par la contribution participative de beaucoup d'agents académiques et de recherche, culturels et économiques.

Dans l'univers Internet, qui constitue de nos jour l'alternative par excellence à laquelle font recours les utilisateurs des systèmes d'information distribués, l'architecture client-serveur du type WWW a pu rendre possible l'accès à l'information à partir de l'hypertexte sans obstruction aucune des divergences linguistiques. Les développement d'interfaces multilingues, y compris la langue arabe, se font voir en continu dans l'univers Internet. Au début elles étaient à base d'hypertexte rébarbatif (liens graphiques en bitmap). Elles deviennent actuellement des interfaces dynamiques et intelligentes avec des potentialités de reconnaissance de caractères non latines (arabe, japonais, russe ...). Ce stade d'évolution et cet état d'universalité n'a pu se rendre réel sans la contribution d'un effort de normalisation qui a accompagné la conception des systèmes bilingues depuis leur début.

La langue arabe a pris sa part dans cet effort de normalisation bien que des controverses encore en vigueur perturbent sa fixation sur des assises normatives définitives. Sans nous approfondir dans les détails de l'historique de la normalisation du caractère arabe, nous précisons simplement que cet effort à débuté en 1975 par initiative de l'Institut des Etudes et des Recherches en Automatisme (Maroc) pour établir un code standard unifié pour la transmission des données en langue arabe conforme à l'Alphabet International n°5, donc compatible à la norme ISO 646 [10].

Ces efforts aboutissent en 1976 au premier code de transmission de données arabes : le CODAR 1 conforme au code ASCII, Alphabet International n°5 [11]. Durant la conférence de Bizerte (Tunisie) tenue la même année par l'IBI (Bureau Intergouvernemental pour l'Informatique) et l'UNESCO, le CODAR 1 fut réaménagé suite à une confrontation avec une proposition d'un code irakien pour introduire les caractères voyellées. Le CODAR 2 fut alors adopté. En Juin 1977, durant la première réunion du COARIN (COmité sur l'utilisation de la langue ARabe en INformatique) fut adopté un nouveau code unifié : le CODAR-U enregistré à l'ISO sous le numéro 59 le 1er juin 1982. Devant ces instabilités et manque de consensus, l'ECMA (European Computer Manufacturers Association) répond aux appels des constructeurs de matériels informatiques par l'annonce en février 1982 d'un nouveau code. L'ALECSO (la contrepartie arabe de l'UNESCO) et l'ASMO (Arab Standard and Metrologic Organisation) réagirent instantanément pour définir entre les 22 et 23 avril 1982 un code arabe unifié, forme définitive : le CODAR-U/FD, devenu par la suite la norme ASMO 449. Dès lors, l'ASMO s'est penchée, par l'intermédiaire de son comité technique n°8 vers la définition de normes complémentaires immédiatement retenues par l'ISO comme références internationales (tableau ci-dessous).

Norme ASMO Equivalent ISO Application
CODAR-U/FD 646 Jeu de caractés codés à 7 éléments pour l'échange des données
449 9036 Jeu de caractères arabes codés à 7 éléments pour l'échange de l'information
662 2022 Jeu de caract&egarve;res codés à 8 éléments pour l'échange d'information
663 2530Répartition des caract&egarve;res sur le clavier
708 8859/6Jeu de caract&egarve;res codés &agarve; 7 et &agarve; 8 éléments-Techniques d'extension de code

Devant cette prolifération de normes et de leurs mises à jours continues, des polémiques d'ordre normatif sont encore à résoudre.

Les codifications arabes ont été généralement préparées avant l 'avènement de la micro-informatique, pour arabiser les périphériques des gros systèmes d'antan (terminaux). Le respect de ces codifications n'a pas été contraignant pour l'arabisation des terminaux et des imprimantes. Avec l'avènement de la micro-informatique, leur utilisation a été par contre problématique pour les raisons suivantes :

L'ASMO 449, jeux de caractères arabes codés à 7 éléments pour l'échange d'information, n'est pas adapté à un environnement 8 bits, indispensable pour aller au delà des caractères arabes de base codés sur les 128 codes disponibles en 7 bits, L'ASMO 662, jeu de caractères codés à 8 éléments pour l'échange d'information n'est pas conforme à l'environnement bilingue, L'ASMO 708 est dans ce cas précis, la codification la plus appropriée, en remplacement direct de la codification existante, mais pose le problème de l'indisponibilité des caractères semi-graphiques et nationaux. L'ASMO 663 a été pensé pour la disposition des caractères sur un clavier de type Querty . Ce qui implique un encombrement pour un clavier du type Azerty.

Des solutions à ces incohérences de normes ont été entreprises par :

2.2. LES USAGES

Comme il est certain qu'entre règles et consensus il peut y avoir des disparités énormes, la pratique actuelle de la langue arabe a subi certaines influences, engendrées principalement des habitudes d'usages qui, à travers le temps, se sont cristallisées face à toute tentative de normalisation. Ces influences sont actuellement notoires au niveau de :

Reprenons plus en détails deux aspects de la polémique d'usage de la langue arabe dans le contexte informatique: les chiffres et les dates.

2.2.1. Les chiffres arabes

Partant du principe que les extensions des codes dans les normes gérant le multilinguisme arabe/latin (ASMO 708 et son équivalent ISO 8859/6) n'ont pas déplacé les codes des chiffres et de beaucoup de caractères non graphiques de leurs emplacements d'origine, les champs numériques arabes peuvent être insérés de droite à gauche en mode maître arabe ou de gauche à droite en mode maître latin. L'opération de l'insertion présente en réalité quatre modes de saisie combinés comme suit :

criture entre les deux langues, que le chiffre 1997 soit rédigé en arabe sous la forme 7991.

Or, ceci constitue un exemple parlant de l'opposition entre règles linguistiques, normes informatiques et usages courants.

En effet, la culture arabe a toujours respecté sa logique directionnelle droite-gauche même au niveau de la transcription des chiffres. Dans la littérature classique, les chiffres étaient écrits et prononcés dans un esprit arithmétique qui se base sur la logique de l'évolution unitaire, décimale ... La valeur 1997 est à titre d'exemple écrite (à la main bien entendu) dans une suite successive du geste graphique (Droite-Gauche) qui passe du dernier caractère du dernier mot écrit (le cas où le chiffre fait partie d'une chaîne de texte) vers l'emplacement situé immédiatement à gauche pour commencer par le chiffre 7 suivi des chiffres 99 et 1. La prononciation du même chiffre est également accomplie dans cette logique d'évolution des unités vers les dizaines, les centaines et les milliers. La prononciation sera en conséquence " sept et quatre vingt dix et neuf cent et mille ". Cette pratique constitue jusqu'à nos jours l'une des règles de la bonnes maîtrise de la langue arabe.

Les usages ont également instauré les chiffres hindous dans la culture orientale. Cette particularité a été transposé sur les systèmes informatiques arabisés sans pour autant affecter la transparence des traitement.

2.2.2. Les dates en arabe

Les dates en langue arabe attestent de la même polémique d'usage. La date " 11 février 1997 " est une suite de valeurs qui à vue d'oeil respectent la logique évolutive du plus petit au plus grand ; en l'occurrence le jour, le mois et l'année. Seulement, si nous observons avec un intérêt graphique la transcription des valeurs de cette date nous remarquerons qu'au niveau de la valeur jour, les dizaines se placent dans cette orientation latine de gauche à droite, avant les unités; chose qui contredit la dite logique évolutive du plus petit au plus grand. Par contre si nous observons, selon le même intérêt graphique, la date arabe "" , nous constaterons qu'elle respecte cette même logique évolutive sur un plan sémantique et graphique à la fois. Partant de droite à gauche, nous avons dans une suite successive l'unité puis les dizaines pour les jours, ensuite le mois et enfin l'année elle même commençant par les unités et poursuivant par les dizaines, les centaines et les milliers. Seulement, suite à des interférences culturelles et à une cristallisation de certains modes d'usages très anciens, les chiffres et les dates s'alignent depuis très longtemps au modèle latin excepté pour les chiffres allant jusqu'à 99. Ce n'est qu'à partir de 100 que l'inversion de l'ordre d'évolution change. 101 est prononcé dans un langage actuel généralisé " cent et un " ; 121 est prononcé par contre " cent et un et vingt " ; 1997 est aussi prononcé " mille et neuf cent et sept et quatre vingt dix ". Une étude socio-linguistique permettrait certainement d'élucider cette anomalie dans l'anomalie.

Conclusion

S'il a été question dans ce document de l'état de l'art en matière d'arabisation de systèmes informatiques, l'objectif essentiel y était de soulever certaines remarques à travers lesquelles je m'adresse normalement aux concepteurs de matériels et de logiciels bilingues et particulièrement arabe/latin. Ces concepteurs qu'ils soient des industriels, commerçants ou universitaires et chercheurs généralement oeuvrant dans des milieux latins (les grands produits et les grands projets d'arabisation émanent essentiellement d'institutions occidentales i.e. Microsoft, Alis, INRIA ...), sont tenus à mon sens de considérer deux alternatives capitales.

D'une part il s'agit de l'intégration d'experts indigènes formés dans leurs propres pays d'origines là où ils ont été imbus de valeurs linguistiques informelles. Des petits détails d'usage phonétique, graphique ou sémantique pourraient passer inaperçus pour le concepteur technicien alors que leur importance pourrait être stratégique. D'autre part, il s'agirait à mon sens d'intensifier les efforts de bilinguisme non pas uniquement sur la traduction des messages et des menus systèmes pour arabiser une quelconque application. Nous avons été à plusieurs fois confrontés à des situations où un système supposé être bilingue ne pouvait pas gérer des opération de tri, d'indexation, d'analyse des données arabes et mixtes.

En définitive, le bilinguisme arabe/latin est encore à ses phase de balbutiement si nous considérons l'évolution énorme des domaines de l'information et de la communication. Les techniques et supports de Multimédia qui s'installe progressivement comme phénomène incontournable, force les solutions bilingues textuelles à aller au devant de nouvelles exigences d'un multimédia bilingue. C'est désormais l'apanage de l'industrie de la langue, de l'intelligence artificielle et des systèmes experts.

NOTES

  1. MLOUKA Moncef; AMARA Fethi. Le Système MALIN : Multi-alphabétisme et linguisme en informatique.
  2. Vers une infrastructure linguistique européenne. Rapport présenté par A. DANZIN et le Groupe de réflexion stratégique pour la Commission des Communautés Européennes (DGXIII). 1992.62 p.
  3. EZZEDINE Mohamed. Arabisation et transparence. Actes du colloque Informatique et langue arabe. IMA. Paris. 7 et 8 décembre 1987.
  4. CHAMSIN Radhouan. Alis : leader dans la technologie d'arabisation (texte en arabe). Al-Computer, Communications & Electronics. Avril 1995. pp.23-26.
  5. Voir les manuels de Microsoft Windows (versions 3.1 et 95) et Microsoft Office avec support pour langue arabe.
  6. BENHEDOUGA A. Expérience de l'ENSI dans l'informatisation des langues : cas de la langue arabe. Actes de la conférence régionale sur les technologies de la langue. IRSIT, CEE. Tunis. 6-7 décembre 1994.
  7. EZZEDINE Mohamed. Arabisation et transparence. Op.Cit.
  8. CHALOUHI Adel. IDOS : une solution optimale et unifiée pour l'arabisation transparente des systèmes informatiques. Actes des Journées Informatiques et Langue arabe. Paris. IMA. Novembre-8 Décembre 1987.
  9. GHOZAL Ahmed Lakhdar. Les outils électroniques d'impression : l'ordinateur et le caractère arabe. (en langue arabe). In : ALECSO. La révolution technologique et les outils arabes de communication. Tunis : ALECSO. pp.244-354.
  10. Le code ASCII, mis en place par les américains dans les années 60 est devenu à partir de 1973, l'Alphabet International n°5 codé à 7 bits pour la transmission de données de tous les alphabets latins référencée ISO 646.
  11. ROMERIO G.F; L'arabe voyellé en informatique, Rapport du projet UNESCO/PNUD MOR/73/024. Rabat : IERA, 1976.