بدايات الترميز الرقمي المعياري للمحارف العربية

من بين التحديات الرئيسية التي واجهتها اللغة العربية في بدايات العصر الرقمي، كانت هنالك أولا مشكلات تشفير المحارف بطريقة معيارية يعتمدها المصنعون لتوفير المعدات والبرمجيات الخاصة باللغة والكتابة العربيتين. وقد تم التوصل إلى تجاوز قسط كبير من هذه التحديات بفضل المساهمات الداخلية والخارجية، خاصة تلك المجهودات التي قامت بها المنظمة العربية للمواصفات والمقاييس (ASMO) ثم تلك التي بادرت بها الجمعية الأوروبية لمصنعي الحواسيب (ECMA/European Computer Manufacturers Association) ، وأخيرا الحلول المعتمدة من قبل مجمع اليونيكود Unicode ومنظمة الآيزو ISO. ولقد كان للدور العربي في هذه المجهودات العالمية دور ليس بالهين في إثراء التعددية اللغوية الرقمية العالمية وفك السيطرة اللاتينية على التكنولوجيات الحديثة للمعلومات. لكن يبقى الدور العربي، رغم مساهمته في الحضارة العالمية الرقمية واتساع الرقعة الجغرافية للوطن العربي وكثافة بعده الديموغرافي، أدنى بكثير من المستوى الذي كان من الضروري أن يكون عليه. في تعرضنا لمزايا هذا الدور ونقائصه من خلال هذه التدوينات المتخصصة، سنعود هنا إلى منطلق التجربة العربية في المغامرة الرقمية من خلال باب التشفير والترميز للكتابة واللغة العربيتين من أجل تعريب المعدات والبرمجيات الحاسوبية. فعلى الرغم من أن بدايات تعريب الأجهزة الحاسوبية في البلدان العربية تعود إلى الستينيات من القرن الماضي مع أنظمة البطاقات المثقبة، فإن وضع المعايير الرقمية الثنائية لم تظهر جديا إلا منذ أواخر الثمانينات من خلال عدد من المبادرات المتفرقة في الزمان والمكان منتجة عددا من المواصفات المختلفة ليس فقط من بلد إلى آخر ولكن أيضا من قطاع إلى آخر. كانت هذه المواصفات عموما عبارة عن مجموعات من المحارف الخالية من التشكيل ولا تسمح بالتعايش مع الحروف اللاتينية ذات الاتجاه المخالف. وللتذكير فإن مشكلة التشكيل في الكتابة العربية وازدواجية الاتجاه على مستوى الواجهات التطبيقية لا تزال قائمة وبدون حلول مناسبة لعديد الحالات ربما سنأتي عليها في تدوينات لاحقة.

كما أوردنا ذلك في التدوينات السابقة، تشتغل جل الحواسيب اليوم بواسطة المعايير الدولية للتشفير الرقمي الثنائي للحروف المعدة من قبل مجمع اليونيكود ومواصفة الأيزو 10646 بمختلف تفرعاتها وأشكال تبسيطها كمجموعات المحارف الدولية UTF-8 و UTF 16 وغيرها. وتعتمد اللغة العربية بدورها هذه التقنيات في دعم تواجدها على الشبكات وفي مختلف المجالات الرقمية تماشيا مع ما تفرضه ضرورة التلاؤم والتطابق مع المنظومات الالكترونية العالمية. إلا أن التجربة العربية، وكسائر اللغات والكتابات العالمية الأخرى، عرفت بدايات محلية وقطرية متعثرة وغير قارة قبل أن تندمج في صياغة الحلول العالمية التي توفرها معايير اليونيكود والأيزو. وسنعرض هنا بشديد الاقتضاب أهم المحطات التي مرت بها هذه التجربة من أجل تشفير الحروف العربية واعتمادها في تصنيع المعدات وصياغة البرمجيات وكتابة المحتويات.

مواصفة آسمو 449

مع مطلع النصف الثاني من السبعينات من القرن الماضي، توصل المجهود العربي إلى الإقرار بضرورة التقارب بين المحاولات المعيارية المتفرقة للمحارف الرقمية العربية. بهذا المقتضى، تمت الدعوة إلى تنظيم اول اجتماع عربي انعقد بالمغرب في عام 1975 شارك فيه عدد من الخبراء العرب لمناقشة إمكانية إنشاء مواصفة معيارية موحدة لنقل البيانات باللغة العربية تكون مطابقة للخصائص التالية:

  • اعتماد أبجدية متكاملة مع وجود الحد الأدنى من الرموز الوظيفية،
  • اعتماد أبجدية متكاملة مع وجود علامات التشكيل،
  • اعتماد أبجدية عربية تكون متوافقة مع الأبجدية الدولية رقم5 ومطابقة لخصوصيات المواصفة الدولية ISO / IEC646

مع مطلع عام 1976 تم التوصل إلى أول معيار عربي موحد لنقل البيانات (CODAR 1) تم اعتماده كنظير عربي لمعيار ASCII. وقد تمت مراجعة هذا المعيار من قبل جميع الأطراف المعنية قبل أن ينعقد اجتماع إقليمي عربي بمدينة بنزرت بتونس في يونيو حزيران من عام 1976 للاتفاق على استراتيجية عمل وسياسة تكنولوجية عربية موحدة خاصة وأنه تم خلال ذلك الاجتماع تقديم مشروع موازي لمعيار CODAR1 اقترحته العراق آنذاك.

تعرضت المداولات خلال ذلك الاجتماع إلى عديد القضايا كضرورة إدراج حروف التشكيل من عدمه في الأبجدية العربية الرقمية. وقد أسفرت المداولات في نهاية المطاف إلى الإقرار بضرورة إدخال بعض التقيحات على المعيار CODAR1 للوصول إلى مشروع مؤقت آخر هو CODAR 2. وقد عرض هذا المشروع في نفس السنة على مؤتمر الوزراء العرب المسؤولين عن تطبيق العلوم والتكنولوجيا من أجل التنمية (CASTARAB) الذي انعقد في الرباط بالمغرب في أغسطس 1976، وعلى الدورة التاسعة عشر للمؤتمر العام لليونسكو في ديسمبر كانون الاول عام 1976 المنعقد بنيروبي بكينيا. وقد قامت الجهتان بتبني المشروع بالكامل.

في شهر جوان حزيران من عام 1977، قامت لجنة مختصة أنشأها المكتب الدولي للمعلوماتية (IBI) لتأسيس معيار مشترك لاستخدام اللغة العربية في أجهزة الكمبيوتر(COARIN)، باجتماع في روما تم خلاله تقريب الخلافات حول تقنين الحروف العربية والتوصل إلى معيار موحد جديد هو المعيار CODAR-U الذي تم التوافق عليه في 15 جوان حزيران 1977 وتسجيله لاحقا لدى منظمة الأيزو. كما تم تقديم مشروع CODAR-U من أجل الدراسة والمراجعة إلى العديد من الهيئات العربية والدولية من بينها الاتحاد العربي للاتصالات (ATU) والمنظمة العربية للمواصفات والمقاييس (ASMO). وقد تناولت هذه الأخيرة الموضوع بجدية بإحداث لجنة فنية خاصة (اللجنة رقم 8) كان لها الأثر الكبير والمباشر لاحقا على إنشاء سلسلة هامة من المعايير المتصلة والمتفرعة.

CODAR_UDمن ناحية أخرى، وأمام البطء الحاصل في تبني الحلول النهائية الملائمة للشيفرة المعيارية للحروف العربية – الأمر الذي أحدث بعض الاضطرابات في الأعمال التجارية لدى الشركات المصنعة للأجهزة الموجهة للدول العربية، تقدمت الرابطة الأوروبية لمصنعي الحواسيب (ECMA) في شهر فيفري 1982، بوصفها سلطة تسجيل للرموز الحاسوبية لدى منظمة الأيزو، بمقترح لمعيار متكامل يستجيب للحاجيات اللغوية الرقمية لشركائها العرب. وكان الرد العربي على هذا المقترح أن دعت كلّ من المنظمة العربية للمواصفات والمقاييس والألكسو إلى اجتماع طارئ في الرباط يومي 22 و 23 أبريل 1982 من أجل الاتفاق على معيار موحد آخر يكون بمثابة الحل النهائي لتشفير الحروف الرقمية العربية. تم إثر ذلك الاجتماع إصدار معيار CODAR-UF/DF كمواصفة عربية موحدة في شكلها النهائي. وقد شكلت تلك المبادرة بداية لسلسلة من المعايير المتفرعة والخاصة بإشراف اللجنة رقم 8 التابعة لمنظمة ASMO من جملتها المواصفة 662 ASMO التي حملت في ثناياها فكرة صياغة الحاسوب العربي أحادي اللغة.

مواصفة آسمو 662 (ASCII موسع)

أدى الحماس في تصميم معيار عربي يتوافق تماما مع المعيار الدولي ISO/IEC 646 إلى الاعتقاد بإمكانية إنشاء نظام عربي مستقل لا يعتمد على أي لغة لاتينية داعمة. ففي عام 1985، تم التوصل إلى تعريف معيار عربي موسع (ASMO 662) مكون من رموز تشفيرية بطول ثماني بتات (Octet) واعتماده في صياغة جدول متكامل لترميز البيانات حصريا بالمحارف العربية بين أنظمة الكمبيوتر المعربة. وكانت لهذه المبادرة الأهداف التالية:

  • إنشاء جدول رموز عربية مستقل عن الرموز اللاتينية يهيئ لتصميم جهاز كمبيوتر عربي أحادي اللغة،
  • إمكانية توسيع جدول الحروف العربية على أساس الاحتياجات اللغوية الخاصة دون الحاجة إلى تصميم مسبق. وفي هذا دعم للغات التي تستعمل الحروف العربية بتمكنيها من إيجاد الحلول الملائمة للحوسبة المحلية (كالفارسية والأفغانية والبربرية …)،
  • تفادي التكرار الذي قد ينجم عن استخدام الجداول المشتركة بين الأحرف العربية واللاتينية،
  • تجنب استخدام برامج تحليل السياق لتحديد الاتجاهية لبعض العلامات المزدوجة الشائعة في الكتابات العربية واللاتينية.

asmo6601

نظرا لعديد الاعتبارات الجيوسياسية والاقتصادية المختلفة التي يطول شرحها هنا، لم يكن من الممكن تنفيذ هذه السياسة العربية من أجل تصنيع جهاز كمبيوتر أحادي اللغة. يمكننا فقط أن نقول هنا أن سياق التعددية اللغوية في تصنيع أجهزة الكمبيوتر وتأثير العولمة المتصاعد منذ ذلك الوقت ساهما في إفشال هذا المشروع. لذا، تحتم على كافة اللغات “الأقلية” ومن بينها العربية، المرور بلغة لاتينية داعمة لضمان تواجدها في السياق الرقمي الدولي. فما كان للغة العربية من حل إلا التوجه نحو اعتماد معيار تشفيري موسع (8 بتات) يحتوي على مجموعتين من المحارف أولها اللاتينية وثانيها العربية. وكان ذلك أيضا حال كافة اللغات “الأقلية” التي تم ضمها لاحقا في سلسلة المعايير المصنفة تحت المعيار العام ISO 8859. بهذه الطريقة، تكرست الهيمنة اللاتينية على المعايير الدولية لتشفير المحارف بتمركز معيار ASCII أو Latin-1 في مداخل كافة المعايير الدولية ومن جملتها اليونيكود وISO 10646 وتفريعاتها المختلفة ك UTF 8 وغيرها. بهذا التوجه تمت صياغة المعيار العربي ASMO 708.

مواصفة أسمو 708 (ISO/IEC 8859-6)

نظرا لطبيعة تصميمها المبني على الثنائية اللغوية بين اللاتينية العربية، تتكون المواصفة ASMO 708 من مجموعة الأحرف اللاتينية المطابقة لمواصفةISO/IEC 646 ومجموعة الأحرف العربية المحددة في معيار ASMO 449 مع اثنين من السمات الرئيسية:

  • تحديد مكان واحد لنفس الحروف المشتركة بين نظامين للكتابة. من نتائج هذا التصميم هو توفير مجموعة مكونة من 50 محرفا عربيا (حروف المواصفة ASMO449 دون الحروف المشتركة) ومجموعة مكونة من 128 حرفا لاتينيا تتضمن المحارف المشتركة كعلامات التنقيط والأرقام،
  • إمكانية تطبيق تقنيات توسيع الجداول وفقا للمواصفات ISO/IEC 2022 و ISO/IEC 4873

نظرا إلى البعد الاندماجي بين مجموعتين من المحارف المستعملة جدا في التطبيقات العلمية، تم اعتماد هذا المعيار من قبل الجمعية الأوروبية لمصنعي الحواسيب تحت المعرف الوحيد ECMA 114 . كما اعتمدته منظمة الأيزو في إطار سلسلتها الجديدة من المعايير الموسعة 8859 تحت المعرف الفرعي ISO/IEC 8859-6 الخاص باللغة والكتابة العربية.

مواصفة أيزو ISO 8859-6

تم تطوير سلسلة مواصفات ISO/IEC 8859 لتحديد تمثيل ثنائي واحد وثابت للحروف الرسومية. في الواقع، تتكون سلسلة المعايير ISO 8859 أولا من المعيار المعروف باسم Latint-1 المطابق للجزء الأول من السلسلة ISO 8859-1. ولكن، نظرا لأنه ليس من السهل تمثيل جميع الحروف المستعملة في جدول واحد، تم تقسيم سلسلة ISO/IEC 8859 إلى عدة أجزاء تُنسَب كل واحدة منها إلى منطقة محددة من العالم لخدمة متطلبات واحتياجات مجموعات لغوية معينة (كاللغات الأوروبية، السريالية واليونانية والعربية والعبرية…). كل جزء يحتوي على 128 حرف مأخوذ من مواصفة ASCII كمجموعة أساسية، مع تكملة الجزء المتبقي من جدول التشفير بمجموعة من المحارف المتغيرة حسب كل لغة على حدة.

تشكل المواصفة الفرعية ISO 8859-6 الخاصة بالكتابة العربية الجزء السادس من السلسلة ISO 8859 . من إشكاليات هذه المواصفة الفرعية أن اللغات التي تعتمد على الحروف العربية في كتاباتها لا يمكن لها أن تجد في هذه المواصفة كافة متطلباتها اللغوية. كما أن ترتيب الأحرف فيها يعتمد التسلسل المنطقي وليس البصري وهذا من شأنه أن يشكل عوائق كبيرة لاتزال تعاني منها إلى اليوم الواجهات التطبيقية متعددة اللغات كالكتابة مزدوجة الاتجاهات والترتيب الهجائي وخاصة معالجة الأرقام. سنعود ربما إلى التعرض إلى هذه الإشكالية في مدونة لاحقة نظرا لأهميتها في التعامل مع التطبيقات ثنائية اللغة ذات الاتجاه المزدوج. فاللغة العربية تكتب من اليمين إلى اليسار مع استثناءات هامة مثل الأرقام ذات الاتجاه الإلزامي من اليسار إلى اليمين. كما أن الأشكال المختلفة التي تربط الحروف العربية لا تمتلك في هذه المواصفة ترميزا متميزا.

 


تعليق

بدايات الترميز الرقمي المعياري للمحارف العربية — 6 تعليقات

  1. أشكرك أستاذي العزيز ، وإن كان هذا الشكر قد جاء متأخرا ، وما ذلك إلا بسبب ظروف منعتني من متابعة الصفحة ومتابعة الموضوع.

  2. السلام عليكم ،،أريد تحويل نص مكتوب بالنظام الثنائي الي كلام مكتوب بالعربي ،،ارجوا المساعدة!!

  3. ممكن تزويدي بمعلومات عن المعلومة الرقمية العنصرية و مفهوم الترميز وحجم المعلومة من فظلكم لم استع الحصول على المعلومات عن هاذا الموضوع

  4. أشكرك أستاذي الكريم على حرصك على اللغة العربية ، وأحييك على هذا الشعار الرائع الذي اتخذته عنوانا لمدونتك .
    أستاذي الكريم ، محدثك يحاول أن يؤرخ للحرف العربي ، وقد صدر لي عدة كتب في هذا المجال ، وأحاول أن أكمل المسيرة إن أطال الله العمر وأعان بالجهد لأكتب عن تاريخ الحرف العربي في عصر الحاسبات الآلية . وكثير من المادة العلمية موجود لدي، ولكن بنسب متفاوتة . وأحاول أن أجد بصورة موسعة وباللغة العربية ما كتب حول تطور الحروف العربية في جداول المحارف الحاسوبية، وبمعنى أدق ؛ الإجابة عن سؤال مفاده : لماذا اختارت مثلا؛ أي بي إم جدولا للمحارف العربية ، واختارت اسمو بإصداراتها المختلفة جداول اخرى ، ولماذا اختارت مايكروسفت جدولا آخر ، ثم الجدول العالمي الموحد .
    بحيث يمكننا تفسير مثل هذه الاختلافات والمشكلات التي عالجها كل جدول على حدة ، وما المشكلات التي كانت في الجدول السابق وهكذا….
    لقد وجدت في مقالكم هذا معلومات مهمة ، ولكن أحبذ تكرمكم بتزويدي بالمزيد حول الموضوع . شاكرا لك كريم تفضلك . أخوك صالح الحسن

    • الأخ العزيز صالح

      أشكرك جزيل الشكر على متابعتك لما أكتبه بموقعي الخاص حول اللغة والكاتبة العربيتين رغم اختزال المادة. فالهدف من التعرض لبعض المسائل المتعلقة بالكتابة الرقمية العربية هو من باب الملامسة لتلك المحاور والحفاض على الخيط الذي يربطني بها علميا وبحثيا خصوصا وأني تعرضت إليها بأكثر دقة وتمحيص منذ سنوات في إطار التحضير لرسالة الدكتوراه بجامعة بوردو الفرنسية.

      إجابة عن تساؤلاتك حول مشكلات الجداول الرقمية في تشفير الحروف العربية واختلافها من مصنع إلى آخر فقد عرفت أغلب لغات العالم هذه الظاهرة منذ بدايات الترقيم الثنائي. ويعود أصل المشكلة حسب رأيي إلى سياسات السوق الإلكترونية الرقمية التي عرفت في بداياتها تنافسية اقتصادية عالية وسعيا لكبريات الشركات المصنعة للمعدات والبرمجيات الحاسوبية من أجل التفرد بالأسواق العالمية والسيطرة عليها اقتصاديا وثقافيا بفرض مواصفاتها الصناعية الخاصة. لكن مع رواج الشبكات العالمية وربط أكبر عدد من الحواسيب الشخصية ببعضها، صار من الضروري توفير قدر معين من التوافق بين المعدات والبرمجيات من أجل تبادل سلس للبيانات بين المنظومات الرقمية المتباعدة. فقد سعت كل الشركات المصنعة وقتها إلى اتباع المعايير المهيمنة – ومن أهمها مواصفة الآسكي (7 بتات) والآسكي الموسع (8 بتات) – كمنطلق لتطوير جداول تشفير خصوصية لعديد من اللغات العالمية لغايات تجارية. وقد كانت شركة ibm من أوائل الشركات التي اعتمدت هذا الأسلوب من خلال تطوير فكرة صفحات الترميز (Code pages) المكونة من أصل ال128 حرف التابع لمواصفة الآسكي، مضيفة إليها 128 رمزا إضافيا لتغطية حروف أي لغة من اللغات الأخرى ذات البعد التجاري. من هذا المنطلق، توفرت بالنسبة للغة العربية صفحات الترميز 420 (إنجليزية وعربية) و 425 (عربية وانجليزية أو فرنسية) و 720 مقتبسة عن مواصفة الأسمو العربية للعمل تحت نظام MS-DOS المعرب وغيرها (يمكن أن تجد وصفا دقيقا لخصائص كل صفحات الترميز هذه على موقع IBM تحت الرابط http://www-01.ibm.com/software/globalization/cp/cp_cpgid.html).

      بنفس هذا الأسلوب، اعتمدت أيضا شركة ميكروسوفت منذ التسعينات تطوير صفحات الترميز لتشغيل النسخ الأولى من نظام الويندوز (ما قبل XP) نذكر من أبرزها صفحة الترميز CP1252 بالنسبة للغات اللاتينية أو الصفحة CP1256 بالنسبة للعربية، وهي صفحة مقتبسة من الفرع السادس من المواصفة الدولية ISO 8859. بنفس منهج الاقتباس طرحت شركة Apple رموزها الخاصة المكونة من 8 بتات في نظام التشغيل Mac OS. وقد صممت صفحة الرموز العربية Mac OS Arabic character set سنة 1986 انطلاقا من المواصفة الدولية 8859-6 مع إدخال بعض التغييرات والإضافات عليها كما هو مذكور في الوثيقة تحت الرابط التالي http://www.unicode.org/Public/MAPPINGS/VENDORS/APPLE/ARABIC.TXT .

      عموما، بهذه الطريقة الاقتباسية (بالحذف أوالإضافة أو تغيير أماكن الرموز) شكلت المواصفة 8859 منعرجا هاما في تاريخ الترميز الرقمي الثنائي للغات إذ تم اعتمادها من قبل جل المصنعين وكذلك الهيئات والمنظمات الحكومية لاقتراح مواصفات أكثر تطورا وشمولية ضامنة بهذا الاختيار قسطا كبيرا من التطابق بين البرمجيات والأنظمة الشبكية المستخدمة رغم أن جل الحول كانت ثنائية اللغة نظرا لكونها مبنية على ترميز ثنائي بطول 8 بتات يوفر 256 حرفا تحتكر مواصفة الآسكي الحروف 128 الأولى منها وتوضف الحروف 128 المتبقية لتغطية لغة اختيارية ثانية.

      لم تكتف المجموعة الدولية بهذه الحلول وواصلت البحث عن أساليب أكثر شمولية وشفافية لكافة اللغات إلى أن تم في سنة 1990 اقتراح المواصفة الدولية ISO 10646 التي تعرف أيضا بمجموع المحارف الدولية (Universal Character Set) لاستيعابها لجميع حروف لغات وكتابات العالم حاضرها وماضيها وذلك بتوسيع تركيبة الرموز من 8 بتات إلى 32 بتة. من خصائص هذه المواصفة أنها تُبقي على نفس الرموز المعتمدة في مواصفة 8859-1 أي الحروف اللاتينية وأولها حروف الآسكي حفاظا على استمرارية التطابقية المكتسبة إلى حد ذلك الوقت. ثم في سنة 1991 تم اقتراح مواصفة اليونيكود كامتداد للمواصفة 10646 بنفس طول وحدات الترميز مع تخصص هذه الأخيرة بضبط خوارزميات إضافية لمعالجة بعض الظواهر منها إدارة ازدواجية توجيه الكتابة ومعالجة السياق لربط المحارف فيما بينها كما في العربية مثلا. من خصائص مواصفة اليونيكود أيضا أنها تشكل حلا توافقيا دوليا لترميز كافة الحروف بشكل أحادي معتمدة في ذلك تركيبات utf-32 وutf-16 وutf-8 وهي طرق مبتكرة لاقتضاب طول الترميز مقارنة مع التركيبة الأصلية لكل رمز يكون مكونا من 8 أو 16 أو 32 بتة. ولعل utf-8 هي الأكثر اعتمادا على الشبكات نظرا لتوفيرها لفضاءات كبيرة داخل الذاكرة الحاسوبية لترميز المحارف.

      ملخصا لسؤالك حول اللغة العربية: قامت في بداية الأمر كافة الشركات المصنعة باقتراح جداول مختلفة للغة العربية انطلاقا من مواصفات موروثة تعود إلى مواصفات البطاقات المثقوبة لكن بإدخال العديد من التغييرات على أماكن الرموز من جدول إلى آخر وذلك لاعتبارات متعددة منها ضرورة إضافة بعض الحروف أو إزالة بعضها استجابة إلى بعض الخصوصيات اللغوية في بعض المناطق (مثلا بعض الخصوصيات اللغوية بين المشرق والمغرب العربيين) أو تلبية لحاجيات بعض اللغات الأخرى التي تستعمل الحروف العربية كالفارسية مثلا.

      مع إصدار المواصفة الدولية 8859 والجزء السادس منها الخاص باللغة العربية، توسع مجال التطابق بين الجداول المعتمدة من قبل المصنعين إلى حد كبير لكن ببقاء العديد من الفوارق التي ترجع أساسا إلى الأسباب المذكورة آنفا وغيرها من الاختيارات ذات البعد التجاري والاقتصادي.

      مع صدور مواصفتي اليونيكود وiso 10646، صار التطابق شبه تام بين كافة المصنعين والمبرمجين نظرا لاعتمادهم الآلي لهذه المواصفات الدولية. لذا نجد اليوم كافة الأجهزة الحاسوبية التي تستعمل اليونيكود قادرة على الكتابة بأي لغة تتم إضافتها ببضع نقرات تحت نظم التشغيل ويندوز أو لينوكس أو غيرها. وللتذكير هنا، فهنالك فارقان أساسيان يميزان كلّا من يونيكود وISO 1064 من جهة وبقية المواصفات التي سبقتها من جهة أخرى. أول الفارقين هو أن هاتين المواصفتين الدوليتين غيرتا من مفهوم الترميز الرقمي الثنائي للمحارف فلم تعد تشفر المحارف حسب اللغات بل تشفرها بطريقة مجردة منفصلة عن اللغة أو اللغات التي تستعملها في أساليب كتابتها. وفي ذلك تغيير جذري في فلسفة التشفير إذ أنه يمكن اعتماد نفس الحرف في عديد اللغات دون ضرورة إعادة تشفيره من أجل لغة أو لغات أخرى تعتمده في طريقة كتاباتها، مثلنا في ذلك الحروف العربية التي تُستعمل في كتابة لغات عديدة أخرى. وفي هذه الطريقة إفادة كبيرة من حيث اقتصاد مساحات الترميز على مستوى مسطحات جدول يونيكود. لم يكن هذا الأسلوب معمول به في المواصفات السابقة إذ تتم إعادة تشفير بعض الحروف ذاتها في عديد الجداول التابعة لمواصفة ISO 8859 مثلا. أما الفارق الثان، وهو هام بالنسبة لمصممي محارف الطباعة، فهي تكمن في أن المواصفتين المذكورتين لا تعنيان بالشكل المادي للمحارف(glyphs) بل تضبطان ترميزا للهوية المجردة للمحارف يتم ربطها بالشكل المادي للحروف على مستوى التطبيقات الخاصة بالواجهات التطبيقية.

      أرجو أن تكون قد وفرت هذه الإضافات بعض المادة ردا عن تساؤلاتك. ولمزيد إثراء هذه المادة أقترح القراءات التالية ومع فائق التحيات

      محمد حسن: http://www.hamoudstudio.com/?p=469
      التصميم الطباعي العربي: https://arabictype.wordpress.com/2011/05/17/arabic-type-characteristics/
      الوحدة فى تصميم الخطوط العربيه الحاسوبية: http://www.sustech.edu/staff_publications/20130512151640768.pdf

      المواصفات والمقاييس:
      http://www.google.fr/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&ved=0CCMQFjAA&url=http%3A%2F%2Ffaculty.kfupm.edu.sa%2Fics%2Fmuhtaseb%2Fteaching%2FACLecture08.ppt&ei=xLo6VZm3JqHSyAO7z4CIDw&usg=AFQjCNH5ykDl67MBXJIpayeUTTwngyxFeg&sig2=Nn5NzQAd0-jlWvtW6wW37g&bvm=bv.91665533,d.bGQ&cad=rjt

      ويكيبيديا : http://ar.wikipedia.org/wiki/%D8%AA%D8%B5%D9%85%D9%8A%D9%85_%D8%B7%D8%A8%D8%A7%D8%B9%D8%A9_%D8%A7%D9%84%D8%AD%D8%B1%D9%88%D9%81_%D8%B1%D9%82%D9%85%D9%8A%D8%A7

      الحرف العربي والحوسبة: http://www.alargam.com/letters/ragm502.htm

      نقاط على الحروف العربية: http://itwadi.com/node/2198

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *