البيانات الضخمة Big data: اختراع أم تحديث؟

 تمثل “البيانات الضخمة (Big Data)” مرحلة هامة من مراحل تطور نظم المعلومات والاتصالات. وهي تعبر في مفهومها المبسط والمختزل عن كمية هائلة من البيانات المعقدة التي يفوق حجمها قدرة البرمجيات والآليات الحاسوبية التقليدية على خزنها ومعالجتها وتوزيعها، الأمر الذي حدا بالأخصائيين إلى وضع حلول بديلة متطورة تمكن من التحكم في تدفقها والسيطرة عليها. والسؤال هنا هو عن طبيعة هذه الظاهرة وكيفية إدراجها ضمن المسار العام للتطورات التكنولوجية التي عرفها مجتمع المعلومات منذ ظهور الثورة الرقمية.

في حقيقة الأمر يمكن اعتبار ظاهرة البيانات الضخمة امتدادا وتكرارا لظاهرة تعوّد عليها مجتمع المعلومات والاتصال منذ بداية الترميز الثنائي للبيانات الذي أدى إلى الثورة الرقمية وظهور مجتمع المعلومات. ففي كل مرحلة من مراحل تطور الظواهر الاتصالية، كانت دائما ردة الفعل البديهية هي ابتكارالبدائل وتحديث المناهج وتكييف الحلول وابتكار الطرق الملائمة للسيطرة على التدفق السريع للبيانات. وهذا ما يحدث اليوم من قبل الفاعلين المباشرين من مصممين ومصنعين ومستعملين للبينات الرقمية على الشبكات وهو الأمر الذي جعل من ظاهرة البيانات الضخمة حدثا متداولا على نطاق واسع هذه الفترة الأخيرة.

لنقم هنا، تماشيا مع هذا السياق، بقراءة سريعة ومقتضبة في تسلسل دورات التطور التكنولوجي لنظم معالجة البيانات الرقمية التي وصلت في هذه المرحلة إلى ظاهرة البيانات الضخمة في كافة أشكالها وبكافة التقنيات المرتبطة بها بما في ذلك شبكات نقل البيانات السريعة (Grid networks) والبيانات السحابية (Data in the clouds) والمعايير التكنولوجية (interoperability standards) وتحليلات البيانات (dat analytics). فمن دون العودة أيضا إلى الأصول التاريخية لاختراع الطباعة قبل خمسة قرون، أو العودة إلى الأصول ما قبل التاريخ لاختراع الكتابة منذ 5000 سنة (وكليهما من بين الاختراعات الكبرى التي يمكن اعتبارها – في إطارها التاريخي – إصدارات بدائية لظاهرة البيانات الضخمة)، تتجلى لنا ثلاث مراحل رئيسية على مستوى البيانات الرقمية ساهمت في الدفع إلى مرحلة البيانات الضخمة التي نعيشها اليوم:

1المرحلة الأولى – من الثقافة الورقية إلى الأوعية الرقمية : يشكل اختراع الطباعة وتصنيع الكتاب وتوزيعه الواسع ثورة رائدة غير مسبوقة في نشر المعلومات. فقد أنتجت انفجارا هائلا للبيانات في جميع المجالات وفي كافة الأشكال (بيانات ضخمة ورقية حسب مقايس عصرها). ثم أتت التكنولوجيات الرقمية في وقت لاحق لتشمل الانفجار الورقي وتعيد هيكلته أولا من خلال اختراع أجهزة الكمبيوتر الشخصية، ثم من خلال ربط أجهزة الكمبيوتر في شبكات محلية تعمل وفق معايير التطابق الدولية.

2المرحلة  الثانية – من جهاز الكمبيوتر والشبكات المحلية إلى شبكة الإنترنت: لما نفذت قدرة أجهزة الكمبيوتر المكتبية والشبكات المحلية على متابعة التدفق الهائل للبيانات (خاصة بعد تطور تقنيات الوسائط المتعددة)، أصبح الانفتاح على الشبكات الافتراضية العالمية لتقاسم الموارد وتبادلها أمرا لا مفر منه. فتم لذلك إنشاء محركات وأدلة البحث على الشبكات الافتراضية مثل شبكة الإنترنت للمساعدة على التحكم في كمية البيانات المنتجة والمتبادلة. كما تم تصميم معايير دولية جديدة لوحدات التكشيف والفهرسة (ميتاداتا) وأدوات بحث أكثر تطورا (الأعوان الذكية). ويمثل نموذج الميتاداتا “دبلن كور” الذي صمم سنة 1995 تعبيرا صارخا عن قلق عديد الفاعلين الدوليين مثل OCLC وNCSA من امكانية فقدان القدرة على التحكم في الكم الهائل من البيانات المتدفقة على شبكة الإنترنت. كما تعتبر مستودعات البيانات الوصفية أو الميتاداتا، والأعوان الذكية، والمنطق الضبابي، وتقنيات الدفع للبيانات، الخ أشكالا أخرى للتعبير عن الحاجة إلى تحسين امكانيات الوصول والاستخدام للكم الهائل من البيانات المتاحة على شبكة الإنترنت.

3مرحلة ثالثة – من شبكة الإنترنت الكلاسيكية إلى البيانات الضخمة: تعتبر البيانات الضخمة واقعا جديدا أفرزته التطورات المتواصلة من حيث الكم والكيف للنظم الآلية لإنتاج المعلومات ومعالجتها. ففي عام 2013، وصل حجم التداول اليومي من البيانات التي تم إنشاؤها إلى 2.5 تريليون بايت و90٪ منه تم إنشاؤه خلال العامين الماضيين. وبالتالي، فالبيانات الضخمة هي مصطلح يستخدم للتعبير عن حجم موارد البيانات المستعملة للرد على تساؤلات كانت صعبة المنال في السابق. وهي أيضا موضوع إجماع واسع على قدرة البيانات الضخمة كي تحل محل المناهج التقليدية بفضل خصائلها الثلاث: حجم وسرعة وتنوع. كما يوجد أيضا توافق واسع حول الإمكانات الكبيرة للبيانات الضخمة لدفع الابتكار والرقي في جميع المجالات الاقتصادية والأنشطة الثقافية. من أجل ذلك، اعتمدت البيانات الضخمة على التكنولوجيات الحديثة وتطبيق المعايير الخاصة بتكنولوجيا المعلومات والاتصالات. فالحوسبة السحابية، وشبكات البيانات فائقة السرعة وبرامج تحليل البيانات هي من بين الترسانة التكنولوجية الهائلة التي تدعم ظهور البيانات الضخمة في مختلف القطاعات.

ولكن على الرغم من الاتفاق العام سواء على الإمكانيات أو القيود الحالية للبيانات الضخمة، فإن عدم الوصول إلى توافق تام في الآراء بشأن عديد القضايا الرئيسية والأمور الأساسية حول هذه الظاهرة لا يزال يشكل مصدرا للالتباس. من هذه القضايا الأساسية نذكر مثلا تلك التي تتعلق بتحديد الصفات المعتمدة في تصنيف منظومة معينة كمنظومة من البيانات الضخمة. يمكن التساؤل أيضا عن تحديد طبيعة الاختلاف بين البيانات الضخمة من ناحية وتطبيقات البيانات التقليدية ناحية أخرى. ثم ما هي الخصائص الأساسية لبيئات البيانات الضخمة؟ وكيف يمكن للبيئات المنتشرة حاليا الاندماج في هيكلية بيانات ضخمة؟ وما هي التحديات التكنولوجية والعلمية والتنظيمية التي يجب معالجتها من أجل تسريع اعتماد حلول البيانات الضخمة بطريقة فعالة وموثوق بها؟ كلها تساؤلات لا تزال بصدد البحث والتدقيق من خلال الدراسات والتجارب والبرامج البحثية والاستعمالات ودراسات الجدوى التي تشارك كلها في بناء الإطار النظري والتقني العام لتطور التكنولوجيا وإحداث فوارق التجديد والخلق والإبتكار.

مراجع عربية خارجية