الحاجة ماسة إلى ابتكار طرق جديدة من اجل تطوير تقنيات اللغة العربية

طورت العديد من الشركات العربية محركات بحث لشبكة الإنترنت منها محرك “أين” الذي انطلق عام 1997 وأغلق عام 2012، و”العربي” الذي انطلق عام 2006 وأغلق عام 2009، و”أنكش” الذي انطلق عام 2007 وأغلق عام 2010.

ولم تستطع تلك التجارب منافسة محركات البحث العالمية خاصة محرك غوغل الذي انطلق عام 1998 وبدأ بدعم اللغة العربية عام 2002.

وطوّرت شركة صخر محرك بحث “الإدريسي” الذي استخدمته العديد من الشركات وبعض مواقع الويب، وعلى الرغم من جودته في معالجة اللغة العربية، لم ينتقل ليتحول إلى محرك بحث شامل للإنترنت، إذ لا تكفي جودة معالجة اللغة للنجاح، فالبحث في الإنترنت يتطلب العديد من التقنيات الأخرى، كالزاحف (Crawler) الذي يجوب كافة صفحات الإنترنت التي يقدر عددها بالمليارات ويفهرسها ويتعرف على الفاسد منها ويتجنبه، ويتعرف على لغة كل صفحة، ويتعرف على حدود النصوص والمقالات ويستخرجها، ويتعرف على اسم المؤلف، ويتعرف على الصور وحدودها وعناوينها.

ومن التقنيات الأخرى الأساسية التي يتطلبها محرك البحث، ترتيب نتائج البحث بأفضل ما يمكن، والذي يتضمن عشرات المتغيرات وهو ما جعل محرك بحث غوغل الأول عالميا بعد فترة قصيرة من إطلاقه.

كما أن تطوير محرك بحث لشبكة الإنترنت يتطلب استثمارات كبيرة. فغوغل مثلا حصلت على تمويل قدره 25 مليون دولار بعد أقل من عام على إطلاقها، ثم حصلت في العام الذي يليه على 25 مليون دولار إضافية، وذلك عبر مستثمرين مغامرين من القطاع الخاص، وهو ما لم يكن متاحا للأسف في البلدان العربية.

وكان يفترض أن تدعم الجهات الحكومية العربية أحد محركات البحث العربية التي تم إنشاؤها وتسهم في تمويله بحيث ينمو ويتمكن من اقتطاع حصة جيدة من السوق المرتبط بالبحث عبر الإنترنت باللغة العربية على الأقل. فمحرك البحث الصيني “بايدو” (Baidu) الذي انطلق في 2000 ما كان ليحقق النجاح الكبير الذي حققه لولا الدعم الحكومي وضخ ملايين الدولارات فيه. وينطبق الأمر أيضا على محرك البحث الروسي “ياندكس” (Yandex).

العقد الثاني من القرن الـ21 شهد انتقال تطوير التقنيات اللغوية العربية من الشركات العربية إلى الشركات العالمية (ويكيبيديا)

أطلقت شركة “إيه.تي.إيه” (ATA) عام 2000 موقع المسبار لترجمة النصوص ومواقع الإنترنت من الإنجليزية إلى العربية. وفي العام ذاته أطلقت “صخر” موقعها للترجمة من الإنجليزية إلى العربية (Tarjim.com). وكان الموقعان واعدين، إلى أن أنهت غوغل العصر الذهبي لبرمجيات الترجمة العربية في شهر أبريل/نيسان عام 2005، بعد أن تفوقت ترجمة غوغل الإحصائية المطورة حديثا على ترجمة صخر وبرامج ترجمة أخرى في الاختبارات التي أجراها المعهد الوطني الأميركي للمعايير والتقنية (NIST).

وظفت غوغل الكم الهائل من المحتوى الذي جمعته عبر محرك البحث، لتطوير محرك الترجمة الإحصائي من الإنجليزية إلى العربية وبالعكس، وهو أمر كان متعذرا على الشركات العربية، لافتقارها لهذا الكم من المحتوى.

وتمكنت عدة شركات عالمية فيما بعد من تطوير محركات ترجمة من الإنجليزية إلى العربية وبالعكس، وعلى رأسها مايكروسوفت نظرا لامتلاكها قدرا من المحتويات مقاربا لما تملكه غوغل.

وشهد العقد الثاني من القرن الـ21 انتقال تطوير العديد من التقنيات اللغوية العربية واسعة الاستخدام من الشركات العربية إلى الشركات العالمية التي تبنت تطوير هذه التقنيات مستعينة بخبراء عرب. ولم يقتصر الأمر على التقنيات التي سبق أن تناولناها، بل شمل التعرف على الصوت العربي والإملاء الصوتي الآلي، والقارئ الآلي للحروف المصورة، وتحويل الكلام العربي المنطوق إلى نص وبالعكس.

الحاجة إلى تطوير تقنيات اللغة العربية أكبر من الحاجة الأوروبية، لكن الأمر يتطلب إنشاء مركز عربي متخصص بذلك، تدعمه عدة بلدان عربية وخاصة الغنية منها، يستخدم الكم الهائل من المحتوى العربي المتوفر حاليا، لابتكار طرق جديدة وفعالة لمعالجة مسائل اللغة العربية المتشعبة بما في ذلك الموسيقى العربية وخطوط اللغة العربية.

المصدر : الجزيرة