أدوات عربي : حُزمة من الأدوات البرمجية المجانية لخدمة اللغة العربية !

Alaa Osman25 ديسمبر 2017
أدوات عربي : حُزمة من الأدوات البرمجية المجانية لخدمة اللغة العربية !

أدوات “عربي” (ArabiTools) هي مجموعة من الحُزم البرمجية مكتوبة بلغة جافا خاصة في اللغة العربية ومعالجة المحتوى العربي. تتكون هذه المجموعة من العديد من الحُزم مثل:

١-  حُزمة الكلمات: وهي مجموعة من الأدوات الإحصائية الخاصة بمعالجة المحتوى العربي وخاصة الكلمات ! تتضمن هذه الحُزمة أداة خاصة في إستخراج جذور الكلمات و أداة خاصة في إيجاد مشتقات الكلمات وأداة خاصة في التصحيح الإملائي و أخرى خاصة في معرفة ان كان النص المدخل عربياً ام لا (فارسي مثلاً).

٢- حُزمة الأسماء: هي حُزمة تحتوي على أدوات برمجية متخصصة في اسماء الاشخاص باللغة العربية، حاليا الحُزمة تدعم الأسماء الشائعة في فلسطين و الخليج العربي (الإمارات خصوصا)، سنقوم بإضافة دول اخرى في النسخ القادمة من الأدوات.

تتكون هذه الحُزمة من العديد من الأدوات الخاصة بالأسماء مثل أداة التصحيح الإملائي الخاص بالاسماء وأداة اكتشاف جنس الاسم و نوعه و تميز بين ذكرٍ وانثى والاسم المستخدم كاسم عائلة. وايضا اداة الترجمة والتي تعيد اكثر الترجمات شيوعاً للاسم المدخل.

تستطيعون تجربة تطبيق ويب تم بنائه بالاعتماد على حُزمة أسماء ويعكس طريقة تفاعلية في إدخال اسماء الاشخاص وترجمتها في نماذج التسجيل.

النسخة الفلسطينية: http://arabitools.com/names.html

النسخة الإماراتية: http://arabitools.com/namesae.html

٣- حُزمة الشبكات الإجتماعية: هي حُزمة برمجية تساعد المبرمج أو الباحث في تجميع كمية كبيرة من البيانات من الشبكات الإجتماعية باللغة العربية، حالياً الأداة تدعم تويتر وفي النسخة القادمه في شهر كانون الثاني سيتوفر دعم للفيس بوك أيضاً


الأداة الخاصة بتويتر قادرة على إرجاع ما يزيد عن ٧٠٪ من المحتوى العربي ( حوالي ٥ مليون تويت عربي يومياً) وتعيد البيانات والمحتوى فور حدوثه. وايضا الجدير ذكره ان الأداة تدعم اللهجات و حاليا تم تفعيل اللهجة المصرية، أي يستطيع المستخدم أو المبرمج ان يعيد المحتوى المصري فقط.

طبعا الاداة تدعم تصنيف المحتوى و تحديده بناءً على كلمات مفتاحية معينة.

٤- حُزمة أداة التصنيف

هي حُزمة مخصصة لتصنيف النص والمحتوى العربي ضمن تصنيفات معرفة ومدرب عليها النظام مسبقاً تشمل التصنيفات: رياضة، طب وصحة\مختبرات، إلكترونيات وميكانيكة، حاسوب وتكنولوجيا، أدب وفنون، أخبار وسياسة، ديانات، إدارة و إقتصاد

تستطيعون تجربتها من هنا: http://arabitools.com/cat.html

٥- حُزمة الكيانات الإسمية

ادوات خاصة في تحليل النص وإستخراج الكيانات الاسمية منه، تشمل هذه الاداة التعرف على الاشخاص والاماكن والمؤسسات والشركات وغيرها من الكيانات الدلالية داخل النص.

الفيديو التالي يوضح أكثر طبيعة عمل أدوت عربي وكيفية دمجها في أي التطبيقات والبرمجيات

اترك تعليق

لن يتم نشر عنوان بريدك الإلكتروني.الحقول الإلزامية مشار إليها بـ *


شروط التعليق :

عدم الإساءة للكاتب أو للأشخاص أو للمقدسات أو مهاجمة الأديان أو الذات الالهية. والابتعاد عن التحريض الطائفي والعنصري والشتائم.

هذا الموقع يستخدم Akismet للحدّ من التعليقات المزعجة والغير مرغوبة. تعرّف على كيفية معالجة بيانات تعليقك.

الاخبار العاجلة