مختبر بقيادة الأبحاث

في إطار سد الفجوة بين الجانب الأكاديمي ومجال الأعمال ، يجب مواجهة التحديات وطموحنا هو قوتنا الدافعة. نحاول استنساخ وتحسين ما هو موجود حاليًا في الأبحاث الأكاديمية مما يجعله قابلاً للاستخدام في سيناريوهات مجال الأعمال حيث يجب التركيز على الكفاءة والجودة. في مختبر علوم البيانات الخاص بنا ، نقوم بإنشاء العوامل الأساسية التي تدعم منصة نورا.

التعرف على الكيانات

من خلال الاستخراج الشامل لميزات الكلمات العربية المورفولوجية في النص، قمنا بتدريب نموذج تسلسلي سريع يمكنه اكتشاف الكيانات المسماة والتعرف عليها مثل الأشخاص والمؤسسات والمواقع. يمكن تعديل وتوسيع النموذج ليشمل أنواعًا أخرى من الكيانات مثل فئات المنتجات ومجالات الأعمال وما إلى ذلك.

يعدَ تحديد الكيانات المذكورة في النص الغير منظم وتصنيفها إلى فئات ذات صلة بها أحد أكثر تقنيات استخراج المعلومات قيمة للشركات. بعض من التطبيقات البارزة هي البحث الفعال عن المستندات أو تحديد أولويات المستندات أو تعيين الموظف المسؤول بناءً على المنتجات أو المواقع المذكورة في الشكاوي, الرسائل, أو البريد الإلكتروني. يمكن لتقنية كشف الكيانات تعزيز مواقع الويب المبنية على وجود محتويات نصية أيضًا عن طريق استخراج البيانات الوصفية من المحتوى وتعليمه.

bubble NER
bubble Sentiment

تصنيف المشاعر

قمنا بتدريب نموذج التعلم العميق المبني على (Transformers) على أكثر من 100,000 عينة عربية بلهجات مختلفة وحققنا تنبؤًا للمشاعر النصية التي يراها القراء إيجابية أو سلبية أو محايدة بدقة 94٪.

بلغ التنقيب عن الرأي ذروته مع إدخال الأدوات التي تسهل تبادل الأفكار, الآراء, والمحتويات مع الجمهور. على الرغم من أن ذاتية الآراء تؤثر على مصداقيتها ، إلا أن تحليل المشاعر يلعب دورًا كبيرًا في دراسة ردة فعل مجموعة مستهدفة تجاه كيان أو حدث معين. لذكر بعض تطبيقات تحليل المشاعر: اكتشاف ردة الفعل لحدث شائع ، تحسين عملية إرضاء العملاء ، ودراسة سمعة علامة تجارية معينة أو كيان ما.

تلخيص النص

من خلال تقييم تقنيات متعددة في الأبحاث الحالية ، قمنا بتطوير نموذج لترتيب الجمل على حسب أهميتها في النص باستخدام أحدث تقنيات تمثيل النص لتلخيص مستندات بكمية هائلة من الجمل في شكل يمكن قراءته في ثوانٍ.

في علم فهم النص وتمثيل المعرفة ، يعدَ تلخيص النص أحد الأساليب التي تعزز إنتاجية مهام القرَاء اليومية. يوفر تلخيص قدر هائل من المحتوى الاجتماعي أو السياسي أو التجاري في عدد قصير نسبيًا من الجمل نظرة عامة ملموسة وسريعة حول أي موضوع مستهدف يرغب أصحاب المصالح في معرفة المزيد عنه.

bubble Text Summerization
bubble Keyword Extraction

استخراج الكلمات المفتاحية

باستخدام أحدث عمليات التضمين السياقي الدلاليَ ، بجانب نموذج مبني على قوانين مورفولوجية لترشيح الكلمات الرئيسية، قمنا بتطوير تقنية غير خاضعة للإشراف يمكنها استخراج الكلمات المفتاحية والعبارات الرئيسية الأكثر إفادة في المستند.

يؤدي تعليم المستندات النصية بكلماتها المفتاحية إلى إنشاء شكل آخر للمستندات حيث يمكن للقارئ أن يتعرف ، على سبيل المثال ، أن مستند مكون من 1000 كلمة يتحدث عن موضوع معين من خلال قراءة 10 كلمات فقط في ذلك المستند. يمكن أن يساعد النموذج في أتمتة التحليلات لمجموعة بيانات ضخمة وتطبيقه للحصول على كلمات معبرة أو وصفية لعلامة تجارية أو كيان معين. يمكن أيضا تطبيقه لمعرفة ما يتحدث عنه جمهورك ، أو معرفة ردة فعل دقيقة بعد تقديم منتج أو سياسة جديدة.