استعراض لأهم تقنيات تضمين الكلمات في معالجة اللغة الطبيعية
الملخص
تعد معالجة اللغات الطبيعية مهمة لأنها تساعد في حل الغموض في اللغة وتضيف بنية رقمية مفيدة إلى البيانات للعديد من التطبيقات النهائية، مثل التعرف على الكلام أو تحليلات النص.
العديد من خوارزميات التعلم الآلي وجميع بنيات التعلم العميق تقريبًا غير قادرة على معالجة السلاسل أو النص العادي في شكلها الأولي. إنها تتطلب أرقامًا كمدخلات لأداء أي نوع من الوظائف، سواء كان ذلك التصنيف أو الانحدار وما إلى ذلك بعبارات عامة. ومع الكم الهائل من البيانات الموجودة في تنسيق النص، من الضروري استخراج المعرفة منه وبناء التطبيقات.
في هذا البحث نوضح مراحل معالجة النص وصولاً إلى طرق تضمين النص الذي يمثل طريقة حديثة لتمثيل الكلمات كمتجهات رقمية ليتم معالجتها من قبل خوارزميات التعلم الآلي، حيث توفر مقدمة موجزة عن المجال ونظرة عامة سريعة على بنى وطرق التعلم العميق وتمثيلات الكلمات السياقية العميقة مثل نموذج التضمين من نماذج اللغة.