تصنيف أقسام الكلام
من ويكيبيديا، الموسوعة encyclopedia
في علم معالجة اللغات الطبيعية تصنيف أقسام الكلام هي عملية تعليم أو تدليل الكلمات في نص أو متن نصي إلى نوع محدد من أجزاء الكلام المقابل لهذه الكلمة مثل (يأكل: فعل)، بناء على تعريف الكلمة وسياقها.[1][2][3] كان هذا التصنيف يعمل يدويا وألان يتم في سياق اللغويات الحاسوبية باستخدام بعض الخوارزميات المتخصصة في ذلك. هناك نوعان من تصنيف أجزاء الكلام: الأول يعتمد على القواعد والثاني على الاحتمالات الإحصائية. في العملية تصنيف أجزاء الكلام ليست سهلة كما تبدو لأن هناك كثير من الغموض واللبس في كثير من الحالات. مثل لو افترضنا كلمة ذهب في العربية هل تعني الفعل ذهب أي غادر ام الاسم ذهب وهو نوع من المعادن؟ من السهل معرفة نوع الكلمة من سياق الكلام بالنسبة للإنسان لكن بالنسبة للكمبيوتر العملية أكثر تعقيد. أيضا من المشكلات التي تواجه تصنيف الأقسام إذا كان النص يحتوي على كلمتين بنهم شرطة تمثل ككلمة واحدة وغيرها من المشاكل العديدة.