چالش های ریشه‌یابی متون فارسی در سیستم‌های بازیابی اطلاعات

در بازیابی اطلاعات و ریخت شناسی زبانی، ریشه یابی کلمه به معنای کاهش گونه‌های مختلف دستوری کلمه همانند فعل، صفت، اسم جمع و غیره به فرمی یکسان به نام ریشه است که منجر به افزایش کارایی سیستم‌های بازیابی اطلاعات می‌شود. ریشه‌یابی کلمات، استخراج ریشه‌های اصلی یک کلمه است. بررسی فنی ایده‌های مورد استفاده در ریشه‌یاب‌های موجود، نشانگر آن است که می توان رویکردهای موجود را به سه گروه طبقه بندی نمود. ریشه‌یاب های ساختارگرا ، ریشه‌یاب های مبتنی بر لغت نامه و ریشه‌یاب‌های آماری. در این مقاله به مطالعه و بررسی چالش‌های موجود در ریشه‌یابی کلمات فارسی پرداخته و مشکلات موجود در ریشه‌یابی کلمات در هر یک از سه دسته را به طور کامل تشریح نموده‌ایم.