چالش های ریشهیابی متون فارسی در سیستمهای بازیابی اطلاعات
در بازیابی اطلاعات و ریخت شناسی زبانی، ریشه یابی کلمه به معنای کاهش گونههای مختلف دستوری کلمه همانند فعل، صفت، اسم جمع و غیره به فرمی یکسان به نام ریشه است که منجر به افزایش کارایی سیستمهای بازیابی اطلاعات میشود. ریشهیابی کلمات، استخراج ریشههای اصلی یک کلمه است. بررسی فنی ایدههای مورد استفاده در ریشهیابهای موجود، نشانگر آن است که می توان رویکردهای موجود را به سه گروه طبقه بندی نمود. ریشهیاب های ساختارگرا ، ریشهیاب های مبتنی بر لغت نامه و ریشهیابهای آماری. در این مقاله به مطالعه و بررسی چالشهای موجود در ریشهیابی کلمات فارسی پرداخته و مشکلات موجود در ریشهیابی کلمات در هر یک از سه دسته را به طور کامل تشریح نمودهایم.
