بررسی امکان افزایش صحت یک ابزار برچسب‌دهی به اجزای کلام در فارسی

نوع مقاله: مقاله علمی - پژوهشی

نویسنده

پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک)

10.22084/rjhll.2019.16614.1834

چکیده

در این پژوهش به بررسی تأثیر رفع ابهام از برچسب نحوی هم‌نگاره‌های اسمی و صفتی مختوم به «ی» در فارسی روی عملکرد یک سیستم برچسب‌دهی خودکار به اجزای کلام، پرداخته شده است. سیستم مورد مطالعه در پژوهش حاضر، سیستم «هضم» است. در پژوهش حاضر، نرم‌افزاری جهت رفع ابهام از برچسب نحوی هم‌نگاره‌های مذکور، تهیه شد که خود مبتنی بر الگوهای حساس به بافت نحوی است؛ این الگوها حاصل بررسی هم‌نگاره‌های مذکور در پیکرة «بی-جن‌خان» است. بنابراین، هضم با پیکرة بی‌جن‌خان آموزش دیده شد. ارزیابی کلی نرم‌افزار تهیه شده جهت رفع ابهام از برچسب نحوی هم‌نگاره‌های اسمی و صفتی مختوم به «-ی» در فارسی، نشان می‌دهد اگر تنها الگوهای حساس به بافت نحوی که تأثیر مثبت در برچسب‌زنی داشته‌اند را به ابزار برچسب‌دهی اضافه کنیم، صحت کلی برچسب‌زن، در مقایسه با حالتی که از تمام الگوهای حساس به بافت نحوی استفاده ‌شود، ۱.۳۴ درصد بالاتر است.

کلیدواژه‌ها