سایر زبان ها

صفحه نخست

سیاسی

بین‌الملل

ورزشی

اجتماعی

اقتصادی

فرهنگی هنری

علمی پزشکی

فیلم و صوت

عکس

استان ها

شهروند خبرنگار

وب‌گردی

سایر بخش‌ها

برای نخستین بار؛

رونمایی از پیکرهٔ به‌روز شونده در زبان فارسی

برای نخستین بار پژوهشگران زبان‌شناسی دانشگاه شیراز پیکره‌ای برای متون فارسی ایجاد کرده اند که هر روز به صورت خودکار به روز‌رسانی می‌شود.

به گزارش گروه استان های باشگاه خبرنگاران جوان از شیراز؛ امیرسعید مولودی مدیر پروژهٔ پیکرهٔ به ‌روز شونده با بیان اینکه در پیکره به روز شونده متون فارسی استانداردهایی رعایت شده است که پیش از این در تهیهٔ پیکره‌های زبان فارسی مغفول مانده بود، اظهار کرد: این پیکره و جستجوگر آن ابزار پژوهشی مهمی برای تحقیقات زبان‌شناسی و سایر حوزه‌های علوم انسانی است و علاوه بر این برای اهداف پردازشی زبان فارسی نیز می‌تواند مورد استفاده قرار گیرد.

وی تصریح کرد: ایدهٔ اولیهٔ طرح پیکره به روز شونده متون فارسی حدود ۲ سال پیش شکل گرفت و پس از انجام مراحل مطالعاتی در سال ۱۳۹۵، پیاده‌سازی فاز نخست آن با تمرکز بر متون خبری آغاز شد و رونمایی از این پیکره، مطابق برنامه‌ریزی‌های انجام‌ گرفته در هفتهٔ پژوهش، آذرماه امسال انجام خواهد شد.

مدیر پروژهٔ پیکرهٔ به ‌روز شونده با اشاره به این نکته که امروزه از پیکره‌های زبانی تقریباً در همه حوزه‌های علوم انسانی به طور عام و مطالعات زبانی به طور خاص استفاده می‌شود، تصریح کرد: بحث به‌روز بودن، توازن و نماینده بودن 3 ویژگی مهم برای کارآمدی پیکره‌های زبانی است که در طرح حاضر مورد توجه قرار گرفته است؛ بنابراین پیکرۀ حاضر از این حیث که تنوعات زبانی را با انتخاب داده از ژانرهای مختلف پوشش می‌دهد، داده به میزان مساوی از هر ژانر انتخاب می‌شود و اینکه هر روز داده‌های آن افزایش می‌یابد به‌ترتیب برخوردار از سه ویژگی نماینده‌ بودن، توازن و به‌روز شوندگی است.

وی اضافه کرد: به‌روز شونده بودن پیکرۀ حاضر به پژوهشگر این امکان را می‌دهد که بتواند تغییرات زبانی و حتی فرهنگی-جامعه‌شناختی را با استفاده از آن بررسی و تحلیل کند.
مولودی ادامه داد: در فاز نخست این طرح، هر روز متون خبری به صورت متوازن از ۶ حوزهٔ موضوعی و از خبرگزاری‌های مختلف به پیکره اضافه می‌شود.

مرتضی رضایی شریف‌آبادی، دانشجوی دکتری زبان‌شناسی دانشگاه شیراز و مسئول فنی طرح نیز با بیان اینکه مراحل اجرایی کار با همکاری تیمی قوی از مهندسان نرم‌افزار و با بهره‌گیری از جدیدترین فناوری‌ها انجام‌ شده است، افزود: علاوه بر امکان دریافت دادهٔ پیکره، علاقه‌مندان می‌توانند برای کاوش در پیکره از ابزار جستجوی برخط تهیه‌شده استفاده کنند.
وی بیان کرد: تمام متون پیکره به صورت خودکار نرمال‌سازی و ریشه‌یابی می‌شوند و برچسب اجزای کلام به واژه‌های آن‌ها اختصاص می‌یابد و برای توازن متون در سطح موضوع و زیر موضوع و همچنین توازن زمانی نیز از روشی ابتکاری استفاده‌شده است.

رضایی گفت: هم‌اکنون پیکرهٔ به‌روز شونده و ابزار جستجوگر آن به صورت آزمایشی و با دسترسی محدود راه‌اندازی شده است.

وی تصریح کرد: علاقه‌مندان برای اطلاع از اخبار و اطلاعیه‌های مربوط به پیکره می‌توانند در کانال تلگرامی @peikare_ir عضو شوند.

انتهای پیام/ن

پیکره به روز شونده متون فارسی

 

تبادل نظر
آدرس ایمیل خود را با فرمت مناسب وارد نمایید.