به گزارش گروه استان های باشگاه خبرنگاران جوان از شیراز؛ امیرسعید مولودی مدیر پروژهٔ پیکرهٔ به روز شونده با بیان اینکه در پیکره به روز شونده متون فارسی استانداردهایی رعایت شده است که پیش از این در تهیهٔ پیکرههای زبان فارسی مغفول مانده بود، اظهار کرد: این پیکره و جستجوگر آن ابزار پژوهشی مهمی برای تحقیقات زبانشناسی و سایر حوزههای علوم انسانی است و علاوه بر این برای اهداف پردازشی زبان فارسی نیز میتواند مورد استفاده قرار گیرد.
وی تصریح کرد: ایدهٔ اولیهٔ طرح پیکره به روز شونده متون فارسی حدود ۲ سال پیش شکل گرفت و پس از انجام مراحل مطالعاتی در سال ۱۳۹۵، پیادهسازی فاز نخست آن با تمرکز بر متون خبری آغاز شد و رونمایی از این پیکره، مطابق برنامهریزیهای انجام گرفته در هفتهٔ پژوهش، آذرماه امسال انجام خواهد شد.
مدیر پروژهٔ پیکرهٔ به روز شونده با اشاره به این نکته که امروزه از پیکرههای زبانی تقریباً در همه حوزههای علوم انسانی به طور عام و مطالعات زبانی به طور خاص استفاده میشود، تصریح کرد: بحث بهروز بودن، توازن و نماینده بودن 3 ویژگی مهم برای کارآمدی پیکرههای زبانی است که در طرح حاضر مورد توجه قرار گرفته است؛ بنابراین پیکرۀ حاضر از این حیث که تنوعات زبانی را با انتخاب داده از ژانرهای مختلف پوشش میدهد، داده به میزان مساوی از هر ژانر انتخاب میشود و اینکه هر روز دادههای آن افزایش مییابد بهترتیب برخوردار از سه ویژگی نماینده بودن، توازن و بهروز شوندگی است.
وی اضافه کرد: بهروز شونده بودن پیکرۀ حاضر به پژوهشگر این امکان را میدهد که بتواند تغییرات زبانی و حتی فرهنگی-جامعهشناختی را با استفاده از آن بررسی و تحلیل کند.
مولودی ادامه داد: در فاز نخست این طرح، هر روز متون خبری به صورت متوازن از ۶ حوزهٔ موضوعی و از خبرگزاریهای مختلف به پیکره اضافه میشود.
مرتضی رضایی شریفآبادی، دانشجوی دکتری زبانشناسی دانشگاه شیراز و مسئول فنی طرح نیز با بیان اینکه مراحل اجرایی کار با همکاری تیمی قوی از مهندسان نرمافزار و با بهرهگیری از جدیدترین فناوریها انجام شده است، افزود: علاوه بر امکان دریافت دادهٔ پیکره، علاقهمندان میتوانند برای کاوش در پیکره از ابزار جستجوی برخط تهیهشده استفاده کنند.
وی بیان کرد: تمام متون پیکره به صورت خودکار نرمالسازی و ریشهیابی میشوند و برچسب اجزای کلام به واژههای آنها اختصاص مییابد و برای توازن متون در سطح موضوع و زیر موضوع و همچنین توازن زمانی نیز از روشی ابتکاری استفادهشده است.
رضایی گفت: هماکنون پیکرهٔ بهروز شونده و ابزار جستجوگر آن به صورت آزمایشی و با دسترسی محدود راهاندازی شده است.
وی تصریح کرد: علاقهمندان برای اطلاع از اخبار و اطلاعیههای مربوط به پیکره میتوانند در کانال تلگرامی @peikare_ir عضو شوند.
انتهای پیام/ن