اتحادیه اروپا با پروژه OpenEuroLLM برای کاهش وابستگی به مدل‌های هوش مصنوعی خارجی تلاش می‌کند.

باشگاه خبرنگاران جوان - وبسایت پیوست به نقل از سایت تک کرانچ درباره تلاش اروپا برای تقویت مدل‌های هوش مصنوعی نوشت:

اتحادیه اروپا در راستای تضمین استقلال دیجیتال، پروژه جدیدی را برای توسعه مدل‌های زبانی بزرگ (LLMs)  کاملا متن‌باز راه‌اندازی کرده است. این پروژه که با نام OpenEuroLLM شناخته می‌شود، قرار است مدل‌هایی را برای تمام ۲۴ زبان رسمی اتحادیه اروپا و همچنین زبان‌های کشورهای در حال مذاکره برای پیوستن به اتحادیه، از جمله آلبانی، توسعه دهد.

این پروژه بخشی از راهبرد کلان اتحادیه اروپا برای کاهش وابستگی به فناوری‌های خارجی است و با هدف توسعه زیرساخت‌های حیاتی دیجیتال و ابزارهای هوش مصنوعی در داخل اروپا آغاز شده است. اتحادیه اروپا همچنین برای توسعه یک منظومه ماهواره‌ای مستقل حدود ۱۱ میلیارد دلار سرمایه‌گذاری کرده است، که هدف آن رقابت با استارلینک ایلان ماسک و کاهش وابستگی به این شرکت آمریکایی است. قاره سبز همچنین به تازگی برای کمک به نوآوری برخی از الزامات و مقررات فناوری را کاهش داده است.

این پروژه با بودجه اولیه ۳۷.۴ میلیون یورو فعالیت خود را آغاز می‌کند که ۲۰ میلیون یورو این مبلغ را برنامه دیجیتال اروپا (Digital Europe Programme) تامین خواهد شد. هرچند این رقم در مقایسه با سرمایه‌گذاری‌های عظیم شرکت‌های بزرگ فناوری چندان زیاد به نظر نمی‌رسد، اما پروژه OpenEuroLLM با توجه به دسترسی به مراکز ابری EuroHPC در کشورهای اسپانیا، ایتالیا، فنلاند و هلند، منابع رایانشی قدرتمندی را در اختیار دارد.

پروژه EuroHPC که در نقش زیرساخت رایانشی این پروژه هوش مصنوعی ایفای نقش می‌کند، بودجه‌ای معادل با حدود ۷ میلیارد یورو دارد که بخش قابل‌توجهی از آن می‌تواند به توسعه مدل‌های هوش مصنوعی در اتحادیه اروپا اختصاص یابد. با این حال، نگرانی منتقدان از آن است که تعداد بالای نهادهای درگیر در این پروژه، از جمله ۲۰ سازمان مختلف از دانشگاه‌ها، مؤسسات تحقیقاتی و شرکت‌های خصوصی، باعث کاهش تمرکز و کند شدن روند پیشرفت پروژه شود.

اهداف و ساختار پروژه OpenEuroLLM

رهبری پروژه OpenEuroLLM را یان هاژیچ، زبان‌شناس محاسباتی از دانشگاه چارلز در پراگ، و پیتر سارلین، مدیرعامل شرکت Silo AI فنلاند، برعهده دارند. این پروژه نسخه‌های اولیه مدل‌های زبانی خود را تا اواسط ۲۰۲۶ منتشر خواهد کرد و نسخه نهایی آن تا سال ۲۰۲۸ آماده عرضه می‌شود.

هدف اصلی این پروژه، توسعه نوعی از مدل‌های پایه هوش مصنوعی است که علاوه بر حفظ تنوع زبانی و فرهنگی اروپا، دقت و شفافیت بالایی را ارائه کنند. مدل‌های این پروژه به دو بخش تبدیل می‌شوند. یکی مدل‌های بزرگ چند زبانه که با دقت بالا برای کاربرها‌ی عمومی عرضه می‌شوند و دیگری نسخه‌های کم حجم و بهینه‌ای که برای پردازش سریع‌تر و با مصرف توان رایانشی کمتری، برای کاربردهای داخلی طراحی می‌شوند.

یکی از نگرانی‌های مطرح‌شده درباره این پروژه، توان رقابتی آن در مقایسه با مدل‌های پیشرفته شرکت‌های خصوصی است. در سال‌های اخیر، استارتاپ‌های کوچک و متمرکز اروپایی مانند Mistral AI و LightOn توانسته‌اند مدل‌های زبانی موفقی را توسعه دهند اما با توجه به اینکه ۲۰ نهاد مختلف در  OpenEuroLLM مشارکت دارند، هماهنگی میان آنها ممکن است چالش‌برانگیز شود.

آناستازیا استاسنکو، یکی از بنیان‌گذاران شرکت Pleias، با هشدار در این باره اعلام کرده است که پروژه‌های موفق اروپایی معمولا توسط تیم‌های کوچک و متمرکز هدایت شده‌اند، نه کنسرسیوم‌های گسترده‌ای که در OpenEuroLLM شاهدش هستیم.

چالش‌های پیش روی OpenEuroLLM

پروژه هوش مصنوعی اروپا به دلیل محدودیت‌های قانونی و همچنین اهداف ویژه خود با چالش‌های متعددی روبرو است که به طور کلی می‌توان آنها را در سه دسته تقسیم‌بندی کرد:

  • داده‌های آموزشی و حق کپی‌رایت: یکی از چالش‌های اساسی، دسترسی به داده‌های باکیفیت و منطبق با قوانین کپی‌رایت اتحادیه اروپا است. برخی از داده‌های آموزشی ممکن است مشمول قوانین محدودکننده باشند و امکان انتشار عمومی آنها وجود نداشته باشد. اتحادیه اروپا به دلیل قوانین سخت‌گیرانه حریم خصوصی و حق‌نشر، دسترسی بسیاری از داده‌ها را محدود می‌کند.
  • کمبود منابع برای زبان‌های کم‌کاربرد: با اینکه OpenEuroLLM به دنبال پشتیبانی برابر از تمام زبان‌های اروپایی است، اما زبان‌هایی که داده‌های دیجیتالی کمی دارند (مانند زبان‌های برخی کشورهای شرقی اروپا) ممکن است در مدل‌های نهایی دقت کمتری داشته باشند.
  • همکاری بین‌المللی: بر خلاف برنامه تحقیقاتی Horizon که بستر و امکان همکاری با دانشگاه‌های بریتانیا و سوئیس را فراهم می‌کرد، پروژه OpenEuroLLM تنها به نهادهای مستقر در اتحادیه اروپا محدود شده است. این مسئله می‌تواند همکاری‌های علمی و تحقیقاتی را تحت تاثیر قرار دهد.

یکی از نکات بحث‌برانگیز پروژهOpenEuroLLM ، احتمال تناقض آن با پروژه مشابهی به نام EuroLLM است که چند ماه پیش در اروپا آغاز شد. پروژه EuroLLM که اولین مدل خود را در سپتامبر ۲۰۲۳ معرفی کرد، توسط کنسرسیومی متشکل از ۹ سازمان، از جمله دانشگاه ادینبورگ و شرکت Unbabel اجرا شده است.

آندره مارتینز، رئیس تحقیقات در Unbabel، در شبکه‌های اجتماعی با انتقاد از OpenEuroLLM  گفت، نام این پروژه عملا از پروژه قبلی کپی‌برداری شده است. این موضوع ممکن است باعث سردرگمی در میان محققان و سرمایه‌گذاران شود.

یان هاژیچ، رهبر پروژه OpenEuroLLM، در پاسخ به این انتقادات گفت که این پروژه آماده همکاری با سایر تیم‌های تحقیقاتی است، اما از آنجایی که اتحادیه اروپا تامین کننده مالی است و قوانینی را برای این پروژه مشخص کرده است، آنها امکان همکاری با موسسات مستقر در بریتانیا و سوئیس را ندارند.

آیا پروژه اروپا با چنین بودجه‌ای توان رقابت با غول‌های آمریکایی را دارد؟

یکی از مهم‌ترین بحث‌ها پیرامون پروژه OpenEuroLLM، میزان بودجه موردنیاز برای رقابت با شرکت‌های بزرگ فناوری از جمله اوپن‌ای‌آی و گوگل است. در حالی که بودجه اولیه این پروژه ۳۷.۴ میلیون یورو اعلام شده است، اما برخی از تحلیلگران می‌گویند برای دستیابی به یک مدل پیشرفته در تراز جهانی به سرمایه‌گذاری‌ چند میلیارد یورویی نیاز است.

با این حال، پیتر سارلین، شریک فنی این پروژه، می‌گوید منابع رایانشی و ابری تحت مدیریت EuroHPC هزینه‌ها را کاهش می‌دهند. شرکت‌های بزرگ فناوری از جمله اوپن‌ای‌آی و گوگل، بخش زیادی از مخارج هوش مصنوعی خود را به دیتاسنتر‌ها و زیرساخت رایانشی اختصاص می‌دهند. سارلین تصریح کرد که هدف این پروژه توسعه مدل‌های پایه یا بنیادی است و آنها به دنبال ساخت یک محصول مصرفی همچون ChatGPT نیستند.

پروژه OpenEuroLLM بخشی از تلاش گسترده اتحادیه اروپا برای کاهش وابستگی به مدل‌های زبانی توسعه‌یافته توسط شرکت‌های آمریکایی و چینی است. این پروژه به دنبال ایجاد مدل‌های پایه هوش مصنوعی متن‌باز است تا شرکت‌های اروپایی بتوانند بر اساس آن، محصولات بومی خود را توسعه داده و در اختیار کابران بگذارند.

اخبار پیشنهادی
تبادل نظر
آدرس ایمیل خود را با فرمت مناسب وارد نمایید.