چند وقتی است که توجه دنیای تکنولوژی به رباتی تازه توسعه‌یافته به نام GPT-۳ جلب شده که به زعم بسیاری قرار است دنیای هوش مصنوعی را دگرگون کند.

به گزارش گروه وبگردی باشگاه خبرنگاران جوان، شرکت OpenAI مسئولیت ساخت GPT-3 را برعهده داشته، شرکتی تحقیقاتی که ایلان ماسک یکی از موسسین آن بوده و به عنوان یکی ستون‌های اصلی پیشرفت هوش مصنوعی در سال‌های پیش رو تلقی می‌شود.

اما به همان اندازه که مردم برای این ربات هیجان‌زده‌اند، اطلاعات اندکی نیز راجع به کارهایی که می‌تواند (و نمی‌تواند) انجام دهد نیز دارند؛ بنابراین در این مقاله با زبان بسیار ساده مسائل پیرامون GPT-۳ را تشریح خواهیم کرد تا درک بهتری از ماهیت آن داشته باشید. علاوه بر این به برخی از مشکلات بالقوه این هوش مصنوعی خواهیم پرداخت و اینکه چرا برخی عقیده دارند به خاطر هیجان بیش از حد، برخی از برجسته‌ترین توانایی‌های ربات OpenAI نادیده گرفته شده است.


بیشتربخوانید


GPT-۳ چیست؟

کار را با ساده‌ترین مسائل شروع می‌کنیم. GPT-۳ مخفف «Generative Pre-trained Transformer ۳» است و در واقع ورژن سوم از این ابزار است که هنوز در دسترس عموم قرار نگرفته.

اگر بخواهیم خلاصه بگوییم، نام‌گذاری GPT-۳ بدان معناست که می‌تواند با استفاده از الگوریتم‌هایی که از پیش تعلیم دیده‌اند، متن تولید کند. این الگوریتم‌ها از قبل اطلاعات لازم برای انجام وظایف خود را دریافت کرده‌اند. دقیق‌تر می‌گوییم، این ربات با ۵۷۰ گیگابایت اطلاعات جمع‌آوری شده از سطح اینترنت (چه در دیتابیس‌های عمومی و چه خصوصی) تعلیم دیده و OpenAI هم برخی دیگر از متون (مانند مقالات ویکیپدیا) را دستچین کرده و در اختیار ربات قرار داده.

اگر از این ربات یک سوال بپرسید، می‌توانید منتظر پاسخی بسیار کارآمد باشید. اگر هم از آن بخواهید که یک خلاصه از مقاله یا یک شعر بنویسد، دقیقا همین کار‌ها را برایتان خواهد کرد. اگر فنی‌تر با موضوع برخورد کنیم، این ربات به عنوان بزرگ‌ترین شبکه عصبی مصنوعی جهان شناخته می‌شود و جلوتر به این موضوع هم خواهیم پرداخت.

GPT-۳ قادر به انجام چه کاریست؟

GPT-۳ قادر به هرچیزی درون ساختار زبان است؛ بنابراین می‌تواند به سوالات پاسخ دهد، مقاله بنویسد، متون طولانی را خلاصه کند، زبان‌ها را ترجمه کند، نت بردارد و حتی کد کامپیوتری بنویسد.

 
در واقع در یک دموی آنلاین دیده‌ایم که این ربات قادر به ساخت اپلیکیشنی با کارکرد بسیار مشابه به اینستاگرام است. GPT-۳ در این راه از پلاگین Figma استفاده کرده که به صورت گسترده برای طراحی اپلیکیشن از سوی توسعه‌دهندگان استفاده می‌شود.

چنین اتفاقی بدیهتا بسیار انقلابی است و اگر در طولانی‌مدت نیز قابل استفاده و کارآمد باشد، می‌تواند تاثیری شگرف روی چگونگی توسعه نرم‌افزار و اپلیکیشن در آینده بگذارد. از آن‌جایی که سورس کد این ربات هنوز به صورت عمومی منتشر نشده، دسترسی به GPT-۳ تنها از طریق رابط برنامه‌نویسی توسعه یافته از سوی OpenAI امکان‌پذیر است. از زمانی که این رابط برنامه‌نویسی در ماه ژوئن امسال در دسترس قرار گرفت، شاهد ظهور انبوهی از متون مختلف مانند شعر، نثر، گزارش‌های خبری و نوشته‌های علمی-تخیلی بوده‌ایم.

GPT-۳ چند وقت پیش یک مقاله بسیار جالب برای خبرگزاری گاردین نوشت و با لحنی بسایر متقاعدکننده توضیح داد که چرا انسان‌ها نباید از هوش مصنوعی و خطرات بالقوه آن بترسند. با این همه GPT-۳ در بخشی از مقاله خود اعتراف کرد که اگر افراد شرور آن را مجبور به کار‌های شرورانه کنند «نمی‌توانم از نابودی گونه بشری جلوگیری کنم».
 

GPT-۳ چطور کار می‌کند؟

از منظر اینکه ربات OpenAI در کدام دسته‌بندی کلی از هوش‌های مصنوعی قرار می‌گیرد باید گفت که GPT-۳ یک مدل پیش‌بینی زبان است. این یعنی GPT-۳ یک ساختار الگوریتم است که طراحی شده تا یک تکه از زبان (یعنی یک ورودی) را برداشته و آن را تبدیل به چیزی کند که بنابر پیش‌بینی خودش، کارآمدترین بخش از زبان برای کاربر است.

تمام این‌ها به لطف متونی است که در فاز «پیش‌تعلیم» به صورت گسترده در اختیار هوش مصنوعی قرار گرفته‌اند. برخلاف الگوریتم‌های دیگر که در وضعیت خالص خود هیچ تعلیمی ندیده‌اند، OpenAI همین حالا انبوهی از منابع کامپیوتری ضروری را در اختیار GPT-۳ قرار داده تا درکی درست از کارکرد زبان و ساختار آن داشته باشد. گفته می‌شود تمام تلاش و وقتی که OpenAI صرف تعلیم دادن این هوش مصنوعی کرده بالغ بر ۴.۶ میلیون دلار هزینه داشته است.

برای یادگیری اینکه ساختار‌های رایج زبان -مانند جملات- چطور کار می‌کنند، GPT-۳ از تحلیل معنایی استفاده می‌کند. این یعنی ربات نه‌تن‌ها کلمات و معنای آن‌ها را تحلیل می‌کند، بلکه درکی کلی از چگونگی استفاده از کلمات در کنار کلمات دیگر متن به دست می‌آورد.

GPT-۳ ضمنا یک فرم از یادگیری ماشین است که بدون نیاز به نظارت، روند یادگیری را طی می‌کند. این بدان خاطر است که هیچ‌کدام از داده‌های آموزشی ربات «درست» یا «غلط» تلقی نمی‌شوند. تمام اطلاعاتی که ربات برای محاسبه سازگاری خروجی با نیاز کاربر لازم دارد، درون خود متن است و بنابراین نظارت انسانی ضروری به حساب نمی‌آید. GPT-۳ این کار را با مطالعه روی موارد استفاده از کلمات و جملات به انجام می‌رساند، بعد آن‌ها را از یکدیگر جدا کرده و دوباره خود بازنویسی می‌کند.

برای مثال در جریان روند تعلیم، الگوریتم ممکن است با جمله «خانه دری قرمز رنگ دارد» مواجه شود. بعد همین جمله به صورت مجدد، اما بدون یکی از کلمات در اختیار ربات قرار می‌گیرد. مانند «خانه X قرمز رنگ دارد». در این مرحله، GPT-۳ تمام متون موجود در داده آموزشی را اسکن می‌کند -داده‌هایی شامل هزاران میلیارد کلمه که به شکل زبان قابل فهم کنار یکدیگر چیده شده‌اند- و تصمیم می‌گیرد که کدام کلمه برای بازسازی جمله اصلی مناسب خواهد بود.

در ابتدای کار احتمالا ربات دست به اشتباه فراوان می‌زند. در واقع میلیون‌ها بار اشتباه می‌کند. اما در نهایت قادر به یافتن کلمه درست خواهد بود. با چک کردن داده ورودی اصلی، ربات می‌فهمد که از خروجی درست استفاده کرده و یک امتیاز «وزن» به آن پروسه الگوریتم که به پاسخ درست دست یافته تعلق می‌گیرد. این یعنی ربات به صورت آهسته، اما پیوسته «می‌آموزد» که کدام متد‌ها برای رسیدن به پاسخ صحیح در آینده بهتر هستند.

باید اشاره کرد که کار GPT-۳ آنقدر‌ها تازه نیست و برای سالیان متمادی با مدل‌های مختلف پیش‌بینی زبان مواجه بوده‌ایم. اما وزنی که الگوریتم به صورت پویا در حافظه خود ذخیره کرده و برای هر کوئری به کار می‌گیرد معادل ۱۷۵ میلیارد است - یعنی ۱۰ برابر بیشتر از نزدیک‌ترین رقیبش که توسط شرکت انویدیا توسعه یافته.

رایج‌ترین مشکلات GPT-۳ چیست؟

توانایی HPT-۳ در تولید زبان به عنوان برترین نمونه در دنیای هوش مصنوعی تلقی می‌شود، اما باید به چند نکته دیگر نیز توجه داشت. مدیرعامل OpenAI، یعنی سم آلتمن خود گفته است که: «هیجان برای GPT-۳ بیش از حد است. هوش مصنوعی قرار است چهره جهان را دگرگون کند، اما GPT-۳ صرفا یک گام کوچک و زودهنگام در این مسیر است».

نخستین مشکل GPT-۳ اینست که اکنون ابزاری بسیار گران‌قیمت به حساب می‌آید، در واقع به این خاطر که به انبوهی از قدرت پردازشی برای انجام وظایف خود نیاز دارد. این یعنی هزینه استفاده از آن از بودجه بسیاری از سازمان‌های کوچک فراتر خواهد بود.

مشکل دوم هم سیستم بسته و جعبه سیاه گونه GPT-۳ است. OpenAI هیچوقت از جزییات مربوط به چگونگی کارکرد الگوریتم خود پرده برنداشته و بنابراین هرکسی که از آن برای پاسخ دادن به سوالات یا ساخت محصولات مفید استفاده می‌کند، نخواهد دانست این ربات چطور طراحی شده.

بعد به مشکل سوم می‌رسیم که بی‌نقص نبودن خروجی سیستم است. اگرچه GPT-۳ می‌تواند وظایفی مانند نوشتن متون کوتاه یا اپلیکیشن‌های ساده را برعهده بگیرد، هنگامی که به سراغ متون طولانی‌تر و پیچیده‌تر می‌رود کارایی کمتری از خود نشان می‌دهد. در واقع خروجی‌های این ربات در چنین حالتی کاملا بی‌معنی هستند.

در مجموع و برای جمع‌بندی باید گفت که GPT-۳ نتایجی تولید می‌کند که بسیار بهتر از آن‌چه قبلا دیده‌ایم هستند. هرکسی که نتایج زبان هوش مصنوعی را دیده باشد می‌داند که نتایج می‌توانند متغیر باشند، اما خروجی GPT-۳ به شکلی بدون تردید مثل گامی بلند به سمت جلو به نظر می‌رسند. زمانی که بتوانیم شاهد استفاده عمومی از این ربات باشیم، آن موقع است که عملکرد ربات OpenAI حتی از قبل هم تحسین‌برانگیزتر خواهد شد.

منبع: دیجیاتو 

انتهای پیام/
اخبار پیشنهادی
تبادل نظر
آدرس ایمیل خود را با فرمت مناسب وارد نمایید.