به گزارش خبرنگار حوزه دریچه فناوری گروه فضای مجازی باشگاه خبرنگاران جوان، شرکت مایکروسافت در دسترس بودن فناوری مبتنی بر هوش مصنوعی برای کپشن نویسی عکسها از طریق را Azure Cognitive Services اعلام کرد. این شرکت ادعا میکند که این سیستم اکنون میتواند تصاویر را مانند انسان توصیف کند.
نقطه عطف جدید باید به توسعه دهندگان در بهبود دسترسی به برنامههای خود کمک کند. برای مثال، استفاده از زیرنویس تصویر به وسیله هوش مصنوعی، کاربران میتوانند محتوای مهم را در تصاویر مانند نتایج جستجو و عکسها در یک نمایش مشاهده کنند. این غول نرم افزاری هشدار داد که نتایج ممکن است همیشه عالی نباشد.
از همه مهمتر، ثاقب شیخ، مدیر مهندسی نرم افزار از گروه پلتفرم هوش مصنوعی مایکروسافت، گفت: شرح تصویر میتواند با ایجاد یک توصیف عکس، که معمولاً به آن asalt text گفته میشود، در یک صفحه وب یا سند به افراد دارای معلولیت بینایی کمک کند. تیم وی همچنین از این سیستم در برنامه دوربین مکالمه Seeing AI برای توصیف عکس برای افراد نابینا یا کم بینا استفاده میکند.
بیشتر بخوانید
مایکروسافت همچنین ادعا میکند که این سیستم جدید دو برابر بهتر از مدل شرح تصویری است که از سال ۲۰۱۵ مورد استفاده قرار گرفته است؛ و این امکان توانست شرحهایی "توصیفی و دقیق تر" از آنچه توسط افراد واقعی برای همان تصاویر ایجاد شده است، تولید کند.
اواخر امسال، فناوری زیرنویس تصویر نیز در Microsoft Word و Outlook برای ویندوز و مک و در PowerPoint برای ویندوز، مک و وب گنجانیده خواهد شد. جالب خواهد بود که تا آن زمان ببینیم که این سیستم در دنیای واقعی در مقایسه با مدلهای رقابتی هوش مصنوعی چگونه کار میکند.
انتهای پیام/