محققان سیستمی را توسعه دادند که صدایی نجوا مانند و قابل پخش در هر اتاقی و هر شرایطی تولید می‌کند.

استادیار رشته علوم رایانه در دانشگاه کلمبیا گفت: یک چالش کلیدی فنی ما این بود طوری آن را طراحی کنیم که به سرعت کار کند. الگوریتم ما که شنود دقیق کلمات را در ۸۰ درصد مواقع مسدود می‌کند، سریع‌ترین و دقیق‌ترین سیستم توسعه‌یافته و در حال آزمایش است این سیستم حتی وقتی ما اطلاعات دقیق از میکروفن جاسوس نداریم؛ مانند محل آن کار می‌کند و به طور اساسی صدای فرد را در برابر سیستم‌های شنود مخفی می‌کند بدون اینکه تداخلی در گفت وگوی این افراد ایجاد شود.

کارل وندریک گفت: در حالی که نتایج کار این گروه در مخدوش کردن سیستم‌های بازشناسی گفتار خودکار از نظر فرضیه‌ای پیشتر در زمینه هوش مصنوعی ممکن شناخته شده بود، رسیدن به این دستاورد با سرعت کافی تا از آن در نرم افزارکار‌های کاربردی استفاده شود هنوز دشوار بود مشکل این بود که وقتی یک صدا سخن گفتن فرد را در یک زمان مشخص مختل می‌کرد، یک ثانیه بعد این کار را نمی‌کرد در حالی که افراد حرف می‌زدند، صدای آن‌ها به شکل مستمر تغییر می‌کند، زیرا از کلمات متفاوتی استفاده می‌کنند و سریع حرف می‌زنند این تغییرات باعث می‌شود هیچ دستگاهی نتواند با سرعت سریع سخن گفتن یک فرد خود را همراه کند.

میا چیکوییر محقق ارشد این گروه نیز گفت: الگوریتم ما می‌تواند با پیش بینی چگونگی حرف زدن فرد در آینده به زمان کافی برای تولید نجوای مناسب داشته باشد، روش ما فعلا در مورد بسیاری از کلمات انگلیسی موفقیت آمیز بوده است و قصد داریم این الگوریتم را در مورد زبان‌های بیشتر توسعه دهیم همچنین در نهایت صدای نجوامانند را کاملا نامحسوس کنیم.

او گفت: محققان باید الگوریتمی طراحی می‌کردند که در یک لحظه بتواند شبکه‌های عصبی مصنوعی را از بین ببرد، به صورت مستمر بازتولید شود، چون سخن گفتن مستمر ادامه دارد و قابل اجرا برای اکثریت کلمات یک زبان باشد. حالیکه تلاش‌های قبلی به طور موفقیت آمیزی یکی از این سه مولفه را در خود داشت، هیچ کدام هر سه مولفه را داشتند.

اخبار پیشنهادی
تبادل نظر
آدرس ایمیل خود را با فرمت مناسب وارد نمایید.
آخرین اخبار