فیلتر‌های صوتی، اگرچه لزوما جدید نیستند اما اخیرا با کمک هوش مصنوعی جدی‌تر گرفته شده‌اند.

توجه فزاینده‌ای که در سال‌های اخیر به فناوری دیپ فیک AI معطوف شده است، در درجه اول بر روی ترفند‌های بصری متمرکز است. به ویدیو‌هایی فکر کنید که می‌توانند به‌طور غیرعادی چهره یک فرد را بر روی بدن یک نسل هنری سورئال دیگر بر اساس پیشنهادات کاربران و اخلاق دردسرساز پیرامون همه این توانایی‌ها قرار دهند. اما یکی دیگر از روش‌های کلیدی برای متقاعد کردن میمیک‌های دیجیتالی اخیرا بار دیگر مورد بررسی و بحث واقع شده است.

فیلتر‌های صوتی، اگرچه لزوما جدید نیستند، اخیرا به لطف کمک هوش مصنوعی جدی‌تر گرفته شده‌اند. متاسفانه این فیلترها پیامد‌های اجتماعی خود را نیز به همراه دارند و مانند صنعت دیپ فیک ویدیو، به نظر می‌رسد که تنظیم‌کننده‌های کمی می‌توانند برای جلوگیری از آن تاثیری داشته باشند.

ابزار‌های نوظهور هوش مصنوعی مانند Koe Recast و Voice.ai به سرعت توانایی خود را برای تبدیل ورودی‌های صوتی به صدایی شبیه به هر کسی که کاربران درخواست می‌کنند، بروز می‌دهند، اگر منبع کافی برای تجزیه و تحلیل ارائه شود. در برخی موارد این برنامه‌ها تنها به یک کلیپ بین ۱۵ تا ۳۰ ثانیه نیاز دارند تا تقلید‌های متقاعد کننده ایجاد کنند. اگرچه Koe Recast فقط در مرحله آزمایش آلفای خصوصی خود است، نمونه‌هایی از قبل موجود است که یک کلیپ کوتاه از مارک زاکربرگ را به تصویر می‌کشد که شبیه یک راوی باس سنگین، یک زن و حتی یک شخصیت انیمه با صدای بلند است.

هدف در اینجا این است که به افراد کمک شود تا به هر طریقی که آن‌ها را شادتر می‌کند، خود را ابراز کنند؛ با این حال، منتقدان همچنان نسبت به اعتماد عمومی به چنین ابزار‌های بالقوه آشفته‌ای شک دارند. اخیرا، برخی از نمایندگی‌های مرکز تماس برون‌سپاری شده نیز شروع به استفاده از نرم‌افزار هوش مصنوعی برای پاک کردن لهجه‌های کشور‌های بومی خود کرده‌اند تا در تلاش برای کاهش تعصبات مصرف‌کنندگان غربی، «آمریکایی‌تر» به نظر برسند. در حالی که سازندگان این ابزار استدلال می‌کنند که اختراع آن‌ها از تعصب جلوگیری می‌کند، بسیاری مخالفت کرده‌اند که این ابزار صرفا وسیله‌ای برای اجتناب از پرداختن به مسائل بزرگ‌تر در دست است: یعنی بیگانه‌هراسی و نژادپرستی.

به همین ترتیب کارمندان برخی از کسب‌وکار‌های بزرگ‌تر طعمه کلاهبردارانی شده‌اند که درخواست انتقال وجه و رمز عبور می‌کنند در حالی که از تقلید صوتی مشابه برای تقلید از رؤسا استفاده می‌کنند.

کایل آلسپاچ، گزارشگر امنیت سایبری Protocol، می‌گوید: این نوع کلاهبرداری‌ها هنوز در مراحل ابتدایی خود هستند، به احتمال زیاد طولی نمی‌کشد که این تاکتیک‌ها رایج‌تر می‌شوند و متاسفانه تشخیص واقعیت از تخیل دشوارتر است؛ بنابراین هیچ مانعی برای افزایش سریع تقلید بصری و صوتی مبتنی بر هوش مصنوعی وجود ندارد.


بیشتر بخوانید 


منبع: popsci

اخبار پیشنهادی
تبادل نظر
آدرس ایمیل خود را با فرمت مناسب وارد نمایید.
آخرین اخبار