متا و گروهی از محققان دانشگاه تگزاس در آستین در حال کار بر روی آوردن صدای واقعی به متاورس هستند. به گفته کریستن گارومن، صدا نقش بسیار مهمی در ایجاد احساس زنده بودن در جهان ایفا میکند.
گارومن میگوید: صوت با محیطی که در آن است شکل میگیرد. برای دستیابی به این هدف، برنامه متا استفاده از عینک AR برای ضبط صدا و تصویر از یک مکان است، سپس با مجموعهای از سه مدل هوش مصنوعی، ضبط را تبدیل به تصویر میکند. برنامه متا برای هدستهای VR شامل تکرار مناظر و صداهای یک محیط است که مانند یک کنسرت بوده و احساس میکنید که شخصاً در آن کنسرت هستید.
راه حل اول به نام AViTAR شناخته میشود که یک مدل تطبیق آکوستیک بصری است که صدا را برای مطابقت با محیط جدید تغییر میدهد. متا مثالی از مادری است که رسیتال رقص فرزندش را در سالنی با یک جفت عینک AR ضبط میکند. یکی از محققان ادعا میکند که مادر میتواند موسیقی را انتخاب و در خانه پخش کند، جایی که هوش مصنوعی صدا را تغییر میدهد، محیط را اسکن میکند، موانع موجود در یک اتاق را در نظر میگیرد، و صدایی شبیه به آن را ارائه میدهد.
آخرین مدل هوش مصنوعی VisualVoice است که از ترکیبی از نشانههای بصری و صوتی برای جدا کردن صداها از سایر نویزها استفاده میکند. تصور کنید در حال ضبط ویدئویی از دعوای دو نفر هستید، این هوش مصنوعی یک صدا را ایزوله میکند تا بتوانید آنها را درک و در عین حال همه چیزهای دیگر را خاموش کنید. متا توضیح میدهد که نشانههای بصری مهم هستند، زیرا هوش مصنوعی باید برخی نکات ظریف را بفهمد و بداند چه کسی صحبت میکند.
این فناوری هنوز در مراحل اولیه توسعه قرار دارد و مشخص نیست که متا چه زمانی این هوش مصنوعی را به یک هدست کوئست تبدیل کرده و عرضه خواهد کرد. سزار کادناس چندین سال است که در مورد صنعت فناوری مینویسد و در زمینه لوازم الکترونیکی مصرفی، دستگاههای سرگرمی، ویندوز و صنعت بازی تخصص دارد. اما او همچنین علاقه زیادی به گوشیهای هوشمند، پردازندههای گرافیکی و امنیت سایبری دارد.
بیشتربخوانید