مایکروسافت اخیراً یک ابزار هوش مصنوعی جدید را منتشر کرده است که VALL-E نام دارد و می‌تواند صدای افراد را تقلید کند. برای استفاده از این ابزار کافیست 3 ثانیه از صدای یک فرد را به هوش مصنوعی بدهید و بعد با حفظ حس‌وحال گوینده اصلی، به تولید عبارت‌های جدید بپردازید.

به گزارش AITopics، ابزار جدید هوش مصنوعی مایکروسافت موسوم به VALL-E می‌تواند از روی نمونه 3ثانیه‌ای صدای افراد، دست به تقلید صدای آن‌ها بزند. این ابزار با 60 هزار ساعت داده صوتی به زبان انگلیسی آموزش داده شده است. VALL-E می‌تواند در عین حفظ احساس گوینده اصلی، دست به خلق عبارت‌هایی بزند که در برش 3 ثانیه اصلاً وجود نداشته است.

گروهی از محققان دانشگاه کورنل با این ابزار چندین صدای مصنوعی ساخته‌اند و نتایج آزمایش‌های خود را در گیت‌هاب منتشر کرده‌اند. با بررسی این صداها می‌توان دید که برخی از آن‌ها طبیعی‌تر و برخی ماشینی‌ترند. درنتیجه، انتظار می‌رود که این هوش مصنوعی در آینده بهبودهای بیشتری داشته باشد. از طرف دیگر، اگر بیشتر از 3 ثانیه داده دریافتی وجود داشته باشد، می‌توان شانس بیشتری برای تقلید صدای دقیق‌تر قائل شد.

VALL-E مایکروسافت در دسترس عموم قرار ندارد

VALL-E درحال‌حاضر به‌صورت عمومی منتشر نشده و این تصمیم احتمالاً تصمیم درستی بوده است؛ چرا که تقلید صدای افراد می‌تواند کاربردهای خطرناکی داشته باشد و خیلی راحت و سریع توسط تبهکاران برای اهداف کلاهبرداری استفاده شود.

به‌علاوه، چنین شکلی از هوش مصنوعی می‌تواند با تقلید صدای سیاستمداران مشکلات بسیار بزرگ‌تری را به‌وجود بیاورد. درنتیجه، به‌نظر می‌رسد که تا پیش از عرضه این ابزار (البته اصلاً اگر امکان عرضه آن وجود داشته باشد)، باید به سؤالات مهمی در این زمینه پاسخ دهیم و نگرانی‌های مهمی را برطرف کنیم.

بدیهی است که VALL-E هم مثل بسیاری از ابزارهای هوش مصنوعی می‌تواند استفاده‌های مفید و غیرمفیدی داشته باشد. «برد اسمیت»، از مدیران مایکروسافت قبلاً گفته بود که این حوزه نیازمند مقررات است و در آینده باید ببینیم که مایکروسافت چه قواعدی را برای استفاده از ابزارهای خود در نظر خواهد گرفت.

 

منبع :https://dgto.ir/2wf9