مایکروسافت اخیراً یک ابزار هوش مصنوعی جدید را منتشر کرده است که VALL-E نام دارد و میتواند صدای افراد را تقلید کند. برای استفاده از این ابزار کافیست 3 ثانیه از صدای یک فرد را به هوش مصنوعی بدهید و بعد با حفظ حسوحال گوینده اصلی، به تولید عبارتهای جدید بپردازید.
به گزارش AITopics، ابزار جدید هوش مصنوعی مایکروسافت موسوم به VALL-E میتواند از روی نمونه 3ثانیهای صدای افراد، دست به تقلید صدای آنها بزند. این ابزار با 60 هزار ساعت داده صوتی به زبان انگلیسی آموزش داده شده است. VALL-E میتواند در عین حفظ احساس گوینده اصلی، دست به خلق عبارتهایی بزند که در برش 3 ثانیه اصلاً وجود نداشته است.
گروهی از محققان دانشگاه کورنل با این ابزار چندین صدای مصنوعی ساختهاند و نتایج آزمایشهای خود را در گیتهاب منتشر کردهاند. با بررسی این صداها میتوان دید که برخی از آنها طبیعیتر و برخی ماشینیترند. درنتیجه، انتظار میرود که این هوش مصنوعی در آینده بهبودهای بیشتری داشته باشد. از طرف دیگر، اگر بیشتر از 3 ثانیه داده دریافتی وجود داشته باشد، میتوان شانس بیشتری برای تقلید صدای دقیقتر قائل شد.
VALL-E مایکروسافت در دسترس عموم قرار ندارد
VALL-E درحالحاضر بهصورت عمومی منتشر نشده و این تصمیم احتمالاً تصمیم درستی بوده است؛ چرا که تقلید صدای افراد میتواند کاربردهای خطرناکی داشته باشد و خیلی راحت و سریع توسط تبهکاران برای اهداف کلاهبرداری استفاده شود.
بهعلاوه، چنین شکلی از هوش مصنوعی میتواند با تقلید صدای سیاستمداران مشکلات بسیار بزرگتری را بهوجود بیاورد. درنتیجه، بهنظر میرسد که تا پیش از عرضه این ابزار (البته اصلاً اگر امکان عرضه آن وجود داشته باشد)، باید به سؤالات مهمی در این زمینه پاسخ دهیم و نگرانیهای مهمی را برطرف کنیم.
بدیهی است که VALL-E هم مثل بسیاری از ابزارهای هوش مصنوعی میتواند استفادههای مفید و غیرمفیدی داشته باشد. «برد اسمیت»، از مدیران مایکروسافت قبلاً گفته بود که این حوزه نیازمند مقررات است و در آینده باید ببینیم که مایکروسافت چه قواعدی را برای استفاده از ابزارهای خود در نظر خواهد گرفت.
منبع :https://dgto.ir/2wf9