مدل هوش مصنوعی جدید با صدای واقعی انیشتین
شرکت تولید محتوای صوتی Aflorithmic و سازندگان انسان دیجیتال UneeQ همکاری خود برای تولید صدای واقعی انیشتین را آغاز کردند.
این دو شرکت در تلاشند تا شرایطی را فراهم کنند که مردم بتوانند سوالات علمیشان را از انیشتینی که توسط فناوری هوش مصنوعی به آنها پاسخ میدهد، بپرسند؛ آن هم به شکلی که انگار خود انیشتین واقعی در حال پاسخ دادن به آنها است.
این دور شرکت همچنین در توضیح اینکه چرا انیشتین را انتخاب کردند اشاره به شهرت، نابغه بودن، نماد تاریخی بودن و علاقهاش به فناوری داشتند. همچنین معتقدند او کسی است که مردم بیش از بقیه افراد مایلند از او سوالاتی بپرسند.
برای شبیهتر شدن هرچه بیشتر مدل به انیشتین، UneeQ تکنیکهای ارائه شخصیت بصری را با یک موتور پیشرفته دانش محاسباتی ترکیب کرده تا نمونه اولیه به میزان زیادی باورپذیر باشد. از نظر احیای صدای معتبر که شباهت زیادی به صدای انیشتین واقعی داشته باشد، محققان پیشرفت زیادی نداشتند و دلیلش این است که دادههای زیادی از صدای واقعی او ندارند؛ تنها چند مورد کوتاه از گزارشاتی که او با لهجه آلمانی داشته است. از آن گزارش اینطور برداشت کردند که ریتم صدایش آرام بوده، شخصیتش عاقلانه و البته مهربان به نظر رسیده و تقریبا بلند صحبت میکرده است.
به دلیل نبودن دادههای کافی برای تولید صدای واقعی انیشتین و پایین بودن کیفیت صداهای موجود از او، تیمهای توسعه تلاش کردند تا یک مرجع برای تولید صدای واقعی انیشتین ایجاد کنند. دغدغه اصلی این است که کاربران نگران شباهت صدای انیشتین با مدل هوش مصنوعی نباشند و باور کنند که این نزدیکترین صدا به صدای واقعی انیشتین است. قرار است صدای این ربات حتی اگر خود صدای انیشتین نباشد، صدایی منحصربهفرد باشد که از این بهبعد کاربران به راحتی آن را تشخیص دهند.
در صدای جدید تولید شده، تلاش بر این بوده که انیشتین همان لهجه آلمانی را داشته باشد و بتوان حس شوخطبعی و دوستیاش را درک کرد. حتی محققان این توانایی را به این مدل هوش مصنوعی دادهاند که وقتی به کاربران در تعامل است، اینطور به نظر برسد که حتی بر دانش خودش هم تامل میکند.
علاوه بر شبیهسازی صدا، محققان مجبور بودند به شکلی این مدل را توسعه دهند که بتواند سرعت خوبی در پاسخ دادن به سوالات کاربران داشته باشد، مانند یک دستیار شخصی یا یک ربات سخنگو که به مشتریان خدمات میدهد.
برای دستیابی به این اهداف آنها یک چرخه همزمان ایجاد کردند که متن ورودی را دریافت کند و توسط موتور دانش محاسباتی پاسخ دهد. طی تنها دو هفته از زمان توسعه، محققان موفق شدند زمان پاسخ دادن این ربات را از 12 ثانیه به کمتر از 3 ثانیه برسانند.
از نظر هردو شرکت سازنده این ربات، پروژه انیشتین دیجیتال آغازی برای توانمند شدن در فناوری تعامل هوش مصنوعی با انسان و ایجاد مکالمه بین آنها میدانند.
جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید.