|
||
Amazon представила голосову ШІ-модель Nova SonicAmazon представила модель генеративного штучного інтелекту Nova Sonic, здатну обробляти голос і генерувати мову, яка звучить природно. У тестах на заміри швидкості, розпізнавання мови і якість розмови Sonic зарекомендувала себе як конкурентоспроможна порівняно з передовими голосовими моделями OpenAI і Google.
Nova Sonic - відповідь Amazon на нові голосові моделі ШІ, як-от та, що лежить в основі звукового режиму ChatGPT; усі вони пропонують більш природні формати спілкування, ніж ранні версії голосового помічника Alexa. Технологічні прориви останніх років дали змогу зробити застарілі моделі та цифрових помічників, включно з Alexa і Apple Siri, набагато природнішими у взаємодії з людиною. Модель Nova Sonic доступна через Bedrock - пропоновану Amazon платформу для розробників корпоративних застосунків із ШІ; підтримується двонаправлений потоковий API. Nova Sonic, додали в Amazon, обходиться в експлуатації на 80 % дешевше, ніж мультимодальна OpenAI GPT-4o, а її компоненти вже працюють в оновленому варіанті Alexa+.
У бенчмарку Augmented Multi Party Interaction, що оцінює якість розмови вголос із кількома учасниками, Nova Sonic виявилася на 46,7 % точнішою за критерієм WER, ніж OpenAI GPT-4o-transcribe. Модель від Amazon також виявилася дуже швидкою - її середня затримка склала 1,09 с проти 1,18 с, яку показала GPT-4o, що лежить в основі OpenAI Realtime API. Компанія має намір представити ще кілька моделей ШІ, здатних до опрацювання зображень, відео, голосу та "інших сенсорних даних, які необхідні під час перенесення у фізичний світ". Джерело: SmartPhone.ua Обговорення новиниКоментариев пока никто не оставил. Станьте первым! Попередні новини
|
|
|