Wintechmobiles.com – Amazon Luncurkan Nova Sonic, AI Suara Real-Time dengan Emosi dan Responsif seperti Manusia
Amazon secara resmi meluncurkan Nova Sonic, model kecerdasan buatan terbaru yang menghadirkan pengalaman percakapan suara real-time dengan respons yang cepat dan penuh ekspresi layaknya manusia.
Model ini menjadi bagian dari strategi ekspansi Amazon dalam memperkuat dominasi di industri AI, bersaing langsung dengan raksasa lain seperti OpenAI dan Google. Nova Sonic tersedia melalui platform Amazon Bedrock yang dirancang untuk pengembang aplikasi berbasis AI.
Nova Sonic bukan sekadar asisten suara biasa. Model ini mengintegrasikan pengenalan suara dan pembuatan suara dalam satu arsitektur. Hasilnya, AI dapat merespons dengan lebih alami dan menyesuaikan nada bicara, ekspresi, hingga kecepatan suara pengguna.
Menurut Rohit Prasad, SVP dan Kepala Ilmuwan AGI Amazon, teknologi ini sudah digunakan dalam perangkat Alexa Plus terbaru. Ia menambahkan bahwa Nova Sonic mendukung berbagai aksen bahasa Inggris dan menyajikan suara yang ekspresif.
Respon Cepat, Hemat Biaya, dan Penuh Nuansa Emosional
Keunggulan Nova Sonic terletak pada kemampuannya memahami dan meniru infleksi emosional dari pembicara. Dengan latensi rata-rata hanya sedikit di atas satu detik, AI ini sangat cocok digunakan dalam berbagai skenario interaktif.
Amazon mengklaim bahwa model ini 80% lebih hemat biaya dibanding kompetitor untuk penggunaan suara real-time.
Dalam uji coba benchmark Multilingual LibriSpeech, Nova Sonic mencatat word error rate (WER) hanya sebesar 4,2% untuk lima bahasa utama: Inggris, Prancis, Italia, Jerman, dan Spanyol. Angka ini sangat kompetitif jika dibandingkan dengan model-model teratas di industri saat ini.
Siap Diintegrasikan di Berbagai Sektor
Nova Sonic dapat diakses oleh pengembang melalui API streaming dua arah di Amazon Bedrock. Integrasi ini mendukung aplikasi seperti layanan pelanggan, pendidikan, hingga asisten pribadi berbasis suara yang responsif dan lebih manusiawi.
Amazon tampaknya serius membidik pasar AI global. Nova Sonic secara langsung disandingkan dengan GPT-4o dari OpenAI dan Gemini Flash 2.0 dari Google sebagai kompetitor utama, meski hingga kini belum tersedia hasil perbandingan independen secara terbuka.
Pengenalan Nova Reel 1.1: AI Generatif Video yang Realistis
Tak hanya suara, Amazon juga meluncurkan Nova Reel 1.1, model AI generatif khusus video. Versi terbaru ini menawarkan kualitas visual antar-adegan yang lebih konsisten dan realistis, memperkuat portofolio AI multimedia Amazon.
Langkah ini menegaskan bahwa Amazon ingin menghadirkan AI sebagai antarmuka yang tidak hanya cerdas, tetapi juga emosional dan imersif—baik secara suara maupun visual.