الرئيسية تكنولوجياأمازون تكشف عن Nova Sonic: نموذج ذكاء اصطناعي صوتي

أمازون تكشف عن Nova Sonic: نموذج ذكاء اصطناعي صوتي

من admin3
A+A-
Reset

كشفت شركة أمازون عن نموذجها الصوتي الجديد المعتمد على الذكاء الاصطناعي التوليدي “Nova Sonic”، الذي صُمم لمعالجة الصوت مباشرةً وتوليد كلام طبيعي يُحاكي المحادثات البشرية.

ويأتي هذا النموذج كخطوة استراتيجية من أمازون لمنافسة النماذج الصوتية الحديثة مثل تلك التي تدعم ميزة الصوت في ChatGPT من OpenAI، بالإضافة إلى نموذج “Gemini” من جوجل. وتقول الشركة إن أداء Nova Sonic يُضاهي أبرز هذه النماذج من حيث سرعة الاستجابة، ودقة التعرف على الكلام، وجودة التفاعل.

ويتوفر Nova Sonic عبر منصة Amazon Bedrock، المخصصة للمطورين لبناء تطبيقات الذكاء الاصطناعي المؤسسية، من خلال واجهة برمجة التطبيقات (API) جديدة تتيح التفاعل الصوتي في الاتجاهين.

وأكدت أمازون أن النموذج يتميّز بكفاءة عالية من حيث التكلفة، موضحةً أنه أقل تكلفة بنسبة تصل إلى 80% مقارنةً بنموذج GPT-4o من OpenAI، بحسب ما ورد في بيان رسمي للشركة.

وقال “روهيت براساد”، النائب الأول لرئيس أمازون وكبير علماء الذكاء الاصطناعي العام (AGI)، إن تقنيات Nova Sonic تُستخدم بالفعل ضمن الجيل الجديد من المساعد الصوتي “أليكسا بلس”.

ويمتاز النموذج بقدرته على الاستجابة اللحظية أثناء الحوار، مع مراعاة فترات التوقف والمقاطعات، كما يتيح توليد نسخة مكتوبة من حديث المستخدم للاستفادة منها في تطبيقات مختلفة. ويتميّز كذلك بقدرته على فهم نوايا المتحدث حتى في حالات التمتمة أو وجود ضوضاء.

ووفقًا لاختبار Multilingual LibriSpeech، سجّل Nova Sonic معدل خطأ بلغ 4.2% فقط في التعرف على الكلام عبر خمس لغات أوروبية، فيما تفوّق على GPT-4o-transcribe من OpenAI بنسبة 46.7% من حيث دقة التعرف على الصوت في المحادثات متعددة الأطراف.

كما تفوق النموذج من حيث سرعة الاستجابة، مسجلاً تأخيرًا متوسطًا قدره 1.09 ثانية، مقارنة بـ1.18 ثانية لنموذج Realtime API من OpenAI، وفقًا لاختبارات مؤسسة Artificial Analysis.

وتأتي هذه الخطوة ضمن جهود أمازون لتطوير الذكاء الاصطناعي العام (AGI)، حيث تسعى لتوسيع قدرات نماذجها لتشمل الوسائط المتعددة مثل الصور والفيديو والصوت، بالإضافة إلى بيانات حسية أخرى. كما أطلقت مؤخرًا نموذج “Nova Act” لتنفيذ المهام داخل المتصفح، ونموذج توليد الفيديو “Nova Reel”، ضمن مزايا الجيل الجديد من “أليكسا بلس”.

شاهد ايضا

خبر جديد عن أفاق للاعلام

الاكثر قراءة هذا الاسبوع

الاكثر قراءة هذا في 24 ساعة

الاحدث