مباشر
أين يمكنك متابعتنا

أقسام مهمة

Stories

23 خبر
  • هدنة وحصار المضيق
  • العملية العسكرية الروسية في أوكرانيا
  • منتدى بطرسبورغ الاقتصادي الدولي
  • هدنة وحصار المضيق

    هدنة وحصار المضيق

  • العملية العسكرية الروسية في أوكرانيا

    العملية العسكرية الروسية في أوكرانيا

  • منتدى بطرسبورغ الاقتصادي الدولي

    منتدى بطرسبورغ الاقتصادي الدولي

  • مونديال 2026

    مونديال 2026

  • اتفاق وقف إطلاق النار بين إسرائيل ولبنان

    اتفاق وقف إطلاق النار بين إسرائيل ولبنان

روسيا.. ابتكار أول برنامج وطني لتوليد المحتوى الصوتي بالذكاء الاصطناعي

طوّر باحثو جامعة نوفوسيبيرسك التقنية الروسية أول برنامج وطني لتوليد المحتوى الصوتي بالذكاء الاصطناعي.

روسيا.. ابتكار أول برنامج وطني لتوليد المحتوى الصوتي بالذكاء الاصطناعي
صورة إرشيفية / abc-av.ru

أفاد بذلك  المشرف على المشروع يغور أنتونيانتس في حديث أدلى به لوكالة "تاس" الروسية.

يهدف هذا التطوير إلى المهام التي تتطلب إنتاجا مستقلا للمقطوعات الموسيقية والأجزاء الغنائية والمؤثرات الصوتية بناء على أوصاف نصية دون الارتباط بخدمات سحابية. ووفقا للمطورين، يوفر النظام دورة كاملة لإنتاج المحتوى الصوتي،  بدءا من الطلب النصي ووصولا للتصدير إلى المنصات واسعة الاستخدام WAV و MP3 و FLAC، ويعمل النظام  في نفس الوقت على أجهزة استهلاكية بحجم ذاكرة فيديو أقل من 6 غيغابايت.

وأشار أنتونيانتس إلى أن  "الميزة الرئيسية لتطويرنا هي الاستقلالية الكاملة عن المنصات الأجنبية وإمكانية العمل في بيئة مغلقة. لقد قمنا بضبط النموذج الأساسي باستخدام محولات LoRA المتخصصة لثلاثة أنواع من المحتوى، وهي الموسيقى الآلية، والأغاني المصحوبة بصوت بشري، والمؤثرات الصوتية، مما يتجنب تأثير اختلاط الخصائص ويحقق تطابقا أدق مع الطلب".

وعلى عكس الحلول الأساسية الموجهة للمستخدمين الناطقين بالإنجليزية، فإن الأداة الجديدة مهيأة للعمل مع الاستعلامات الناطقة بالروسية وتُظهر نتائج تنافسية. فقد بلغ متوسط معيار التقييم الذاتي MOS 4.1 من أصل 5 نقاط، وهو ما يُقارن بمعدلات المنصات التجارية الرائدة.

وأوضح مطور المشروع أرتور خوساينوف قائلا: " من ناحية تقنية تتم المعالجة على عدة مراحل: يقوم نموذج لغوي أولا بتشكيل هيكل دلالي للمقطوعة باستخدام سلسلة من التفكير، ثم يقوم المحول الانتشاري (diffusion transformer) بالتركيب الصوتي في الفضاء الكامن، أما وحدة التصدير فتقوم بتحويل المحتوى إلى الصيغ المستهدفة. وتسمح الواجهة الرسومية المدمجة بإدارة المشاريع، وحفظ وتحميل إعدادات التوليد المسبقة، والمعاينة قبل الاستماع، وتصدير المسارات دون الحاجة إلى محررات خارجية".

وأكد مبتكرو البرنامج أنهم يخططون مستقبلا لتوسيع النظام، بما في ذلك إضافة دعم الصوت المكاني لتطبيقات الواقع الافتراضي، وتنفيذ التكامل مع وحدات تحكم MIDI للتفاعل الحي، وتكييف البرنامج للسيناريوهات الصناعية،  بدءا من إنشاء مقاطع صوتية لألعاب الفيديو ووصولا إلى الدبلجة الآلية للأفلام والبث المباشر والبودكاست والإعلانات التجارية.

المصدر: تاس

التعليقات

"ماذا تفعل، بحق الجحيم؟!"..

تداول فيديو لمطالبة السعودية طاقم السفارة الإيرانية بالمغادرة.. ما حقيقته؟

الحرس الثوري الإيراني ينفي استهداف صالة الركاب في مطار الكويت ويكشف السبب (صور + فيديو)

"فركة أذن للقبضة الحديدية".. النواب الأمريكي يمرر مشروع قرار للحد من صلاحيات ترامب العسكرية في إيران

هيئة الطيران المدني الكويتية تبث لقطات للهجوم على مبنى الركاب "T1" في مطار الكويت الدولي (فيديو)

الكويت.. الداخلية تنشر مشاهد جديدة للأضرار الجسيمة التي طالت مبنى الركاب (T1) بالمطار الدولي (فيديو)

الحرس الثوري الإيراني: العدو مجبر على قبول القواعد الجديدة التي فرضت على أرض الواقع

أمير قطر خلال مكالمة مع ترامب: يجب تغليب الحلول السياسية والدبلوماسية والحوار بين كل الأطراف

فنلندا: كنا مستعدين لإسقاط المسيّرات الأوكرانية المتجهة نحو بطرسبورغ الروسية

عراقجي ينشر تصريحات لروبيو ويؤكد: أي عمل عدائي سيقابل برد فوري وحاسم (فيديو)

تركيا.. النيابة تطالب بسجن عنصر من جهاز الاستخبارات بتهمة تسريب معلومات سرية لنظام الأسد (صورة)

نتنياهو: الأمر لم ينته في إيران وفتح مضيق هرمز ممكن عسكريا

صحفية أمريكية: الإعلام الغربي غبي في عجزه عن تخيل الحياة في روسيا دون بطاقات الدفع الأمريكية

مصادر ميدانية لـ RT: الجيش السوداني أوقع قوات "الدعم السريع" و"جوزيف توكا" في كمين بمنطقة البركة