العُلماء يُطوّرون برنامجاً ذكياً يُمكنه قراءة الشفاه بدقة

العُلماء يُطوّرون برنامجاً ذكياً يُمكنه قراءة الشفاه بدقة

مكّن فريق مُختص بالبرمجيات من جامعة “أكسفورد” من تطوير برنامج ذكي، يُمكنه قراءة الشفاه بشكل صحيح بنسبة 93.4%، وذلك في مُستوى يفوق قدرات خبراء قراءة الشفاه، والبرامج الإلكترونية الأخرى.

ووفقاُ لوسائل إعلامية دولية فإن البرنامج الذي أطلق عليه الباحثون اسم “LipNet” يتميز بإمكانيات علمية هائلة، إذ يًمكن استخدامه لتحسين أجهزة السمع لذوي الاحتياجات الخاصة من فئة الصم، كما ويُساعد في تمكين المحادثات في الأماكن الصاخبة أو لإضافة كلمة إلى السينما الصامتة.

مع ذلك، لم يُنكر الباحثون تخوفهم من سلبياته، حيث قد يُستخدم في مراقبة خطاب الجماهير في الأماكن العامة عبر كاميرات المراقبة والسماح لأي شخص بالتقاط المحادثات الخاصة.

ويعمل الباحثون مع قسم DeepMind للذكاء الاصطناعي في غوغل، لتدريب البرنامج على أكثر من 30،000 شريط فيديو من الموضوعات واختبار نطق الجمل.

وبحسب الباحثين فمع مرور الوقت، ستتطابق كلمات معينة للبرنامج مع حركات الشفة لمعرفة ما هي الكلمات.

وأدرج الباحثون مزيداً من أشرطة الفيديو لجمل أشخاص يتحدثون، ونجح البرنامج في تفسير الجمل بدقة بنسبة 93.4%، بالمقارنة مع 52.3% لفئة ضعاف السمع.

على عكس البرامج السابقة، برنامج LipNet يُفسر العبارات والجمل كاملة ويسمح بوضع الكلمات في سياقها بدلاً من فك كل منها على حدة، وهذا يعني أنه لا يحتاج لتقسيم الفيديو في أشرطة الفيديو منفصلة لكل كلمة.

وكشف الباحثون أن البرنامج ليس جاهزا تماما للعالم الحقيقي، إذ أن البحوث والاختبارات لا تشمل سوى مجموعة محددة من أشرطة الفيديو والتي ظهرت كلمات في بنية مجموعة من “الأوامر، الألوان، حرف الجر، رسالة، رقم، ظرف”.

ولتوسيع البرنامج يحتاج إلى سعة تخزينية واسعة للغاية لإدراج مختلف اللغات واللهجات في العالم، ولا يخفي الباحثون صعوبة التعامل مع اللكنات العامية للدول وكيفية برمجتها داخل “LipNet” لا يزال غير واضحاً لديهم.