Code and data

<p dir="ltr">State-of-the-art (SOTA) Automatic Speech Recognition (ASR) systems primarily rely on acoustic information while disregarding additional multi-modal context. However, visual information are essential in disambiguation and adaptation. </p><p dir="ltr">...

وصف كامل

محفوظ في:

التفاصيل البيبلوغرافية
المؤلف الرئيسي:	Supriti Sinhamahapatra (22271917) (author)
مؤلفون آخرون:	Jan Niehues (22272010) (author)
منشور في:	2025
الموضوعات:	Speech recognition speech recognition outcomes multi modal ASR
الوسوم:	إضافة وسم لا توجد وسوم, كن أول من يضع وسما على هذه التسجيلة!

Code and data

مواد مشابهة