Code and data

<p dir="ltr">State-of-the-art (SOTA) Automatic Speech Recognition (ASR) systems primarily rely on acoustic information while disregarding additional multi-modal context. However, visual information are essential in disambiguation and adaptation. </p><p dir="ltr">...

Full description

Saved in:

Bibliographic Details
Main Author:	Supriti Sinhamahapatra (22271917) (author)
Other Authors:	Jan Niehues (22272010) (author)
Published:	2025
Subjects:	Speech recognition speech recognition outcomes multi modal ASR
Tags:	Add Tag No Tags, Be the first to tag this record!

Code and data

Similar Items