新的唇读AI系统可以帮助患有听力损失的人

牛津科学家开发了一种新的人工智能程序,可以比人们更准确地阅读,这一进步将帮助那些患有听力损失的人。来自英国牛津大学的研究人员比较了机器和人类专家的能力,通过专注于每个扬声器的唇部运动来计算静音视频中的内容。

牛津科学家开发了一种新的人工智能程序这可以比人们更准确地阅读,这一进步将帮助那些患有听力损失的人。 Watch,Attend and Spell(WAS)软件系统使用计算机视觉和机器学习方法来学习如何从由六个不同程序收集的超过5,000小时的电视镜头组成的数据集中进行唇读。这些视频共包含118,000多个句子,词汇量为17,500字。来自英国牛津大学的研究人员比较了机器和人类专家的能力,通过专注于每个扬声器的唇部运动来计算静音视频中的内容。

他们发现该软件系统比专业人士更准确。人类唇读者正确读取了12%的单词,而WAS软件识别出数据集中50%的单词,没有错误。机器错误很小,包括在一个单词的末尾错过s或单字母拼写错误。该软件可以支持许多发展,包括帮助听力障碍导航周围的世界。唇读是一项令人印象深刻且具有挑战性的技能,因此WAS可以为这项任务提供支持8211,例如,建议专业唇读者使用他们的专业知识进行验证,牛津大学研究生Joon Son Chung说。

同时观看:

还有许多其他应用,例如在嘈杂的环境中指示手机的指令,配音档案无声电影,解决多人讲话同声传音以及提高自动语音识别的性能总的来说,说Son Chung。

(责任编辑:亿恒彩票app下载)

本文地址:http://www.hxkzxh.com/caizhuang/fangshai/201908/1830.html

上一篇:Ayush亿恒彩票app下载man Bharat计划:没有提议审查价格 下一篇:没有了

相关文章

在线评论

想说什么就说点什么吧! * 为必填字段

今日头条

人气点击

+