千里传音是各路武侠小说中的经典桥段,因为谁都想拥有洞悉一切的顺风耳,然后笑看风云变幻独步江湖。虽然不可思议,但在人工智能和机器视觉技术不断实现突破的当下,曾经只有虚构的侠客们才能习得的“传音术”,终于走出了小说里的奇幻描述,来到我们身边。
2017年3月29日,《重庆新闻联播》播出了这条“传音术”新闻。其实,这是一款由海云数据研发的“唇语识别”技术。从理论上讲,唇语识别并不神秘。就在半年多前,牛津大学曾开发了一个类似的深度学习系统LipNet,这套系统当时就以93.4%对52.3%的大比分击败了人类唇读专家。
登陆《重庆新闻联播》的唇语识别是个啥?点击视频立刻探秘
要知道,声音是人类感知世界的核心渠道,然而在特定的无声场景中,声音的传播属性被强制剥离,形成信息真空。唇语识别系统使用机器视觉技术,从图像中连续识别出人脸,并提取此人连续的口型变化特征,随即将连续变化的特征输入到唇语识别模型中,识别出讲话人口型对应的发音,从而计算出可能性最大的表达语句。
海云数据创始人、CEO冯一村说:“海云研究院经过多项技术攻关,结合海云数据业务形态、打破了原先只能识别英文的技术局限,开创了中文唇语识别模型的研究先河,而且还将实现少数民族语言、甚至其他语种语言的唇语识别。”
“成熟的唇语识别系统需要建立在大量人脸特征样本的基础之上,通过带记忆的深度神经网络才能保证结果的最大准确性。鉴于人种的生物特征以及语言特征区别,国外的系统并不能照搬照抄,,冯一村进一步指出。
,有了这种语言识别技术,我们就把那些哑巴的录像、视频,变成了有声的录像和视频了。从一个默片时代进入到有声电影时代,这是一个巨大的技术应用突破。
可以预想,加入唇语识别技术后,,极大助力犯罪缉查工作的开展。
这其实只是唇语识别技术的应用场景之一。在日常生活、社会公益、体育赛事裁定等方面唇语识别有着更广阔的空间。譬如助力聋哑人、老年人交流;唇语解锁;体育赛事的语言暴力等。一项新技术的诞生,往往能够给人类带来无限的想象空间,而率先掌握新技术的人则必将拥有打开商业市场的钥匙。
合作须知:合作及投稿请在微信后台直接回复或发邮件:yuanfeng@hiynn.com
推荐阅读
海云数据(HYDATA)
海云数据是中国大数据可视分析的领导者,提供企业级大数据整体运营与分析服务,依托于计算机数据视觉、数据算法等技术,探索大数据的潜在商业价值,为不同行业客户提供基于数据交互可视化的整体产品,真正实现将大数据应用于分析、决策和预判领域。
更多关于海云数据的介绍请戳这里哦~
你还可以在
【新浪微博】【今日头条】【一点资讯】
【百度百家】【搜狐新闻客户端】
【网易新闻客户端】【爱奇艺】
找到我们
如果你喜欢我们的文章请点击右上方分享哦
▼ 喜欢请按赞哟~ ヾ(o◕∀◕)ノ