依图夺冠世界级声纹识别竞赛!智能语音战场又破一城

来源:QQ快报
责任编辑:鲁晓倩
字体:

新智元报道

编辑:木青

【新智元导读】去年年底才宣布进军智能语音市场,如今依图科技又攻下一城:9月初,夺冠全球声纹识别竞赛VoxSRC。依图正成为“边界重塑者”,业务愈加多元:计算机视觉、NLP、芯片、智能语音,逐渐备齐各项AI能力。

AI技术战场上,依图科技又攻下一城。

刚刚,在全球声纹识别竞赛VoxSRC(VoxCeleb Speaker Recognition Challenge)上,依图以大幅领先的成绩夺得第一名

去年年底,依图宣布强势进军智能语音领域,并用“识别精度创中文语音识别新高点”的技术成就作为开场,如今在声纹识别技术上亦是登顶。

这两年来,依图不断在重塑边界,业务越来越多元,一直在挑战新领域,也屡摘桂冠——在AI技术上的记录既有深度也有广度,除拥有绝对优势的起家本领人脸识别外:

视觉计算:成为“AI国家队”,依图承建“视觉计算国家新一代人工智能开放平台”。

语音识别:在全球最大的中文开源数据库AISHELL-2中,依图2018年时短语音听写的字错率(CER)达到3.71%,大幅刷新当时的纪录;

AI芯片:算法即芯片,重磅推出拥有世界级算法优势的云端AI芯片——求索(questcore);

自然语言处理:基于机器学习的NLP技术,依图医疗与合作团队在世界顶级医学科研期刊《自然·医学》(Nature Medicine)刊发题为《使用人工智能评估和准确诊断儿科疾病》的医疗人工智能成果。

计算机视觉、智能语音、NLP、芯片,依图的下一程又在哪里?

超过清华、约翰霍普金斯团队,拿下全球声纹识别竞赛冠军

所谓声纹识别就是说话人识别,根据人说话的声音,判定人的身份的技术。

VoxSRC是基于英国牛津大学两年前发布的公开声纹识别VoxCeleb数据集组织的学术界知名比赛。

本次参赛者来自中、美、法、日本等多个国家的高校与企业,包括中山大学、约翰霍普金斯大学、清华大学、法国国家信息与自动化研究所、平安科技、NEC、君林科技等。

这是依图首次且独立参与这场竞赛,参赛队伍名称为logicworld,比赛成绩大幅领先第二名,依图、第二名和第三名队伍的 EER(等错误率)分别是 0.98% 、1.42%和1.54%。EER是判断声纹识别算法系统的综合指标,EER越小系统性能越好。

VoxCeleb数据集来自YouTube名人采访视频,含有 7000 多个不同说话人超过 100 万段语音,时长总共超过 2000 小时。不仅数据量大,VoxCeleb还充分考虑了数据的多样性,61%的发言者为男性,并且涉及不同的种族、口音、职业和年龄。

此外,VoxCeleb的数据都来自无约束场景,比如红毯采访、会谈录音,因此音频中含有大量噪音,包括背景噪音、笑声、重叠的说话声和其他杂音,收录工具也不尽相同,有的甚至是手机拍摄的粗糙视频。

来源复杂的数据集对声纹识别技术水平的要求更高,声纹识别的高准确率可以提高采用声纹识别技术进行访问控制的系统的安全性。

VoxSRC挑战赛的另一大难点,同时也是其结果备受认可的一点,就是测试数据不含标注,也就是“盲测”,确保了比赛结果的公正与公平。

参赛团队的任务是分辨一对音频是来自同一个发言者还是来自不同的发言者,可以选择固定训练集,也可以使用无约束训练集(除测试集以外的任何数据)。

依图参加的是固定训练数据集任务,在这种情况下,参赛者只能使用赛方提供的VoxCeleb2开发集,该数据集含有来自5994个讲者的超过10万句话语

深度学习拓展声纹识别边界,深耕算法的依图赢在起跑线上

此前,深度学习在声纹识别领域并不常见,从2012年开始,深度学习逐渐介入声纹识别,进行技术的重新洗牌

事实上,相对于图像和NLP领域,目前声纹领域所用到的神经网络和深度学习算法相对简单,提升空间依然很大。

而依图正是拥有世界顶级算法的人工智能公司,可以说是直接赢在了起跑线上。

还有一点值得注意,这次依图参加的是固定训练集任务,而其识别精度比其他使用无约束训练集的团队还高

目前,声纹识别的后端仍被PLDA等传统处理和分类技术占据,深度学习的介入可以促使声纹识别像人脸识别一样广泛应用。

去年年底强势进军,成为智能语音界一匹黑马!

依图科技在2018年底杀入智能语音领域成为一匹“黑马”。

用以宣布进军语音战场的则是技术与产业的双重亮眼成绩:

技术上,在全球最大的中文开源数据库AISHELL-2中,依图2018年12月时的短语音听写的字错率(CER)达到3.71%,相比原业内领先者提升约20%,大幅刷新彼时纪录。

产业上,依图联合微软推出基于Azure云服务的语音开放平台,并携手华为发布软硬件一体化的“智能语音联合解决方案”,将依图语音识别技术提供给第三方应用开发者。

那时候依图就强调语音一直以来都是该公司的关注课题,进入语音识别领域是自然而然的事情,立志做世界最好的中文普通话语识别技术。

讯飞依图BAT各家算法差异巨大,讯飞依图位列第一阵营

如同以往一直坚持的“技术王道”理念,在谈到关于未来预计推出的语音产品及其功能时,依图首席创新官吕昊博士曾经表示:“实际上,我们认为技术和场景是比产品和功能更关键的要素。

依图2018年推出的中文语音识别算法,与业内原有领先者相比,不仅大幅提升了识别准确率,而且在单个算法模型上,有极为出色的多场景适用性表现。

在全球最大中文开源数据库AISHELL-2的三个测试子集,以及来自第三方的近场口音测试集(Accent)、近场安静聊天测试集(Chat)、语音节目测试集、电话测试集、远场测试集等测试场景中,依图均处于业界领先水平,而且字错率几乎全部在15%以下。

其中,在AISHELL2的-2018A-EVAL数据集中,依图的识别准确率高达96.29%,字错率仅为3.71%,领先第二名约20%

依图联合创始人兼CEO 朱珑

而构建生态方面,2018年12月,依图宣布与微软Azure云服务联合发布语音开放平台,将行业领先的语音识别技术能力开放给第三方应用开发者。依图也携手华为联合发布“智能语音联合解决方案”,该方案基于依图语音开放平台,以及华为全栈全场景昇腾系列芯片和面向数据中心侧的 Atlas 300 AI加速卡。

已有的生态布局,加上从语音识别到声纹识别不断进行边界拓展的技术积累,依图已经在智能语音方面握了一手好牌。

边界重塑者:视觉感知、NLP、AI芯片、智能语音,依图备齐各项AI能力

不止是在语音领域成为“黑马”,今年5月,依图在发布会上重磅推出了拥有世界级算法优势的云端AI芯片——求索,打破了算法公司与芯片硬件公司的“次元壁”。

在近两年来,依图一直在“跨界”尝试,不断重塑业务边界。

依图求索芯片

当时AI“大牛”颜水成博士加入依图担任CTO时,曾向新智元表示:“依图是一家非常低调的AI公司,但它无论是在产品还是国际技术比赛上都取得了非常好的成绩,这引起了我的好奇,想要一探究竟。”

虽然低调,但AI成绩单确实过硬。

截止目前,依图在人工智能技术上的记录既有深度——在视觉、听觉、语义理解等方面分别问鼎全球一流水平,并且有公开的独占鳌头的成绩;也有广度——覆盖视觉感知、自然语言理解、语音/声纹识别、AI芯片、AI医疗等方面。

其中,NLP的研究甚至已经与依图早已进军的AI医疗相结合。今年2月,世界顶级医学科研期刊《自然·医学》(Nature Medicine)在线刊发题为《使用人工智能评估和准确诊断儿科疾病》的医疗人工智能成果。

该成果由依图医疗联合广州市妇女儿童医疗中心等机构共同研发,基于机器学习的自然语言处理(NLP)技术实现不输人类医生的强大诊断能力,并具备多场景的应用能力。

这是全球首次在顶级医学杂志刊发有关自然语言处理技术基于中文文本型电子病历(EHR)做临床智能诊断的研究成果。不久前,依图医疗将相关技术应用于临床应用,将全国首款儿科诊疗解决方案落地国家儿童医学中心,就诊时间缩短了1.5~2 小时。

在人脸识别方面,依图在美国国家标准与技术研究院(NIST)举行的全球人脸识别权威测试(FRVT)中连续三年获得第一名。

在中央网信办、工业和信息化部、公安部指导下的首届中国人工智能竞赛上,依图斩获10项A类成绩,是夺冠最多的团队

芯片设计的技术实力也让依图一举进入“AI国家队”行列

8月29日的上海人工智能大会上,科技部宣布,依托依图先进的芯片设计及世界级算法,建设“视觉计算国家新一代人工智能开放平台”,促进芯片设计与人工智能的结合,推动视觉计算生态体系的建设。

逐渐备齐各项AI能力,业务能力越来越多元,商业竞争力不断增强。

那么,依图下一步的计划是什么呢?下一个重塑的边界在哪里?这可能又是一个新故事。

请注意:本文转载自QQ快报,并不代表本网赞同其观点,版权归原作者所有,本网不承担任何责任,特此声明。

根据您访问的内容,您可能还对以下内容感兴趣,希望对您有帮助:

依图科技人脸识别为何能再夺冠?

依图还在6月份获得2亿美元C+轮融资,投资人有高成资本、工银国际、浦银国际。 依图... 即在千万分之一误报下的识别准确率已经接近99%。另外值得注意的是,依图去年夺冠的...

重庆西南政法大学成人教育脱产学习,所颁发的毕业证是否属国...

级社科基金项目96项(其中教育部重点研究基地重大项目2项),横向课题52项,大型国际合... 我校体育运动队在重庆市和全国举行的各项比赛中多次夺冠。2006年,我校男子排球队...

在欧冠历史上都有那些俱乐部球队获得过欧冠冠军

。最终国际米兰3比1击败 皇马首次夺冠,为皇马进球的是费洛。 1965年5月27日,米... 欧冠历史上的最快入球未能诞生。这场 比赛,双方势均力敌,罗特(图右1)接贝肯鲍尔的...

从92年开始历届美国男篮梦之队奥运会表现

“梦三队”……之称。第二支“梦之队”(即“梦二队”)在1994年世界篮球锦标赛上夺... 阿根廷81-101美国 美国118-107西班牙 6、梦十2012奥运会战绩(夺冠) 美国98-71法...

荷兰国家足球队的最新名单

依场上的情况作适当的跑位, 以全攻全守的踢法,在74、78年连续两届杀入世界杯决赛, ... 又错失的夺冠的大好机会。 2002年是荷兰足球黑暗的一年,两大世界级的克鲁伊维特...

求关于足球的作文素材

刘翔110米栏夺冠并破奥运记录平世界记录,消除了中国田竞羡慕的弱势,更带动了中国田... 它也是普及最广泛,影响最深远的一项运动。国际级体育运动会中影响最深最大的有两项...

什么是足球升降级制?各国最高级别赛后怎么参加洲际、国际比...

方具资格。 意甲∶以积分排名次序,同分如涉及夺冠、欧洲赛事资格、降级等问题,要另... 法甲∶以积分排名次序,同分先按净胜球数、总入球数、对赛成绩等依次序来区别排名...

翼教版五年级上册语文第8单元卜算子·咏梅的背景

面对如此盛大寒冷的冬景,梅花仍然一支独秀,傲然挺拔。诗人当然也依古训,以诗言志... 它已成为一名国际共产主义战士的形象,它已从一个中国革命者成为一名世界革命者...

奥运会起源于哪个国家,第一届什么时间

为你塑像,使其立于宙斯庙之侧。优胜者还能获得物质、金钱等奖励。 夺冠更是城邦... 让奥林匹亚的火种燃遍全世界。 经顾拜旦多方奔波,1894年6月23日,国际奥委会宣布...

苏迪曼杯,尤伯杯,汤尤杯,……怎么分啊!还有 吗?

其中印度尼西亚队战绩最佳,共12次捧杯;马来西亚队先后5次夺冠;中国队是从1982年开... 她在1956年的国际羽联理事会上,正式向国际羽联捐赠由麦皮依和维伯制作的纪念杯,即...

声明:以上内容由用户提供,并不代表本网赞同其观点。如有任何不妥,请与不良与违法信息举报中心联系:513175919@qq.com

www.book1234.com true http://www.book1234.com/q/20190910/20190910A0A5WM00.html report 21558
娱乐时尚
科技资讯
历史文化
真视界
旅游美食
精彩图文
我爱我车
母婴健康
关于本站 | 广告服务 | 手机版 | 商务合作 | 免责申明 | 招聘信息 | 联系我们
Copyright © 2004-2018 book1234.com All Rights Reserved. 布客网 版权所有
京ICP备10044368号-1 京公网安备11010802011102号