请选择 进入手机版 | 继续访问电脑版
专注物联网产业服务
微信二维码
威腾网服务号
游客您好
第三方账号登陆
  • 点击联系客服

    在线时间:8:00-16:00

    客服电话

    17600611919

    电子邮件

    online@weiot.net
  • 威腾网服务号

    随时掌握企业动态

  • 扫描二维码

    关注威腾小程序

声纹识别
声纹识别
声纹识别,生物识别技术的一种,也称为说话人识别,包括说话人辨认和说话人确认。声纹识别就是把声信号转换成电信号,再用计算机进行识别。不同的任务和应用会使用不同的声纹识别技术,如缩小刑侦范围时可能需要辨认技术,而银行交易时则需要确认技术。
  • 这项技术可在你皮肤上采集振动信息,给声纹识别加了一道保险
    摘要:这是一种提高声纹识别安全性的新思路。 目前,声纹识别被越来越多地运用到身份识别,虽然声纹是唯一的,但它并不绝对安全,面临模拟、录音使用等隐患。比如,别有用心者可以给你录音,然后根据录音模拟相应的声音来操控你的设备。 不过,声纹识别非常适合与其他识别方法搭配使用,增加一道认证方式来确认声音的拥有者就安全多了。许多厂商提供了虹膜识别、人脸识别等配套措施,以提高安全性。但是多种验证方式间的关联性不大,可以各个击破。 根据最新消息,密歇根大学的研究人员创造了一种名为 VAuth(vee-auth)的技术,给出了一种解决该问题的新思路。这项技术需要使用者将硬件贴身佩戴,如眼镜、项链、耳塞等。硬件中有专门的设备检测佩戴者在发出声音时脸部、喉咙或胸部皮肤上的细微振动。 这就将声音与精确振动两种关联性信息搭配起来,形成了每个人独有的信息,而且体表振动产生的信息极难被外界伪造,提高了身份识别的安全性。 在准确性上,研究人员称,在一个使用 18 个用户和 30 个语音命令的实验室测试中,VAuth 的检测准确率达到 97%,在模拟、播放录音等实际攻击面前,它也表现优秀。 这项技术很有可能会结合其它技术推向市场,应用于门禁、购物、手机解锁等声纹识别广泛应用的领域。因为该技术需要采集使用者的体表振动,应该会以可穿戴设备与目标设备无线联通的形式出现。 这种解决声纹识别安全性问题的思路值得开发者和厂商借鉴。而对于消费者来说,加上这道保险,你再使用声音来控制身边的设备,也就放心多了。 头图来源:网络 责任编辑:早优夫斯基 原文章作者:极客公园,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于昨天 02:47
    最后回复 郏善芳 昨天 02:47
    2754 0
  • 知识科普:6大国产声纹识别厂商,看看你知道哪家?
    当我们拿起手机,首先是指纹识别或人脸识别解锁,生物识别技术似乎变成了人们生活中的必需品。近两年,声纹识别逐渐被应用在一些移动支付场景上。 语音和声纹识别的区别 声纹识别和语音识别的技术原理一致,两者都是通过对采集到的语音信号进行分析和处理,提取相应的特征或建立相应的模型,然后据此做出判断。两者之间的区别,主要在于目的及应用。简单来说,语音识别技术,主要考虑说的内容是什么,而声纹识别则考虑,说话的人是谁。 声纹识别技术的基本原理是为每一个说话人建立声纹模型,再将语音信号中说话人的生物参数(声音波形)作提取,去除信号低频和噪声部分后与声纹模型做比对以确认说话人的身份。 声纹识别技术的现状 声纹的概念,最早在1945年被提出,到了1966年,自美国法院开始采用“声纹”取证后,声纹技术开始被应用于司法场景。 有人会问,既然声纹识别由来已久,为什么不像指纹识别或语音识别一样被广泛应用? 由于声纹识别对环境要求较高,考虑实际商用场景的复杂性,做身份识别时有机会出现识别误差。举个例子,同一个说话人,在不同时间中录制相同的音频内容,有可能因为情绪、身体状况、说话语速不同等原因,出现不同的声纹特征。此外,声纹识别技术对环境的要求比较高,因为嘈杂的环境有混淆说话人信息的可能。 不过,由于声纹识别具有难以伪造、识别成本低廉、隐私性弱和不易丢失的优势,被广泛使用在银行证券、公安司法、安防及信息防伪领域。 那么,国内掌握声纹识别的厂商有哪些,他们技术来源又出自哪里呢?国际电子商情整理了声纹技术相关的厂商,具体如下: 得意音通技术 成立于2002年成立,北京得意音通技术有限责任公司是清华大学知识产权入股的高科技企业、中国人工智能产业发展联盟(AIIA)理事单位、互联网金融身份认证联盟(IFAA)理事单位,是拥有完全自主知识产权的声纹识别(VPR)、语音识别(ASR)与中文自然语言处理(CNLP)领域的技术研发商、产品开发商和服务提供商。得意音通在声纹识别这一被美国列为战略安全技术的领域居国际领先地位,可提供高安全、弱隐私、低成本的无监督身份认证服务。 中科信利 北京中科信利技术有限公司于2002年依托中国科学院声学研究所合作成立,是以开发智能语音技术为核心的高新技术公司。中科信利是国内第一家完全自主研发并拥有全部自主知识产权且实现了大规模商用案例的语音识别技术公司,是专业的语音核心技术和解决方案提供商。 声智科技 声智科技主要提供SoundAI Azero交互系统和平台服务,以及深度结合应用场景的人工智能技术和产品解决方案,并拥有声学矢量传感、声学阵列芯片、声学结构设计、远场声学处理、远场语音唤醒、远场声纹识别、远场语音识别、远场双工通话、场景语义理解、自然语音合成、超远场声学监控、局部场语音识别、分布场语音交互、深度学习与小样本学习、智能搜索与个性化推荐等自主核心技术。 厦门天聪 厦门天聪智能软件有限公司是一家成立于2005年的高新技术企业、公安部声纹识别行业标准制定单位,专业从声纹识别、语音技术和人工智能软件的研发和销售。天聪研发团队来自厦门大学、中科院等知名科研院所。 天聪公司是国内专业的语音声纹识别技术开发商,拥有软件著作权6项、授权和受理专利9项、科技鉴定成果1项、制定声纹标准1项。 国音智能(SpeakIn) 广州国音智能科技有限公司(SpeakIn),2015年诞生于美国硅谷,目前总部位于广州,作为以声纹识别等人工智能技术为核心的行业综合方案提供商,面向国家安全、公共安防、金融及互联网等领域提供专业的科技产品和大数据服务。SpeakIn的团队核心成员均来自哈佛大学、麻省理工学院、香港科技大学、香港中文大学、中国科学技术大学、微软亚洲研究院等国内外顶尖高等学府和科研机构。 VoiceAI Tech 声扬科技 深圳市声扬科技有限公司(英文简称“VoiceAI Tech”),以计算机听觉、大数据分析等前沿技术为核心的国家高新技术企业,拥有世界领先的声纹识别、语音识别等人工智能原创技术,可提供安全、高效、稳定的身份识别与智能语音综合解决方案,可广泛应用在金融、社保、公共安全、政务、物联网、智能硬件等多个领域。声扬科技的科研团队具有顶尖学术背景丰富,云集来自香港科技大学、香港中文大学、康奈尔大学、清华大学、中国科学技术大学、复旦大学、南开大学等一流院校的科学家与行业专家。 原文章作者:数智网,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于3 天前
    最后回复 特灼拷 3 天前
    2546 1
  • 厉害,360 AI 智能音箱竟然拥有声纹识别功能,网友说太智能化
    说起来,智能音箱也不是什么新鲜事物,目前市面上智能音箱产品也很多,纵观目前智能音箱产品,语音交互和智能家居联动是未来物联网的大趋势,作为物联网的中枢,智能音箱的重要性不言而喻。 3月28日,360在北京举办IoT春季发布会,正式公布了360未来的智能家居安全场景,并发布了诸多的新品。其中重点发布了一款AI智能音箱MAX,主打Hi-Fi级发烧音质,支持双重智能唤醒,拥有声纹识别功能。 指纹识别、面部识别,大家相对比较熟悉,声纹识别很多人都是第一次听说,再加上这款产品由圈内骨灰级音频发烧友的周鸿祎亲自调音。所以产品一经发布,就引起了网友的关注。 从外观上看,360 AI智能音箱采用类似于复古收音机的矩形外观设计,个头在目前的智能音箱中应该说是大块头,产品三围尺寸为230*115*100mm,不过850g的重量确是非常的轻巧,出乎我的意料。 颜色方面,我入手的这款是玄铁黑,红色款目前还未上市。音箱采用圆润的边角设计,音箱底部中间是黑色的软硅胶区,中间的led状态指示灯把硅胶区一分为二,上部是360品牌logo和四个线阵麦克风,下部是按键区,播放暂停、音量控制和麦克风按键。音箱正常使用状态下,点击麦克风按键,可以关闭语音交互功能,再次点击,开启语音交互功能。 音箱正面是大面积的蜂窝状喇叭罩,为了打造一款不仅仅是大音量的Hi-Fi级音箱,360 AI智能音箱配置了76mm超大口径全频扬声器单元和双被动振膜,配合专业优化的2000CC大尺寸音腔,真正实现了大块头高音质的效果。 在便携性和移动性方面,360 AI智能音箱略显不足,采用交流电供电,没有内置电池,而且需要吐糟的是充电口没有采用mic USB充电口,用户使用中如果遇到充电线问题,需要重新购买电源适配器。 从外观设计来看,这款360 AI智能音箱中规中矩,玄铁黑配色,稳重的矩形卧状复古收音机外观,可以适配适合的家居环境,稳重大气。 功能方面,360智能音箱具备了目前市面上大多数智能音箱具有的功能,而且还创新性地加入了双重智能唤醒和声纹识别功能,通过一段时间的体验,个人感觉音质和语音交互识别率方面要优于市面上的大多数智能音响产品。 和大多数智能音箱产品一样,360 AI智能音箱也匹配有一款名为360 AI音箱的APP软件,简单的连接绑定后,就可以开始愉快的体验了。 不得不说,音箱顶部LED状态指示灯还是炫酷的,不同的颜色表示音箱处在不同的状态。语音唤醒的时候,LED灯带也会自动亮起。 语音交互几乎成了目前智能音箱产品的标配,不过市面上一些音箱的语音交互体验并不理想,这款360 AI智能音箱的语音识别率高的出乎我意料,除了音箱顶部的四个线阵麦克风外,这款产品还内置了专为音箱定制的Rokid KANINO 18人工智能AI芯片,搭配先进的声源定位、噪音抑制和回音消除等,可以轻松在5米范围内唤醒音箱。 除此之外,360 AI智能音箱还拥有双重智能引擎,内置大人和儿童两套独立唤醒词和应答语音,这点应该是这款产品的一大亮点,而且,针对不同的唤醒词,会推荐不同的内容,比如同样时播放歌曲,大人唤醒的时候,会播放适合大人听的音乐,小朋友唤醒的时候,会播放适合小朋友听的音乐。我家小朋友小宝小宝唤醒后,说想听相声小品,音箱回答不适合小朋友收听的内容。看来,推荐还是很精准的。 内容方面,360 AI智能音箱目前已经接入了酷狗音乐、QQ音乐等,并与喜马拉雅FM\\、蜻蜓FM、宝宝巴士等知名内容厂家合作,资源相当的丰富,不管是老人,还是小孩,都能找到自己喜欢的内容。 而且,更厉害的是,360 AI智能音箱拥有声纹识别功能,可以识别家庭不同用户的声纹,并集合每位用户的试听习惯,有针对性的推荐内容,比如家里的老人喜欢听戏曲,听到老人的唤醒词后,音箱会自动播放戏曲,家里的妈妈喜欢听烹饪类节目,听到妈妈唤醒词后,音箱会主动搜索烹饪类节目并播放。这点还是智能化程度非常高的。 再来谈谈音质,360 AI音箱由周鸿祎亲自调音,而且采用 smart EQ智能音效,会根据不同风格歌曲加载相对应的音效参数。从体验来看,音箱的三频表现可圈可点,低频浑厚有力,试听蔡琴经典的试音歌曲《渡口》,音乐开始部分的小鼓声音清脆,大鼓声音浑厚,下潜和弹性都不错。人声方面,清晰通透,高频方面,亮丽有张力,不刺耳,即使音箱音量最大,也没有出现破音现象。而且这款音箱在细节、现场感方面也非常不错,试听《加州旅馆》,可以很清楚的感受到这一点。 智能音箱作为物联物的中枢,智能家居控制联动也是重要方面,360AI智能音箱可以与360摄像头、360扫地机以及Broadlink的红外遥控器和智能插座等产品,由于我家里目前没有相关支持的设备,所以暂时无法体验家居联动功能,不过360 AI智能音箱联动的品牌过少,这点有点遗憾。以后应该会增加更多的品牌产品。 除了是一款智能音箱外,360 AI智能音箱还是一款蓝牙音箱,连接电视,就可以简单搭建一个小型的家庭影院。 在目前智能音箱市场竞争激烈的情况下,360才推出了这款AI智能音箱,这也从一个侧面反映了周鸿祎对这款产品的自信,从体验来看,360AI 智能音箱确实在音质、语音识别率、资源丰富度方面要优于很多的同类产品,而且还创新性的加入了双重智能引擎、声纹识别等功能,199元的售价绝对是高性价比。不过在语音交交互、产品的移动性、智能家居关联互动等方面还有很多需要完善的地方。 原文章作者:科技微数码,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于3 天前
    最后回复 咸玉环 3 天前
    2468 1
  • AI的B面,声纹识别的应用优势和主要应用场景
    在挖掘人工智能技术应用过程中,计算机视觉作为人工智能的一大核心技术分支一直以来都备受关注,并且随着人工智能技术红利的兴起,行业内诞生了一大波计算机视觉技术研发型企业,从视觉AI算法、专用AI芯片等技术领域着手,探索视觉AI技术在各行业领域应用的落地。 在视觉AI技术及应用迅猛发展之际,机器听觉和自然语义理解作为人工智能的另外两大分支这几年来也随着政策、市场、人才等条件的日趋成熟取得了一些突破性的进展。这里,我们具体讨论一下以声纹识别为代表的机器听觉技术的发展情况。 早在2014年,公安部下属全国安防标委会人体生物特征识别应用分技术委员会便正式发出公告称《GA/T 1179-2014 安防声纹确认应用算法技术要求和测试方法》标准已通过审核,并于2014年10月1日开始实施。 这项标准可以说为国内声纹识别技术研究奠定了坚实的基础,因为它对声纹识别系统的技术指标,包括测试库建库规则、测试集、测试环境的技术指标、声纹识别系统的评测标准、测试流程、测试报告内容等都做出了详细规定,且要求所有受测企业,必须经过严格的测试,方可批准通过。 有了这项行业技术标准的加持,也让声纹识别技术在大面积商用开启之前即能在标准规范之下展开专项技术的研究和测试,从而避免了由于标准缺失可能带来的技术滥用及市场认知参差不齐的乱象。 AI的B面,声纹识别补齐身份认证听觉技术辅助 众所周知,人脸识别核心应用主要聚焦在个人身份认证方面,由此衍生出在金融支付、人脸门禁、公安稽查布控、人脸识别寻亲等诸多场景下的应用,但从技术维度上看,这些都是基于计算机视觉层面,声纹识别技术则刚好可以从听觉技术的层面补齐身份认证视听技术手段的完整性。 并且由于技术原理的差异,据澎思科技表示,相比于人脸识别和指纹识别,声纹的采集只需要麦克风模块,成本相比于摄像头或者指纹识别模块而言要低,采集的方便性和安全性则要高,在一些特殊领域,声纹识别更是具有独一无二的优势。 平安科技也曾发出观点认为,相比人脸、虹膜、指纹等生物识别方式,声音作为人类最自然的沟通方式,具有日常使用广泛、数据传输量小等天然优势,这为声纹识别算法的提升优化提供了数据基础。 声纹识别因其独特的识别方式以及在安全性/防伪、成本、便捷性等方面的应用优势,被认为可以很好的填补人脸识别身份认证之外的应用市场,尤其在公安、金融、社保、交互型机器人等领域蕴含着广泛的应用场景。 声纹识别技术主要应用场景 纵观现阶段的声纹识别技术应用,其中最典型的一个应用场景聚焦在金融领域的身份验证环节。早在2018年,《关于发布金融行业标准规范声纹识别技术金融应用的通知(文件编号:0001-2018-S-000-005057)》便已随《移动金融基于声纹识别的安全应用技术规范(标准编号:JR/T 0164-2018)》的印刷版一同下发给了全国各大银行及各类金融机构。 声纹识别之所以能成为金融领域反欺诈的核心技术,还在于它的独特技术优势:1)声纹作为一种行为特征,具有唯一性和独特性;2)声纹不易纂改,综合利用声音中蕴含的丰富信息可以具备较高的安全特性;3)由于特殊设计的声音一般不涉及用户隐私问题,往往用户接受程度较高。 据相关数据显示,在金融、信贷等强调高安全性和防伪措施的个人身份认证环节,声纹识别的准确率可达99%,可以用于辅助核实身份、声纹锁登陆等场景。声纹作为综合身份核验方式的有效补充,在金融领域的电话客服身份核验、远程面签身份核验、金融防欺诈等场景中,对用户身份核验识别发挥了重要作用。 比如在信贷申请环节,一般需要用户亲自阅读一段固定的文字存于声纹库,并且同时提取其声纹特征。在信审过程中,系统自动将该声纹与黑名单库中的声纹做对比,同时也能够跟最近的或者同区域的订单声纹做交叉对比,如果命中黑名单,则可以调低信用级别乃至直接拒绝,而通过交叉比对,还能发现重复的联系人信息,提示重大欺诈嫌疑。 声纹识别的另一大应用场景是声纹锁登陆,最为大众所熟悉的应用应该要数微信和支付宝的声纹锁登陆。声纹锁一般采用1v1的声纹比对模式,将用户注册时的声纹信息存于声纹库,每次登陆时用户只需对着手机念出屏幕上的随机数字或文字即可轻松登陆。用声纹密码代替或辅助传统的字符密码或手势密码,可以有效解决用户忘记密码的困扰,相比于字符信息,声纹密码更能降低了信息泄露的风险。 在公检法领域,声纹识别作为视觉线索的补充也逐渐受到越来越多的关注,在司法诉讼、反电信诈骗、治安防控、侦查破案、执法监督、网络安全等诸多环节发挥着重要作用。 原文章作者:a&s安防知识网,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于6 天前
    最后回复 壤驷冉冉 6 天前
    2260 0
  • 强大的骨声纹识别技术,华为FreeBuds 2 pro无线耳机图赏评测
    不知道大家有没有发现,在两年来所发布的智能手机中,已有越来越多的智能手机取消了3.5mm的耳机孔,这样的做法除了能腾出手机内部空间,为能拥有诸如电池这样的必须品让路之外,还有就是为了整机的外观更为整齐美观。随之而来的就是大家纷纷选择蓝牙耳机作为日常使用的“标准配置”,但是市场上的蓝牙耳机可以说是良莠不齐,有的价格又特别高,有的质量不敢恭维。不过今天的主角却是国产品牌中的佼佼者华为出品:华为FreeBuds 2 Pro无线耳机。这款真蓝牙耳机都有什么“与之不同”之处?下面就边看图赏边聊一聊。 轻奢质感简约大方的造型 有人说耳机的造型不都那样?其实仔细看看还是有挺大的区别的,这次的华为FreeBuds 2 Pro无线耳机是汲取了古典管乐的外观造型,和符合人体工学的半入耳设计加上耳机柄独有的曲线,让整个耳机佩戴贴合面部温润舒适。最为重要的是非常牢靠,我曾带着华为FreeBuds 2 Pro无线耳机冲刺跑、打篮球,耳机都很稳固,不用担心会在不知不觉中跌落遗失。华为FreeBuds 2 Pro无线耳机有碳晶黑、陶瓷白两款配色,有个小细节,两款配色上都有一圈细细的红线,这可以说是颜值的点睛之笔了。 现在南方可以说早已进入了夏天,那么佩戴蓝牙耳机有个非常关键的点就是“防水”了,这里的防水并不是说一定要将耳机丢入水池中清洗,而是在生活中流汗或者是遇到小雨的时候都不用担心耳机会“开小差”。这也是得益于华为FreeBuds 2 Pro无线耳机是经过了专业纳米图层的处理以及防水结构的设计,满足IP54级别的防尘抗溅水。 强大的骨声纹识别技术 骨声纹识别技术是骨纹ID+声纹ID共同作用而进行鉴权的全新生物识别技术。骨声纹传感器能够感应通过头部骨骼传导的振动并开启MIC, 可以自动的响应已注册的佩戴者语音命令,并且能够杜绝周围环境和身边其他人的语音干扰。 利用骨声纹识别技术可以做做的事就非常“科幻感”了,用户可以通过语音控制进行手机解锁、拨打电话、说出地名查找地图、设置闹钟等等操作。尤其是在需要进行支付的时候,只需说出“支付宝支付”或者“微信支付”二维码就能自动刷新打开,非常的快速便捷。在外人看来这简直是魔术,其实这就是华为FreeBuds 2 Pro无线耳机的骨声纹识别技术。 方便快捷的充电和放心的巡航 华为FreeBuds 2 Pro无线耳机内置的是25mAh电池,电池存储中是拥有420mAh电池,在华为的官方测试中,完全充满电之后耳机的通话时间可达15小时,这个时间可以说是很惊人了,在我的体验中,每天至少带着耳机听歌2小时,加上充电盒已使用一周时间,还是显示有1格电。所以对于华为FreeBuds 2 Pro无线耳机的续航可以说是大可放心的。 在充电方面华为FreeBuds 2 Pro无线耳机的充电盒采用的是Type-C接口,充电只需一小时就可以充满,这个速度是非常快了。重点华为FreeBuds 2 Pro无线耳机是支持无线充电的,只需将华为FreeBuds 2 Pro无线耳机的充电盒放置在无线充电板上就可以进行充电。当然如果你用的是华为Mate 20 Pro或者华为P30 Pro这样拥有反向无线充电技术的智能手机,那么将华为FreeBuds 2 Pro无线耳机的充电盒放置在手机的背部也也可以进行充电,是不是非常的酷? 总结 如果你想找一款音质不错、外形简洁、质量无忧而且还拥有强大的骨声纹识别功能的真蓝牙耳机,那么推荐试试这款华为FreeBuds 2 Pro无线耳机,相信你会喜欢上的。 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于7 天前
    最后回复 朦邵 7 天前
    2988 0
  • 2019年终盘点丨公共安全篇:以声纹识别技术引领实战效能变革
    2019年,声纹识别技术的研究突破和规模落地,为警务建设开启了新“声”代。 快商通扎根电信网络反诈领域,瞄准公安部门刑侦技侦、维稳反恐、治安管理等实战需求,形成了包含声纹采集软硬件设备、大规模融合声纹数据库平台、金融电话声纹反诈风控平台等产品在内的一整套应用生态。 从产品列装、标准建设,到校企研讨、警企合作,快商通深耕行业,致力于引领公安实战效能变革,为智慧警务建设加码赋能。 标准声纹采集器 产品价值: 公安部认证的首批标准声纹采集设备,配套智能化声纹采集系统,功能集采集、入库存储于一体,采用智能化麦克风集群,一次录入即可采集到符合公安机关声纹建库要求的高质量声纹数据。 产品优势: 1、高保真录音 2、支持多种采集模式 3、智能有效语音检测 4、配套快商通声纹采集系统 应用场景: 标准声纹采集、派出所、 拘留所、监狱 移动声纹数据采集终端 产品价值: 可广泛用于“一标三实”信息采集中基层语音数据的采集。是全球首款移动式声纹采集设备,支持近场采集、人声分离、声纹撞库、实时预警等功能,极大地提升了采集场景的便捷性,进而丰富侦控手段、提高管控效能。 产品优势: 1、体积小,易携带,方便基层公安进行声纹信息采集 2、隐蔽性高,便于公安办案人员在特定场景下,对重点人员进行声纹采集工作 3、具有智能识别和分析功能,可在嘈杂环境下清晰录制 4、高度集成,内嵌专业的前端降噪算法,可为录制高质量语音数据提供基础性保障 应用场景: 治安防控、人口普查、侦查破案 大规模融合声纹数据库平台 产品价值: 实现了千万级声纹数据库的实时、高精度比对,采用微服务架构,兼具多算法融合及多来源数据融合的特点,目前已在众多公安机关中完成部署。 产品优势: 1、通过公安部质量检测 2、支持亿级规模声纹库的快速检索引擎 3、智能语音数据质量检测 4、支持多数据来源、跨信道声纹识别 应用场景: 辖区声纹数据质量管理、重点人员声纹库建设、身份查询与核验、反电信诈骗 金融电话声纹反诈风控平台 产品价值: 利用高效的声纹比对算法,在金融信贷业务中实时识别贷款黑名单用户,为金融公司和服务机构提供精准高效的身份认证和反欺诈服务。目前已经服务于阳光保险集团、太平洋保险集团、中国银联、交通银行总行、华瑞银行等金融单位。 产品优势: 1、强鲁棒性,支持电话信道、网络信道等多信道跨越识别 2、有效防录音、合成语音欺诈 3、1:N top1命中率超90%,有效防坏账 应用场景: 支付核验、信贷审核、反洗钱、手机银行登录、证券交易/开户、在线保险理赔 2019年,快商通公共安全事业群厚积薄发,斩获公安部、工信部和网信办三部委联合举办的“首届中国人工智能·多媒体信息识别技术竞赛”音频识别技术组最高奖(声纹识别和变种同源音频检索);2019年3月,公司率先通过公安部安全与警用电子产品质量检测中心发布的《GA/T1179-2014安防声纹确认应用算法技术要求和测试方法》;声纹采集设备、声纹数据库系统进入首批公安部刑事技术声纹装备目录。 作为国内最早一批将声纹识别投入公安实战应用的企业,快商通落地成果显著,在福建公安、河南公安、山东公安、山西公安、湖南公安、江西公安、江苏公安、内蒙古公安等地成功部署产品和服务方案,获得各级公安领导的大力称赞。 此外,快商通还与中国人民公安大学、公安部第一研究所、西南政法大学、山西警察学院、浙江警察学院开展了一系列产学研合作与交流,加快破除公安实战难题,提高智能化转型效率。 肩负社会责任,坚守初心使命。未来,快商通将在电信网络反诈领域持续聚焦,用声纹识别等技术,驱动智慧警务底层技术创新,引领公安实战效能变革。 原文章作者:快商通AI,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-14
    最后回复 帕昆 2020-1-14 17:54
    1188 0
  • 声纹识别:非接触式,更保护您的隐私
    近年来,隐私保护愈发受到人们的关注,智能手机的普及,人们日常生活许多隐私都会储存进手机当中,一定的保护是免不了的。从一开始的手势密码和数字密码,逐渐发展到现在的指纹识别和面部识别,而近日有新消息称声纹识别可能即将开始普及。 据报道,继去年广州等地推出“微信身份证”后,我国首个基于声纹识别技术的互联网身份认证云项目落户贵州,致力于为百姓提供网络身份认证服务。 据笔者了解,其目前的认证方法大概如下:基于共享密钥的身份认证、基于生物特征的身份验证和基于公开密钥加密算法的身份验证。而其中声纹识别是根据语音中所蕴含的说话的个性特征去识别该段语音说话对象的身份的过程。 声纹识别最大的特点就是与其他生物特征识别相比,声纹识别不会存在遗忘和忘记,且不需要记忆和使用方便等等。简单来说,声纹识别就是将声信号转换成电信号,再通过计算机进行识别的技术,可以用于多方面领域的公共认证服务。 原文章作者:芝士科技,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-14
    最后回复 剑爰 2020-1-14 12:28
    1714 0
  • 声纹识别准确率99.5%,快商通用声纹识别+自然语言处理技术深度服务B端36万客户
    今年,是80后连续创业者肖龙源在创投圈打拼的第14个年头。回首过去,恍然如梦。 2002年,还在集美大学就读的肖龙源就凭借着其敏锐的商业嗅觉,靠组装二手电脑赚取差价;毕业后,他来到某上市公司做销售,任商务经理3个月后,迅速晋升商务总监;2005年底,肖龙源开始自己创业,起步于为百度、google以及民营医疗机构供应流量;2012年底,他围绕人工智能创立了智能客服、AI自适应教育科技公司、AI舌诊体检公司以及智能导诊机器人等。 创业早期,肖龙源尝试的包括舌诊、体检等众多AI产品大都失利,只留下了智能客服和声纹、语音、自然语言处理、大数据等算法引擎。创业屡战屡败,却并没有消减肖龙源对AI的热情,多年积累的创业经验促使肖龙源不断反思自己,创业方向亦愈加清晰开阔。2009年,肖龙源创办了“快商通”,并于2012年正式进军人工智能行业。 现阶段,快商通已形成基于自然语言处理和声纹、语音识别等技术的双脑业务——感知智能“智能生物识别大脑”和认知智能“艾赋能大脑”。快商通以定制化解决方案为主要服务形式,产品包括智能客服系统、仿真客服机器人、声纹采集设备、大规模融合声纹数据库平台、变种同源音频检索系统及金融电话声纹反诈风控系统等,服务于金融、安防、能源、交通、医美、公安司法、大型商超、企业客服等垂直领域。 肖龙源介绍,智能客服领域是TO B行业的刚需。市场研究表明,2020年将有80%的企业部署AI客服业务,这些AI客服将会替代大部分业务员的工作,实现拟人交互。同时,传统人工坐席痛点明显,人员流动性大、培训成本高、服务水平良莠不齐等,早已不能满足日益提升的客户需求。智能客服不但可以补齐人力缺口,降本提效;更可以扩大服务边界,重构劳动力市场,商业价值可观。 当前,快商通智能营销客服业务已形成标准化解决方案,能直接代替或辅助人工回答客户问题。服务过程中可以通过深度学习技术,自主学习营销客服话术并更新知识库,直接为企业带来降本提效。 快商通艾赋能大脑执行董事刘晓葳透露,市场上大部分智能客服偏向于售后型(如咨询售后问题),业务导向非常清晰(如订票、查询卡余额等场景);而快商通区别于竞品,主要做的是营销型机器人。用自然语言处理技术仿真对话,能更好地理解用户输入语言的不同意图;必要时还会发起追问、暖场、多轮对话等,以达到售前业务目标,如留下有效联系方式、完成预约和产品介绍推荐等。目前,快商通智能营销客服的任务达成率已超过人工5%以上。想要做到以上水平并不简单,需要团队结合语义表达多样性、错别字、语音推理等方面反复训练。 声纹、语音识别是快商通针对金融、电信和公检场景推出的解决方案,主要通过指纹、人脸、虹膜、声纹等特征进行识别,调用快商通十亿级别的声纹数据库分析判断,实时有效动态布控、预警,消除潜在电信网络的诈骗风险。 从行业的角度来看,国外竞争对手英国的ValidSoft、俄罗斯的STC、美国的NUANCE等,在中国的市场份额不大。快商通智能生物识别大脑执行董事李稀敏告诉创业邦,声纹技术在基本原理上没有绝对的门槛,其技术难点主要在于落地程度。比如,应用到实际场景时,如何在强噪音等复杂环境下满足用户的多样性需求。为了建立自身竞争壁垒,快商通已基于多年经验积累,打造出适用于场景复杂性的一整套工具链,使每一条数据过程趋于自动化。目前,快商通声纹识别电信反欺诈相关产品及解决方案已完全应用在国家公检法与金融机构之中。 截至目前,快商通总客户量已超过36万,其中包括联想集团、中国移动、中国银联、平安集团、阳光保险、南方航空、致同快所等知名企业,在全国医美企业覆盖率超过80%。团队已在北京、上海、深圳、新加坡、美国硅谷、莫斯科等地设有人工智能研发中心、研究基地和子公司;并与俄罗斯科学院西伯利亚分院、公安部第一研究所、中国标准化研究院、中国保健协会等长期合作,参与数十个国标和行标的制定,共建立多个标准化研究基地。 营收模式方面,快商通智能客服业务主要依据项目难易程度或客服坐席量进行收费,声纹识别业务按照解决方案包年收费。2019年全年,公司共签下合同额2亿多,营收超1.5亿。 “从人才垄断到技术垄断,建立用户粘性闭环”是快商通的商业逻辑。团队已有300多人规模,其中技术员工共200多人,硕博人数占全员的60%。团队核心技术成员大部分是来自Facebook、百度、京东、OPPO、华为、阿里等头部企业的技术骨干,首席科学家是国际语音通信学会(ISCA)首位华人主席,前苹果语音实验室的主任、前百度独立董事李海洲院士(IEEE Fellow)。 融资方面,快商通已于2018年初获得美图董事长蔡文胜旗下隆领投资领投的亿元融资。目前,新一轮战略融资即将到位,资金将主要用于强化技术算法、搭建销售团队、加速技术在金融公检法方面的落地。 本文相关的文章列表页头图图片来源于摄图网,经授权使用。本文为创业邦原创,未经授权不得转载,否则创业邦将保留向其追究法律责任的权利。如需转载或有任何疑问,请联系editor@cyzone.cn。 原文章作者:创业邦,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-13
    最后回复 噙周损 2020-1-13 00:53
    1752 0
  • 声纹识别技术在公共安全领域的应用
    查指纹、查人脸、查DNA,这些都已成为了公安机关打击违法犯罪分子的重要技术手段,然而还有另外一种技术手段,在上述无法做到的情况下,依然可以让犯罪活动无所遁形!本文就声纹识别技术在公共安全领域的应用作简单介绍。 一、公安行业现状与背景 随着社会与科技的发展,特别是通讯工具、互联网及社交软件的普及,近些年相关语音案件及涉及声纹鉴定的案件日益增多,公安现有的声纹识别装备技术以及人力工作量已饱和,难以应对新形势下快速增长的公众期待以及声纹实时侦查与鉴定和布控需求,无法实现传统声纹应用的革新。 另一方面,声纹识别作为最前沿的一项技术,正在快速发展,综合了多项学术界的最新成果,特别是算法层面已经解决了以往识别准确率低、处理效率差、对语音检材要求过高等主要问题,且可实现高度的自动化,能够极大的节省人力。 此外,在反电信诈骗方面,受害民众对于案件侦破有很高的期待,声纹识别技术在此能发挥出无可替代的作用。中央政法委书记孟建柱在过去一年曾多次指出,电信网络诈骗等犯罪已经成为严重侵害人民群众切身利益的社会公害,要坚持综合治理、源头治理,坚决遏制电信网络诈骗犯罪高发势头,切实维护人民群众财产安全和合法权益。 二、声纹识别技术优势 在公共安全领域,为更好进行声纹识别的应用落地,对算法提出了更高的要求。声纹识别技术使用学术界最前沿的特征提取技术,结合多种声纹识别的前端语音信号处理算法,在不断更新迭代中形成了的技术优势。 先进的声音处理技术 领先业界的前后端语音处理技术,包括人声检测VAD算法、语音降噪、快速语音增强算法、语音质量评估算法,有效保证注册和验证的效果。 先进的特征提取算法 使用学术界最先进的深度神经网络,以及端到端神经网络的训练方法,从大量样本中学习到高度抽象的音素特征,在相同的声纹数据中能提取更多的特征信息,并对噪声有很强的免疫力,大大提升算法准确率。 高准确率 在公安领域中,声纹识别一般使用长自由文本算法模型,在长自由文本模型下,EER小于0.64%,准确率达98.1%以上。在1:N比对中,TOP1命中率超过96.1%,在此种准确率前提下,可为公安应用提供最好的落地保障。 高鲁棒性 公安领域中真实案件中,检材都是五花八门,录音文件都可能使用各种不同的设备录制的,那么就需要考验声纹识别算法在不同噪声环境下的适应性、各种文本类型适应性、跨信道适应性上的表现,当具备了上述的优秀表现后,才保证了在不同应用场景下算法性能的稳定。下图为在不同噪音下可以通过动态分数偏移的算法,保持了高鲁棒性。 三、公安领域应用方案 声纹识别技术能够为公安行业带来以往战法的突破,助力科技强警,为案件侦破过程提供新的线索和证据,对于提高办案效率,优化办案方式,提高办案质量,提升案件侦破能力都将起到积极的推动作用,在维护国家安全、打击犯罪工作中具有非常重要的意义。 通过独特的算法,可在多人对话场景中进行精准的声纹识别,分离出单个说话人音频,并识别出每个人的说话内容。适用于公安动态布控、大型会议记录等应用场景。 此外,相对于指纹、虹膜、人脸等识别技术,声纹在远程采集与识别上具备先天的优势,且仅需普通麦克风或其它易于集成麦克风的设备(如监控摄像头、便携式执法记录仪等),采集自然、便利,在不被采集对象发觉的情况下即可完成采集与识别。声纹技术大幅提高了远程采集的成功率及识别的准确性,从技术上具备了远程采集与识别的可行性。 声纹采集系统 声纹库为声纹识别应用的基础,声纹采集系统主要部署在公安各基层信息采集室中,用于对重点人员的声纹信息进行采集,形成继指纹、DNA库后又一个生物特征库,声纹数据库,为案件侦破提供一种新的技术手段,为各警种提供一套新的个体识别应用平台。 声纹比对系统 声纹比对系统提供1:N大库检索比对,支持千万库容建设。在使用的实际数据测试的实验中,用159449句语音,与12782个说话人进行约10亿次比较,154027条语音对应的实际说话人直接命中top1,也就是说top1的直接命中率为96.6%。根据该性能表现,在较好的测试数据集下(声音噪音、信道、有效语音时长、采样率比较理想的情况下),一万人的平均返回比中排名约为1.5位,十万人返回排名约为9.7位。 声纹鉴定工作站 除了具备传统声纹工作站的一般功能以外,声纹工作站独有的音素检索技术可协助鉴定人员,从音频数据中检索出特定的音素。 使用传统的声纹工作站,声纹鉴定人员需要反复听检材以确定其中是否出现特定的音素。声纹鉴定工作站可以极速自动搜索、定位检材中是否包含特定音素,将工作效率提高20倍以上,为声纹的实时识别和快速鉴定提供了极为可靠的技术基础。 声纹实战平台 作为一项非常前沿的技术,声纹数据库及识别系统与已有的指纹库、DNA库、人像库类似,助力科技强警,但又更适应新形势下公安实战及维护人民安全和社会稳定的需求。 作为一项基础性和创新性工作,以声纹识别系统为核心,公安机关可建成两大应用平台后可直接为刑侦、治安、反恐、治安管理等多警种服务,成为打击犯罪的一项新的高科技手段和增长点,也能够为处理重大突发事件、侦破重大、疑难案件提供重要且无法取代的技术手段。在新形势下,基于声纹信息的目标人监控已经成为技侦领域的重要技术手段之一,声纹库的建设将为各个语音侦控系统提供高质量的声纹信息源,并实现自动监控,其应用前景非常广泛。 声纹侦查作战平台:以破案、追逃为导向,利用声纹识别技术进行“案查人”、“人查案”、“案查案”与“人查人”等多种排查方式。 【案查人】如电信诈骗,主要线索只有语音的情况下,将该语音进行声纹库大库检索,快速锁定嫌疑人。【人查案】公安抓捕到可疑人员后,提取出该人的声纹特征,将其放入尚未侦破的语音案件中,排查该人是否为在逃人员。【案查案】公安人员可使用声纹识别技术将尚未侦破的语音案件以及语音线索归纳整理,从中排查是否有多起案件是同一人所为,帮助侦察人员获得更多线索,提高排查效率。【人查人】公安机关在抓捕到可疑人员后,提取出该人的声纹特征,为避免该人使用伪造身份,可将其声纹特征放入已知人员的声纹库,查询其真实身份 动态声纹布控平台 动态声纹布控平台:以布控、预警为导向,通过声纹生物特征与语音内容多维识别,在包含电信和互联网范围内实行有效动态布控、预警,消除潜在风险。 动态声纹全网布控是基于声纹识别技术,结合与技术侦查、自动监听等技术,将各种通信及语音中的声纹特征及语音内容进行实时、远程、非接触式的主动识别,实现对涉暴、涉恐、涉毒、涉稳等重点防范人员的布控预警,提示安保及公安人员采取控制措施,并持续跟踪监控,可广泛应用于重点区域、重点时段、重点频段、重点社交媒体等语音通信场景,特别适用于对安保要求极为严格的大型峰会或有领导人出席的重要会议区域。 动态声纹全网布控平台能够实时搜索和识别目标人物,既可报警黑名单上的嫌疑人以提高公共安全,还能记录音频流中出现的所有声纹进行归档,建立声纹人员的档案库,实现重点人员的语音分析和行为预测。 四、声纹识别大平台建设内容 声纹识别大平台的核心是声纹识别系统,其建设主要分为声纹数据库、声纹识别引擎、声纹鉴定工作站三大部分,由此构成采集、自动建模、自动检索、鉴定、自动预警等一整套智能化业务系统。 声纹库数据为整个声纹大系统的基础,为构建更加完善的声纹基础数据库,建设采集来源应包括: 标采:通过专业标准的声纹采集设备按照标准采集流程进行声纹采集,并与现在数据形成人、像、声等多维度关联,适用于各派出所采集点;电信:采用技侦手段从电信运营商处获取电话信道中的语音信息;网络语音:通过专业手段从网络或嫌疑人手机中获取语音数据,如:从嫌疑人手机中读取微信语音数据;其它:录音笔等其它方式录制下来的语音数据; 声纹检索引擎是声纹识别系统的核心,是声纹库建设及价值发挥的关键技术手段,目前,业内领先的声纹检索引擎最高可支持上千万库容,适应多种格式的语音检材数据,实时返回检索结果。 声纹鉴别工作站为声纹业务人员的日常操作与实战应用系统,主要部署在省厅及各个市局,提供声纹信息管理、下载、查询、复核及声纹鉴定报告等具体任务。 声纹数据库、声纹识别引擎、声纹鉴定工作站为声纹识别系统中不可或缺的三大部分,为动态声纹全网布控平台提供有力保证。 五、总结 声纹识别大平台建设是公安机关的信息化工作的重要一环,其需求急迫、专业技术性强、应用广泛,能够有效助力公安机关遏制与打击犯罪、提高风险预警与动态布控能力,突破传统布控模式,实现公安机关的高技术手段和战法的创新,构建和强化安全的社会环境。 原文章作者:人人都是产品经理,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-11
    最后回复 躬甍 2020-1-11 22:09
    1019 0
  • 干货:NIST评测(SRE19)获胜团队声纹识别技术分析|CSDN博文精选
    作者 | xjdier 来源 | CSDN博文精选 (*点击阅读原文,查看作者更多精彩文章) 关键技术一:FTDNN & EFTDNN 在这次评测中,团队基于目前State-of-the-art的框架X-vector, 在主流的TDNN上做了两个改进,分别是FTDNN和EFTDNN。FTDNN的灵感来源于SVD。SVD本身是降低模型参数的常用做法,将训练好的参数进行SVD分解成两个小参数,再进行fine-tune.但如果没有训练好的参数,直接使用SVD的结构随机初始化训练,网络训练就很不稳定。 为了解决训练不稳定的问题,FTDNN将每一层TDNN拆成两个低秩矩阵的乘积,通过半正交化第一个低秩矩阵,保证信息从高维到低维没有流失。半正交之后特征值的分布会比较均匀,这样的参数矩阵相当于一个映射矩阵,总能够从上一层学到更重要的信息。使得网络熟练的更稳定。对于矩阵M,半正交化就意味着M乘M的转置是恒等矩阵,也就是M乘M的转置减恒等矩阵趋近于0,可以通过梯度下降的方式迭代实现M的半正交化。 关键技术一:FTDNN & EFTDNN 在这次评测中,团队基于目前State-of-the-art的框架X-vector, 在主流的TDNN上做了两个改进,分别是FTDNN和EFTDNN。FTDNN的灵感来源于SVD。SVD本身是降低模型参数的常用做法,将训练好的参数进行SVD分解成两个小参数,再进行fine-tune.但如果没有训练好的参数,直接使用SVD的结构随机初始化训练,网络训练就很不稳定。 为了解决训练不稳定的问题,FTDNN将每一层TDNN拆成两个低秩矩阵的乘积,通过半正交化第一个低秩矩阵,保证信息从高维到低维没有流失。半正交之后特征值的分布会比较均匀,这样的参数矩阵相当于一个映射矩阵,总能够从上一层学到更重要的信息。使得网络熟练的更稳定。对于矩阵M,半正交化就意味着M乘M的转置是恒等矩阵,也就是M乘M的转置减恒等矩阵趋近于0,可以通过梯度下降的方式迭代实现M的半正交化。 关键技术二:多任务学习机制融合语音文本上下文信息 关键技术三:融合语音适应与多任务学习机制 关键技术四:启发式后端对X-vector进行信道补偿和分类 在X-vector特征中,即包括了声纹信息又包括了信道信息,因为团队将重点放在了声纹信息上,所以在X-Vector中存在信道信息的干扰,这会降低系统的性能表现。于是,团队还需要通过信道补偿算法来减少这种影响。除了数据级和模型级的改进,针对域不匹配的问题,后端团队采用启发式算法,遍历不同的后端策略,线性鉴别分析(Linear Discriminant Analysis,LDA)和概率线性判别分析(Probabilistic Linear Discriminant Analysis,PLDA),LP-LDA,以及MotPLDA,尽量减少训练、测试数据不匹配带来的影响。 技术的道路一个人走着极为艰难? 一身的本领得不施展? 优质的文章得不到曝光? 别担心, 即刻起,CSDN 将为你带来创新创造创变展现的大舞台, 扫描下方二维码,欢迎加入 CSDN 「原力计划」! ◆ ◆ 原文章作者:AI科技大本营,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-10
    最后回复 峰帷 2020-1-10 18:57
    3406 0
  • 5G加速声纹识别应用落地,声扬科技加速拓宽新赛道
    集微网消息,近年来,生物识别市场发展非常迅猛。据市场研究公司MarketsandMarkets的最新预测数据显示,全球生物识别市场将由2018年的168亿美元快速增长至2023年的418亿美元,年复合增长率将达到19.99%。 在生物识别庞大的市场空间下,逐渐催生出诸如指纹、人脸、虹膜、声纹、静脉识别等生物识别技术的落地应用,而这些不同的生物识别技术正在加速融合。其中,声纹识别将作为生物识别领域新兴技术,以高安全性、支持远程识别等独特优势,开始在行业应用中崭露头角。 “生物识别的多种技术融合是未来的趋势,我们在印度尼西亚做的养老金的项目,用了指纹、人脸、声纹技术,退休人员通过任意两种生物识别就可以完成验证识别的过程,项目上线一年多以来,声纹是退休人员选择最多的,让我们看到这项技术的巨大潜力。”在芯智讯主办的“融合·创新——2019生物识别技术与应用高峰论坛中,声扬科技首席科学家张伟彬表示,声纹识别将会成为生物识别技术的新风口,现在的声纹识别有点像2013年左右的人脸识别,处于市场前期,随着5G的到来,其他生物识别技术的落地会有越来越多的场景需要声纹识别这项技术。 生物识别新风口 在某种程度上,诸如指纹、人脸、声纹、虹膜等不同的生物识别技术都存在自身的局限性,比如很多老人的指纹已经磨损难以识别、打电话的过程中难以采集人脸和指纹等;但不同的生物识别是可以互补的,如果能融合多种生物识别技术,整个识别系统的效果会好很多。 而继指纹和人脸识别之后,在当前众多声纹识别技术中,张伟彬博士认为,随着技术的攻克、行业标准的落地和应用的展开,声纹识别正被视为生物识别技术的新风口。 张伟彬博士认为,这主要得益于国家相关政策与标准的颁布、市场需求爆发和AI发展驱动使得技术日趋成熟。2018年10月,中国人民银行颁布了《移动金融基于声纹识别的安全应用技术规范》,这是国内金融行业的首个生物识别行业标准。张伟彬博士认为,该规范的颁布证实声纹识别技术已成熟且达到大规模商业应用的门槛,可以满足金融等场景对高安全语音技术的应用需求。 与此同时,近几年国内以电信网络诈骗为代表的非接触式犯罪增长迅猛,而声纹识别技术可通过声音来识别身份,对此类犯罪案件的侦破提供重要帮助;再加之,近几年深度学习的发展,令早已有之的声纹识别技术在准确性、稳定性等方面获得了可适应大规模应用的突破。 不过,声纹识别和其他生物识别一样,面临最大的挑战是环境因素的影响,声音在传播过程中会有噪声,在噪声情况下如何准确识别人的声纹是非常大的挑战之一,而声扬科技这三年已经通过多个落地项目的打磨,实现了在复杂噪音环境下的高精度识别。张伟彬博士同时表示,不同的采集设备或者声学传感器采集进来的声音是有差别的,如手机麦克风采集和高保真麦克风采集的声音差别很大,如何在不同的采集设备及信道直接做比对也是非常大的挑战,而声扬科技在技术上已经解决了这些问题,且带来更多应用场景的落地。 据了解,全球第一个大规模应用声纹识别技术的国家级社保项目(印尼)中的声纹远程身份验证,采用的就是声扬科技的技术,去年5月份已经上线第一期,覆盖250万人群,实际落地项目中测得准确率高达99.7%,这套系统中就采用了指纹、人脸、声纹技术,退休人员通过两种生物识别就可以完成验证识别的过程。 张伟彬表示,声扬科技除了在原创的声纹识别技术上处于国际领先水平之外,在语音识别、语音信号处理等智能语音技术也有多年的积累,通过多种技术的组合可以打造符合行业、市场、客户需求的智能语音综合解决方案,这是公司的竞争优势之一。目前,在金融领域,声扬科技的声纹识别技术在多家银行POC测试当中排名第一;声扬科技的声纹识别技术也在为中国公安部服务,目前已在全国十多个省市的公安机关中应用。 拓宽新赛道 随着5G等新技术的发展,智能硬件不断升级,包括声纹识别在内的智能语音技术将在5G时代中占据非常重要的地位,并且进一步普及于5G商业应用,声纹识别在更多细分市场会迎来一个新的爆发。 不过,目前以声扬科技为代表的声纹识别厂商应用开展以金融、公共安全为主。张伟彬博士表示,从客户需求来讲,这两个行业的客户需求是非常强烈的,可以说是他们非常痛的痛点。 其他相对消费类电子、机器人或者一个玩具需要识别主人的身份,这时候是辅助功能,声纹识别需求则没那么强烈。“从需求角度来讲,声扬科技先从需求上满足一些有非常强需求的客户的要求;另一个角度是从技术来讲,金融对安全的要求等级是非常高的,对技术的挑战是最大的。我们希望先难后易,先从技术上解决金融等最难的问题再做其他行业的拓展。” 张伟彬说到。 在金融、公共安全领域应用展开后,声扬科技也在开拓新赛道。比如IoT、移动终端等,现在手机语音交互有唤醒功能,如果加上声纹识别可以大大地降低误发,可以提高安全性;不过,对手机功耗等方面有非常苛刻的要求,同时需要结合语音识别技术、降噪处理等,具体落地尚在探索中。 目前,结合自身的技术优势,声扬科技也针对行业推出了“声网声纹大数据作战网络”、“FinVoice金融行业智能语音认证系统”、“V + IoT 互联网及智能硬件解决方案”、“ConVoice智能语音会议系统”和“TeleVoice智能电话远程身份认证系统”等行业解决方案。在2018年10月NIST举办的SRE 2018(全球最权威声纹识别大赛),声扬科技是唯一一家跻身前十的独立企业队伍。 张伟彬博士表示,希望通过未来两三年的发展,我们能扩展到更多的行业,用智能语音技术为其他的行业赋能,如教育、医疗、消费电子等。据悉,声扬科技为印度尼西亚做的养老金的项目明年将上线第二期项目,预计会为超过500万用户提供安全便捷的社保服务,在公共安全领域的应用范围也会进一步扩大。基于这些国内外大型项目实施中积累的丰富经验,声扬科技未来将持续应用创新技术为更多的行业赋能,加速带动声纹识别市场的应用爆发。(校对/Lee) *此内容为集微网原创,著作权归集微网所有。未经集微网书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。 原文章作者:手机中国联盟,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-10
    最后回复 脉肄 2020-1-10 18:29
    3174 0
  • 苹果发布的声纹识别技术,是种怎样的黑科技?
    在今年苹果的发布会上 官方宣布:HomePod加入了声纹识别功能 可以通过声纹识别特定的用户 据说,Siri也将加入声纹识别 当你说出“Hi Siri”时 Siri可以马上知道是不是主人在喊它 是不是更人性化的交互体验? 今天我们就来聊一聊 声纹识别到底是种怎样的黑科技? 什么是声纹识别技术? 简单来说,就是通过声音来识别说话的人 因为每个人的声纹图谱都是独一无二的 就像每个人的指纹一样 所以是可以用于密码认证的生物特征识别技术 声纹识别技术目前应用如何? 虽然目前声纹识别还没在消费产品中普及 但其实在银行交易和国防安全等领域 已经应用的非常广泛 它能从数百万个声纹中 快速且准确地识别出一个人的声音 而且已经证明比一般的密码要安全 声纹识别的优势是什么? 声纹特征不仅安全,而且更加方便 语音的采集和识别的成本也比面部识别要低 其实更加适合用于密码认证 因此,Gartner等调查机构预测 声纹识别将成为未来身份认证的主流 全球首款声纹识别空调面世 前不久,全球首款声纹识别空调 长虹CHiQ AI人工智能空调Q5D 在德国IFA荣膺中国家电产品创新奖 成为柜式空调唯一获创新奖的产品 不仅知道是谁在用 为你提供专属的温度湿度、风量与风速 而且知道你在哪里 实现风随人动或者风逆人动 让空调不再只吹机械风 空调变得更“听话” 技术更硬核、体验更舒适、外观更新颖 CHiQ Q5D声纹识别空调即将上市 敬请期待! 原文章作者:长虹健康空调,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-10
    最后回复 讼鸽 2020-1-10 18:21
    1497 0
  • 千亿市场蓄势待发声纹识别未来可期
    在以前社会中,身份证作为人们安全出入地唯一凭证,因为一个身份证ID只对应一个人。但随着科技的发展,社会越来越智能化,在虚拟网络上的出入凭证不在是身份证,而是人们身上具备的唯一地生物属性。 只要是人们身上独一无二的特性就有可能用来做成虚拟网络上的一把“钥匙”,就像“只闻其声,便知其人”、“天下没有两片相同的树叶”.....都是在表达这种唯一性。如今也利用指纹、面部、虹膜、静脉和声纹等多种特性的唯一性研发出了多种生物识别技术比如:指纹识别、人脸识别、虹膜识别、静脉识别以及声纹识别等。 在这些生物识别技术中,因为智能手机的普及且现在大部分的智能手机都有指纹识别的功能,以及很多的公司都采取指纹识别打卡的方式统计出勤率,所以指纹识别是最为广泛被认知的。但有一种识别技术虽没有指纹识别这么火爆高调,但它却在科技领域低调地散发着独特的魅力,那就是“声纹识别”。正如我国人工智能界学术泰斗、中国科学院院士张钹教授谈到:现在的图像识别存在局限性,只需要加一点点的干扰,机器就会将一个“炮兵阵地”错误识别为“一群羊”,甚至是任何其他东西,很“脆弱”“很不安全”,从目前来看,各种生物特征里相对比较安全的就是声纹。 但这里一定要将“声纹识别”和“语音识别”做一个区分,目前智能手机应用中的是语音识别,还未有一款手机里嵌入了真正成熟的声纹识别技术。这两者一个最简单的区分就是:声纹识别的功能是识别“谁在说”而语音识别的功能是识别“说了什么”。 壹看千亿级应用场景 目前对于声纹识别的应用并非很普及,主要还是应用在公共安全、金融、社保以及智能安防等领域。 1、国家公共安全 声纹作为一种重要且不易仿造的生物特征,声纹辨认技术首先在针对特定人群的国防安全、公安技侦、司法矫正等领域投入使用,有力保障了国家和公共安全。 例如在战场环境下,声纹辨别技术可察觉电话交谈过程中是否有关键说话人出现,一旦通过电话发出军事指令时。便可对发出命令者进行身份辨认。据报道,2001年4月I日迫降在我国海南机场的美军EP-3侦察机就载有类以的声纹识别侦听模块。在反恐作战中,恐怖分子在作案前后的通讯中往往会包含关键内容,因此,在通信系统或安全监测系统中预先安装声纹排认系统,可通过通讯跟踪和声纹辨别技术对罪犯进行预防和侦查追捕。 尤其在这几年形式花样百出的电信诈骗。犯罪嫌疑人通过非法渠道获取受害者详细的个人信息之后通过电话对受害者进行勒索、恐吓、绑架的犯罪案件层出不穷。如轰动全国的“8·19徐玉玉电信诈骗案”,对于这类的刑事犯罪案件,公安司法人员可利用升温辨别技术,从通话语音中锁定嫌疑人、缩小刑侦范围。可在车站、机场、码头等公共安检点装入声纹识别系统,有效对危险人物进行鉴别和提示,降低肉眼识别所带来的错误,提高人们生命财产安全。 2、金融领域 现如今网上虚拟货币支付已经成为人们交易的主流方式,所以网络支付的身份认证也越来越重要。指纹识别和人脸识别被暴露各种漏洞的同时,声纹识别也被寄予了更多的期待。为了防止盗刷等案件发生,声纹识别被加入到交易支付中,通过动态密码方式进行客户端身份认证,有效提高个人资金交易安全。 2016到2018年间,中国建设银行、贵阳银行、兰州银行、西安银行、中国银联、中国互金协会等多家单位上线了声纹识别身份认证服务,用于账户登录、大额转账、无卡取款、密码找回等业务场景。微信和支付宝也已上线基于声纹动态口令的登录方式。此外,在信贷业务中引入声纹识别技术作为反欺诈手段,还可有效降低冒用他人身份进行骗贷以及多头贷款等事件的发生率。 3、社会保险 社保对于很多老人来说是他们生活的保障,领社保必须老人亲自去社保机构进行身份核实,这对于老人而言是一件辛苦且不方便的事情。但是进行身核实又是非常重要的,怎么样才能够不需要本人去现场且还能保证社保金不被冒领呢?声纹识别技术就有效解决了这样的问题,同时也为社保机构免去诸多人力、物力、行政以及时间的成本。 在全国多省及自治区进行了声纹生存认证试点工作,旨在为多地群众百姓提供便利。 4、智能安防及个性化语音交互 利用声纹确认技术,可完成个人日常生活中的各种事物访问控制的授权,比如智能手机锁屏、各类网络账号的声控密码锁、电脑声控锁、声控安全门、汽车声控锁等;利用声纹辨认技术,可支持智能音箱、智能语音助手等,针对不同年龄段的用户提供个性化服务以及开放特定的功能权限等;通过语音识别和声纹识别技术的结合,完成多人会议记录。 5、新型应用场景 据前瞻产业研究院的分析,当下全球生物识别产业规模庞大,仅请音生物识别(注:即声纹识别)这一细分方向的市场规模就将近百亿美元,预计2020年更是有望超过200亿美元(合1346亿元人民币),占整个生物识别市场的2.4%。 从网络身份认证应用领域来看,据国外调研机构MarketsandMarkets数据显示,2019年网络安全市场预计增长至1557.4亿美元,其中,身份认证信息安全市场规模将超过300亿美元。声纹识别市场成为了一个正在爆发的蓝海市场。 智能电子设备必定是声纹识别应用的一个突破口。在目前的电子设备上还没有具有代表性以及跨时代的声纹识别产品出现,像指纹识别或人脸识别应用市场的第一块蛋糕已经无望,成为第一个吃“声纹识别”这块蛋糕还是有可能的。 随着5G的商用进一步的推进了物联网的构建,万物互联作为发展目标,非接触式识别技术声纹识别必定会有非常大的应用场景。就比如在智能家居领域:声纹识别将改变未来的智能家居领域的操作习惯。智能家居应用落地存在各种操作控制上的麻烦问题,而声纹识别是有效解决方式之一。解放用户的双手,双脚,无需走来走去或者拿着移动终端拼命按键。也让老人小孩等不方便用物理形式操控产品系统的用户人群享受智能家居生活,更有助于智能家居在大众家庭的普及落地。 贰技术壁垒高,两极分化严重 声纹识别的厂家大致可以分为三个阶段: 第一阶段:2000年前后第一批公司成立,主要是老牌语音厂商; 第二阶段:2005年前后第二批公司成立,主要是深耕声纹的专业厂商; 第三阶段:第三批主要是贴着AI标签的创业公司,以及近两年,BAT等大公司开始布局声纹领域。 2018年11月,中国人民银行发布《移动金融基于声纹识别的安全应用技术规范》金融行业标准,这意味着声纹识别技术得到金融监管部门的认可。这一标准的发布也意味着金融科技一跃成为声纹识别时下最热门的应用领域之一,而声纹识别在金融领域的场景应用,也将极大程度带动上下游产业发展。与此同时声纹识别相关厂商也得到迅速扩充,不单单只有深耕多年的专业声纹厂商,还涌现出了一大批新面孔。 这也就导致了,在声纹厂商中,有明确技术来源的厂商总体占比不高,并且主要集中在少数几家有深厚耕耘的高校和科研机构中。 并且由于声音信号的复杂性,在处理声音信号的技术上有很大的难度,这可能就会导致以往有技术积累的老牌企业抓住应用场景扩大的机遇而发展的越来越好,而新型企业可能无法学习以及掌握声纹识别技术无法长大起来。 叁既然这么好,为什么没有普及 与其他这些生物特征相比,声纹主要有以下三方面的优势: 1、非接触、易接受: 声纹由于其非接触性是可以用于远程领域的生物识别技术。另外蕴含声纹特征的语音获取方便、自然。在采集过程中涉及到的用户个人隐私信息较少,因此更容易被使用者接受。 2、成本低: 语音采集装置成本低廉,使用简单,一个麦克风即可,在使用通讯设备(如电话、手机)时更无需额外的录音设备。 3、伪造难: 声纹信息必须是活体采集,可使声纹口令动态变化而无需担心密码遗忘、丢失和窃取问题,防止录音假冒。 不得不提及的事任何事物都有双面性,优势和劣势必是同时存在的。声纹识别也还有一定的难点需要攻克,比如建立声纹库和特征,远场识别,噪音,多信道(手机、电话、网络)等问题亟需整个业内一同解决,这些需要攻克的难点任何一个没有攻克都无法使得声纹识别普及使用。 肆未来值得期待 纵使声纹识别技术还没有广泛的应用,但不可否认地是它现已经被时代所认可,所赋予了无限期待,未来可期。随着万物互联的趋势,也将是各种数据信息互联的趋势,而确保数据信息的安全关系到每一个人的利益,所以怎么去完善安防技术是未来一个重要的课题,而声纹识别将是未来提升安防解决方案的重要手段。未来声纹识别一定会像现在的指纹识别和人脸识别一样“重要的角色,广泛的应用”。 备注:文章分享自物联网空间站,转载的目的在于信息的分享,如有侵权请联系我们删除。 原文章作者:信软网,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-10
    最后回复 鲷泾 2020-1-10 18:16
    1812 0
  • 依图在全球权威声纹识别竞赛中夺冠
    近日,在国际声纹识别权威竞赛VoxSRC上,依图算法夺得第一,等错误率降到0.0098、大幅领先第二名。 并且,依图团队(参赛队伍名为logicworld)在使用指定数据的情况下取得了优于其他团队使用不限数据得到的结果,表明依图声纹识别技术已达世界领先水平。 (竞赛的任务是判断两段音频是出自同一个人还是两个不同的人,算法的输出结果用等错误率(Equal Error Rate,EER)来衡量,EER越小系统性能越好) 0.0098的等错误率意味着什么? 首先,日常生活应用基本能够满足,笔记本电脑和汽车的声纹锁功能越来越可靠,智能硬件上的虚拟助理将不会被他人用同样的关键词唤醒,成为真正属于你的个人助理。 在社保远程身份验证、反电信诈骗等公共服务领域,精准的声纹识别技术也将更好地降本增效、服务民生,不需要再“居住异地,千里奔波”,更避免“九旬老人社保年审,家人抬着爬上三楼”。 声纹识别拥有广阔的应用前景。不仅如此,将语音识别与声纹识别、语义理解相结合,就能知道 “是谁因为什么说了什么”,将大幅增强智能语音个性化服务,实现真正意义上的交互。 VoxSRC是由英国牛津大学、韩国互联网巨头Naver、斯坦福国际研究院和麻省理工学院联合发起的全球声纹识别竞赛,被誉为“声纹识别界的ImageNet竞赛”。 本次比赛采用的数据集基于开源数据集VoxCeleb,由牛津大学团队于 2017 年发布,后来逐渐扩充,现在是声纹识别领域规模最大、标注最完备的开源数据集之一。 VoxCeleb来自YouTube名人采访视频,包含了7000多个来自不同种族、口音、职业和年龄的说话人,超过100万段的说话声,2000多小时的音频和视频,且基本都含有背景噪音、笑声、说话声重叠及其他杂音,非常考验算法的实战水平。同时,本次比赛测试数据不含标注,无法用来训练或调整系统,确保了结果的公正与公平。 今年的VoxSRC吸引了来自海内外多支队伍参与,包括约翰霍普金斯大学、法国国家信息与自动化研究所、清华大学、中山大学等知名高校和研究机构,以及平安科技、NEC等大型企业。 成立7年来,依图在视觉感知、自然语言处理、语音识别、智能决策等多技术领域发展,这次参赛VoxSRC是依图在语音领域的一次新尝试。 未来,依图将在多算法领域持续投入,推进多模态技术融合、软硬件协同开发,将世界领先的人工智能算法与行业场景深度结合,推动人工智能应用落地。 原文章作者:依图科技,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-10
    最后回复 衮代 2020-1-10 18:15
    1898 0
  • 新宝骏发布2.0版车联网系统:新增声纹识别,预计年内推出
    11月22日,2019(第十七届)广州国际车展正式拉开帷幕。在本场活动上,新宝骏“智能家族”四款车型的首次同台亮相。同时,新宝骏RM-5的1.5L版正式发布。本场活动,RM-5 1.5L共计发布了6款车型,涵盖5座、6座和7座版,售价区间为7.88万~9.38万元。 (新宝骏RM-5 1.5L版车型价格) 在亿欧汽车看来,比新车更值得关注的是,新宝骏品牌在本场活动展示了该公司2.0版本车联网系统。 新宝骏2.0版车联网系统集合了数字识别技术、声纹识别技术、视听融合技术、复合式路况算法等多种科技。据新宝骏品牌传播负责人张丽娜介绍,这一版系统预计将在年底前正式推送到车。 据新宝骏介绍,高速芯片和复合式路况算法,将帮助车与车、车与人、车与路面的信息形成协同,为产品多路况、多气候、全场景的智能驾驶辅助提供支持。其数字识别N2N技术能够让手机与汽车实现一对多、多对多之间的自由切换。其声纹识别技术能够像指纹一样,用声音识别实现对新宝骏车型的接管。 2019年4月11日,上汽通用五菱正式发布以“创造出行新生活”为品牌主张的“新宝骏品牌”并启用全新钻石标。 为了体现品牌主张,新宝骏正在不断对外展示其在智能网联体验、智能驾驶体验、产品全生命周期的数字化智能体验、全新用户服务体验等新科技方面的成绩。 (新宝骏RM-5 1.5L版) 新宝骏官方给出的统计数据显示,在主动安全方面,新宝骏RM-5/RC-6上市后,防碰撞预警共生效2132次、ACC自适应巡航累计使用了29544小时、限速标识预警提示了12408次、车道保持介入了858962次。60天内,该品牌82%的用户已习惯使用智能驾驶。 在车联网方面,新宝骏车联网手机摇一摇打开车门117386次、用户累计与语音AI互动1464071次、远程开启空调96884次、用户使用手机寻车26209次、AI语音控制92213次、使用语音发送消息165501次、使用音乐播放功能1245186次。官方数据显示,该品牌60天内的车联网的使用次数增长了134%。 此外,今年7月,柳州市正式启用了一条集成5G、V2X、无人驾驶、远程驾控技术的公开测试道路。新宝骏则获得了柳州市政府颁发的“智能网联汽车道路测试牌照”,并率先使用这条国内首个设置于公开道路的5G基站群开展产品测试。 不久后,新宝骏将在该条道路上进行一键召车、异常车辆提醒、信号灯信息推送、无人驾驶提速段、前方拥堵提醒、前向碰撞预警、限速预警、智能泊车等功能的测试。 张丽娜表示,新宝骏品牌推出7个月以来,新增用户中有约20%来自上汽通用五菱旗下老品牌的转化,而70%以上都是全新用户,这意味着其品牌定位的差异化取得了一定的成绩。 在即将到来的2020年,新宝骏将推出至少六款全新车型,包括纯电动版产品。“当下的智能网联汽车市场处于一个窗口期,所以我们希望加快节奏去抢占这一市场,”张丽娜表示,“不论外部环境如何,我们对明年的发展还是有信心的,预计至少会有300%的增长。” 当然,新宝骏对于明年的信心主要来自今年的低基数和接下来的多车密集上市。依靠全新车型带来红利的时期过去后,这一新品牌才将真正接受市场考验。 原文章作者:亿欧,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-10
    最后回复 文嘉颖 2020-1-10 18:13
    2370 0
  • 【热点聚焦】“刷脸”之后声纹识别有望成为新秀
    同属于生物识别技术,与火爆的人脸识别相比,声纹识别表现得很低调,然而并不影响这一黑科技魅力的散发:巴克莱银行、汇丰银行、哈利法克斯银行等多家英国银行目前都支持声纹识别;我国公安部已面向全国推广声纹技术,各地公安机关均在努力提升声纹信息的实战应用效能,加强公安机关声纹技术的应用工作;近期有消息称 Siri 将加入声纹识别,当有人说出“Hey Siri”的时候,Siri 可以知道是否是主人在喊它。 那么,在经历从指纹识别到面部识别后,声音是不是会成为新主流身份认证模式呢? 声纹识别三大优势 相较于声纹识别,大众可能对语音识别更为熟悉,但二者有本质的区别。语音识别是“说什么”,声纹识别是“谁在说”。声纹识别可以分为说话人辨认和说话人确认两类。 不同于人脸、指纹、虹膜等其他生物识别方式,声纹识别拥有独特的优势。其一,声纹语料收集方式自然,无需进行眨眼、摆动作等特定动作,不受光线或隐私等特定场景的约束,人们的接受度更高;其二,声纹识别可以随机改变朗读内容,即便在网上或其他地方留下语音信息,也不易被复制或盗用;其三是使用成本低,人脸识别需要摄像头,而声纹识别只需要麦克风,这也更易推广应用。 声纹识别在安防领域表现亮眼 正因如此,声纹识别技术已经在多个领域内进行了应用,其中,较为突出的则是安防领域。在安防领域,无论多维度的防控还是多层次防控,声纹识别已经成为了音视频融合体系中不可或缺的一部分;在车站、酒店等公共安检点或通信系统中嵌入声纹识别技术,可以对重点人员进行鉴别和侦查追捕,助力公安有效遏制与打击不法行为,构建和强化安全的社会公众环境。 值得一提的是,物联网发展趋势下,对于屏幕较小的终端设备而言,用语音进行声纹识别更为合理,声纹识别有望成为物联网场景下的验证方式和服务入口之一。 尚面临诸多困难 声纹识别在各行各业当中体现出巨大的价值,不过也面临着很多困难。例如,目前声纹数据掌握在公安系统,企业想利用这些数据进行训练较为困难;另外,人类的方言、口音差异,以及不同情绪状态下的声音状况不同,都会对声纹识别造成一定的影响。如何在动态识别中准确判断出声音的本质特征对于声纹识别来说是非常重要,也是非常困难的。 结语:尽管有许多问题需要解决,但不可否认声纹识别确实有着更广泛的应用前景。生物特征认证技术已经被认为将取代各种明文密码,而声纹比起其他声纹特征也有着特殊的优势,除了更加安全和方便,语音的采集和识别的成本也比面部识别要低,其实更加适合用于密码认证。或许声纹识别成为主流身份认证模式那一天,不会太远了。 原文章作者:安防展览网,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-10
    最后回复 捆慌锲 2020-1-10 17:46
    1971 0
  • 依图刷新国际声纹识别权威竞赛世界纪录
    近日,在国际知名声纹识别挑战赛VoxCeleb Speaker Recognition Challenge上,依图以显著优势刷新世界纪录,中国AI再次世界争光。 此次参赛队伍不仅包括约翰霍普金斯大学、法国国家信息与自动化研究所、清华大学、中山大学等海内外知名高校、研究机构,还包含平安科技、NEC、君林科技等各大企业。至此,依图人工智能技术不仅在视觉感知、自然语言理解等领域领跑全球,声纹识别技术也已达世界顶尖水平。 “声纹识别”和“语音识别”是完全不同的技术,语音识别只负责让机器识别出“说话的内容”,但声纹识别能判定“话是谁说的”。因此,结合声纹识别与语音识别,我们才能知道“是谁说了什么”,这一点对于会议、访谈等有多人轮流说话的场景尤其重要。 声纹识别的应用前景非常广泛,比如智能手机锁屏、声控安全门、汽车声控锁等;利用声纹辨认技术,还可以支持智能音箱、智能语音助理等提供个性化服务,比如针对家里的老人和孩子,推荐不同的歌曲、新闻。 但由于声纹识别技术本身的难度很高,这些应用需求大部分还处在探索阶段。这也是到目前市面上能自动辨别说话人的智能语音应用比较少见的一个原因。 在声纹识别领域,VoxCeleb Speaker Recognition Challenge(VoxSRC)是兼具影响力和权威性的国际评测。与常规的声纹识别评测不同,VoxSRC所用的数据量大、来源多样,而且都采集自真实场景,比如会场访谈、室外多人对话,含有各种噪音和杂音,对于算法性能的要求非常高。此外,该竞赛的评估方法非常严谨,因此其结果在学术界和工业界都得到认可。 依图以“logicworld”为名参赛夺冠,成绩大幅领先第二、三名 在声纹识别竞赛中,“EER”值是衡量声纹识别算法系统性能的重要指标,EER越小系统性能越好,表明不仅算法识别准确率高,系统也安全可靠。在本次竞赛中,依图基于算法的多年研究积累,首次参赛便拿下冠军,在关键指标上创下新高,远超第二、三名。 依图这次创下纪录的声纹识别精度水平,已经可以满足基本的智能声纹应用需求,比如在线交易支付的动态声纹密码、个人账户登录的声纹动态口令登录。试想,社保局安装声纹身份认证系统后,就能实现安全的远程身份认证,让“信息多跑路,群众少跑腿”,为百姓生活带来极大的便利。随着技术的不断成熟和融合,声纹识别技术将逐渐融入我们的日常生活,产生巨大的应用价值。中国自研的人工智能技术,也将持续推动和引领全球技术发展,力争成为行业标杆。 此次依图刷新世界声纹识别领域权威纪录,不仅代表中国声纹识别技术向前进了一步,更意味着智能语音产业发展的一大步。 原文章作者:业界新讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-10
    最后回复 秧橹帼 2020-1-10 17:35
    2603 0
  • 智能家居:新的控制方式声纹识别!会给我们带来什么便利?
    有人常说,希望摆脱手机、平板等移动终端来控制智能家居,这是否可行?又用什么新的操作控制方式能实现?今天带大家认识另外一种新方式——声音识别。 所谓声纹(Voiceprint),是用电声学仪器显示的携带言语信息的声波频谱。人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理物理过程,人在讲话时使用的发声器官:舌、牙齿、喉头、肺、鼻腔在尺寸和形态方面每个人的差异很大,所以任何两个人的声纹图谱都有差异。每个人的语音声学特征既有相对稳定性,又有变异性,不是绝对的、一成不变的。声纹识别是生物识别领域里的一种,也称为说话人识别。有两类,即说话人辨认和说话人确认。 声纹识别的发展现状: 声纹识别,似乎人们对它的认识还不够深刻,或者说绝大部分人对它还完全不了解。但其实早在童话故事《天方夜谭》里的“芝麻开门”,就是声纹识别,用自己的声音做密码,辨认或者确认是不是本人。 目前,国内声纹识别技术主要应用在司法、刑侦、社保等领域,而应用于硬件生活场景里的,还不多。国内对声纹识别技术有比较深入研究的企业也不多。应用市场上应用声纹识别技术的有隐私声纹锁、声纹锁屏等产品,是声纹技术应用的初步试水,但是引起的反响并不是非常明显。 声纹识别能为智能生活带来什么: 1、加强信息安全。在生活场景里,信息泄露、银行卡被盗、支付宝被盗等事件时有发生。而纵观移动互联网用户的扩张速度、移动互联网金融的蓄势待发,采用声纹识别认证,可能是将来解决安全问题的唯一手段。 2、利用声纹识别技术,改变以往的破案手段、传统监禁模式。对于各种电话勒索、绑架、电话人身攻击等案件,声纹辨认技术可以在一段录音中查找出嫌疑人或缩小侦察范围;在司法社区矫正应用中,通过识别定位手机位置和呼叫对象说话声音的个人特征,系统快速自动判断被监控人是否在规定的时间出现在规定的场所,有效地解决人机分离问题,为人性化的监禁又推动了一步。 3、声纹识别将改变未来的智能家居领域的操作习惯。智能家居是一个新概念,但也存在各种操作控制上的麻烦问题,而声纹识别是有效解决方式之一。解放用户的双手,双脚,无需走来走去或者拿着移动终端拼命按键。也让老人小孩等不方便用物理形式操控产品系统的用户人群享受智能家居生活,更有助于智能家居在大众家庭的普及落地。 但就目前的智能家居来讲,与声纹识别的处境一样,还是处于一个长大阶段,所谓的智能还不完善,所有的产品也还没有成为一个体系。如果要改变人们一个时代的生活习惯,也是任重道远。可以预测,未来的生活场景里,声纹识别技术将会得到普及,随时可以看到人们对着家里任意角落喊出各种指令。 原文章作者:康凯智能,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-10
    最后回复 平雪粉 2020-1-10 16:59
    3419 0
  • 指纹识别概念股有哪些,指纹识别概念股一览
    指纹识别概念股有哪些,指纹识别概念股一览 据最新消息显示,指纹识别概念午后大涨,汇顶科技(603160)、高新兴(300098)2股涨逾7%,华天科技(002185)涨超3%,川大智胜(002253)、晶方科技(603005)等个股纷纷上涨。那么,指纹识别概念股有哪些呢?下面小编就给大家介绍一下吧。 据报道,指纹识别概念股12月9日午后大涨,汇顶科技(603160)、高新兴(300098)2股涨逾7%,华天科技(002185)涨超3%,川大智胜(002253)、晶方科技(603005)、新开普(300248)、恒生电子(600570)、东软集团(600718)等个股也有不同程度的跟涨。下面给投资者们介绍一些指纹识别概念股: 高新兴(300098):高新兴致力于感知、连接、平台等物联网核心技术的研发和行业应用的拓展。高新兴近日发布2019年半年度报告,公告显示,报告期内实现营收16.14亿元,同比增长15.23%;归属于上市公司股东的净利润1.85亿元,较上年同期下滑26.12%;基本每股收益为0.1072元,上年同期为0.1447元。 华天科技(002185):公司2019年前三季度实现营业总收入61.1亿,同比增长9.8%;实现归母净利润1.7亿,同比下降48.8%,降幅较去年同期扩大;每股收益为0.07元。报告期内,公司毛利率为14.4%,同比降低2.7个百分点,净利率为3.1%,同比降低3.4个百分点。报告期内,非经常性损益合计8447.7万元,对净利润影响较大。 新开普(300248):公司2019年前三季度实现营业总收入5.6亿,同比增长19.3%;实现归母净利润5347.8万,同比增长176.4%;每股收益为0.11元。报告期内,公司毛利率为55.8%,同比提高0.6个百分点,净利率为9.1%,同比提高5.3个百分点。报告期内,非经常性损益合计1861.2万元,对净利润影响较大。 原文章作者:小可爱是我家宝贝,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-10
    最后回复 窑屋 2020-1-10 16:57
    2928 0
  • 干货:NIST评测(SRE19)获胜团队声纹识别技术分析 | CSDN博文精选
    作者 | xjdier 来源 | CSDN博文精选 近日,NIST说话人识别技术评测 (Speaker Recognition Evaluation,SRE)正式公布榜单,芯片初创公司清微智能和清华大学等机构组成的联队,在Conversational Telephone Speech (CTS)和Multimedia两个任务上均取得全球前十,亚洲地区第一的好成绩。 NIST SRE是由美国国家标准与技术研究院主办的国际上最权威、规模最大的声纹识别技术评测和多媒体评测,为全球的研究机构提供了一个统一的测试平台。竞赛包含两个任务,分别考验电话信道语料(CTS)和音视频语料(Audio-visual)上声纹识别的性能,目的在于通过比这样的形式探索说话人识别的新技术、新方法,提升说话人识别系统的性能。从1996年举办至今,参加NIST SRE评测的研究机构逐年增加,今年有包括MIT,JHU,NEC等各国顶尖学术科研机构和公司参加。 从1995年开始,混合高斯模型的统计模式识别技术被引入说话人识别,2000年Reynolds提出的GMM-UBM模型成为声纹识别领域最重要的基石。2008年kenny提出联合因子分析(JFA)将GMM均值超矢量空间划分为本征空间,信道空间,残差空间,分别对说话人和信道空间建模。由于JFA进行信道补偿时不可避免的包含说话人信息,并且存在空间掩盖和空间重叠的问题,因此不能对说话人和信道进行准确建模和区分,于是在2010年Najim Dehak等人提出使用全局差异空间代替本征空间和信道空间,即I-vector对说话人进行建模。随着数据和计算资源的丰富,基于深度学习的声纹识别带来了性能的进一步提升。2018年X-vector在D-vector的基础进行改进,通过在帧级特征上池化映射获得可以表示说话人特性的段级向量,成为state-of -the -art的框架。基于X-vector说话人建模的声纹识别系统主要包括语音特征提取,说话人建模和后端分类器进行信道补偿及似然度打分三个部分。 团队对现有说话人建模和后端分类器技术进行改进,基于目前State-of-the-art的框架X-vector,在主流的TDNN上做了两个改进,分别是FTDNN和EFTDNN,核心是在后端解决领域失配的问题。除了传统的LDA,PLDA进行信道补偿并给出似然比分数,团队在中心化、白化、自适应策略上也进行启发式搜索。本文将团队在此次声纹识别竞赛中的关键技术点整理如下。 关键技术一:FTDNN & EFTDNN 在这次评测中,团队基于目前State-of-the-art的框架X-vector, 在主流的TDNN上做了两个改进,分别是FTDNN和EFTDNN。 FTDNN的灵感来源于SVD。SVD本身是降低模型参数的常用做法,将训练好的参数进行SVD分解成两个小参数,再进行fine-tune.但如果没有训练好的参数,直接使用SVD的结构随机初始化训练,网络训练就很不稳定。 为了解决训练不稳定的问题,FTDNN将每一层TDNN拆成两个低秩矩阵的乘积,通过半正交化第一个低秩矩阵,保证信息从高维到低维没有流失。半正交之后特征值的分布会比较均匀,这样的参数矩阵相当于一个映射矩阵,总能够从上一层学到更重要的信息。使得网络熟练的更稳定。对于矩阵M,半正交化就意味着M乘M的转置是恒等矩阵,也就是M乘M的转置减恒等矩阵趋近于0,可以通过梯度下降的方式迭代实现M的半正交化。 FTDNN则是把TDNN 10241024的层拆成两层:1024256,2561024,网络从随机初始化开始训练,在参数更新的过程中,后一层每4个step半正交化一次。例如,传统的节点数为1024的TDNN层,被分解为两个卷积核为21,节点数为256的卷积层,其中第二个卷积层在训练的过程中是限制半正交的。这样的FTDNN结构虽然层数加深,但是参数量反而变小,这样使得在同等参数量的情况下,FTDNN的性能更好。 此外, 鉴于ETDNN在声纹识别任务上的突出性能,团队对FTDNN也进行扩展。在FTDNN每层之间按照ETDNN的方式插入DNN,并且加宽加深卷积层,这样的网络结构可以看到局部更多语音帧的信息。EFTDNN采用3-stage splicing的策略,传统的节点数为1024的TDNN层,被拆成三个卷积层,其中前两个卷积层在训练的过程中限制半正交。除此之外,团队引入AM-Softmax (Additional margin softmax)让深度模型获得更稳定的和更快的收敛,进一步提升了声纹识别的性能。对于这样大规模的网络,AM softmax 比Angular softmax收敛的更快更稳定,因为后者开始的时候类间距比较大,再乘以一个参数m不利于模型训练。同时,通过使用海量的数据集建立更深、更大的深度声纹模型EFTDNN(extended factorized TDNN),在单系统上获得了不错的性能。这样的FTDNN结构虽然层数加深,但是参数量相差不大。 关键技术一:FTDNN & EFTDNN 在这次评测中,团队基于目前State-of-the-art的框架X-vector, 在主流的TDNN上做了两个改进,分别是FTDNN和EFTDNN。FTDNN的灵感来源于SVD。SVD本身是降低模型参数的常用做法,将训练好的参数进行SVD分解成两个小参数,再进行fine-tune.但如果没有训练好的参数,直接使用SVD的结构随机初始化训练,网络训练就很不稳定。 为了解决训练不稳定的问题,FTDNN将每一层TDNN拆成两个低秩矩阵的乘积,通过半正交化第一个低秩矩阵,保证信息从高维到低维没有流失。半正交之后特征值的分布会比较均匀,这样的参数矩阵相当于一个映射矩阵,总能够从上一层学到更重要的信息。使得网络熟练的更稳定。对于矩阵M,半正交化就意味着M乘M的转置是恒等矩阵,也就是M乘M的转置减恒等矩阵趋近于0,可以通过梯度下降的方式迭代实现M的半正交化。 FTDNN则是把TDNN 10241024的层拆成两层:1024256,2561024,网络从随机初始化开始训练,在参数更新的过程中,后一层每4个step半正交化一次。例如,传统的节点数为1024的TDNN层,被分解为两个卷积核为21,节点数为256的卷积层,其中第二个卷积层在训练的过程中是限制半正交的。这样的FTDNN结构虽然层数加深,但是参数量反而变小,这样使得在同等参数量的情况下,FTDNN的性能更好。 此外, 鉴于ETDNN在声纹识别任务上的突出性能,团队对FTDNN也进行扩展。在FTDNN每层之间按照ETDNN的方式插入DNN,并且加宽加深卷积层,这样的网络结构可以看到局部更多语音帧的信息。EFTDNN采用3-stage splicing的策略,传统的节点数为1024的TDNN层,被拆成三个卷积层,其中前两个卷积层在训练的过程中限制半正交。除此之外,团队引入AM-Softmax (Additional margin softmax)让深度模型获得更稳定的和更快的收敛,进一步提升了声纹识别的性能。对于这样大规模的网络,AM softmax 比Angular softmax收敛的更快更稳定,因为后者开始的时候类间距比较大,再乘以一个参数m不利于模型训练。同时,通过使用海量的数据集建立更深、更大的深度声纹模型EFTDNN(extended factorized TDNN),在单系统上获得了不错的性能。这样的FTDNN结构虽然层数加深,但是参数量相差不大。 关键技术二:多任务学习机制融合语音文本上下文信息 团队使用多任务学习机制,将语音信息导给给基于X矢量架构进行声纹嵌入提取。将声纹识别和语音识别任务联合学习,借助音素信息和语音文本上下文信息对声纹更有效的建模。其中,语音帧级别的语音识别模型和语音段级别的声纹识别模型共享了7层TDNN的参数,在训练的过程中,输入数据对应的声纹标签用于更新声纹模型,对应的文本标签用于更新语音识别模型。由于同时含有声纹标签和文本标签的数据集很有限,为了产生其他声纹语料的文本标签,引入了一个额外的GMM-HMM模型用来对齐语音帧和文本标签。将语音向量与X-vector网络共同优化,并提供辅助信息以适应声纹特征,可以同时在帧和片段级别上得到有效结果。共享层提取信息特征,使网络更稳健,避免出现过拟合的情况。 关键技术三:融合语音适应与多任务学习机制 在语音适应方法中,语音内容被认为会对声纹验证任务产生负面影响。相反,混合多任务学习利用有用的语音信息来改善模型的概括性。于是,在多任务学习框架的基础上又做了改进,生成了C-vector,从预训练好的声学模型中提取音素向量,拼接在Multi-task声纹识别模型的池化层前。它融合了Multi-task和phonetic adaptation,进一步挖掘语音文本信息对声纹识别任务的有用信息。在C-vector架构中,使用了两个独立的语音分支。为什么要采用这种形式?因为这两个子网是通过不同的目标功能进行优化的,但是还需要限制模型大小。团队注意到,在多任务学习中,区分语音的网络也提供逐帧的语音信息。因此简化的模型可以删除预训练的声学模型,然后将BN层合并到语音区分网络中,并从该层中提取语音矢量。 关键技术四:启发式后端对X-vector进行信道补偿和分类 在X-vector特征中,即包括了声纹信息又包括了信道信息,因为团队将重点放在了声纹信息上,所以在X-Vector中存在信道信息的干扰,这会降低系统的性能表现。于是,团队还需要通过信道补偿算法来减少这种影响。除了数据级和模型级的改进,针对域不匹配的问题,后端团队采用启发式算法,遍历不同的后端策略,线性鉴别分析(Linear Discriminant Analysis,LDA)和概率线性判别分析(Probabilistic Linear Discriminant Analysis,PLDA),LP-LDA,以及MotPLDA,尽量减少训练、测试数据不匹配带来的影响。 2019年声纹识别领域在数据,模型,后端方面均涌现出新的技术。包括在说话人和带宽上做数据扩展,采用Gating CNN block,Dense block等网络结构,通过特征域自适应方法解决领域失配问题。除此之外,在图像和语音识别任务上有效的SE-Net、LSTMP也在声纹识别任务上验证有效。 据悉,今年获得全球第一的是来自美国的一家公司,制胜原因在于其采集了更多集内数据。大家也猜测,为了体现该比赛是一个技术导向性赛制,未来也许将会改为闭集训练数据赛制。随着赛制的完善和更多经验的积累,相信中国的团队会开发出更好的声纹识别系统。 技术的道路一个人走着极为艰难? 一身的本领得不施展? 优质的文章得不到曝光? (*本文为AI科技大本营转载文章,转载请联系原作者) 所有CSDN 用户都可参与投票和抽奖活动 加入福利群,每周还有精选学习资料、技术图书等福利发送 原文章作者:AI科技大本营,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-10
    最后回复 谷秋阳 2020-1-10 16:52
    2471 0
  • 乌镇世界互联网大会强调网络安全建设,快商通声纹识别实力助阵
    10月20日,第六届世界互联网大会在中国浙江乌镇开幕。主题为“智能互联,开放合作——携手共建网络空间命运共同体”。 乌镇世界互联网大会自2014年举办以来,每届大会议题都会聚焦网络安全。从“互联互通 共享共治”,到现如今的“智能互联,开放合作”,共同构建网络空间命运共同体的理念成为主线。 当前,网络安全和信息化是一体之两翼、驱动之双轮,是事关国家安全、国家发展和人民工作生活的重大战略问题。尤其是在城市中的各个关键信息基础设施、业务机构、终端设备不断有数据产生,数据中心与应用平台之间不断有数据的流转、共享,而网络威胁也无处不在。 在网络安全危害行为中,电信网络诈骗因其犯罪成本地、发生频率高、社会影响大,已经成为侵害人民群众切身利益的社会公害,坚持综合治理、源头治理,遏制电信网络诈骗犯罪高发势头,已成为社会各界共同努力的目标。 电信诈骗,是指通过电话、网络和短信方式,编造虚假信息,设置骗局,对受害人实施远程、非接触式诈骗,诱使受害人打款或转账的犯罪行为,通常冒充他人及仿冒各种合法外衣和形式或伪造形式以达到欺骗的目的,如冒充公检法,冒充商家公司厂家,国家机关工作人员,银行工作人员,各类机构工作人员,伪造和冒充招工,刷单,贷款,手机定位,招嫖等各种形式进行诈骗。 从2000年以来,随着科技的发展,电信诈骗迅速在中国发展蔓延,犯罪分子借助于手机、固定电话、网络等通信工具和现代的电信诈骗技术等实施的非接触式的诈骗,并迅速地发展蔓延,给人民群众造成了很大的损失。仅2008年北京、上海、广东、福建这四个省市因电信诈骗市民损失近6亿元。 针对这种非接触的诈骗行为,人脸识别、指纹识别等人们熟知的身份确认技术便显得有些鞭长莫及,并且它们并不能体现人的动态变化,很容易出现面部信息、指纹信息被盗用等安全问题。 而智能生物识别技术的另一分支——声纹识别,是一种在认证时无须双方接触的技术,具有远程非基础、识别可靠且迅速、采集成本低等优势。业内人士常说,声纹识别可以让骗子“失业”。 (快商通声纹识别金融反欺诈解决方案) 当声纹识别建立起强大的声纹库,人民在接听电话时可以通过声纹准确知道通话人身份;即便无法确定来电人身份但如同“来电标记”一样,通过在骗子的声纹中标记,该声纹无论换多少电话号码,加入多少处理都无可遁形,警方也可以迅速将其缉拿归案。 为此,公安部提出要深化声纹技术在网络安全工作中的应用,及声纹识别电信反欺诈建设,加强音视频舆情监测系统建设和互联网音视频监管系统建。 针对电信反欺诈建设,目前国内的厂商以快商通为代表。快商通电信反欺诈解决方案以布控、预警为导向,通过声纹生物特征与语音内容多维识别,结合与技术侦查、自动监听等技术,将各种通信及语音中的声纹特征及语音内容进行实时、远程、非接触式的主动识别,在包含电信和互联网范围内实行有效动态布控、预警,消除潜在电信网络诈骗风险。目前,快商通声纹识别电信反欺诈相关产品及解决方案已经能成功应用在公检法与金融机构之中。 在公检法领域,智能声纹数据采集终端+智能声纹识别系统+智能声纹鉴定专家工作站+声纹综合实战平台,是快商通“声纹识别与身份安全服务”的四大拳头产品,已广泛应用于公安、司法、戒毒、检察院、监狱等领域,协助相关机构进行重点人员监管、刑事案件侦破、反恐、身份查询与核验,强有效地打击遏制了犯罪,为社会公众筑起了一道牢固的安全防线。 在金融领域,快商通以“声纹反欺诈风控系统”为基础,通过建立金融黑名单声纹库,在信审等可能存在欺诈的节点中,利用声纹进行客户身份识别。当识别为黑中介、羊毛党等黑产,可及时提示、防范风险,有效防范金融欺诈。目前,该系统已率先服务于平安集团、交通银行、阳光保险集团、上海华瑞银行,落地国内银行、保险领域的大规模声纹反欺诈应用。 原文章作者:快商通AI,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-10
    最后回复 私凋 2020-1-10 16:45
    2416 0
  • 依图科技声纹识别权威竞赛夺冠,智能语音再下一城
    全球权威声纹识别竞赛结果出炉,依图科技获得第一 作者:栗峰 编辑:唐里 在奥地利召开的机器语音国际顶会 InterSpeech 2019 上,国际声纹识别权威竞赛 VoxCeleb Speaker Recognition Challenge(VoxSRC)公布最新结果,依图科技大幅领先海内外多支强队获得冠军,再次展示了世界级人工智能算法实力。 不仅如此,依图团队使用小数据就取得了优于其他团队使用大数据得到的结果,充分表明中国声纹识别技术已达世界领先水平。 依图团队(logicworld)在全球权威声纹识别竞赛 VoxSRC 2019夺冠,等错误率(EER)0.0098,大幅领先第二名。 声纹识别为什么难? 声纹识别是一种通过声音判别说话人身份的技术。如果说语音识别是让机器判断「说了什么」,那声纹识别就是判断「是谁说的」,用于解决生物身份的确认和识别。 2012 年以来,深度学习技术逐渐进入声纹识别主流,这种方法纯粹采用数据驱动的方式,通过海量数据样本和深度神经网络模型,让机器自动去发掘声学特征中说话人的信息差异,从而「学会」声学特征中的说话人信息表示。 很显然,使用基于端到端深度学习的方法做声纹识别,拥有大量声纹数据样本,就有了无可置疑的优势。 目前,声纹识别应用还处于探索阶段,但其应用前景十分广阔。最容易想到的,比如会议录音的音频转录,在结合了声纹识别技术后,就能自动标注出谁在什么时候说了什么,轻松完成多人会议纪录,大幅提高工作效率。 随着技术的不断成熟和融合,声纹识别技术将逐渐融入日常生活,根据不同应用场景的特点进行针对性开发,将产生巨大的应用价值。 VoxSRC:声纹识别界的 ImageNet 竞赛 VoxSRC 是由英国牛津大学、韩国互联网巨头 Naver、斯坦福国际研究院(SRI International)和 MIT 的研究者联合发起的全球声纹识别竞赛,可以说是「声纹识别界的 ImageNet 竞赛」。在很大程度上,VoxSRC 结果反映了全球声纹识别技术最高水平。 VoxSRC 基于开源数据集 VoxCeleb,由牛津大学团队于 2017 年发布,后来逐渐扩充,现在是声纹识别领域规模最大、标注最完备的开源数据集之一。 VoxCeleb 来自 YouTube 名人采访视频,包含了 7000 多个不同种族、性别、口音、职业和年龄的说话人,在不同场合下超过 100 万段的说话声(utterance),时长加起来总共超过 2000 小时(每段音频的长度从 3 秒到 20 秒不等)。 除了数据量大且来源多样化,VoxCeleb 的音视频基本都含有背景噪音、笑声、重叠的说话声和其他杂音,非常考验算法的实战水平。 牛津大学发布并维护的VoxCeleb数据集是目前全球规模最大、标注最完备的开源声纹数据集之一,数据来源多样且都来自无约束场景,非常考验算法的实战水平。 此外,VoxSRC 的测试数据集是「盲的」(blind),即没有任何标注。这些数据无法用来训练或调整系统,确保了比赛结果的公正与准确(不会出现有团队过拟合数据的情况)。 今年的 VoxSRC 吸引了海内外多支队伍参与,有约翰霍普金斯大学、法国国家信息与自动化研究所、清华大学、中山大学等知名高校和研究机构,也有平安科技、NEC、君林科技等大企业。 竞赛的任务很明确,就是判断两段音频是出自同一个人,还是来自两个不同的人。算法的输出结果用等错误率(Equal Error Rate,EER)来衡量。 EER 是衡量声纹识别算法系统综合性能的重要指标,EER 值越小,系统的性能就越好。 什么是EER、FAR、FRR? 评估算法系统性能时常输出ROC 曲线,用于描述FAR(误识率)与FRR(拒识率)之间的关系。 简单说,在声纹识别中,误识率就是“把不应该匹配的声纹当成匹配声纹”的比例,拒识率则是“把应该匹配的声纹当成不匹配声纹”的比例。 在对安全要求非常高的应用场景,就会把FAR值设置得低一些,因为判断错一次的代价很大,但这样做的同时会导致FRR值上升,用户体验度下降。 等错误率(EER)是系统的误识率(FAR)和拒识率(FRR)相等时的错误率,即ROC曲线与45度角直线相交的点,是衡量声纹识别算法系统综合性能的重要指标。EER数值越小,系统性能越好。 为了评估数据量(训练样本多少)对系统性能的影响,这次 VoxSRC 竞赛给定了两种情况,一是固定数据集,另一个是无约束数据集。 固定数据集任务,参赛队伍使用的训练数据集是固定的,也即 VoxCeleb2,该数据集包含了来自 5994 个不同说话人超过 100 万段的说话声音频。无约束数据集任务,参赛队伍在训练模型时,可以使用除竞赛测试集以外的其他任何数据,包括未公开发布的数据。 依图团队以 0.0098 的 EER 值获得本届竞赛冠军,也是唯一将 EER 值降低到 0.01 以内的团队。 特别值得一提的是,这个结果比其他团队无约束数据集任务的结果更好(无约束数据集任务的冠军 EER 值为 0.0126)。 中国最好的就是全球最好的 依图已经不是第一次在国际人工智能公开比赛中获得第一。 成立 7 年来,依图在视觉感知、自然语言处理、语音识别、智能决策等多算法领域发展,并且都独占鳌头。这次在全球声纹识别权威竞赛 VoxSRC 中夺冠,是对中国自有 AI 技术能够引领世界的又一个绝佳证明。 今年 5 月,依图发布自研云端 AI 芯片求索(questcore),旨在提升智能密度,结合世界领先人工智能算法和先进芯片设计理念,同等功耗下的视觉推理性能是 NVIDI GPU 的 5 倍。 基于求索构建的智能视频分析系统,将原本需要 16 台机柜的方案压缩到 1 台,降低数据中心整体建设成本 50%,运维成本 80%,让 10 万路智能视频解析系统成标配,50 万路成现实,大幅提升基础设施智能水平,为人工智能应用落地和普及奠定了坚实的基础。 8 月 29 日,依图获得科技部正式授牌,承建视觉计算国家新一代人工智能开放创新平台,促进芯片设计与人工智能的融合,同时针对不同业务场景打造一系列定制化芯片,支持智能城市、智慧医疗和智慧金融等行业。 未来,依图将在多算法领域持续投入,多模态技术融合,软硬件协同开发,将世界优胜人工智能算法与行业场景深度结合,推动人工智能应用落地。 点击 阅读原文查看 安卓智能语音助手源代码 原文章作者:AI科技评论,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-10
    1315 0
  • 黑科技!“声纹识别”将成警方破案神器?再也不用担心电话诈骗了
    (央视财经《极客出发》)在即将到来的万物互联时代,智能语音交互,极有可能成为下一代核心交互模式。本周日19:30,由央视财经频道和英翼文化科技联合出品的大型全球高校极客挑战节目《极客出发》第二季第五期 CCTV2 播出 , 带您对话未来,深度探秘 “ 语音 交互 ” 如何造福于人类社会。 (图为上海音乐学院极客团队和普林斯顿大学极客团队) (图为机器人小睿) (图为“听音盲侠”李琦进行听音识别) “智能语音交互”挑战温情作曲 让人机对话不再冰冷 人类有很多事情是机器无法代替的。最主要也最明显的就是人类具有情感,而机器没有。情感是人与人之间的纽带,亲情、爱情,这些都很难用科学去解释或者度量,毕竟机器太难分析与传达人类的情感。当人类与机器进行语音交互时,机器需要通过声学处理我们的声音和周围环境,减少干扰和噪音。再通过语音识别技术将听到的声音翻译成文字,语义理解技术则会分析这些文字的意义,最后机器去执行用户的指令或者通过语音合成技术把要表达的内容合成语音。 本期《极客挑战》蓝队普林斯顿大学极客团队带来实力战将——国内最先进的智能语音机器人“小睿”,通过精准的语音交互系统,“小睿”轻松将主持人所说的成语输出为文字信息。而红队上海音乐学院极客团队则请来最强援助——“听音盲侠”李琦,在和极客召集人、英翼文化科技创始人余慧的合作中,挑战人类分辨力的极限。一个是具有精准语音分析系统的智能机器人,一个是声音辨别无可匹敌的听音盲侠,电脑与人脑的挑战究竟哪个更胜一筹? 首轮挑战中,双方队伍面对的任务是谱曲。在这一环节中双方将用五天时间为文工团退休的周奶奶量身创作一首专属她的歌曲作为生日礼物,并在舞台上进行演唱,获得周奶奶青睐的歌曲将为所在队伍赢得一局。明星观察员金铭一语中的:本轮关键的就在于能否打动周奶奶,击中周奶奶的心房! 面对挑战,音乐专业背景的红队极客们大胆放话,一定能用最温情的音乐讲述周奶奶的芳华岁月。而蓝队的语音交互机器人“小睿”是否能完成这个“有人情味”的任务?连极客召集人、英翼文化科技创始人余慧都替它捏一把汗,“音乐是最能表达人类情感的一种方式,要化学反应的情感抒发是机器很难做到的”。没有人喜欢跟呆板的机器一直做交流,语音交互机器人“小睿”能否具有人性化感知,顺利完成任务?极客观察员金铭又在“小睿”的歌声中发现什么玄机?最后到底是哪支队伍给周奶奶带来的生日惊喜让她不敢置信,动容落泪? (图为上海音乐学院极客深情演唱歌曲) (图为机器人表演舞蹈) 实现噪声抑制 “智能语音交互”完成精准识别 第二环节中,极客们需要完成语音识别的终极挑战,找到30名合唱者中正在朗读的“捣蛋鬼”。 红队表示倍感压力,尽管团队中有着无人匹敌的“听音盲侠”李琦,但是他能否排除29个声源干扰,识别出“捣蛋鬼”的朗诵信息呢? 众所周知,语音识别技术对环境要求苛刻,在识别的准确率上受较多因素的影响,比如背景噪音、口音、语速、特定领域的专有名词等。蓝队带来的高密产品“麦克风阵列”对声层的空间特性进行采样及精密处理,智能对话机器人“小睿”搭配上这样得力的助手,能否突破人机交互系统中的难点,顺利识别并输出“捣蛋鬼”的语音信息,完成精准语音识别? (图为极客们进行语音识别挑战) 声纹识别:闻声识人 机器精准还是人类更牛? 声纹识别,是生物识别技术的一种,也称为说话人识别,有两类,即说话人辨认和说话人确认。不同的任务和应用会使用不同的声纹识别技术,如缩小刑侦范围时可能需要辨认技术,而银行交易时则需要确认技术。声纹识别就是把声信号转换成电信号,再用计算机进行识别。 本轮的挑战是“寻找嫌疑人”。现场将播放两位嫌疑人的声音,需要两队极客从十位目标人物中,采用声纹识别技术,找出两位嫌疑人。普林斯顿大学的极客们认为世上没有相同的两支声纹,机器人小睿将声音分析成两段声纹,再将获取的声纹与嫌疑人声音进行匹配验证,从而得到最准确的结果。上海音乐学院的极客们则有些担忧,这一轮挑战对于听觉方面的敏感度要求更高,因为声音的状态并非能一直保持稳定。而机器人小睿不仅运算速度快,而且不会被主观情绪所影响,这一轮胜率明显大于上海音乐学院极客队。观察员金铭却选择支持上海音乐学院极客队,她相信李琦能再次制造奇迹,给大家带来惊喜!上海音乐学院能否赢得这一分,李琦又能否如金铭所说再次惊艳全场? (图为极客进行声纹识别挑战) 随着科技不断发展,人工智能让我们有了更多可能,当机器能读取我们的信息,并很好的执行时,很多场景的人机交互方式将会被改变,更多适合的场景将会被挖掘出来。物联网时代已经成为继移动互联时代之后的下一个浪潮,而智能语音交互必定带给我们新的惊喜。就像英翼文化科技创始人余慧所说:“其实人跟机器并不矛盾,这丝毫不妨碍人和机器共同工作,我们的人心与科技心结合,一定会给整个世界带无尽的美好。” (本文编辑:实习杨茵茵) 转载请注明央视财经 原文章作者:央视财经,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-10
    最后回复 瑭剌 2020-1-10 15:59
    2406 1
  • 三星推出T7触摸便携固态硬盘,指纹识别
    今天,三星发布了其t系列便携固态硬盘的最新产品。三星便携SSD T7 Touch是一个外部存储驱动器,它的速度是三星T5的两倍(评测),而且它还首次配备了内置指纹传感器,以增强安全性。 新款T7 Touch的读取速度高达1050 MB/s,写入速度高达1000 MB/s,同时还保留了可携式总线驱动的外形,正是这一特点让三星的硬盘系列产品深受消费者欢迎。 三星T7 Touch将有500gb、1tb和2tb的存储容量。500gb版本的起售价为129.99美元,1tb和2tb版本的起售价分别为229.99美元和399.99美元。 T7触摸功能的USB- c接口,支持USB 3.2 Gen 2 10Gbps的连接。驱动器将支持向后兼容的接口,不支持更快的USB速度。 重量只有58克,尺寸为3.3 x 2.2 x 0.3英寸,T7 touch保留了前几代产品的小巧外形,很容易塞进衬衫或裤子口袋。 撇开那些规格不谈,这个新版本最大的问题是安全性;最值得注意的是,它首次包含了指纹传感器。 来自三星的新闻稿: 为了增加一层安全性,T7 Touch在密码保护和AES 256位硬件加密的基础上,为SSD带来了第一个内置指纹扫描仪。它还配有一个“动态LED”,用户只需扫一眼就能确定设备的状态。 T7 Touch有黑色或银色两种表面处理,有500GB、1TB和2TB三种尺寸可供选择,适用于各种各样的用例。为了确保无论用户在哪里都能获得可靠的连接,这款硬盘配备了USB Type-C-to-C线缆和USB Type-C-to-A线缆,并兼容Windows、Mac和Android操作系统。T7 Touch还包括一个为期三年的有限质保,制造商建议零售价(MSRP)为500GB的129.99美元,1TB的229.99美元,2TB的399.99美元。 三星指出,T7 Touch最多可以识别4个指纹,用于多人共享一个驱动器的情况。用户将能够通过将手指放在驱动器外壳上来快速访问锁定的数据。一个方便的LED指示灯将帮助用户快速确定驱动器是否处于锁定或解锁状态。 除了T7 Touch,三星还推出了一个没有指纹传感器的版本。这个驱动器,简单地称为便携式SSD T7,将在2020年第二季度推出。目前还不清楚T7的具体细节和价格,但它可能会比T7 Touch便宜。 就我个人而言,我是这些小驱动器的超级粉丝,当我用MacBook Pro工作时,我几乎每天都在使用它们。它们的规模、速度、构建质量、容量和可靠性是难以匹敌的。内置指纹安全是一个有趣的想法,运动LED功能听起来也很有趣。 不用说,我期待着亲身体验这个驱动。请务必在YouTube上订阅9to5Mac,观看本月晚些时候将发布的T7 Touch全面评测。 你的Mac电脑使用便携式固态硬盘吗?你怎么看三星进入其备受尊敬的便携式固态硬盘产品线的最新产品?在评论中说出你的想法。 原文章作者:酷玩儿,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-10
    最后回复 丁伙 2020-1-10 15:14
    2914 0
  • 中国的知名声纹识别技术厂商
    关键词:生物识别技术、声纹识别、声纹验证、语音识别、语义分析、语音交互、声纹密保、闻声识人、人脸识别 什么是声纹识别? 声纹(Voiceprint),是用电声学仪器显示的携带言语信息的声波频谱,是由波长、频率以及强度等百余种特征维度组成的生物特征,具有稳定性、可测量性、唯一性等特点。 人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理物理过程,发声器官–舌、牙齿、喉头、肺、鼻腔在尺寸和形态方面每个人的差异很大,所以任何两个人的声纹图谱都有差异。每个人的语音声学特征既有相对稳定性,又有变异性,不是一成不变的。这种变异可来自生理、病理、心理、模拟、伪装,也与环境干扰有关。尽管如此,由于每个人的发音器官都不尽相同,因此在一般情况下,人们仍能区别不同的人的声音或判断是否是同一人的声音。 声纹识别(VPR) ,生物识别技术的一种,也称为说话人识别 ,是从说话人发出的语音信号中提取声纹信息,从应用上看,可分为: 说话人辨认(Speaker Identification):用以判断某段语音是若干人中的哪一个所说的,是“多选一”问题;说话人确认(Speaker Verification):用以确认某段语音是否是指定的某个人所说的,是“一对一判别”问题。 得意音通技术 成立于2002年成立,北京得意音通技术有限责任公司是清华大学知识产权入股的高科技企业、中国人工智能产业发展联盟(AIIA)理事单位、互联网金融身份认证联盟(IFAA)理事单位,是拥有完全自主知识产权的声纹识别(VPR)、语音识别(ASR)与中文自然语言处理(CNLP)领域的技术研发商、产品开发商和服务提供商。得意音通在声纹识别这一被美国列为战略安全技术的领域居国际领先地位,可提供高安全、弱隐私、低成本的无监督身份认证服务。 中科信利 北京中科信利技术有限公司于2002年依托中国科学院声学研究所合作成立,是以开发智能语音技术为核心的高新技术公司。中科信利是国内第一家完全自主研发并拥有全部自主知识产权且实现了大规模商用案例的语音识别技术公司,是专业的语音核心技术和解决方案提供商。 声智科技 声智科技主要提供SoundAI Azero交互系统和平台服务,以及深度结合应用场景的人工智能技术和产品解决方案,并拥有声学矢量传感、声学阵列芯片、声学结构设计、远场声学处理、远场语音唤醒、远场声纹识别、远场语音识别、远场双工通话、场景语义理解、自然语音合成、超远场声学监控、局部场语音识别、分布场语音交互、深度学习与小样本学习、智能搜索与个性化推荐等自主核心技术。 厦门天聪 厦门天聪智能软件有限公司是一家成立于2005年的高新技术企业、公安部声纹识别行业标准制定单位,专业从声纹识别、语音技术和人工智能软件的研发和销售。天聪研发团队来自厦门大学、中科院等知名科研院所。 天聪公司是国内专业的语音声纹识别技术开发商,拥有软件著作权6项、授权和受理专利9项、科技鉴定成果1项、制定声纹标准1项。 国音智能(SpeakIn) 广州国音智能科技有限公司(SpeakIn),2015年诞生于美国硅谷,目前总部位于广州,作为以声纹识别等人工智能技术为核心的行业综合方案提供商,面向国家安全、公共安防、金融及互联网等领域提供专业的科技产品和大数据服务。SpeakIn的团队核心成员均来自哈佛大学、麻省理工学院、香港科技大学、香港中文大学、中国科学技术大学、微软亚洲研究院等国内外顶尖高等学府和科研机构。 VoiceAI Tech 声扬科技 深圳市声扬科技有限公司(英文简称“VoiceAI Tech”),以计算机听觉、大数据分析等前沿技术为核心的国家高新技术企业,拥有世界领先的声纹识别、语音识别等人工智能原创技术,可提供安全、高效、稳定的身份识别与智能语音综合解决方案,可广泛应用在金融、社保、公共安全、政务、物联网、智能硬件等多个领域。声扬科技的科研团队具有顶尖学术背景丰富,云集来自香港科技大学、香港中文大学、康奈尔大学、清华大学、中国科学技术大学、复旦大学、南开大学等一流院校的科学家与行业专家。 厦门快商通 厦门快商通科技股份有限公司成立于2009年6月,是一家专注于人工智能技术领域的高新技术企业,公司依托强大的大数据研发团队、人工智能技术团队以及机器人硬件技术团队,支持对各个行业进行人工智能的技术输出。公司在业务战略上推出的产品有面向公共医疗领域的智能导诊机器人、面向家庭的家庭医生机器人以及面向服务型企业、政府等领域的智能客服云平台。目前快商通以厦门为总部,在硅谷、深圳等地建立了分支机构。 AI大数据及人工智能服务平台:http://www.aideeptech.com 深入挖掘计算机视觉CV、智能物联网AIoT、机器人等人工智能技术及应用: 欢迎交流:18801218481 AI王 原文章作者:AI大数据及人工智能,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-10
    最后回复 陀喻 2020-1-10 15:09
    3520 0
  • 依图声纹识别竞赛夺冠?商汤、微美全息深耕互联网AI视觉
    近日,在奥地利召开的机器语音国际顶会 InterSpeech 2019 上,国际声纹识别权威竞赛 VoxCeleb Speaker Recognition Challenge(VoxSRC)公布最新结果,依图科技大幅领先海内外多支强队获得冠军,再次展示了世界级人工智能算法实力,充分表明中国声纹识别技术已达世界领先水平。 此次参赛队伍不仅包括约翰霍普金斯大学、法国国家信息与自动化研究所、清华大学、中山大学等海内外知名高校、研究机构,还包含平安科技、NEC、君林科技等各大企业。至此,依图人工智能技术不仅在视觉感知、自然语言理解等领域领跑全球,声纹识别技术也已达世界顶尖水平。 声纹识别是一种通过声音判别说话人身份的技术。如果说语音识别是让机器判断「说了什么」,那声纹识别就是判断「是谁说的」,用于解决生物身份的确认和识别。很显然,使用基于端到端深度学习的方法做声纹识别,拥有大量声纹数据样本,就有了无可置疑的优势。 声纹识别的应用前景非常广泛,比如智能手机锁屏、声控安全门、汽车声控锁等;利用声纹辨认技术,还可以支持智能音箱、智能语音助理等提供个性化服务,比如针对家里的老人和孩子,推荐不同的歌曲、新闻。 但由于声纹识别技术本身的难度很高,这些应用需求大部分还处在探索阶段。这也是到目前市面上能自动辨别说话人的智能语音应用比较少见的一个原因。 在声纹识别领域,VoxCeleb Speaker Recognition Challenge(VoxSRC)是兼具影响力和权威性的国际评测。与常规的声纹识别评测不同,VoxSRC所用的数据量大、来源多样,而且都采集自真实场景,比如会场访谈、室外多人对话,含有各种噪音和杂音,对于算法性能的要求非常高。此外,该竞赛的评估方法非常严谨,因此其结果在学术界和工业界都得到认可。 成立 7 年来,依图在视觉感知、自然语言处理、语音识别、智能决策等多算法领域发展,并且都独占鳌头。这次在全球声纹识别权威竞赛 VoxSRC 中夺冠,是对中国自有 AI 技术能够引领世界的又一个绝佳证明。 依图这次创下纪录的声纹识别精度水平,已经可以满足基本的智能声纹应用需求,比如在线交易支付的动态声纹密码、个人账户登录的声纹动态口令登录。试想,社保局安装声纹身份认证系统后,就能实现安全的远程身份认证,让“信息多跑路,群众少跑腿”,为百姓生活带来极大的便利。随着技术的不断成熟和融合,声纹识别技术将逐渐融入我们的日常生活,产生巨大的应用价值。中国自研的人工智能技术,也将持续推动和引领全球技术发展,力争成为行业标杆。 近年来,随着人工智能利好政策频出、AI技术逐渐发展成熟,在巨大的市场需求下中国AI产业迅猛发展。相关数据显示,2018年中国人工智能市场规模约为238.2亿元,增长率达到56.6%,2019年市场规模预计达到近280亿元。而在蓬勃发展的人工智能产业中,计算机视觉领域尤为火热,不单单依图的声纹识别优秀,商汤、旷视、WiMi微美全息的计算机视觉同样格外令人瞩目。 商汤科技成立于2014年,是国内一家致力于计算机视觉和深度学习原创技术的创新型科技公司,提供人脸识别、语音技术,文字识别,人脸识别,深度学习等一系列人工智能产品及解决方案,帮助各行各业的客户打造智能化业务系统。作为全球领先的人工智能平台公司,商汤科技为中国科技部指定的国家新一代人工智能“智能视觉”开放创新平台。同时,商汤科技也是“全球最具价值的AI创新企业”,公司总融资额超过16亿美元,估值超过45亿美元。 商汤科技的市场占有率居多个垂直领域首位,涵盖智慧城市、智能手机、互动娱乐及广告、汽车、金融、零售、教育、地产等多个行业。目前,商汤科技已与国内外700多家世界知名的公司和机构建立合作,包括美国麻省理工学院、高通、英伟达、本田、阿里巴巴、苏宁、中国移动、银联、万达、华为、小米、OPPO、vivo、微博等。 此次商汤集团智能视觉国家新一代人工智能开放创新平台将在四个方面发挥核心使命,包括通过超算系统、训练系统、智能视觉工具链等核心基础的研发、数据系统的构建,在基础研究和核心技术上与国际保持同步研发水平;实现智能视觉底层关键技术和共性支撑技术的突破,促进智能视觉技术与多行业的快速结合、产业赋能;建立人工智能国际化人才体系和培养国际化人才;通过人工智能赋能,创造以众创空间、孵化器为代表的大众创业、万众创新的生态环境,促进新旧动能转换。同时,商汤集团将成为助推粤港澳大湾区打造科技创新新高地,推动科技全球化布局的领导力量。 国内的另外一家以全息视觉为引导的企业微美全息,在AI视觉领域也是较为突出。微美全息专注于计算机视觉全息云服务,微美全息覆盖从全息计算机视觉AI合成、全息视觉呈现、全息互动软件开发、全息AR线上及线下广告投放、全息ARSDK支付、5G全息通讯软件开发、全息人脸识别开发、全息AI换脸开发等全息AR技术的多个环节,是一家全息云综合技术方案提供商。 微美全息十分注重底层技术的研发,凭借多年来在计算机视觉领域的耕耘与积累,微美全息已经完成了从0到1的技术沉淀、打磨,微美的AI视觉技术已经到了成熟落地,各项技术指标也达到了行业的领先水平。技术成熟后,微美着重规划了从1到N落地应用,其中机器人是规划中非常重要的一环。微美全息云产品布局商业应用场景主要聚集在家用娱乐、光场影院、演艺系统、商业发布系统及广告展示系统等五大专业领域。 微美的全息图像处理功能定期进行优化和改进,包括两项核心技术:全息AI面部识别技术和全息AI面部变化技术。由于视频处理和识别技术的发展,微美基于图像检测、识别、模板匹配、图像动态融合和替换的全息AR广告和全息成像服务目前在行业中处于领先地位。 微美云息技术研发以满足客户需求和自身业务发展为目的,以计算机图形图像处理技术为基础,AR全息技术为核心,各环节技术成熟。 此外,我国计算机视觉的发展与国外有着不同的应用市场。根据IDC市场跟踪,2018年我国计算机视觉技术输出规模最大的三个行业是政府、金融和互联网。而国外计算机视觉技术则主要输出于消费、机器人(及机器视觉)、智能驾驶行业。不过,有业内人士指出,随着我国计算机视觉的不断发展,其也将与更多行业进行全方位地深入融合,这意味着计算机视觉市场仍有巨大的潜力。 在此背景下,聚焦于计算机视觉领域的商汤、旷视、WiMi微美全息等企业将值得期待。与此同时,我国人工智能的发展也将围绕计算机视觉等核心领域展开,在人工智能相关政策的推动下,计算机视觉也将继续满足各行各业的需求,推动产业的转型升级。 原文章作者:财经科技热闻,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-10
    最后回复 烽腓 2020-1-10 15:09
    2578 0
  • 人工智能助力网络金融反欺诈,声纹识别受追捧
    我国金融业务下沉的同时,其风险也在不断扩张。各类金融机构,无论是银行、互联网金融平台,还是私募基金、保险等,都将面临愈发严峻的风控挑战。与此同时,基于新技术和新场景的诈骗手段不断升级,软、硬件攻击,社会工程学等方式并举,犯罪分子欺诈能力不断提升,欺诈方式更具专业化、智能化,欺诈手段迅速翻新。 在此背景下,反欺诈成为了金融系统中必不可少的一环。金融反欺诈覆盖多种不同的场景和业务。面对新技术、新业态催生的复杂环境,反欺诈也需要结合人工智能等新技术,有针对性地进行防范。 反欺诈工作中,识别用户真实身份是第一关,也是最难的一关。主流思路界更多的身份识别手段。本文将以此展开,对以声纹识别技术为主的人工智能金融反欺诈进行剖析。 为什么声纹识别可以应用于人工智能金融反欺诈? 声纹识别是通过对一种或多种语音信号的特征分析来达到对未知声音辨别的目的,简单的说就是辨别某一句话是否是某一个人说的技术。 理论上来说,声纹就像指纹一样,基本不会有两个人具有相同的声纹特征。声纹的独特性主要由两个因素决定,第一个是声腔的尺寸,具体包括咽喉、鼻腔和口腔等;第二个是发声器官被操纵的方式,发声器官包括唇、齿、舌、软腭及腭肌肉等,他们之间的协作方式是人通过后天与周围人的交流中随机学习到的,会逐渐形成自己的特征。 与其他生物特征相比,声纹识别的应用有一些特性: 1、蕴含声纹特征的语音获取方便、自然,声纹提取可在不知不觉中完成,因此使用者的接受程度也高; 2、获取语音的识别成本低廉,使用简单,一个麦克风即可,在使用通讯设备时更无需额外的录音设备; 3、适合远程身份确认,只需要一个麦克风或电话、手机就可以通过网路(通讯网络或互联网络)实现远程登录; 4、声纹辨认和确认的算法复杂度低; 5、配合一些其他措施,如通过语音识别进行内容鉴别等,可以提高准确率。 声纹识别金融反欺诈的最大优势:安全与便捷 上述特性,特别是其“非接触式”、“远程识别”的优势,使声纹反欺诈模型在诈骗防范上可以发挥重要作用。只需要一个麦克风或者电话和手机就可以采集用户声纹特征信息,完成身份认证。相比于指纹需要按压,人脸需要特定设备扫描,声纹识别技术可以更加方便地用来作为远程身份确认技术。 此外,相比于其他生物识别技术,声纹识别技术的“动态”特征使其在应用安全上独占优势。 每个人在说话过程中所蕴含的语音特征和发音习惯几乎是不可替代的,即使是模仿,也难以改变说话者最本质的发音特性和声道特征。因此与其他静态的生物识别方式相比,厦门快商通科技股份有限公司自研的声纹识别技术,不仅具有特定性,也具有相对的稳定性,它不容易丢失,可以做到“失声(音)不失身(份)”,伪造起来也更为困难,因而被认为认证强度更高、更安全。 而指纹、人脸等静态生理特征,并不能体现出个体的动态变化,因此很容易出现被盗用等安全问题。例如,当我们验证指纹时,构成指纹物理纹路的独特模式被传感器转换成数据后,这些数据可以被存储、共享,甚至修改,为不法分子盗用埋下了伏笔。至于人脸识别,大街小巷各种摄像头漫山遍野,手机拍照愈发清晰,面部生物特征随时都可能被获取。 声纹识别技术在金融反欺诈中的应用流程 声纹反欺诈模型的业务流程可以按照如下方式构建和进阶: 1、在登录申请环境中,快商通“声纹识别反欺诈解决方案”要求用户阅读一段固定的文字,搜集提取其声纹特征。此时可以逐步建立声纹白、灰、黑信用风险明单库。 2、后续客户再次登录时,用此次声纹与之前比对,判断是否是同一个人申请。如果声纹与库中声纹不一致,可以采取限制其登录app或增加验证策略,如人脸识别。 3、通过关系复杂网络技术进行关联人检验,识别并逐步建立金融机构声纹欺诈黑名单。在信审过程中,系统自动将该声纹与声纹欺诈黑名单库中的声纹做对比。这种方式与指纹识别相似,但机器合成的声纹,更容易被识别出来,不易伪造。 4、在积累到一定的声纹特征数据后,可以在信贷申请环节通过声纹识别匹配技术简化登录验证,用户只需按照系统要求读出随机数字,声音若与此前声音特征参数匹配,即可登录成功。 目前,声纹反欺诈已经在国内多家大型金融机构落地,平安集团、阳光保险集团、上海华瑞银行等均部署了快商通“声纹识别反欺诈解决方案”,在电话端实现远距离、高精度的身份认证与身份反欺诈。只需要一通电话,几秒钟时间就能远距离确定说话人的真实身份。 原文章作者:AI观察报,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-10
    最后回复 晖迢浪 2020-1-10 15:06
    1851 0
  • 屏下指纹识别不景气,屏内指纹识别能否翻身?
    集微网消息(文/木兮),据MoneyDJ报道,安全系数相对较高的屏下指纹识别近日也出现一些安全方面的问题,为此芯片厂商也在寻求妥善的方法加以解决。 对于其出货情况,MoneyDJ表示,由于2020年上半年的新机种都已完成设计,因此不论是光学式屏下指纹识别或是超声波屏下指纹识别供应商,在明年上半年都将会收到华为、三星、OPPO、vivo、小米等相应手机厂商的订单。 除此之外,在明年上半年屏下指纹识别将得以继续沿用的情况下,面板厂商也在持续开发新一代的In-cell內嵌型屏下指纹识别技术,也称为屏内指纹识别技术。和屏下指纹识别相比,屏内指纹识别将更轻薄、透明,并且其尺寸大小没有限制。 目前该指纹识别技术的主要研发厂商是中国大陆的箩箕OXI,采用天马a-Si TFT制程作出TFT光学感测器。除了箩箕OXI,其他芯片厂商和面板厂商也在进行着这一指纹识别技术的开发。 业界表示,最快将于今年底明年初便有厂商推出这一屏内指纹识别技术。 (校对/holly) 原文章作者:手机中国联盟,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-10
    最后回复 缪娅欣 2020-1-10 15:02
    1556 0
  • 闻声识人:声纹识别让金融安全听得见
    登录手机银行APP,开启声纹验证,用户只要准确说出随机动态码,系统录制语音信息,验证身纹及随机动态码后,就能进行转账、支付等交易。这是中国建设银行自2015年7月在手机银行和ATM上推出的声纹验证服务。该行首席信息官金磐石介绍,截至目前,声纹用户已突破100万,日均交易17万笔,未发生一例声纹识别风险事件。 “闻声识人”正在在移动支付领域拉开应用大幕。近日,中国人民银行正式发布了金融行业第一个生物识别技术标准《移动金融基于声纹识别的安全应用技术规范(标准编号:JR/T 0164-2018)》(下称标准)。该标准由中国建设银行、清华大学、北京得意音通技术有限责任公司(下称得意音通)等34家主要起草单位,历时3年完成。 清华大学信息技术研究院教授、得意音通创始人郑方认为,该标准的颁布,标志着以声纹识别为代表的生物特征识别技术首次得到金融监管部门的认可,形简意丰的语音信号可以为金融安全保驾护航,开启无监督情形下一种全新的“声纹 ”身份认证方式。 技术具有多重优势 什么是声纹识别?简单地说,就是通过声音进行说话人身份识别的过程。郑方解释,语音信号之所以被形容为“形简意丰”,是因为声音包含有内容、身份、情感、年龄及健康状况等丰富的信息。人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理物理过程,理论上说,每个人说话时的短时频谱特征、声源特征、时序动态特征、韵律特征、语言学特征等都有差异,因此声纹就像指纹一样具有唯一性和独特性。 2002年成立的得意音通是国内最早从事声纹识别技术研发的企业之一,当时这一领域的研究机构不到5家。近年来,随着移动金融市场的快速发展,其对安全认证技术的需求随之加大,加之声纹识别技术的不断发展,市场上涌现了不少投资声纹识别技术的企业。从目前应用来看,声纹识别主要分为声纹辨认和声纹确认两类,前者用以判断某段语音是若干人中的哪一个所说的,是“多选一”问题,已应用于公安技侦和国防监听等领域;而后者用以确认某段语音是否是指定的某个人所说的,是“一对一判别”问题,主要用于移动金融、社保生存认证、声纹锁控等领域。 随着投资界和产业界对声纹识别技术的投入加大,近年来该领域的专利申请也呈现快速增长态势。 2013年,得意音通提交了“基于动态密码语音的身份确认系统及方法”的专利申请(专利号:ZL201310123555.0),并基于该专利开发了“声密保”声纹识别系统。需要认证时,该系统会随机产生一组动态码(如6位或8位数字)要求用户朗读,系统对用户读出的声音进行语音识别并将识别的内容与发出的动态码数字进行比对,同时系统对用户的发音进行声纹比对,两种认证手段都通过时才判断通过。据介绍,通过核心专利和外围专利布局,得意音通围绕“声密保”建立了内外两层专利墙。 中国建设银行在手机银行和ATM上采用的声纹识别技术,就是得意音通的“声密保”方案。相比其他生物特征识别,业内人士认为,声纹识别具有多重优势:金融领域的很多应用场景都是高频使用,对用户体验方面的需求较高,如果验证方式较为繁琐,往往用户难以接受,声音信息一般不涉及用户隐私问题,声音采集通过一个麦克风或者电话、手机就可完成,用户的接受度比较高;更重要的是,声纹不易纂改,再加之声音信号中含有语言信息、副语言信息和非语言信息,综合利用声音中蕴含的丰富信息可以具备较高的安全特性。 标准助力应用推广 相比声纹识别,起步更早的人脸识别、指纹识别等的应用更为广泛,为什么移动金融领域会首先推出声纹识别标准呢? 郑方认为,这还是基于声纹识别技术在保障金融安全方面具有的技术优势。在一次标准专家评审会上,来自中央网信办、公安部、国家信息中心、国家信息安全研究中心、中国银联、中国金融认证中心、中国科学院、中国社会科学院、清华大学等单位的院士专家一致认为,“声纹识别技术在个人隐私保护、身份认证强度等方面有一定的优势”。 据了解,标准全面规定了移动金融服务场景中基于声纹识别的安全应用技术要求,适用于手机银行等移动金融服务中基于声纹识别的开发、检测与应用。随着国际上对移动支付安全性和个人隐私保护等问题的日益重视,标准也将安全性和个人隐私保护摆到了突出位置。标准明确了声纹注册、验证、变更、注销等环节的基本需求,提出了采样、抗噪音、防攻击、抗时变等技术要求,对声纹信息采集、传输、存储、处理、删除等全生命周期进行了规范。 值得注意的是,声纹识别应用也存在一些缺点,比如同一个人的声音易受身体状况、年龄、情绪等影响,具有时变性,同时也会存在有人通过录音或者人工合成的声音来假冒的情况,因此,抗时变和防攻击成为提高声纹识别技术的准确率和安全性的关键所在。在此次标准制定过程中,抗时变要求和防攻击要求都被写入了标准之中。郑方表示,这些都是企业研发的重点和难点。得意音通很早就开展了抗时变研究,并通过录音检测等技术,推出了防假体攻击的方案,但是随着人工智能合成技术和语音转换技术的发展,相关防攻击技术的研发还需不断跟进。 可喜的是,标准的制定为技术的推广带来了福音。郑方介绍,以前在向金融机构介绍声纹识别技术时,对于这一新技术,很多人不了解,也不知道应达到什么标准。有了这个标准之后,用户将有章可循。目前,除了建设银行外,浦发银行、民生银行信用卡中心、贵阳银行、兰州银行、西安银行等均已在手机银行中正式应用了声纹识别技术,中国银联也已经启动在其数据平台的身份认证模块中集成声纹识别功能。在互联网金融行业,中国互联网金融协会在其统一身份核验平台集成了声纹识别功能,蚂蚁金服在支付宝产品、腾讯在微信平台中也都开始应用声纹识别作为身份认证的安全手段。(刘 仁) 原文章作者:人民网,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-10
    最后回复 郏善芳 2020-1-10 14:46
    2325 2
  • 古代没有指纹识别,为什么还要摁手印
    我们经常可以在各种古装剧当中,看到有“摁手印”这种情节,一旦摁下了手印,那么就相当于完全承认了纸上所写内容的真实性,有什么差错都会被追究的。但是,古代并没有现在的指纹识别技术,他们又能通过指纹验证出什么?古人利用指纹的办法是什么,在没有指纹识别技术的古代,为什么还要用摁手印这种办法,来约束和管理呢? 众所周知,中国人口多达14亿人,而其中同名同姓的人也不在少数,但是我们的指纹都是独一无二的,没有任何人的指纹是完全相同。而且随着科技的发展,指纹识别技术对人们日常生活有着重要的影响。一开始这样技术只是用来帮助警察寻找罪犯,但是随着指纹识别技术的普及和应用,人们在生活中也经常会用到自己的指纹,现在的智能手机基本上都会有指纹解锁功能,但是大家可能不知道的是,其实指纹识别早在2000年前就已经在我们的先祖应用,老祖宗的智慧真不是吹的。 人们在看电视剧时,尤其是讲到古代罪犯或是买卖良田时,经常会看到一些按手印的行为,其实这就是古人利用指纹来识别人的身份的一种应用。虽然古代没有像现在这样先进的指纹识别技术,但是人们却用手手掌的方法来代替了,而且在古代读书识字人非常少,所以基本上许多人文化水平非常低,有些人甚至连自己名字都不会写,所以基本上唯一的画押方式也只能是用手掌或者用手指摁掌印或是指纹了。而且按了指纹之后,他们也非常重视,一般在地契房契等重要的东西上面都会有自己的指印。 其实早在先秦时期就已经有了按指纹的方式,当时官府的主要文件都是用竹简来编写,但是既然文件是官府的,许多文件就一定会有保密的要求,所以当时的人们为了能够保密,他们先会把写有文件的竹简卷起来之后再封口的地方加上粘土,然后在黏土上盖上印章,或者是自己的指纹。 在当时这样的保密方法是非常管用的,如果粘土上的印章或者指纹有所改变,说明文件的秘密也被泄露了,所以从此之后这种事指纹的使用方式也成为了识别一个人身份的标志。到宋朝时,甚至已经开始使用指纹来进行案件的审理工作。 既然指纹在古代就已经有了应用,但是那时候的人们没有指纹识别的科技,那么古人是怎么来识别指纹的呢?其实大家都知道人的指纹一般是不会改变的,所以在古代的时候人们就会对比两个指纹来进行观察,官府指纹上的纹路与本人的纹路是否相同,如果相同的话,就说明指纹是他的,如果不同的话,就另有其人。 而古代文件的保密工作也是根据这一原理来进行的,在宋代判案的时候,也是运用了这个方法,来审理案件,寻找犯人的。毕竟只要细心对比两个人指纹的区别,就可以分辨出指纹是不是犯人的,这是一种非常简单,而且非常直观的判断方式之一。 然后有时候一些指纹并不是完整的,所以聪明的先祖又想出来了一个更加简单而且有效的方法,那就是把犯人的指纹以及在犯罪现场获得的指纹,一起按在两张纸上。 之后把两张纸合起来之后,可以随机的撕成两半,拿其中的一半覆盖完整的指纹之上,如果这两份不同的指纹能够在纹路上相对接,那么就说明获得的指纹与本人的指纹是相同的,如果纹路不能够对接,那么这两个指纹就不是一个人了,这也就是古代验证指纹的方法。而在宋朝,提刑官宋慈,就是世界上第一个运用指纹进行破案的人,而他在他的著作《洗冤录》中就提到了如何能够运用指纹来进行断案的方法以及案例。 在欧洲最早提出指纹的人是英国的一位医生,他的1880年的时候发布了一篇著作,而在文中他指出了人的指纹会在玻璃杯等物体上面留下印记,而这些印迹就会成为破案的重要证据之一。但是他在发布这篇文章之后的100年,也就是到了上世纪80年代,英国的科学家们才正式给人类的指纹进行了编码,而这一编码才诞生了现代的指纹识别系统。 由此可见,我国运用指纹断案比欧洲等西方国家要早将近1000年,而且古代的先祖们运用这一技术虽然正确率并没有现在的这么高,但是也成功的减少了很多的冤案,足以看出祖先们的智慧。 原文章作者:历史空空,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-10
    最后回复 牌揍 2020-1-10 14:44
    2916 0
  • 古代没有指纹识别,为啥签字时还要按指纹
    如今的科学技术十分发达,在身份识别领域更是有诸多高科技助阵,凭借指纹就能辨别出一个人的身份,甚至一根头发一小块皮肤碎屑都可以拿来当证据,随着科技的进步,仅凭一张手部照片就能确定人的身份,因为有学者发现人手上的血管分布和指纹一样,每个人都不同。但是让人奇怪的是,在没有指纹识别的古代,古人在签字的时候,依然还采用画押的方式来确定身份,那这是为什么呢? 早在秦汉时期,古人就采用了封泥制来作为保密措施,当时重要的文书都写在木简上,在绳端或者交叉的地方封上粘土,然后盖上印章或者指纹,作为信验。这种保密方式非常可靠,而且用起来非常方便,是古人最常用的保密方式之一。在中国新疆米兰古城,出土了最早的一份唐代指纹契约文书,在落款处按有四个红色指印,其中一个指纹很清晰能清楚的看到嵴线。 古代按手印,虽然有一定的对比效果,但是总的来说并没有靠谱的方法来鉴别相似的指纹,而古人按手印的主要目的就是作为认可证明,古代的文化教育十分匮乏,很多人都不会写字,故此当有需要个人签字的时候,只有用按手印的方式来证明自己的身份,这就像是一种承诺,只要画押了基本不会有人抵赖。古代社会民风淳朴信誉对一个来说是十分重要的事,所以说有时候一个指纹就能要了一个农民的命。 在宋朝时期,官人就已经会用指纹来判案了,古人很早以前就发现,每个人的指纹都是不一样的,而且同一人的指纹不管画押多少次都不会改变。古人鉴别指纹的方式只有一种,便是用肉眼识别,大家都知道指纹有螺纹和非螺纹,这是最好区别的指纹,但是总会有一些难以用肉眼分辨的情况,就算是同一人,在相隔很长时间按下的指纹都会有一定的区别。尽管如此,指纹也是古代最好用的鉴别身份的方法,正确率还是挺高的。 原文章作者:猫不快乐,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-10
    最后回复 崎溜 2020-1-10 14:40
    2195 0
  • 什么是智能锁指纹识别的拒真率和认假率?
    http://5b0988e595225.cdn.sohucs.com/images/20191226/a20e325d180a4a3d9b7a863fbbeb5685.jpeg 此前公安部发布的拒真率和认假率标准是:拒真率应=<3%,认假率=<0.001%。而根据相关标准,家庭进户门用智能锁安全等级应当为3级,即拒真率< 0.1%,认假率=<0.001%。很多智能锁品牌宣传所用的指纹头分辨率也在大致在这个范围之内,具体的指标可能会有出入,但只要是品牌厂家的产品,用户体验基本不会相去甚远。 对于什么是智能锁的拒真率和认假率今天就分享到这里,希望能够帮助到大家。 原文章作者:门锁世界,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-10
    最后回复 噙周损 2020-1-10 14:32
    1429 0

快速发帖

还可输入 80 个字符
您需要登录后才可以发帖 登录 | 立即注册

本版积分规则

在本IOT圈子中寻找帖子
IOT圈子地址
[复制]
Weiot(威腾网)是一家以原创内容、高端活动与全产业渠道为核心的垂直类物联网产业媒体。我们关注新兴创新的物联网领域,提供有价值的报道和服务,连接物联网创业者和各种渠道资源,助力物联网产业化升级。
15201069869
关注我们
  • 访问移动手机版
  • 官方微信公众号

© 2014-2020 Weiot.NET 威腾网 北京微物联信息技术有限公司 ( 京ICP备20000381号 )|网站地图