请选择 进入手机版 | 继续访问电脑版
专注物联网产业服务
微信二维码
威腾网服务号
游客您好
第三方账号登陆
  • 点击联系客服

    在线时间:8:00-16:00

    客服电话

    17600611919

    电子邮件

    online@weiot.net
  • 威腾网服务号

    随时掌握企业动态

  • 扫描二维码

    关注威腾小程序

声纹识别
声纹识别
声纹识别,生物识别技术的一种,也称为说话人识别,包括说话人辨认和说话人确认。声纹识别就是把声信号转换成电信号,再用计算机进行识别。不同的任务和应用会使用不同的声纹识别技术,如缩小刑侦范围时可能需要辨认技术,而银行交易时则需要确认技术。
  • 乌镇世界互联网大会强调网络安全建设,快商通声纹识别实力助阵
    10月20日,第六届世界互联网大会在中国浙江乌镇开幕。主题为“智能互联,开放合作——携手共建网络空间命运共同体”。 乌镇世界互联网大会自2014年举办以来,每届大会议题都会聚焦网络安全。从“互联互通 共享共治”,到现如今的“智能互联,开放合作”,共同构建网络空间命运共同体的理念成为主线。 当前,网络安全和信息化是一体之两翼、驱动之双轮,是事关国家安全、国家发展和人民工作生活的重大战略问题。尤其是在城市中的各个关键信息基础设施、业务机构、终端设备不断有数据产生,数据中心与应用平台之间不断有数据的流转、共享,而网络威胁也无处不在。 在网络安全危害行为中,电信网络诈骗因其犯罪成本地、发生频率高、社会影响大,已经成为侵害人民群众切身利益的社会公害,坚持综合治理、源头治理,遏制电信网络诈骗犯罪高发势头,已成为社会各界共同努力的目标。 电信诈骗,是指通过电话、网络和短信方式,编造虚假信息,设置骗局,对受害人实施远程、非接触式诈骗,诱使受害人打款或转账的犯罪行为,通常冒充他人及仿冒各种合法外衣和形式或伪造形式以达到欺骗的目的,如冒充公检法,冒充商家公司厂家,国家机关工作人员,银行工作人员,各类机构工作人员,伪造和冒充招工,刷单,贷款,手机定位,招嫖等各种形式进行诈骗。 从2000年以来,随着科技的发展,电信诈骗迅速在中国发展蔓延,犯罪分子借助于手机、固定电话、网络等通信工具和现代的电信诈骗技术等实施的非接触式的诈骗,并迅速地发展蔓延,给人民群众造成了很大的损失。仅2008年北京、上海、广东、福建这四个省市因电信诈骗市民损失近6亿元。 针对这种非接触的诈骗行为,人脸识别、指纹识别等人们熟知的身份确认技术便显得有些鞭长莫及,并且它们并不能体现人的动态变化,很容易出现面部信息、指纹信息被盗用等安全问题。 而智能生物识别技术的另一分支——声纹识别,是一种在认证时无须双方接触的技术,具有远程非基础、识别可靠且迅速、采集成本低等优势。业内人士常说,声纹识别可以让骗子“失业”。 (快商通声纹识别金融反欺诈解决方案) 当声纹识别建立起强大的声纹库,人民在接听电话时可以通过声纹准确知道通话人身份;即便无法确定来电人身份但如同“来电标记”一样,通过在骗子的声纹中标记,该声纹无论换多少电话号码,加入多少处理都无可遁形,警方也可以迅速将其缉拿归案。 为此,公安部提出要深化声纹技术在网络安全工作中的应用,及声纹识别电信反欺诈建设,加强音视频舆情监测系统建设和互联网音视频监管系统建。 针对电信反欺诈建设,目前国内的厂商以快商通为代表。快商通电信反欺诈解决方案以布控、预警为导向,通过声纹生物特征与语音内容多维识别,结合与技术侦查、自动监听等技术,将各种通信及语音中的声纹特征及语音内容进行实时、远程、非接触式的主动识别,在包含电信和互联网范围内实行有效动态布控、预警,消除潜在电信网络诈骗风险。目前,快商通声纹识别电信反欺诈相关产品及解决方案已经能成功应用在公检法与金融机构之中。 在公检法领域,智能声纹数据采集终端+智能声纹识别系统+智能声纹鉴定专家工作站+声纹综合实战平台,是快商通“声纹识别与身份安全服务”的四大拳头产品,已广泛应用于公安、司法、戒毒、检察院、监狱等领域,协助相关机构进行重点人员监管、刑事案件侦破、反恐、身份查询与核验,强有效地打击遏制了犯罪,为社会公众筑起了一道牢固的安全防线。 在金融领域,快商通以“声纹反欺诈风控系统”为基础,通过建立金融黑名单声纹库,在信审等可能存在欺诈的节点中,利用声纹进行客户身份识别。当识别为黑中介、羊毛党等黑产,可及时提示、防范风险,有效防范金融欺诈。目前,该系统已率先服务于平安集团、交通银行、阳光保险集团、上海华瑞银行,落地国内银行、保险领域的大规模声纹反欺诈应用。 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于5 天前
    最后回复 盖孟乐 5 天前
    2809 0
  • 解锁支付动口不动手,华为申请“声纹识别”相关专利
    当前,指纹识别、面部识别解锁技术日渐成熟,并且运用非常普遍,声纹识别技术也在不断升级,只需要对着屏幕说说话,就能实现设备解锁,甚至支付等功能。 近日,华为技术有限公司与昆山杜克大学共同公开了一项名为“种声纹识别方法及装置”的专利,该专利公开号为CN112289325A,申请日期为2019年7月。 专利摘要显示,一种声纹识别方法及装置,用以解决现有技术中声纹识别方法鲁棒性低的问题。 该方法涉及人工智能等相关领域,具体包括:电子设备提示用户录入注册语音;电子设备采集用户录入的注册语音;电子设备基于注册语音生成远场条件下的样本语音;电子设备基于样本语音对声纹识别模型进行训练。 什么是鲁棒性问题?所谓鲁棒性也叫健壮性,是指计算机程序在多种意外输入、故障、错误等等条件下保持正常运行的能力。鲁棒性越高,程序的完善性越好。 今年1月12日,华为还公开过一项基于声纹的“语音支付”相关专利。该专利摘要显示,本申请提供了语音支付方法和电子设备。本申请实施例的语音支付方法,有助于提升语音支付的安全性,可以适用于人工智能终端等电子设备中。 上游新闻-重庆晨报记者 李舒 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-9
    最后回复 釜胚雩 2021-9-9 13:53
    4627 0
  • 鄞州银行:手机银行声纹识别功能上线
    9月8日,鄞州银行手机银行推出“声纹登录”功能,这是继“手势登录”、“指纹登录”后又一大用户体验优化之举,使得用户登录手机银行时,除了可以选择密码保护外,还可以设置“声音锁”,等于给账户上了一道双保险。 近年来,鄞州银行手机银行的登录界面不断升级,在历经手势解锁、指纹解锁阶段后,以个人生理特征作为登录密码的生物识别功能,已经逐渐成为了主流的身份鉴别手段。声纹识别就是通过辨识声纹特征识别说话人身份的过程。鄞州银行上线手机银行声纹识别功能,为用户带来更快、更准、更舒畅的登录体验。 王瑾 应迪 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-9
    最后回复 贰内鹅 2021-9-9 10:57
    4524 0
  • 机器如何实现听音辨人?
    https://p6.toutiaoimg.com/large/pgc-image/b81a36b2c8a44053908cc11d39efb1ef 每个人的声音各有不同,就算是双胞胎,也具有各自不同的特性。我们都有这样的经验,接电话时,如果是自己熟悉的人,只要对方“喂”一声,就能判断出对方是谁。 图1给出两个人发同一个字“绿”得到的声音音频可以看到,同样的声音由不同人发出来细节有很大差异,这些发音细节和说话人直接相关,因此通常杯形象地称为“声纹”。 图1:两个人发“绿”时的声音差异 https://p5.toutiaoimg.com/large/pgc-image/83f013f16c3243cbb4c22fa98e325ddb 利用不同人在发音上的个性化差异可以对身份进行验证,这一技术称为“声纹识别”。声纹识别有些独特的优势,如验证方便,无需接触,隐私暴露较少等,还可以结合发音内容来确认验证人的真实意图。智能语音中的声纹识别有广泛应用,例如在手机银行转账时,加入声纹验证可极大降低账户被盗用的风险;在智能家电中加入声纹认证可以让它表现得更智能(如可以按使用者偏好调节运行方式);在刑侦破案中,声纹可以用来对嫌疑人进行筛查,或作为辅助证据确认嫌疑人。 图2:空调上加入声纹识别可以让空调认“主人”。[1] https://p6.toutiaoimg.com/large/pgc-image/9a0d9ca9ec2046f996cde08d5a448c42 如何实现智能语音的声纹识别呢?传统方法一般采用特征提取-统计建模方案:首先提取和说话人相关的显著特征,再基于这些特征对每个人建立统计模型。近年来,研究界多采用深度学习的方法。这种方法通过收集大规模人群的发音数据,通过训练一个深度神经网络来提取与说话人相关的显著特征。这种方法一般具有更好的抗干扰能力,在实际应用中表现出更优越的性能。图3给出基于深度学习方法得到的不同发音人的特征,其中每种颜色代表一个发音人,每个点代表一个句子。可以看到,这一方法可以实现对不同发音人的较好区分。 目前,智能语音的声纹识别技术已经有一些商业化应用,但总体来说性能还有待加强,特别是复杂环境下(如远场、噪音、跨领域)的识别效果还有较大差距[3]。如果将声纹识别和其它生物认证技术(如人脸识别)进行结合,则有望显著提高认证的可靠性。 图3:利用深度神经网络可以对说话人进行较好区分。[2] https://p9.toutiaoimg.com/large/pgc-image/9e395e15b59248d5ac45df35ef511e47 语音之家助力AI语音开发者的社区 原文章作者:语音之家,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-8-25
    最后回复 檀悦征 2021-8-25 15:33
    3169 0
  • 无接触场景助推声纹识别 恒昌AI赋能数字化转型
    迈入“十四五”开局之年,数字科技已经成为驱动中国下一轮经济增长的关键引擎。“十四五规划和2035年远景目标纲要”明确要求“打造数字经济新优势”,将数字经济发展和数字化转型目标与作用提高到了国民经济的高度。在此背景下,云计算、大数据、人工智能、物联网、区块链等技术将加速赋能数字经济,各行各业也将步入“以数字化转型整体驱动生产方式、生活方式和治理方式变革”的数字经济时代。 数字科技的力量在疫情下得到印证,新冠疫情催热了“无接触经济”,以智能化、无人零售为代表的“无接触场景”成为主流。解码“无接触场景”背后的技术应用,生物识别技术中的声纹识别占有一席之地。疫情中契合“无接触”理念的声纹识别技术在防控上大展身手,伴随大数据、人工智能等前沿技术的加速落地,有望推动更多场景升级迭代。 声纹识别又称“说话人识别”,是一种通过从说话人发出的声音信号中提取声纹信息,把声音信号转换成电信号,利用相关算法进行身份确认的技术。最近两年,人工智能迎来快速发展,声纹识别技术日渐成熟,加之语音交互兴起带来大量数据沉淀,声纹识别有了更广阔的发展空间,在金融、公共安全等众多领域特定场景中加速落地。 在数字化转型“换挡提速”的关键时期,金融行业也在不断拓展数字发展空间。各类金融机构均着手利用最前沿的声纹识别技术,通过布局“非接触式”、“线上化”业务场景,提供智能、高效、安全的金融服务,增加内生动力和发展后劲的同时,推动行业转型升级。目前来看,声纹识别应用在金融领域取得快速进展,金融领域——人工智能先锋阵地的地位由此得到彰显。 比较典型的声纹赋能金融的场景包括:手机银行、反欺诈、信贷风控等。在移动端的登录、取款、转账等场景下,利用基于声纹识别的用户身份验证,能够达到提高金融服务安全性,提升用户体验的效果;黑中介主导的产业链式诈骗事件需要重点防范,借助智能、高效的声纹识别技术,弥补了传统身份验证成本高、安全系数低、效率低的不足,满足客观、全面的甄别要求;呼叫中心存在大量的语音实时对话流,声纹识别被引入电话客服系统中,能够快速确定客户身份,高效服务的同时提升客户体验感和满意度;在积累到一定的声纹特征数据后,通过声纹识别匹配技术,简化了信贷申请上的登录验证步骤,降低人力成本,精准进行身份核验,提前洞察潜在风险。 作为成立十年的金融科技公司,恒昌早在2017年就已经投身声纹识别领域,开始了相关方向的技术研发。2018年恒昌通过推出“图灵”声纹识别系统,加速布局声纹赛道。据悉,“图灵”在1:N主流声纹识别技术和平台的基础上自主开发,通过声纹特征工程、统计模型和深度学习,结合图谱的关联数据分析,重点解决声纹库识别准确率问题,同时防范外部通过技术手段对系统进行的攻击。通过高效应用“图灵”,恒昌开展业务时可有效识别身份造假、包装代办等一系列欺诈风险,数字化转型速度因此不断加快。 具体而言,“图灵”声纹识别系统的技术满足了金融服务所需的实时性、精准性、高效性。在吸收开源社区和声纹识别技术领域的研究成果基础上,“图灵”保留了文本无关声纹识别技术的实时性和便利性优势,采用了以深度神经网络为主的技术,相比较早期的人工智能技术,提高了预测假冒身份行为的准确性。同时运用统计模型、说话人声纹特征统一建模等方式,将声纹识别的重点从声纹确认转移到生产环境中较少关注的声纹辨认领域,以更好地满足反欺诈需要。目前,恒昌已形成庞大的声纹库,声纹比对和异常模式挖掘能够快速完成,系统识别声音准确率达到行业标准应用水平。 除了在生物识别领域取得建树外,恒昌也在金融科技的其他领域积淀深厚。发展中,恒昌确立了涵盖机器学习、自然语言的处理和理解、深度学习、知识图谱等技术在内的金融科技ABC发展战略(A即AI人工智能、B即大数据和区块链、C即云计算),将科技创新持续用于各业务流程,确保数字化转型蹄疾步稳 。 未来,伴随科技革命和产业变革日新月异,人工智能驱动数字化转型的新势能将愈发强劲,恒昌也将众“智”成城,持续以科技之力,建立广度链接、深度赋能,创新多元化场景、服务更多用户,推动业务高质量发展,开启下一个黄金十年里数字化转型新征程。 原文章作者:聚集新财经,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-8-17
    最后回复 抹截 2021-8-17 23:09
    2643 0
  • 1000次智能客服用声纹识别阻击“信贷欺诈”
    “先生,您好,我们将再次验证您的身份,请说出您收到的随机短信验证码。” 近日,一名自称刘XX的人在马上消费金融股份有限公司(下称马上消费)平台申请消费贷款,在提供了身份信息后,被该公司智能电话客服要求念随机短信验证码。 根据要求,刘XX随即念完了验证码。但下一秒,他却傻眼了——智能客服那不带任何感情的声音再次响起——“对不起,您并非借款人本人,借款申请无法通过审核。” 这是一次马上消费的内部测试。测试中,由于真正的刘XX身份信息被“不法分子”获知,他不知不觉中成了“信贷欺诈”的受害者。所幸的是,他上次在马上消费借款后,留下了一段录音。而这段录音,成为了智能客服挫败“不法分子”骗局的关键。 “据研究,声纹与指纹具有相似性——基本不会有两个人具有相同的声纹特征。而声纹识别,则是根据待识别语音的声纹特征,识别该段语音所对应说话人的过程。”马上消费相关负责人解释,相对于近年来流行的人脸识别、指纹识别,声纹识别具有采集用户声纹特征信息、完成身份认证更方便的优势。金融机构客户只需远程通过手机或信贷平台说一段话,即可完成声纹采集或声纹验证。 实际操作中,马上消费会在征得客户同意的前提下,引导用户通过朗读指定内容进行声纹注册。而后,当客户在线上申请贷款时,智能电话客服会发短信验证码让其说出来,以验明真伪。其声纹识别的准确率,高达97%。近1年多来,在该公司逾千次的内部测试中,声纹识别技术成功阻击了逾千次“信贷欺诈”行为。 近年来,不法分子利用智能化技术破解金融机构的智能风控系统,给金融机构的人脸识别、指纹识别等风险防控手段,带来严峻的挑战。面对挑战,马上消费投入大量人力研究声纹识别技术,力图构建更加牢固的反信贷欺诈“防火墙”。2019年11月,我们成功研发出声纹识别技术,打算经测试后用于贷款风险防控等领域。 原文章作者:二三里资讯重庆,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-8-16
    最后回复 罗燕岚 2021-8-16 18:34
    1388 0
  • 机器声纹会是下一个蓝海吗?
    机器声纹创业正酣 自2015年起,国内外开始涌现出一批聚焦机器声纹领域的创业企业,国外有Augury、3D Signals等,国内则以硕橙、谛声、华控智加、联智、湃方为代表,各公司基本信息如下表所示。若从参保人数粗略看各公司规模,湃方及硕橙相对较大,君林、华控智加、谛声次之,联智和迅声最小。有意思的是,国内这波机器声纹创业公司里,清华系占了大多数,7家中有4家是清华团队,2家是中科院系。 公司 成立时间 发展状态 人数 技术来源 湃方 2018/9 A轮 56 清华电子系 硕橙 2016/9 B轮 52 清华机械工程系 君林 2016/11 股权融资 39 中科院 华控智加 2018/5 股权融资(天使轮后) 28 清华电子系 谛声 2017/7 股权融资(A轮后) 25 中科院 联智 2018/2 A轮 15 清华电机系 联丰迅声 2018/4 Pre-A 11 西北工业大学 注:表中人数是公开资料获取到的“参保人数”,与公司实际员工数有一定滞后。统计范围包括:母公司、子公司(占股50%以上)和分公司。 声音手段用于工业的优劣势 这一波人工智能创新浪潮,在工业领域的应用已经走向深入,但声音手段是新近发生的事情。机器声纹是指通过声音手段,依托“声学照相机”和“工业听诊器”等产品,监测工业设备运行状态,在故障发生前或发生后及时提供预警或报警信息,解决过维护和欠维护问题,以降低工业设备运行维护成本,保证工作人员的安全。 声音信号具有丰富的信息量,在很多视觉、触觉、嗅觉不合适的场合下,具有独特的优势:一是可以实现更细微的信号监测,提前发现更小的故障信息,实现预警,真正做到预测性维护;二是可以实现非接触式的数据采集,避免了光线昏暗、振动大、高温等复杂环境数据采集的困难。 但声音应用于工业领域也有先天不足之处。一是工业现场环境复杂,对声音信号的采集、处理带来更大困难。如一些运转设备在工作时温度较高,若采用接触式信号采集,则对传统的阵列设计提出了更高要求,并且工业设备自身运转时带有巨大噪声,周围通常也会有其它设备干扰,要采集到有效信号更加困难。二是当前人工智能技术对标注数据有极大的依赖,而真实的设备运行故障数据少、采集难度大、周期长、标注困难,为模型训练带来极大挑战。 软硬一体化是解决方案的标配 进入机器声纹领域还有一个门槛,就是软硬件一体化能力。在7家企业中,仅联智没有公开的硬件相关产品,其它公司都有涉及,其中湃方甚至涉足了芯片。 公司 核心产品 湃方 湃星核:边缘AI芯片湃星象:一站式工业AI算法管理分发平台湃星尘:多维工业智能物联平台湃星云:设备管理服务软件平台 硕橙 机器听诊大师 前端硬件:橙盒后端软件:实时识别并统计机器运转状态 君林 智能声学检测分析系统((端+云)) 工业声学传感器定制化声音采集方案工业声纹算法模型云端的大数据分析系统 华控智加 工业设备健康与安全监护系统 设备:嵌入式边缘芯片+智能算法信息:振动+声音+多传感器特征:细微特征提取+多域特征建模:融合物理机制的深度神经网络 谛声 硬件系统:分布式高精度同步采集系统振动声学联动诊断软件系统终端产品:动车走行部异音监测系统、变压器故障监测系统、声像仪 联智 智能诊断平台-电脑端:实现设备故障的精准监测与设备状态的全局管理智能诊断平台-手机端:注重便捷性,易用性的设备管理工具 联丰迅声 空气声呐-麦克风阵列电子哨兵-声振一体传感器系统音频分析-Xslab核心库 主要应用领域 目前机器声纹的应用领域主要集中在电力、石油、钢铁等。各企业公开的行业案例分布情况如下表所示: 公司 应用领域 湃方 石油、钢铁、电力、化工、水务、石油 硕橙 烟草、日化、汽车、产品质检、钢铁、电力、水务、石油化工、工程机械、工业车辆、船舶设备、目标探测 君林 电力、港口设备、自动生产线、电梯设备 华控智加 电力、石化、地下管廊 谛声 汽车/家电质检、交通(动车)、电力、智能安防 联智 钢铁、机泵、船舶设备 联丰迅声 煤炭、火电、钢厂、石油 机器声纹企业专利分布 下表统计了7家机器声纹公司的专利申请情况(注:包含非机器声纹领域的专利),以初步评估各家的创新基础和能力。从专利数量看,湃方最多,智加、硕橙、联智和君林相当,迅声与谛声较少。 若只统计发明专利数量,则湃方和智加相当。可以发现,硕橙、联智的专利中,发明占比相对较少,以实用新型和外观为主。因此,若从发明专利角度看,湃方与智加的创新基础更“硬核”。 公司 申请日 专利名称 类型 状态 湃方 2020/11/26 一种高效的卷积神经网络运算指令集架构及装置、服务器 发明 公开 湃方 2020/10/12 一种边缘智能SOC处理器、电子设备 发明 公开 湃方 2020/10/12 一种旋转型设备运行正异常状态分析方法、装置 发明 授权 湃方 2018/4/8 一种应用于卷积神经网络的处理器 发明 授权 湃方 2019/12/4 机械设备异常检测的边缘检测模型构建方法及装置 发明 实质审查 湃方 2019/12/11 一种用于机器状态监测诊断仪的智能网关、方法及系统 发明 实质审查 湃方 2019/11/25 非标机械设备的运行状态检测方法及装置 发明 实质审查 湃方 2019/5/27 卷积计算加速方法和装置 发明 实质审查 湃方 2019/6/6 基于多模态数据的异构旋转型机械异常检测方法及系统 发明 授权 湃方 2020/6/3 一种无线网络中异常设备识别方法及装置 发明 公开 湃方 2020/6/3 无线网络中假冒DHCP服务器或网关的识别方法及装置 发明 公开 湃方 2020/6/3 一种无线网络中设备识别方法及装置 发明 公开 湃方 2019/12/20 机器状态监测诊断仪 实用新型 授权 湃方 2020/5/14 机器状态监测诊断仪 外观 授权 湃方 2020/5/14 机器状态监测诊断仪 外观 授权 湃方 2019/12/24 机器状态监测诊断仪的防爆网关 实用新型 授权 湃方 2019/12/4 一种数据迁移方法及装置 发明 实质审查 湃方 2019/11/22 一种数据增广方法及电子设备 发明 实质审查 湃方 2019/5/31 一种旋转型机械设备状态监测方法及设备 发明 实质审查 湃方 2019/5/22 旋转设备状态监测方法及装置 发明 实质审查 湃方 2019/5/22 旋转型机械设备健康状态监测方法及装置 发明 实质审查 湃方 2019/5/28 一种旋转型机械设备启停判断方法及系统 发明 实质审查 湃方 2019/5/23 一种旋转型机械设备工况检测方法及设备 发明 实质审查 湃方 2019/5/22 旋转型机械设备异常检测方法及装置 发明 实质审查 君林 2020/5/29 一种远场拾音的降噪麦克风阵列 实用新型 授权 君林 2019/3/26 一种基于音频特征的状态检测方法、装置及设备 发明 公开 君林 2019/3/26 一种用户画像构建方法及装置 发明 公开 君林 2019/8/30 一种低功耗的智能门锁 实用新型 授权 君林 2019/8/29 智能麦克风 外观 授权 君林 2017/9/8 一种智能家居控制系统及控制方法 发明 授权 君林 2018/1/17 账户信息的分组方法、装置及支付方法、装置 发明 实质审查 君林 2017/12/20 一种文字校验方法及装置 发明 实质审查 君林 2017/12/20 一种将语音转换为文字的方法、装置及系统 发明 实质审查 君林 2019/1/22 一种声纹识别的轴承故障检测方法及装置 发明 实质审查 君林 2017/9/8 一种智能语音设备及其控制方法 发明 公开 君林 2017/9/8 一种智能语音设备及其控制方法 发明 公开 君林 2017/9/8 一种智能语音设备 实用新型 授权 君林 2017/5/12 一种多媒体流的生成方法及装置 发明 实质审查 硕橙 2018/6/19 一种产量监测方法及装置 发明 授权 硕橙 2020/2/17 设备运转周期检测及健康度分析方法、装置及存储介质 发明 实质审查 硕橙 2018/8/27 设备健康度监控方法、装置、计算机设备及可读存储介质 发明 授权 硕橙 2019/5/29 一种屏蔽外界噪音的多挡位净化器质量检测系统 实用新型 授权 硕橙 2016/11/20 一种利用可再生能源的自支持加氢站 发明 授权 硕橙 2018/6/28 包装盒 外观 授权 硕橙 2018/7/30 一种自动唤醒与休眠的低功耗声音采集设备 实用新型 授权 硕橙 2018/5/11 声音采集器的外壳(硕橙) 外观 授权 硕橙 2018/8/3 一种生成训练集的方法及装置 发明 实质审查 硕橙 2018/6/30 一种手持式故障检测设备 实用新型 授权 硕橙 2018/6/28 一种基于lora传输的机电设备监控系统 实用新型 授权 硕橙 2018/6/19 一种空压机故障监测系统 实用新型 授权 硕橙 2018/6/14 手持式故障检测仪 外观 授权 硕橙 2017/9/4 一种用于机电设备的预测性维护系统 实用新型 授权 硕橙 2016/11/4 一种微波管集成监控系统 实用新型 授权 硕橙 2016/11/16 一种基于互联网数据采集的情绪指数构建方法 发明 实质审查 硕橙 2016/11/20 一种利用可再生能源的自支持加氢站 发明 授权 智加 2020/3/18 一种用于机械设备故障监测的无线通信声音采集器 实用新型 授权 智加 2020/3/18 一种用于机械设备故障监测的有线通信声音采集器 实用新型 授权 智加 2020/4/14 一种基于三级神经网络建模的机器故障预测诊断方法 发明 实质审查 智加 2020/4/14 一种基于神经网络统一建模的磨煤机故障诊断方法 发明 实质审查 智加 2020/4/14 一种基于深度神经网络的磨煤机磨辊的磨损量计算方法 发明 实质审查 智加 2020/4/14 基于神经网络统一建模的机器故障检测、分类和定级方法 发明 实质审查 智加 2017/3/3 基于DNN模型和支持向量机模型的说话人个数估计方法 发明 授权 智加 2017/3/31 一种基于数字口令与声纹联合确认的用户身份验证方法 发明 授权 智加 2017/1/18 基于密度峰值聚类和变分贝叶斯的说话人标记方法与系统 发明 授权 智加 2019/8/2 身份验证的方法、装置、计算机设备及存储介质 发明 实质审查 智加 2017/5/23 一种基于多帧频谱和非负矩阵分解的语音增强方法与装置 发明 实质审查 智加 2017/1/17 一种基于二次建模的说话人识别方法 发明 授权 智加 2014/2/19 一种具有自定义功能的音频检测分类方法 发明 授权 智加 2010/8/30 基于重音突显度的英语发音质量评价方法 发明 授权 智加 2009/12/10 嵌入式系统的汉英双语语音识别方法 发明 授权 智加 2010/11/29 一种分布式非同步声传感器的声源空间定位方法 发明 授权 智加 2010/11/29 一种分布式麦克风的说话人聚类方法 发明 授权 智加 2008/3/17 计算机辅助语言学习系统中的发音质量评价方法 发明 授权 谛声 2018/12/28 滚动轴承故障实时监测方法 发明 实质审查 联智 2020/7/10 一种鼓风机预测性维护设备 实用新型 授权 联智 2020/7/10 一种变压器预测性维护测试系统 实用新型 授权 联智 2020/7/7 一种数控机床预测性维护标准测试床 实用新型 授权 联智 2020/7/7 一种用于离心泵的预测性维护系统 实用新型 授权 联智 2020/7/7 一种空压机故障监测系统 实用新型 授权 联智 2020/7/10 一种可进行预测性维护的减速机测试台 实用新型 授权 联智 2020/7/10 一种基于物联网的工业设备维护管理系统 实用新型 授权 联智 2020/7/7 一种往复泵预测性维护调试系统 实用新型 授权 联智 2020/7/10 一种多设备混联预测性维护系统 实用新型 授权 联智 2020/7/7 一种用于机电设备的预测性维护系统 实用新型 授权 联智 2018/9/14 一种用于铁路货车轴承早期故障诊断的装置 发明 公开 联智 2018/9/14 基于震动和噪声采集的故障诊断分析装置 发明 公开 联智 2018/9/14 一种电机设备故障诊断的运营维护系统 发明 公开 联智 2018/8/8 一种声纹识别用训练数据集仿真获取方法及其获取装置 发明 实质审查 联智 2018/8/17 一种用于无需说话人确认文本的神经网络嵌入系统 发明 实质审查 迅声 2020/4/22 一种皮带机异常声音检测装置 实用新型 授权 迅声 2020/4/22 一种分布式皮带机异常声音检测方法 发明 实质审查 迅声 2019/6/24 一种同轴同中心的声像联合定位装置 实用新型 授权 迅声 2019/11/8 一种非接触式工业异常声音检测方法 发明 实质审查 迅声 2019/5/8 一种分布式声像联合校准定位方法 发明 实质审查 迅声 2019/5/8 一种基于卷积神经网络的汽车鸣笛识别方法 发明 实质审查 迅声 2018/11/23 一种基于支持向量机的汽车鸣笛分类方法 发明 实质审查 迅声 2018/11/22 一种基于匹配场的空气声呐定位方法 发明 实质审查 迅声 2018/11/23 一种汽车鸣笛智能检测方法 发明 实质审查 机器声纹企业软著分布 虽然软著申请相对简单,但也能反映出企业的活跃程度,从这个角度来看,智加、硕橙、湃方和联智是相对较为活跃的。 公司 登记批准日期 软件全称 软件简称 湃方 2019/10/29 一种用于嵌入式系统的神经网络编译器软件 嵌入式神经网络编译器 湃方 2019/10/29 智能泵机无线网关软件 - 湃方 2019/10/11 湃方数据采集工具软件(IOS版) 数据采集工具 湃方 2019/10/11 I2Analyzer智能泵机分析软件 I2Analyzer 湃方 2019/10/11 湃方星云数据采集平台 湃方数据采集 湃方 2019/10/9 湃方星云节点管理平台 湃方星云 湃方 2019/10/9 湃方星象算法管理平台 湃方星象 湃方 2019/8/8 一种嵌入式深度学习加速器的编译器软件 STICKER工具链 湃方 2019/12/16 LIMS设备在线诊断云平台(iOS版) 湃方星云2.0(iOS) 湃方 2019/12/16 机器状态监测诊断仪智能网关软件 - 湃方 2019/12/16 LIMS设备在线诊断云平台(android版) 湃方星云2.0(Android) 湃方 2019/12/16 湃方星链设备管理平台 湃方星链(starchain) 湃方 2019/9/10 智能泵机无线边缘终端健康状态监测软件 - 湃方 2019/8/7 LIMS智能泵机在线云平台(iOS版) LIMS平台 湃方 2019/8/7 LIMS智能泵机在线云平台(android版) LIMS平台 湃方 2019/7/9 LIMS智能泵机在线云平台 LIMS平台 君林 2018/12/19 君林麦克风软件 - 君林 2018/6/28 录音采集软件(安卓版) - 君林 2018/6/21 声脸管家软件 声脸管家 君林 2018/6/21 君林声纹软件(IOS版) 君林声纹 君林 2018/6/21 智能数码研发平台 - 君林 2018/6/20 数字音频管理平台 - 君林 2018/6/20 君林声纹软件(安卓版) 君林声纹 君林 2018/6/20 录音采集软件(IOS版) - 硕橙 2021/2/7 机器听诊大师设备健康度检测APP系统 健康度检测APP 硕橙 2021/2/2 云平台演示系统 云平台 硕橙 2021/2/2 硕橙科技官网系统 官网系统 硕橙 2021/2/2 设备健康度监测系统 监测系统 硕橙 2021/2/2 算法进程控制系统 算法系统 硕橙 2021/2/2 server-manager后台系统 SM后台系统 硕橙 2020/9/15 信息综合管理平台 综合管理平台 硕橙 2020/9/15 本地特征值展示软件 本地特征 硕橙 2020/6/4 机器听诊大师系统 机器听诊大师 硕橙 2019/11/19 硕橙盒子系统监控软件 盒子监控 硕橙 2019/11/13 更新历史数据服务系统 - 硕橙 2019/9/23 微信小程序版机器听诊大师状态监控软件 机器听诊大师 硕橙 2019/9/17 硕橙科技内部数据查看软件 内部数据查看软件 硕橙 2019/9/17 Sucheon Supervisor质检软件 Supervisor 硕橙 2019/9/17 Sucheon Multichannel质检软件 Multichannel 硕橙 2019/9/17 本地数据存储服务系统 本地数据服务 硕橙 2018/12/10 数据分析结果展示系统 数据分析 硕橙 2018/11/29 硕橙设备管理系统 设备管理系统 硕橙 2018/11/15 硕橙科技官网后台管理系统 后台管理系统 硕橙 2018/11/15 机器听诊大师服务器管理台系统 管理台系统 硕橙 2018/11/15 自定义策略负载均衡系统 自定义负载 硕橙 2018/11/15 盒子数据展示软件 盒子展示软件 硕橙 2018/11/15 微信小程序版机器听诊大师状态监控软件 监控小程序 硕橙 2018/10/9 Sucheon SC-box云管理系统 云管理系统 硕橙 2018/9/18 数据接收服务器和算法服务器系统 数据服务器系统 硕橙 2018/9/18 机器听诊大师状态监控软件 - 硕橙 2018/9/18 硕橙盒子全国分布软件 - 硕橙 2018/9/18 机器听诊大师开放数据接口系统 - 硕橙 2018/6/5 机器听诊大师数据服务器管理监控系统 - 硕橙 2017/1/6 微波管集成监控系统 - 智加 2021/3/22 多声纹引擎识别结果融合平台 - 智加 2021/2/5 多语音系统融合平台 - 智加 2021/2/5 多语音引擎融合平台 - 智加 2021/2/4 多声纹引擎融合平台 - 智加 2020/9/8 大规模声纹库系统软件 - 智加 2020/9/4 语音增强引擎软件 - 智加 2020/9/4 情绪识别引擎软件 - 智加 2020/9/4 高性能计算云平台系统软件 - 智加 2020/9/4 智能呼叫中心系统软件 - 智加 2020/9/4 人机语音交互系统软件 - 智加 2020/9/4 音字对齐引擎软件 - 智加 2020/9/4 综合智能语音处理系统软件 - 智加 2020/9/4 智能呼叫中心系统软件 - 智加 2020/9/4 语音变声引擎软件 - 智加 2020/9/4 自然语言处理软件 - 智加 2020/9/4 语音检出引擎软件 - 智加 2020/9/4 性别识别引擎软件 - 智加 2020/9/4 人机语音交互系统软件 - 智加 2020/9/4 语音转换引擎软件 - 智加 2020/9/4 音频事件检测引擎软件 - 智加 2020/9/4 语音命令词识别引擎软件 - 智加 2020/9/4 语音合成引擎软件 - 智加 2020/9/4 航空语音识别系统软件 - 智加 2020/9/4 声纹识别引擎软件 - 智加 2020/9/4 高性能计算云平台系统软件 - 智加 2020/9/4 语种识别引擎软件 - 智加 2020/9/4 工业设备健康与安全监护系统软件 - 智加 2020/9/4 语音评测引擎软件 - 智加 2020/9/4 唤醒词识别引擎软件 - 智加 2020/9/4 口语评测系统软件 - 智加 2020/1/6 高性能音频指纹引擎软件 音频指纹 智加 2019/8/6 高性能说话人标记引擎软件 说话人标记 智加 2019/5/6 AT-KWS语音关键词识别系统 语音关键词识别 智加 2019/3/13 重复音检测(加密狗)软件 重复音检测 智加 2018/7/17 AT-VP声纹认证系统 - 智加 2018/7/17 AT-ASR语音识别系统 - 谛声 2019/1/17 中科东韧多通道麦克风信号同步测试插件系统 - 谛声 2019/1/17 中科东韧分布式声像仪远程WEB管理平台 - 谛声 2019/1/17 中科东韧工业设备故障预警及智能诊断系统 - 谛声 2019/1/17 中科东韧智慧交通违法鸣笛执法APP平台 - 谛声 2019/1/17 中科东韧低空小型慢速飞行目标声源测向及定位系统 - 谛声 2019/1/17 中科东韧智慧交通违法鸣笛车辆定位系统 - 谛声 2019/1/17 中科东韧声场噪声三维快速成像软件 - 联智 2020/7/13 联智科技设备告警信息管理系统 - 联智 2020/7/13 联智科技工业旋转设备故障诊断系统 - 联智 2020/7/13 联智科技lora传感器信息采集系统 - 联智 2020/7/13 联智科技后台数据管理系统 - 联智 2020/7/13 联智科技传感器信息管理系统 - 联智 2020/7/13 联智科技振动数据处理系统 - 联智 2020/7/13 联智科技数据分析可视化系统 - 联智 2020/7/13 联智科技用户信息管理系统 - 联智 2020/7/13 联智科技产品维护及售后服务系统 - 联智 2020/7/13 联智科技故障诊断app软件 - 联智 2020/7/13 联智科技工业旋转设备故障诊断系统 - 联智 2020/7/13 联智科技振动数据处理系统 - 联智 2020/7/10 联智科技故障诊断微信小程序平台 - 联智 2019/10/25 联智科技设备预测性维护维护平台 - 联智 2019/10/25 联智科技设备预测性维护计算平台 - 迅声 2020/6/3 一体化声像仪软件 XSAC 迅声 2020/1/15 一体化改装车噪声抓拍系统 IMCNCS 迅声 2020/1/3 工业异常声音检测软件 IASDS 迅声 2019/8/28 一体化鸣笛抓拍系统软件 I-Klapture 迅声 2019/7/31 声音采集识别定位软件 XSLAB 迅声 2019/7/8 迅声云环境声音数据平台 XSYESD 迅声 2019/1/22 多通道空气声呐采集定位软件 MCASL 伪命题还是新蓝海? 机器声纹未来如何?有持怀疑态度的,认为这是个伪命题,也有非常看好的,认为是下一个蓝海,各公司也都处于产品化探索的过程中。但资本已经用“钱”进行了第一轮的投票,2020和2021年各家公司均获得了数千万甚至过亿元的融资,至少迈出了星辰大海第一步。 名称 发展状态 机构股东数 最新融资额 披露日期 湃方 A轮 8 数千万元 2020/3/10 硕橙 B轮 9 近亿元 2020/9/24 君林 股权融资 7 千万级 2021/1/5 华控智加 股权融资 6 未披露(天使轮2000万) 2020/1/16 谛声 股权融资(A轮后) 11 未披露(A轮6000万元) 2021/2/22 联智 A轮 11 数千万元 2020/7/17 迅声灵智/联丰迅声 Pre-A 2 数千万元 2021/4/8 巨头们也来应战了 智能语音行业一片红海,看到新的蛋糕,巨头们当然也想分一杯羹。比如科大讯飞在2020年10月发布的顺风耳-图聆工业互联网平台,据称已经在电力、煤炭、水利等能源领域成功应用。如电力领域已在国网浙江、国网安徽、国网重庆等多处变电站部署、运行,现场实时捕捉开关蓄能、操作刀闸放电、变电站异常操作、环境异常声音等并及时进行报警,为客户提供智能化的预测性维护解决方案。 京东也联手中联重科打造了泵送机械AI专家诊断系统,把AI语音识别和人机交互等应用在工程机械故障排查领域。 联合监测及数据分析才是根本 综合来看,声音技术应用于工业依旧存在很多困难需要克服,将其作为一个创新点或工业转型的切入点是非常好的,但试图以声音为单一监测手段,可能解决不了“大问题”。要想在这个市场上站稳脚跟,必然需要延伸采集多类数据,进行联合建模,结合大数据分析能力和人机耦合能力,才能解决切实的工业痛点,真正实现落地。 我们想知道你的看法 你还关注机器声纹的哪些方面?还有哪些机器声纹企业这里没有论述到?你认为机器声纹会是下一个蓝海吗?欢迎留言或邮件(voicehood@outlook.com)了解更多信息,共话行业发展。 原文章作者:语音江湖,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-8-4
    最后回复 裘谦 2021-8-4 22:42
    1106 0
  • “声纹鉴定”让拒不认罪的毒贩低头认罪
    涉嫌贩毒团伙成员到案后 拒不交代犯罪事实 “零口供”判案背后 警方抽丝剥茧 调出团伙成员手机里微信语音 借“声纹鉴定”零口供断案 湖北襄阳这起贩卖毒品案 最终得以圆满告落 1 贩毒团伙露端倪 2017年 老河口市公安局民警根据线索摸排 一名绰号叫“老千”的男子 多次在襄阳地区进行毒品交易 不仅交易量大且“货源”供给稳定 办案民警很快就意识到 其背后肯定隐匿着一个贩毒团伙 遂立即组织警力开展调查 经查实这名叫“老千”的男子原名黄某 他与同乡及同学李某常年吸毒 为了解决吸毒花销 两人便通过襄阳同乡郭某牵线搭桥 结识武汉籍毒贩“秋秋” 定期从“秋秋”处购买毒品 在襄阳地区贩卖 警方循线追踪 发现从“秋秋”处购买毒品的襄阳籍毒贩 不仅有黄某、李某 还有贺某等人 至此,一个以“秋秋”为首的 贩毒团伙开始浮出水面 2 80条微信语音突破“零口供” “获取确凿充分的证据 是办理涉毒案件的关键所在!” 但该团伙成员到案后,拒不交代犯罪事实。 民警制定多种审讯计划 但效果均不理想 致使案件办理停滞不前 民警决定转变取证方向 欲从视听资料入手锁定证据 几经搜索,反复试听 从团伙成员手机微信中 找出八十多条与本案有关的语音 经多方协调联系 深圳市公安局物证鉴定中心派出专家 对微信语音进行声纹鉴定 鉴定结果—— 所提取的语音均出自7名犯罪嫌疑人 毒 2020年10月19日,襄阳市中级人民法院对“2018.01.02”贩卖毒品案集中进行宣判,丁某秋、程某“零口供”被判处死刑,缓期两年执行;周某、李某、黄某、郭某“零口供”被判处无期徒刑;贺某“零口供”被判处有期徒刑十五年。一审宣判后,原审被告人不服判决提起上诉。近日,湖北省高级人民法院作出驳回原审被告人上诉,维持原判的终审判决。至此,“2018.01.02”贩卖毒品案成功告落。 声纹鉴定 声纹鉴定是运用语言学、语音学、生理学、心理学、物理学、计算机科学和统计学等学科的相关知识,通过对证据声音 ( 或渉案声音 ) 和已知声音进行听觉和频谱两方面特征的比对别和综合分析,确定二者是否出自同一声源,或者对证据声音 ( 或涉案声音 ) 进行听觉和频谱两方面特征的综合分析,确定声音或声源的性质,为审判活动提供证据、为侦查活动提供线索的一种专门技术手段。 声纹鉴定在实际办案和诉讼中的应用 01 在获得了嫌疑人的语声录音资料时,如在电话中进行的恐吓、勒索,或在其他性质的案件中录到了相关嫌疑人说话的声音,那么可以通过收集嫌疑人语音样本进行声纹鉴定,为认定或否定嫌疑人提供鉴定结论。 02 通过语音分析,判断说话人的性别、年龄、方言(生活地区)特征,为侦查工作提供方向和范围。 03 声音伪装行为造成诈骗等名誉侵犯,通过声纹鉴定辨别真伪。 04 网络主播违反合同,跨平台进行节目直播,从而产生的纠纷,可以做语音同一性鉴定。 05 人身攻击、诽谤谩骂、威胁恐吓,收集相关语音,通过声纹鉴定巩固证据。 06 在发生纠纷时诸如合同纠纷、经济纠纷、遗嘱纠纷、婚姻纠纷等,注意收集语音证据,通过录音资料辨识、话者同一性认定,形成有效证据。 【来源:中新网湖北、湖北禁毒】 欢迎关注中国禁毒:微信号onncc626 48人落网!三亚警方跨区域作战破部督毒案 这不是电影!这,是缉毒民警的日常! 国家禁毒委员会办公室提醒您: 珍爱生命 远离毒品 投稿邮箱:zhongguojindu@qq.com 原文章作者:中国禁毒,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-7-28
    最后回复 房榕 2021-7-28 23:03
    1788 4
  • 鼻纹、静脉、虹膜……奇奇怪怪的生物识别技术有哪些?
    ? 现在,假设你养了一只狗,你们如胶似漆,交情过硬。那么,给你二十张同品种小狗的鼻子照片,你能一下子找出你的爱犬吗? 你可能要花费一段时间,也可能经受不住考验。不过,现在有能迅速分辨出你的爱犬的技术:鼻纹识别。 https://p1.pstatp.com/large/pgc-image/900b3d46fae74050be14fcf8e0a63c16 ? 宠物鼻纹识别示例 图源:网络 像人的指纹一样,宠物的鼻纹也具有唯一性和不变性,并且同一只小狗的鼻纹不会随着长大而改变,是犬类最具代表性的生物体征。主人只需打开具有鼻纹识别技术的软件,对准犬鼻拍照,系统即可自动检测并录入数据,生成犬只专属的“电子身份证”。 既然鼻纹也能作为身份识别依据,那么,眼睛、嘴巴、耳朵……我们还能从哪里获取生物识别特征? ● 你能想到的,可能都有 所谓生物特征识别技术,即通过计算机与光学、声学、生物传感器和生物统计学原理等高科技手段密切结合,利用人体固有的生理特征和行为特征来进行个人身份鉴定的技术。 ? 生物特征识别种类概览 图源:网络 生理特征包括:指纹、静脉、掌型、视网膜、虹膜、人体气味、脸型、血管、DNA、骨骼等;行为特征包括:签名、语音、行走步态等。从头到脚,从四肢到躯干,几乎你能想到的,都有生物特征可供提取。 目前,市场上应用领域最广的两种识别技术为指纹识别和人脸识别。因二者具有较高的技术易用性,在安全级别上可以满足日常使用且成本适中,故应用最为广泛。而除此之外,奇奇怪怪的生物特征识别技术还有很多。 ? 指静脉智能锁示意图 图源:网络 静脉识别,即使用近红外线读取静脉模式,再与存储的静脉模式进行比较,从而对个人进行身份鉴定。静脉识别又分为指静脉识别和掌静脉识别,前者反应速度快,后者安全系数更高,但二者都具备精确度高、活体识别的优势。 由于静脉隐藏于皮肤内部,并且只有流动中的血液才可吸收特定波长光线、形成清晰的图像,所以,假手模型或手部图像是无法通过静脉识别的。可以说,静脉识别是“指纹识别2.0”,不仅克服了传统指纹识别速度慢的缺点,也不受手部表皮状态影响,还无需接触。目前,静脉识别主要应用于门禁和安防系统。 ? 虹膜识别原理示意图 图源:网络 虹膜识别,即使用特定的摄像器材对人的整个眼部进行拍摄,并将拍摄到的图像传输给虹膜识别系统的图像预处理软件,经过虹膜定位、虹膜图像归一化以及图像增强后,系统提取特征点并对其进行编码,最后将特征编码与数据库中的虹膜图像特征编码逐一匹配,判断是否为相同虹膜,从而达到身份识别的目的。 虹膜在胎儿发育阶段形成,除非遭遇重大创伤,否则其在整个生命历程中保持不变。因此,虹膜识别技术适用于具有高度保密需求的场所,如银行、监狱、煤矿单位等等。 ? 声纹识别流程示意图 图源:网络 声纹识别,即提取并选择对说话人的声纹具有可分性强、稳定性高等特性的声学或语言特征,把声信号转换成电信号,再用系统进行识别。但目前,声纹识别存在较多问题,一方面,人们的语音声学特征具有变异性,病理、模拟、伪装都有可能干扰识别准确度;另一方面,该技术的模式匹配问题仍需解决。 声纹识别包括说话人辨认和说话人确认。我们在登陆微信时使用的声音锁功能,即运用了说话人确认技术。尽管目前使用场景受限,但这项技术表现出了高度的视障者友好特征,未来也将在与声控技术的结合方面发挥更大潜力。 除了以上这些识别技术,人耳识别、步态识别、签字识别……越来越多的生物特征资源被挖掘了出来,相应的识别技术已经投入了实际应用。可以说,“你”就是你的身份证明。 ● 技术会翻车吗? 东方财富证券2020年发布的《电子设备行业专题报告》显示,2019年全球生物识别行业规模已达200亿美元。在这个迅速扩张的技术领域,准确率一直是避不开的评判标准。 ? 近十年全球生物识别行业规模及增速 图源:中商产业研究院、东方财富证券研究所 前段时间,“AI智障”收获了不少嘲讽。把猫识别成狗、把手指比的圈识别成眼镜,又或者把公交车上的广告牌人像认作不走斑马线的行人,除去网友调侃的成份,识别技术确实常有小失误。 https://p1.pstatp.com/large/pgc-image/1059a0697dec42b4aee29ac5d931b859 ? 把猫识别成狗的“人工智障” 图源:网络 但更严重的翻车也已经出现了。今年4月,美国密歇根州底特律一名42岁男子Robert Williams将底特律警察局告上法院,原因是先前因为人脸识别错误,他被当成小偷抓捕,并且在拘留所待了30个小时才被放行。 经历重重关卡、通过一环环技术筛选出来的结果,大概率比人先进,但也有一定概率会翻车。一项技术的发展势必会经历一次次失败和调试,在正视技术误判的后果之余,除了回溯原因,我们的目光也应该向前瞩望。 宠物鼻纹识别为犬只身份做了背书,不文明养犬、宠物走丢等问题将得到更有效的解决,进而推动犬只治理与智慧城市建设;老龄化越发凸显,声纹识别技术将满足随之增长的语音操控需求,未来人群生活便利度将获得提升——正是在一次次可能翻车的担忧或反思中,技术走向了更远处。 ● 万物可识时代,珍惜你的“身体” 当越来越多的生物特征可以被识别时,我们也就越来越“暴露”。 众所周知,现在去售楼处看房最好蒙面……因为藏在角落里的摄像头会识别人脸,以此区分客户是中介带看还是售楼处销售人员带看,进而决定是否支付中介佣金。 https://p1.pstatp.com/large/pgc-image/6ae67393bb7b437a90098f934a0641a4 ? 男子戴头盔看房 图源:@新浪财经微博视频截图 我们面向摄像头展露的五官,我们的写字和走姿习惯,都渐渐成为我们的身份印证。物联网已成现实,越来越多的事物正在或将要被纳入数字网络中。在享受便利的同时,我们也要珍惜自己的“身体”,保护好属于自己的生物特征数据。总之,在摄像头和传感器面前,该保持神秘还是得保持神秘。 ? 原文章作者:闪马智能,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-7-28
    最后回复 伏林楠 2021-7-28 21:52
    2469 0
  • 面部识别之后,声音能成为新的密码吗?
    在前不久的苹果 WWDC 2019 全球开发者大会,有一项更新可能很多人没太多关注,那就是 HomePod 加入了声纹识别功能,可以通过声纹识别特定的用户。 最近也有消息称 Siri 也将加入声纹识别,当你说出「Hey Siri」的时候,Siri 可以知道是不是主人在喊它。这或许并非只是传言,毕竟去年苹果就曾在官方技术博客上发文,披露了关于 Siri 的声纹识别技术细节。 所谓声纹识别(Voiceprint Recognition),简单来说就是通过声音来识别说话的人。因为每个人的发声器官、语言习惯、发音大小、频率等的差异,所以每个人声纹图谱都是独一无二的,就像指纹一样,是可以用于密码认证的生物特征识别技术。 那么我们在经历从指纹识别到面部识别后,声音是不是会成为新主流密码认证模式呢? 虽然目前声纹识别还没在智能手机这样的消费级产品中普及,但其实在银行交易和国防安全等领域已经广泛应用。 据外媒 This is Money 报道,巴克莱银行、汇丰银行、哈利法克斯银行等多家英国银行目前都支持声纹识别,据悉在英国有 300 多万银行客户使用声纹识别系统来登陆他们的银行账户。 ▲ 图片来自:This is Money 你可能没想到,最青睐这项新技术的人群居然是老年人。一些银行表示老年的注册人数激增,因为声纹识别让他们不用记住密码,也降低了被欺诈的可能性。 英国汉普郡一位退休音乐教师 Michael Wallis 曾经被骗子盗取账户信息后从账户里转账,银行建议他使用声纹识别技术, Michael 目前已经用声纹识别来进行了 100 多次交易和查询余额,他表示这让他更加放心。 ▲Michael Wallis. 图片来自:This is Money 据称这些银行采用的声纹识别技术还能识别出声源是否是录音,以防止骗子通过录音来欺骗系统。不过这项技术目前还是存在一些问题,比如 Michael 反馈在喉咙痛或感冒时系统有时会识别不出他的声音。 而且跟面部识别一样,声纹识别还是不能很好区分双胞胎。BBC 一名记者让自己的非同卵双胞胎兄弟模仿他的声音登陆他的汇丰银行账户,在第八次的时候成功了。 ▲ 图片来自:Science 随后汇丰在对 BBC 的回应中表示,双胞胎的声纹的确很类似,但不可否认声纹识别技术的引入大大减少了欺诈行为,而且已经证明比一般的密码要安全。 今年 4 月,汇丰银行宣布自 2016 年推出声纹识别以来,已经有 160 万客户使用了 1500 万次,这套系统还阻止了价值 3.3 亿英镑的银行诈骗,未来还可能通过声纹帮助警方抓捕那些难以追踪的诈骗者。 ▲ 图片来自:Consumer Reports 除了英国,荷兰、澳门和中国一些银行都相继引入了声纹识别系统。早在 2004 年美国加州的 BeepCard 公司就推出了支持声纹识别的信用卡,这种信用卡只有在识别到用户的声音后确认身份后才能正常操作。 其实声纹识别技术最早的大规模应用是在国防安全领域,据 The Intercept 报道,美国国家安全局(NSA)2006 年 1 月的机密备忘录显示,NSA 分析员通过一种「用声音识别人的技术」,在音频文件与电话监控中识别出一位间谍。 这里面所用到显然就是声纹识别技术,而且由于 NSA 的特殊地位,得以建立一个庞大的声纹库,进一步提高了识别效率,即使监控对象使用的是未知号码或者不同的语言,算法都可以与声纹库的数据匹配。 一家向军事和情报部门提供声纹识别技术的公司 Nuance 表示,他们可以建立一个全国范围内的生物声纹识别系统,能从数百万个声纹快速且准确地识别出一个人的声音。目前 Nuance 的声纹识别技术还应用到了银行交易、车遭语音助手等领域。 现在类似的声纹识别技术也被应用到更多消费级产品,最为常见的就是智能音箱,亚马逊的 Echo,苹果的 HomePod 和阿里的天猫精灵都已经支持,而且国人最常用的微信其实在 2015 年就推出了基于声纹识别技术的声音锁。 不过消费电子产品领域,大多数消费者对于声纹识别技术的接受度还不高。比如上线了 4 年微信声音锁,有不少用户吐槽识别率不高,而且安全性也有待提高。据新京报报道,乱读、读错或播放录音都有可能打开微信声音锁,随后微信方面也承认「确实存在一定的隐患」。 这也是声纹识别技术在消费级领域还不够成熟的一个体现,清华大学语音和语言技术中心主任郑方在接受媒体采访时表示: 目前在声纹识别这个领域,不同技术或产品提供商参差不齐、差异很大;与此同时,声纹识别不再是单一强调准确性,而是变得更为成熟、完备和可用。如果声纹识别技术在智能手机和众多应用中普及,还可能引发更多关于隐私的问题。这意味 app 通过「偷听」我们的话来给我们进行个性化推荐有可能成为现实。 去年 Facebook 的一项新的专利就可以在远程激活手机的麦克风,从而对用户的对话和周围环境音进行录音,然后将数据传回 Facebook 进行分析。 尽管有许多问题需要解决,但不可否认声纹识别确实有着更广泛的应用前景。生物特征认证技术已经被认为将取代各种明文密码,而声纹比起其他声纹特征也有着特殊的优势,除了更加安全和方便,语音的采集和识别的成本也比面部识别要低,其实更加适合用于密码认证。 Gartner 等调查机构曾预测未来语音将取代屏幕,尽管现在看起来还很遥远,但以亚马逊智能音箱为代表的产品已经让语音搜索市场份额不断提升,或许声纹识别成为主流身份认证模式那一天,不会太远了。 题图来自:Twitter 原文章作者:爱范儿,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-7-25
    最后回复 五仓获 2021-7-25 11:07
    2426 0
  • 中国首份声纹识别产业发展白皮书-清华大学人工智能研究院
    原文章作者:田钦宇,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-7-23
    最后回复 向望慕 2021-7-23 22:16
    3163 0
  • 马上消费再获权威认证助力声纹识别产业健康发展
    近日,马上消费在中国信息通信研究院(以下简称“中国信通院”)举办的“可信AI成果发布会”上荣获“声纹识别服务能力基础评估证书”,是唯一一家入选的金融机构。这标志着马上消费的科技创新能力获得权威机构认可,同时在稳定性、服务可靠性等方面已跻身业界先进水平。 据悉,为引导声纹识别产业健康发展,增强用户对声纹识别产品选择可信度,中国信通院开展了第三方评估测试工作,整个评测工作拥有权威的测试数据集和软硬件环境,具有高公信力和高影响力。 此次入选的产品是马上消费自主研发的声纹活体识别与身份核验系统,在中国信通院开展的声纹识别服务能力基础评估中,成功通过功能验证评估、基础性能评估、应用性能、服务指标四项评测指标,进一步彰显了马上消费高质量、合规的产品和服务。 声纹识别是根据待识别语音的声纹特征识别该段语音所对应说话人的过程,目前已经广泛应用于金融、安防等领域。相对于人脸识别和指纹识别,声纹识别拥有着更高的技术门槛。随着声纹识别更多的场景被挖掘,拥有自研能力的金融机构将在风口中崛起、抢占先机。 作为科技驱动型金融机构,马上消费在已经取得众多科技成果的基础上,将根据市场需求持续精进自主研发能力,为客户提供更优质的产品,并助推行业服务创新,加快企业数字化转型的步伐,为构建精彩纷呈的金融新时代、智能新未来贡献力量。 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-7-20
    最后回复 乔雅娴 2021-7-20 14:31
    3760 0
  • 【语音之家】ai技术沙龙——声纹识别
    由CCF语音对话与听觉专委会 、中国人工智能产业发展联盟(AIIA)评估组 、北京希尔贝壳科技有限公司、语音之家(北京)科技有限公司共同主办的【语音之家】AI技术沙龙——声纹识别,将于2021年7月17号 9:30在线上直播进行。 沙龙简介 做为人类的生物特征之一“声纹”,在刑侦、安防等场景有着广泛应用。每一个人的生理发音器官都有差异,任何人的声纹特征都是独一无二的。声纹识别技术通常用于解决“谁在说话?”的问题,但是依旧面对一些例如发音人个体的生物特征变化、环境噪音等问题的挑战。“文本相关”和“文本无关”是说话人识别的两个系统分类,通过声纹特征准确判断说话人的信息已经在声学以及语音分析技术中被使用,在多人对话场景中对说话人语音内容的准确识别也起到很重要的应用。声纹识别的技术已经应用到人们日常生活的各个角落。 主持人 吴本谷 标贝科技 AI数据技术负责人 参会嘉宾 洪青阳 厦门大学副教授、天聪智能创始人 分享内容:声纹识别研究现状和开源工具 摘要:声纹识别又称说话人识别,可用来判断用户的身份,在人机交互中起着越来越重要的作用。近几年来,声纹识别技术的发展迅速,在工业界也有越来越多的应用,但仍面临着短语音、噪声干扰、快慢语速和错误标签等诸多挑战。报告将对国内外前沿技术做个综述,然后重点介绍厦大团队的研究进展,包括针对文本相关任务的音素多任务学习、迁移学习,针对错误标签的前后端优化工作。报告还将介绍开源工具ASV-Subtools的最新进展以及实验室其它成果。 嘉宾简介:洪青阳,厦门大学副教授,天聪智能创始人,全国人机语音通讯会议(NCMMSC)常设委员,公安部安防行业标准(SAC/TC100/SC2)委员。主要研究方向为声纹识别、语音识别,先后主持国家自然基金2项,科技部创新基金2项,省杰出青年基金1项,已发表论文60篇以上。2014年8月,参与制定的公安部第一个声纹识别行业标准发布实施。2014年底,主持研发的大规模声纹检索系统分析语音超过10万小时。2015年,主持研发的社区矫正声纹识别系统应用到江苏、广东、辽宁、广西等十三个省市。2018年3月起,研发针对语音唤醒的声纹识别技术,已成功应用于华为手机、耳机等终端产品。2018年11月,带领厦门大学xmuspeech团队在第三届“东方语言语种识别竞赛”获得第一名。2019年1月,成功研发闽南语识别和合成系统。2019年起,研发的语音识别技术应用到司法、电力、证券等行业。2020年6月,出版专著《语音识别:原理与应用》。2020年起,研发的说话人分割聚类技术应用到语音质检等场景中。2020年11月,担任第二届声纹识别研究与应用学术研讨会共同主席。 王 东 爱丁堡大学博士、清华大学副研究员 分享内容:声纹识别--等错误率背后的真实性能 摘要:近年来,随着深度学习技术的发展,声纹识别取得显著进步,在SITW, VoxSRC等测试集上已经获得了接近或低于3%的等错误率。然而,直到目前为止,声纹还没有像人脸一样得到广泛应用,研究人员对声纹的推广也持审慎态度。测试数据与实际性能的差异启发我们思考当前评测方法的合理性,并探讨声纹识别本身的基础困难。最近,我们发布了多场景声纹识别数据库CNCeleb,并基于该数据库对复杂真实场景下的性能进行了若干研究。研究结果表明,当前声纹识别技术可能还无法满足复杂场景下的性能要求,多场景、跨场景、场景泛化是未来声纹识别研究面临的一个主要困难。 嘉宾简介:王东,爱丁堡大学博士,清华大学副研究员,人工智能研究院听觉研究中心副主任,IEEE 高级会员,长期从事语音语言相关技术研究,在领域主要杂志和会议上发表论文150余篇,著有《人工智能》《机器学习导论》《语音识别基本法》等著作。 李 明 昆山杜克大学电子与计算机工程副教授 分享内容:面向复杂场景的高可靠性声纹识别及其关联任务研究 摘要:首先描述面向复杂场景的声纹识别这一具有挑战性的任务;其次介绍实验室在远场声纹识别领域的近期研究成果;最后,扩展到多个使用声纹编码的语音关联任务的工作,如特定人唤醒,特定人合成与变声,特定人分离等。 嘉宾简介:李明, 昆山杜克大学电子与计算机工程副教授, 大数据研究中心研究员, 武汉大学计算机学院兼职教授, 博导, 第十五批江苏省六大高峰B类高层级人才。2005年获南京大学通信工程专业学士学位, 2008年获中科院声学所信号与信息处理专业硕士学位, 2013年毕业于美国南加州大学电子工程系, 获工学博士学位。2013-2017年任教于中山大学卡内基梅隆大学联合工程学院及电子与信息工程学院,副教授,博士生导师。2018年加入昆山杜克大学, 研究方向包括智能语音处理, 多模态行为信号分析等方向。 已发表学术论文130余篇,现担任IEEE语音及语言技术委员会委员,中国计算机学会语音对话与听觉专委会委员,中国人工智能学会人工心理与人工情感专委会委员, APSIPA 语音及语言处理专委会委员,IEEE学会高级会员。担任Interspeech2016,2018及2020说话人语种识别领域主席。 带领团队于2011, 2012, 2019三次获得了INTERSPEECH Computational Paralinguistics Challenge子任务第一名,ASRU19 阿拉伯语语种识别第一名, interspeech20 fearless steps 说话人识别第一名, interspeech21 fearless steps 说话人识别及说话人日志第一名,获得IEEE DCOSS2009最佳论文奖,ISCSLP2014最佳学生论文奖。2016年被授予IBM Faculty Award,2018年被授予ISCA 5年最佳期刊论文奖,2020年被授予教育部第八届高校科学研究优秀青年成果奖。 沙龙议程 参加方式 https://wx.vzan.com/live/tvchat-1749577780?v=1626143958099#/ 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-7-14
    最后回复 桓静慧 2021-7-14 15:28
    1518 0
  • 美国收集声纹,俄罗斯核潜艇如裸泳,最终酿成灾难,中国必须警惕
      这些年,中国渔民在捕捞作业时,经常会打捞出一些奇怪的东西。有球形的,有圆柱形的,漂浮在我国附近海域的航道上。这些东西正是外国军舰或者反潜机投掷的,探测我国潜艇声纹的装置。   别看这些探测器都是一次性的,却价格不菲,再加上专门的,声学探查船,为了获取我国潜艇的声纹,美国和日本每年的花费甚至多达数亿美元。   声纹是什么?有什么重要意义,值得美日投入这么大人力物力?   声纹就像人的指纹,就是潜艇在水下航行的时候发出的特定声音波动,因为每艘潜艇的体积结构不同,所以声纹也各不相同。   即使是同一型号的潜艇,在建造过程中也会因为细微的差异,从而产生不同的声纹。这就使潜艇的声纹跟人的指纹一样,具有唯一性。   只要中国的潜艇经过附近海域,这些布设的探测器就会收集声纹特征,通过长年累月的检测,建立起潜艇声纹库。   以后再遇到这艘潜艇,只要跟声纹库一对比,就能立刻得知潜艇的国别、型号,是敌是友,战斗力如何。   正所谓,知己知彼百战百胜。   一旦声纹暴露,就等于把我们的底牌提前展现在对手的眼前,而我们对敌人仍一无所知,还没正式交手,就已处于被动。   尤其是核潜艇,对于国家安全具有非凡意义。一旦声纹暴露,将更容易被敌人的反潜作战单位有针对性的搜索,暴露的概率将大大提升。   曾经震惊世界的,俄罗斯库尔斯克号核潜艇事故,起因就是由于声纹暴露!   库尔斯克号核潜艇,隶属于俄罗斯海军北方舰队,是世界上最大的攻击型核潜艇,其水下排水量高达1,39万吨,最大潜深300米,搭载22枚花岗岩导弹,18枚重型高速鱼雷。   1995年服役的库尔斯克号核潜艇,是当时世界上噪音最小的潜艇,能以30节的速度在水下追踪航母,是俄罗斯强大的新锐武器。   然而,就是这样一艘强大的核潜艇,却在2000年8月12号,进行演习的时候,突然发生爆炸,然后沉入了一百多米深,冰冷黑暗的巴伦支海的海底。   根据公开资料显示,库尔斯卡号在发生事故之前一切正常。   并在8月10号,刚刚完成了一次发射花岗岩反舰导弹的演习。难以置信,这样一艘服役刚刚五年的新锐潜艇,会突然在俄罗斯的家门口爆炸沉没。   当时,俄政府迅速反映,包括彼得大帝号核动力巡洋舰和库兹涅佐夫元帅号航母在内,北方舰队几乎倾巢而出,组织救援。   但是因为俄海军缺乏有效的救援设备,令救援工作非常不顺利。在出事后的第九天,潜水员才打开潜艇的救生舱,却发现舱内早已被淹没了。宣告库尔斯卡号核潜艇,全体118名官兵,无一生还!   时隔将近两年,在2002年7月26号,俄罗斯宣布了事故调查结果。   官方的说法是,在库尔斯克号核潜艇进行鱼类发射演练的时候,艇内存放的鱼类出现裂缝,泄露出了易燃的二氧化二氢,在装填的时候,导致鱼类爆炸,继而引起其他鱼类发生殉爆。   这次殉爆是致命的,直接将库尔斯克号的船头炸断,使这艘排水量1万多吨的庞然大物瞬间倾覆。   虽然俄罗斯官方给出了一个说法,但库尔斯克号的沉没依然存在许多疑团。根据种种迹象表明,库尔斯克号核潜艇更像是被鱼雷击中的!   并且在事发海域,俄罗斯海军发现了疑似库尔斯克号与其他潜艇相撞留下的残骸。这令库尔斯克号的事故更增添了几分阴谋论的色彩。   有人认为,库尔斯克号核潜艇进行演习的时候,很可能与另外一艘潜艇发生了碰撞。而当时正好有两艘美国潜艇和一艘英国潜艇在附近。   在事故现场发现的残骸,非常像是英国潜艇的事故浮标,这令俄罗斯方面一度怀疑英国潜艇是肇事者。   但说不通的是,英国潜艇的体积和吨位都比库尔斯克号小得多,一旦双方相撞,肯定是英国潜艇吃亏,根本不可能库尔斯克号直接沉没,英国潜艇却若无其事的偷偷跑掉。   直至2005年,法国的一部纪录片,终于揭开真像。   在事故发生时,有两艘美国潜艇正在跟踪监视库尔斯克号,另外一艘英国潜艇则是事故发生之后才到场的。   与库尔斯克号相撞的,就是其中一艘美国的核潜艇。美国核潜艇也是上万吨的庞然大物,跟库尔斯克号体型相当,两者碰撞之后,倒也不算严重。   但库尔斯克号以为遭到攻击,立刻开启了鱼雷发射管,准备反击。另外一艘美国潜艇发现不对,紧急关头,抢先发射鱼类,击沉了库尔斯克号。   根据法国表述,俄罗斯也调查出了真像,但这种情况根本不能公布真像,俄罗斯只能打掉牙往肚里咽。   再加上美国理亏,跟俄罗斯达成秘密协议,愿意放弃俄罗斯上百亿美元债务,算是双方私了。   关于这个说法,并没有得到美俄两个当事人的回应,只有一位不太靠谱的,所谓英国国防部的前官员出面证实。   我们在这里,且不论美国潜艇击沉库尔斯克号这件事是不是真的。   但有一点可以确认,就是在库尔斯克号进行演习的时候,的确有两艘美国核潜艇在一旁偷窥!   要知道,潜艇演习可不像水面舰艇,集结成编队,明火执仗,大张旗鼓。   潜艇演习,一定是悄悄地进村,打枪的不要!   那么问题来了,美国的两艘核潜艇是怎么盯上库尔斯克号的?   原来早在两年前,库尔斯克号前往地中海,监视北约轰炸南联盟的时候,就被美国的检测设备捕捉了声纹。   这令美国潜艇的声呐,能有针对性的发现特定波段的声纹,从而提前发现库尔斯克号核潜艇的存在。   如果事实真如法国披露的,作为当时世界最先进的核潜艇,如果库尔斯克号核潜艇没有提前被美国潜艇发现并追踪,后面的悲剧也就不会发生了。 原文章作者:非常事件簿xv,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-7-8
    最后回复 瑭剌 2021-7-8 12:41
    3045 1
  • 声纹识别“黑科技”可以做什么?这家光谷企业说,不仅仅能启动汽车……
    楚天都市报9月20日讯(记者胡长幸 通讯员王法建)声纹识别技术可以做什么?昨日,在光谷举行的中西部“双城·双创”城市论坛暨2018“西源汇”活动上,六个优秀双创项目参与路演,一家光谷企业向评委们展示了声纹识别技术的广泛应用前景: 启动自己的爱车时,只要说一声“启动汽车”,引擎就会立马启动,外人说无效;下班回家对着智能门锁喊声“开门”,不插钥匙即可开门,陌生人的声音则无法开门;进行领取养老金人员社保生存状态验证时,采用声纹识别对比,系统会在几秒内做出身份判断,腿脚不便的老人也无需到社保窗口验证……此外,还可用于银行、公安、医院、交通、智能硬件等需要进行身份识别、安全验证的行业。 “任何两个人的声音在电声学仪器上显示的声纹图谱都不相同,跟个人指纹、虹膜等特征一样具有唯一性特点,可以用来鉴别身份。”武汉昊音通科技代表徐泉介绍,根据这种特性,该公司研发出昊音通Ai-Voice Cmfmc 2.0声纹识别引擎技术,支持方言声纹录入鉴别,在电话呼叫中心场景下的声纹识别率与app场景不相上下,还可以进行活体检测、精准识别声音冒仿行为,能够使声纹识别技术更迅速落地应用。 目前该公司已开发出以声纹识别作为主要技术基础,兼容了人脸识别和指纹识别系统,运用AI技术、语音采集等技术,手机app开发出的社保生存验证系统,已在湖北省内外多个地市社保系统中应用。另外正在和东风、猎豹、兴业银行等多家公司进行汽车、金融服务产品的量产、测试合作。 路演现场,昊音通科技凭借声纹AI“社保声纹认证&汽车声纹启动”项目,与武汉元生创新科技“多源融合运动传感与定位导航”,启明视界“盲人智能多维应用系统”等项目,收获了风投代表、嘉宾评委中最多比例的投资意向。 “西源汇”是陕西省科技厅、陕西省西咸新区管委会、光谷创业咖啡共同打造的陕西首个全生态双创品牌,此次走进武汉,旨在结合武汉与西安的双创政策,促进双城科创资源的相互结合、相互交流、相互学习。 原文章作者:极目新闻,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-7-6
    最后回复 丁伙 2021-7-6 00:58
    2958 0
  • 海淀镇楼宇小区试用声纹识别门禁系统,最快8秒通过
    刷身份证、声纹识别认证、测温,人员进入楼宇、小区,最快8秒通过。 海淀区海淀镇联手北京分音塔科技有限公司,在楼宇、小区试行声纹识别门禁系统,为企业复产复工提供保障,不断提升社区防控科技含量。 今天早上,记者在海淀桥北的左岸公社看到,楼宇入口处有一个三脚架,上面放着一个比IPAD略大的屏幕,每个人员进楼前,都要在屏幕下方刷身份证,随后对着屏幕说一句话,等屏幕上显示“通过验证”后即可放行。往里走,还有一个红外热成像测温设备,即走即测,无须停留。一位员工,识别、测温,前后只需8秒时间,就能顺利进楼。 技术人员介绍,声纹识别系统基于的原理是每个人的声音有唯一性和独特性,声纹识别(又称说话人识别)是从说话人发出的语音信号中提取声纹信息,并对说话人进行身份验证的生物识别技术。不需要接触,只需声音即可判断一个人的身份,准确率可达99%。 此前,左岸公社物业组织楼宇内各商户对员工进行了声音信息采集并录入系统,员工在刷完身份证、身份信息比对成功后,再对着屏幕说一句话,系统就能够自动与库里存的声音信息进行比对,比对成功后即可放行。 这种刷身份证、声纹双验证的模式可以让楼宇更好地把好 “入口关”,同时非接触式、自动化的手段也最大限度地减少了人员聚集,降低了交叉感染风险。 声纹识别门禁系统的研发,源于海淀镇镇长朱海斌的一个设想。在疫情防控检查中,朱海斌发现,楼宇、小区一线人员的工作压力很大,既要做人员排查登记,还要测量体温,长期在一线工作还存在交叉感染风险。能否借助科技手段提升工作效率、降低感染风险、缓解人员不足的压力呢? 传统人脸识别系统由于带口罩无法发挥作用,指纹验证系统由于多人接触,存在交叉感染风险,是否能够运用声音进行识别呢?带着这样的想法,朱海斌和北京分音塔科技有限公司进行了沟通,而此时,分音塔公司的清华研发团队也正在寻找疫情工作的着力点,两者一拍即合。短短三周,公司就开发出了声纹识别门禁系统,并在海淀镇的楼宇、小区试用。 在裕和嘉园小区门口,技术人员正为出入小区的居民采集声音信息,平均每个居民采集信息用时25秒。“虽然前期声音采集工作麻烦了点,但如果信息都采集好了,后续我们的工作就轻松了”。物业工作人员说。 据介绍,后续系统将根据使用者反馈更新升级,并将红外热像测温功能一并整合,实现人员验证和测温合一。刷身份证也将改为刷二维码,为楼宇、小区人员实行“一人一码”认证,保护人员隐私。同时,还将考虑老年人、残疾人等特殊群众的需求作进一步改进。 来源:北京日报客户端|记者 于丽爽通讯员 曹莹 编辑:徐慧瑶 流程编辑:吴越 原文章作者:北京日报客户端,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-7-3
    最后回复 骏肴津 2021-7-3 07:37
    1878 0
  • 声扬科技李亚桐:声纹识别落地金融安防高安全行业,走向全局应用
    一个好的AI技术应该是可靠的工具,而不是玩具。7月9-10日,36氪在北京和上海同步举办“2019WISE超级进化者”大会,活动设有七大会场,关注企业发展变革路径、行业风向把握、零售行业的进击与蜕变、万亿企业服务市场的崛起、产业创新机会、全球化趋势与差异化需求的爆发逻辑等议题,邀请超百位行业领袖,聚焦那些引领行业变革的超级进化者的崛起之路。 声扬科技成立于2016年,是一家典型的技术驱动型公司,聚焦于声纹识别技术的研发,致力于打造有生命力的产品体系,并成功地将产品落地于金融安防等高安全要求行业。 声扬科技联合创始人兼CEO李亚桐在今天演讲中认为:2018年是声纹识别的元年,声纹识别的应用走向了发展的快车道;声纹识别具有安全、智能、准确、易用等特性;且声纹识别的应用市场很大,应用的领域也很广,未来以声纹识别为核心的智能语音技术,一定会从局部应用发展到全局应用,从专业领域出发直至覆盖更广泛的行业领域。 以下是略经修改的嘉宾演讲实录: 李亚桐:大家上午好!声扬科技成立于2016年,是一家典型的技术驱动型公司,我个人在过去十多年来一直在生物识别领域从事技术产业化方面的工作,下面花一些时间向大家分享一下我对声纹识别的基本看法。我们创始团队有非常好的智能语音技术,我们应该创造什么样的价值? 2018年是声纹的元年 一个好的AI技术应该是可靠的工具,而不是玩具,我们把目光投到行业应用,用语音识别人的身份。很多情况下非常有必要,通过声纹可以登录账户,甚至帮助金融机构完善风控体系。另外在公共安全领域,声纹像人脸一样,为大家的安全保驾护航。根据我们当时的判断,最近两三年时间,我们进行大量的前沿探索,到2018年,我们非常确信声纹识别这个领域开始进入了需求的爆发期。 我们认为是2018年声纹的元年,为什么这么说呢? 首先产业的发展离不开国家政策的大力支持,2018年的10月发生了一件非常重要的事情,央行颁布了《移动金融基于声纹识别的安全应用技术规范》,这意味着声纹识别得到了国家监管部门的认可。另外声纹在打击犯罪方面的应用也越来越多。国家政策的出台离不开技术的发展和人们生活习惯的变化,一方面移动互联网的普及,语音变得无处不在,麦克风作为声纹数据的入口,变得随手可得。另外一方面,这几年来智能音响、语音输入法等智能语音交互的相关应用变得越来越普及,这也培养了用户对语音的使用习惯。 近几年我们看到身份验证有的翻天覆地的变化,从过去传统的身份验证,如身份证件、密码,到现在的指纹、人脸验证等等,生物识别验证越来越多,大家也越来越熟悉。现在大家对身份识别技术有了进一步的需求,我们希望能有更安全、更准确、更智能的识别方式。包括现在应用非常广泛的人脸识别、声纹识别,它们的特性决定了它们能够适应这个发展趋势。2018年下半年开始声纹走向了发展的快车道,未来几年这项技术将得到越来越广泛的应用,并且很大程度上去促进人与人的远程沟通,人机交互等方面的效率提升。 简单来说,声纹是语音的特征,是独一无二的,是人类最本能、最自然表达的交互习惯,也是非常安全的方式。它的独特性在于它跟语言无关,无论你是讲什么内容,或者是讲普通话、广东话,你的声纹特征是不变的,并且声纹可以做到远程的识别,采集也非常方便。这段时间,得益于我们算法的升级迭代,我们初步解决了几个技术难题,比如识别准确率、抗噪音的干扰等等。 声纹识别这个技术已经跨过了大规模商业化的门槛。现在,我们对身份识别的要求越来越高,可以看到近十年来,随着移动互联网的发展,我们的生活、工作、交流方式都发生了很大的变化。过去很多事需要到现场办理,现在通过电话、发短信都可以实现远程办理,当然这也带来安全的隐患和风险。 声纹识别拥有很高的应用价值 安全与便利在某种程度上来说是矛盾的,如何更好的处理安全与便利的关系呢?我们认为声纹识别要满足以下四点: [*]安全:声纹不怕丢失、难以伪造。 [*]智能:可能做到只凭几个字就可以识别出身份。 [*]准确:当前声纹技术已经达到了比较高的准确率,并且,随着技术不断迭代,准确率还将进一步提升。 [*]易用:只需要普通麦克风,比如手机或电话上的麦克风就可以,完全不需要专门的设备 其实早在十几年前,国际上大的电子证件以及身份识别场景中都加入了多种身份识别技术。身份识别的应用场景非常的多样性,指纹的应用场景非常广泛,但是老人的皮肤会磨损这个就会很难采集到。没有一种生物识别技术可以满足所有场景的需要,多生物识别能够满足多样性的应用。而声纹的特性决定了它非常容易与其他的生物识别技术相融合,实现“1+1>2”的效果。 落地金融、安防:经受最苛刻的检验和打磨 我们的定位是专业的工具,而不是玩具,这个技术最先应用在安全等级要求非常高的场景,我们选择了金融,选择了公共安全作为切入点。这些涉及到了资金和信息安全,是我们大家最看重的安全场景。比如我们在手机上进行APP上登陆,声纹可以实现密码检测;未来我们也可以用到声纹支付,另外,打电话的时候也可以用声纹进行识别身份,通过跟用户的交谈,能够很快速的识别出接电话的这个人是谁,而在这个场景下,单凭电话号码是不够的。 近三年的探索和积累,我们申请了30多项专利,以声纹技术识别为核心,我们构建了比较完整的智能语音产品基础体系,面向金融、公共安全、IOT等领域,我们的技术和产品体系必须具备一定的前瞻性,并且有很强的生命力,一直伴随着用户需求的多样化而不断的完善。 在我们实际上线的项目中,识别的准确率超过了99.7%,高于行业的有关标准。还能实现1:1000万的高精度检索能力,具备了支持国家级项目的基础能力。我们做了很多大型项目,像平安集团、广安证券是我们的客户,去年做了东南亚和墨西哥的海外项目,还有南方电网等比较知名的企业,我们累计的服务全球用户超过了5000万人。 我们去年跟印度尼西亚的国家级养老基金系统提供了声纹识别技术,第一期用户是250万的退休老人,老人们只需在家里面读出12个数字就可以进行远程验证。过去,为了防止养老金的流失,他们用的传统方法是,老人家带着证件到现场跟养老金工作人员进行现场核验。而用了声纹识别技术,老人家在家里说12个数字就可以完成,减少了时间成本,对于管理基金也节省了时间和人力成本。这也是全球第一家应用声纹识别技术的国家级机构。 最近三年来,声纹识别领域的发展进一步印证了我们团队当初的判断,感谢政策的制定者、同行以及用户们的耕耘与支持,让我们更加坚定的在这方向上继续前行,我们团队对未来充满信心,也相信只有经过金融业、公安部门对安全、性能、技术、服务要求最苛刻的检验和打磨,再面向更多通过金融和公安领域认识到声纹识别技术价值的行业去应用时,才会带来符合用户对智能语音交互预期的体验,从而推动整个智能语音产业持续发展。 未来发展:从局部到全局,从专业到普及 未来人一定会成为被识别的主体,现在是手机,因此以声纹识别为核心的智能语音技术一定从局部应用发展到全局应用,从专业领域发展覆盖更广泛的用户群体。 今天的主题是开创者峰会,未来大量的应用场景等着我们去开创。我们语音中包含着大量的信息没有被充分的挖掘,人类的语言里包含了很多信息,比如我们的讲话内容、口音、性别、年龄、情绪等等,而现在我们只是使用了一部分。声扬科技深信声纹识别和智能语音的应用能够带来效率和成本上的改变,进而让我们的生活变得更安全、更智能。声扬科技会坚持在科技创新,从语音中挖掘更多的价值,让我们的科技可以在很多领域进行服务,谢谢大家! 原文章作者:36氪,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-6-30
    最后回复 汝拼旖 2021-6-30 10:47
    1284 0
  • 别只盯着谷歌亚马逊,美国国安局才是声纹识别的「无形之手」
    相比之下,Siri 和 Alexa 不过是玩具罢了。 编译 | 王宇欣 白悦 Rik R 邱陆陆 作者 | Ava Kofman 来源 | The Intercept 在美苏冷战最严峻的时期,那是 1980 年的冬天,美国联邦调查局(FBI)的特工人员记录到了一次通话——一名男子被安排与在华盛顿特区的苏联大使进行秘密会晤。然而,在约定的那天,调查局的特工们没能看到究竟是谁进入了大使馆。当时,特工们没有办法仅根据他的通话声音就查出他的名字,所以这个间谍得以继续藏匿自己的身份,并在随后的五年中,将一些美国机密项目的细节卖给了苏联。 直到 1985 年,根据一名俄罗斯叛逃者提供的情报,FBI 才最终确定了当时那名通话者为前美国国家安全局(NSA)分析员 Ronald Pelton。次年,Ronald Pelton 被判处间谍罪。 而今,FBI 和 NSA 的特工能够在 Pelton 给苏联拨出第一个电话的几秒内识别出他的真实身份。NSA 2006 年 1 月的机密备忘录显示,NSA 的分析员使用了一种「用声音识别人的技术」成功将 Pelton 以往的音频文件与电话监控相匹配。备忘录中描述道:「如果这种技术早出现 20 年,那么将能够提前发现 Pelton 的间谍行为并实施抓捕,这将会大大减少 Pelton 对国家安全造成的重大损失。」 由前 NSA 雇员斯诺登提供的机密文件显示,NSA 开发的技术不仅能够将私密对话转为文本,还能自动识别对话中的人。 美国人在唤醒亚马逊的 Alexa 或者打电话给银行的时候,经常会使用到这种被称为声纹识别的技术。但是早在「Hello Siri」和「OK Google」这样的语言指令走入寻常百姓家之前十年,NSA 就用这种声纹识别技术来监控恐怖分子、政治家、毒枭、间谍甚至是一些普通政府机构的雇员。 这种技术的原理在于分析个人声音中独特的物理和行为特征来区分不同人的声音,例如发声的音高、嘴型、咽部长度等。算法随后会创建个人声音特征的动态计算机模型,也就是通常所说的「声纹」模型。整个过程——捕捉所说的单词、将单词转化为声纹、并将这种表示与数据库中其他的「声纹」进行对比——都可以在瞬间完成。尽管我们已经知道 NSA 依靠指纹和面部图像来识别目标,但是根据 2008 年的一份机构文件,声纹才是「NSA 的统治地位所在」。 我们不难看出原因。NSA,无论获得许可与否,截取了数以百万计的美国公民的电话,甚至包括越洋电话、视频电话和互联网电话,从而建立了一个无可比拟的声纹库。来自斯诺登提供的文件显示,分析人员将部分人的录音提供给声纹识别算法之后,即使这些人在其他通话中使用未知的号码、秘密代码亦或是不同语言,算法都可以将其与已有的音频相匹配。 早在伊拉克自由行动时,分析人员就使用声纹识别技术,证实了那些「疑似被废黜的领导人萨达姆的录音」确实是萨达姆本人,而不像公众以为的那样是伪造的。NSA 的备忘录进一步表明,NSA 分析员为本·拉登也构建了声纹,「在几次放送中,他的声音都十分明显且一致」;与基地组织的现任领导人 Ayman al-Zawahri 以及基地组织的三把手 Abu Musab al-Zarqawi 有显著不同。他们也使用 Zarqawi 的声纹从几份网上发布的音频中找到了他。 据 2004 年至 2012 年间的机密文件显示,NSA 对其声纹识别技术进行了愈发复杂的迭代。文件证实了声纹识别在反恐行动和缉毒行动中均获使用。文件还建议更多国家机构部署这项技术,不仅仅是为了追溯像 Pelton 这样的间谍,还为了防止像斯诺登这样的举报人出现。 永远在听的算法 2015 年 3 月 4 日,一位男子倚在纽约的一个公共电话亭旁用智能手机打电话 一些民权专家担心声纹识别技术和该技术的扩展应用将会侵害公民隐私。白宫前国家情报局局长顾问 Timothy Edgar 解释说,「声纹识别技术即创建了一种新的情报能力,一种容易被滥用的能力。」「我们的声音代替我们本人穿越各种渠道完成沟通。在大众监控的时代,这种能力对我们所有人的隐私都有深远的影响。」 Edgar 和其他专家指出,相比于姓名、地址、密码、电话号码和个人识别码,人声的相对稳定性使得其难以被改变或伪装。电子前线基金会(Electronic Frontier Foundation)的律师 Jamie Williams 表示,这让追踪变得「容易的多」。「只要你能识别出某个人的声音,」她表示,「你就能在监听记录或录音中找到他们。」 声音是一种独特且易于获取的生物特征:与 DNA 不同,它可以被动地被收集,且不受距离的限制,不需要目标知悉或者征得他们的同意。虽然识别的准确度受到收音条件的相似性,但是在受控的环境中——低底噪、熟悉的声学环境和良好的通信质量——这种技术可以用寥寥几句话就精确地匹配到个人。计算机模型拥有的同一个人的不同声音样本越多,模型就愈发强大,愈发「成熟」。 在商业环境中,声纹识别技术与呼叫中心欺诈审查、与 Siri 等语音助理交谈以及个人银行业务密码验证等任务关联密切。并且这种技术的用途正在逐渐增长,根据市场研究公司 Tractica 的报告,到 2024 年,语音生物识别技术产业的收入预计将达到每年 50 亿美元,其用途将扩展至边境检查站、医疗、信用卡支付和可穿戴设备中。 公民自由主义者的一个主要担心在于,声纹识别技术有可能使谈话「冷却」。新闻自由基金会执行董事 Trevor Timm 指出,可以假设 NSA 的声纹识别技术将会被用来追踪记者、揭露消息来源,拦截匿名消息等。虽然如今人们已经知道在处理敏感材料时应该加密自己的电话,但是 Timm 指出,从电视机到耳机再到互联网设备,能够偷偷记录声音的渠道实在是不胜枚举。Timm 说,我们 24 小时都会随身携带一个麦克风,那就是我们的手机。我们知道政府有办法侵入手机和计算机来打开这些麦克风。 他继续说道,「尽管斯诺登泄密事件之后,立法方面发生了很大变化,但美国人民对这种政府用来监视全球数百万人的工具依旧只有一个片面的理解。这是一个值得在公众领域辩论的事情。」但是他指出,如果公众对技术的使用缺乏有意义的认识,这种争论将会非常困难——甚至是否能存在都值得商榷。 一位前国防情报官员,因政策所限无法对机密文件进行讨论,匿名对 The Intercept 表示,他相信这种技术一直隐而不漏绝非偶然。「政府避免讨论这种技术,正是因为它提出了一些严峻的问题,而这些问题政府不愿意回答,」这位官员如是说道。「这是自 911 事件发生以来,对于我们个人及我们的权利的一项重要转变。」而想要进入技术监控范围,官员指出,「你什么都不用做,张嘴说话就行了。」 民权主义者担心,如果没有针对政府秘密收集我们的语音模式这一事项的公开讨论以及监督,我们可能会进入一个越来越沉默的世界。 新型声音工具 2012 年 10 月 9 日,科罗拉多州博尔德,美国国家标准与技术研究院语音研究所(NIST)大楼 2013 年开始,美国人就已经知道 NSA 在大量收集国内外的电话数据,但如何将原始数据转化为有用情报这一技术依旧鲜为人知。2015 年,据 The Intercept 报道,NSA 为处理政府收集的大量音频建立了一系列「人类语言技术」。通过开发程序自动将语音翻译成文本——分析员称之为「语音版谷歌」——政府部门可以使用关键词和「选择器」来搜索、阅读和索引录音而不是派人亲自去听,从而节省了大量的人力。 从语音转写文字项目衍生的声纹识别技术为分析员提供了一种额外的工具,使其可以将不计其数的战区音频进行拦截与分类。NSA 和国防部斥巨资发展此技术并增加其可靠性。数字时代之前,声纹识别隶属于法庭科学。二战期间,人类分析员对来自无线电的声音频率的可视化输出进行比较。根据《法庭声纹识别》的作者 Harry Hollien 的说法,这些可以「阅读语音」的机器——即语谱图技术——甚至用来驳斥阿道夫?希特勒被暗杀并被人取代的谣言。 作为法庭声纹识别标准化事宜的联邦领导者,首席声纹识别专家 James Wayman 解释道:「声纹可以被看到,」他指出,虽然「声纹」这个词已经被商业公司用烂了,但其实有一定的误导性。因为「纹」意味着所捕获的信息是物理的,而不是行为的。他说:「其实你所拥有的是软件程序里的一个方程,能够输出不同的数字。」 这些方程已经从简单的求均值演变为动态算法模型。自 1996 年依赖,NSA 资助了美国国家标准与技术研究院语音研究所(NIST),培养和测试「解决声纹识别问题的最具主导性和前途的算法」。与 NIST 一起测试系统的还有,领先的生物识别公司和研究人员,其中有一些人获得了 NSA 和国防部高级研究计划局(DARPA)的资助。 NSA 一直对其声纹识别项目三缄其口,因此公众很难知道它目前可以发挥多大的作用。但是考虑到 NSA 资助的学术研究所和私企间紧密的联系,从其他国家正在做的事情和供应商正在销售的东西可以大概估计出 NSA 的进展。 例如,行业领导者 Nuance 向政府、军事部门和情报部门推销「一个全国范围内的生物声纹识别系统,能够从包含数百万声纹的系统中快速准确地识别并区分一个人的声音」。2014 年,美联社报道说,土耳其最大的移动电话公司已经使用 Nuance 的技术,用来收集 1000 万左右用户的语音数据。 10 月份,人权观察社(HRW)报道说,中国政府正在建立一个国家级声纹数据库,从而能够自动识别电话中的人。政府旨在将成千上万的人的语音生物信息与他们的身份证号码、民族和家庭地址联系起来。据 HRW 报道,制造中国语音软件的公司甚至已经给一个可以精确定位音频文件用于「舆论监督」的系统申请了专利,。 11 月,根据国际刑警组织发布的新闻,由欧盟资助的一个国际声纹识别的项目通过了最后的测试。来自 50 多个国家的 100 多名情报分析员、研究人员和执法人员(其中包括国际刑警组织的探员,英国大都会警察局和葡萄牙司法系统的警察们)都来到了展示现场,研究人员证明他们的方案可以识别「社交媒体上或合法截获的音频中说不同语言的未知发言者」。 The Intercept 查阅的 NSA 文件中描绘了一个类似地正在发展的系统的轮廓——在 9/11 事件之后的几年里,这个系统的发展使得「语音分析员能够在几秒钟内对数百小时的语音剪辑进行筛选,基于关键词或说话者声纹识别筛选出有用的信息。」 「戏剧性」结果 2008 年 11 月 22 日,一名 Sahwa 成员在巴格达市中心检查站附近用手机通话 NSA 声纹识别技术的部分历史可以通过阅读信号情报局(SID)近十年的内部通讯中重新构建。刨除那些自吹自擂和刻意略过的部分,SIDtoday 的备忘录详细记录了声纹识别的转变历程——从一门需要人类审查员进行的不太可靠的法庭科学到一个依赖大量的语音数据进行的自动算法程序。特别是,这些备忘录着重说明了美国分析员与英国政府通讯总部(GCHQ)的同行们如何密切合作处理来自伊拉克和阿富汗的与反恐工作相关的大量录音。GCHQ 虽然拒绝回答本文中涉及的具体细节,但在内部通讯中自夸称其系统「在与 NSA 的合作中发挥了重要作用」。 虽然有时候很难区分 SIDtoday 总是在展望未来的信息发布和技术的实际进展,但显然,至少自 2003 年以来,NSA 一直在利用自动声纹识别技术来定位和标注「那些重点关注对象的语音消息」。一份 SIDtoday 的备忘录解释说,每当一个声音信号被拦截,声纹识别技术就会为其建模,并将其与其他已知音源比较来回答这个问题:「这是我们一直在跟踪的恐怖分子吗?是奥萨马·本·拉登吗?」 但 NSA 的系统的功能远远不止回答「是」或者「不是」。在 2006 年的一系列通讯中,报道了一个名为「实时语音」(Voice RT)的项目,这个系统不仅能在语音拦截中自动识别说话者身份,还能识别他们的语言、性别和口音。分析员可以对拦截按上述类别进行分类,通过关键字进行实时搜索,并设置自动警报,在传入的拦截符合某些标签的条件时通知他们。一份 NSA 的 PPT 进一步证实,Voice RT 程序将其「摄入」的伊拉克语音数据转换为了声纹。 斯诺登提供的 NSA 备忘录并没有说明 Voice RT 的部署范围,而 GCHQ 的语音/传真用户组的会议记录中提到了这一点。英国机构的备忘录中的详细说明了 NSA 的声纹识别计划是如何针对外国目标进行部署的。2007 年秋季,当其语音/传真用户组在与 NSA 代表会面时,NSA 成员们介绍了一个高效的 Voice RT 系统,可以为语言学家和分析员提供说话者识别和语言类别识别能力,可以将语音转换为文本和并搜索语音。「实质上,」会议记录将 Voice RT 描述为,「一个一站式商店……他们为了提高系统的可部署性付出了大量的努力。」到 2010 年,NSA 的 Voice RT 程序可以处理超过 25 种外语的音频。在阿富汗,NSA 将语音分析和地图软件配合使用,定位那些讲阿拉伯语的信号塔集群——用来发现新的基地组织训练营。 GCHQ 则使用了一个名为 Broad Oak 的项目,根据声音来识别目标者。英国政府在中东地区建立了声纹识别系统,识别对象不乏沙特、巴基斯坦、格鲁吉亚和伊拉克的领导人。GCHQ 的会议记录称:「如果您认为我们可以帮助您在海量信息流中找到您感兴趣的目标,请随时与我们联系,我们很乐意与您讨论您的需求,并希望能够提供一个迅速准确的解决方案。」 这不是一张空头支票。2009 年,在识别伊拉克副总统之一 Adil Abdul Mahdi 时,GCHQ 吹嘘说他们比对手 NSA 做得要好。「由于我们一直以比他们更快的速度报告他(副总统)的相关消息,NSA 已经放弃参与其中 …… 此项良好的表现也提高了我们在 NSA 的声誉。「2010 年,GCHQ 的研究概述显示,两个机构就声纹分析项目的联合实验进行了广泛的合作。 但声纹识别工具的发展并非一帆风顺。在其早期阶段,这项技术远不如今天那么强大有效。前国防情报官员回忆说,虽然分析员能够在他们的工作站播放语音样本,但由于音频没有编入索引,搜索重要的样本是一个很大的挑战。在 SIDtoday 发表的一封 2006 年的写给编辑者的信中,一位分析员抱怨说语音工具的引入使其非常崩溃,并将其初始速度比作「流淌在一月的糖浆」。 然而到了 2007 年,声纹识别技术已经明显成熟。NSA 专门为伊朗总统 Mahmoud Ahmadinejad 的纽约市联合国大会之行建立的备忘录中详细列举了该技术的实际功用。在获得合法授权后,分析员配置了一个专门的系统,尽可能多的跟踪 143 名伊朗代表的电话。在所有的这些传入流量上,他们运行了语音活动检测算法,以避免目标在没有说话的时候分析员浪费时间跟踪; 通过关键字来搜索「电子邮件地址的传递和重要人物的讨论」;以及根据说话者声纹识别来成功定位「包括伊朗外交大臣在内的重要人士」的对话。 同年,NSA 在当年格鲁吉亚开设的一家新的音频取证实验室在一份声明中指出,NSA 计划将这些语音技术提供给整个机构的更多分析员。2008 年 SIDtoday 的备忘录报告称系统的升级将允许分析员「找到目标者与过去音频匹配的新的音频剪辑」。 当目标找出规避声纹识别技术的策略时,这些工具也会随之进化。2007 年,分析员注意到,他们识别为基地组织的两个目标的拦截频率超出了正常人的谈话范围。在接下来的几年中,分析员在也门,阿富汗,伊拉克和其他地方也发现了这种声音经过调制的目标。「这很有可能是为了避免被情报机构识别」。他们观察到的一些音频剪辑扭曲了说话者的音调,所以听起来像是「艾文和花栗鼠」在说话。分析员据此推测,参与 2009 年 12 月企图在底特律轰炸的 AQAP 成员通过使用全新的电话号码和掩盖自己声音的方式逃脱了政府的识别。 2010 年,机构的技术人员制定出了一个应对这些调制声音的解决方案——应用 HLT Lite——一个用来搜索修改过或异常的声音的软件。SIDtoday 称,该方案在扫描了 100 多万条音频后,在也门发现至少 80 个经过修改的语音的例子。据报道,这使机构发现了同时使用几个新电话号码的目标人物。 随着系统能力的提升,他们的监控范围也在扩大。2010 年 9 月的一则通讯详细介绍了墨西哥城升级的声纹识别系统的「戏剧性」发展——网站的负责人称,堪比相当于一台额外的扫描仪。通过在音频拦截中搜索「bomba」这个词,分析员可以分离和检测有关炸弹威胁的对话。 声纹识别系统也可以很容易地通过重新配置,用在别的地方。GCHQ 2008 年 10 月的会议记录描述了一个「涉及阿富汗毒品交易的高层人员网络」的建立过程,这个网络后来被「投入到意想不到的应用之中」。分析员甚至「在毒品流量较大的区域进行了一次地毯式搜索」来识别更多的目标。 从战场上到机构中 服务器机房里的网络设备 NSA 很快意识到,他们的录音处理能力可以用来识别 NSA 内部的员工。正如 2006 年 1 月那篇讨论 Ronald Pelton 的音频的备忘录所解释的那样,「声音匹配技术正被应用到新提出的内部威胁(Insider Threat)计划中,企图捉住『我们中的间谍』。」 在美国军方告密者 Chelsea Manning 泄密之后,该计划由奥巴马政府公开宣布,其内容是密切监视政府雇员的生活。但这份文件似乎表明,该举措在 2011 年奥巴马颁发行政命令之前就已经开始实行了。 据新闻自由基金会的 Trevor Timm 的分析,NSA 将用于检测外部威胁人员的生物技术运用到检测内部成员中的异见人士身上这一手段并不新鲜。「在过去 15 年中,我们已经看到了一连串这样的例子:执法机构把那些侵犯式的、本来作用于恐怖分子身上的工具——无论是定位跟踪还是人脸识别,或者是像这种声纹识别技术——用于其它各种犯罪调查中。」 Timm 指出,在过去几年中,告密者,情报人员以及记者都采取了更严密的安全措施来避免暴露身份。但是,「如果记者使用的电话号码并未与其身份关联,那么政府就会通过许可证等方式来扫描他们通话,这项技术也将潜在被用于抑制新闻业的发展。」 对于情报圈的民权律师第一人 Timothy Edgar 来说,这些「风险」可以归为这样一个问题:「他们是在寻找正当目标,还是在滥用权力?比如试图监控记者或告密者这样的做法?」 Edgar 说,在某些方面,声纹识别或有助于保护个人隐私。这项技术允许分析员来筛选电话,这样他们就可以专注于目标人物的声音,从而剔除掉其他人的声音。一份 2010 年度的 SIDtoday 备忘录强调,通过确保「该名说话人是某国领导人而非甜甜圈店的某个服务员,」该技术可以降低情报人员所需监听的通话量。 「事实上,」这一级别的精确度,成为了「NSA 解释当初大量收集元数据的做法的挡箭牌」,Edgar 解释说。「他们为项目进行辩护的手段之一,就是自称没有收集所有的数据,而是通过筛选器来收集信息。」 同时,从大量数据中识别特定个体的目标,常常证明了继续收集更多数据的必要性。识别可以帮助分析人员缩小电话接听的范围,但这项技术似乎会鼓励他们在更大范围内进行搜索,因为本质上这项任务的目标是监听目标声音出现的对话,无论他用什么号码拨出。或如 Pelton 备忘录所指出的那样,这项技术使得分析员能够「在任何地方辨别出那个声音。」 虽然这些文件表明,该机构确实试图在其员工身上运用这项技术,但 The Intercept 所查阅的文件并没有明确表明,该机构是否已经在美国普通公民的对话数据中进行声纹创建。 外国人情报监视法案(Foreign Intelligence Surveillance Act,FISA)规定,机构可以自由收集在国外服务器和基础设施上传输的音频数据,以及美国人与外国人的语音交流数据。因为项规定,Edgar 称,越洋电话「基本上」是被系统录过声纹了。「如果他们没对越洋电话使用这些技术手段,我才会感到惊讶。在某种程度上,这就是他们的工作内容。」 然而专家们对「NSA 是否有权利在没有许可的情况下扫描美国公民在美国领土上进行的通话并制作声纹」这一议题表现出了分歧的态度。这种分歧部分源自监督相关法律的不完备,这方面的法律未能跟上声纹与语音识别等数字技术的发展。 虽然美国已经制定了严格的法律,禁止在没有许可证的情况下对美国领土上进行的电话内容进行记录,但也没有任何联邦机构负责监管声音数据的采集和处理事宜。 监管缺失的部分原因是,虽然政府需要许可才能获得「内容」,但声纹应该被归类为「内容」吗?或者像 NSA 声称的那样,声纹不过是「元数据」——这部分信息所受的法律保护就少多了。在这个问题上,法律基本上没有做对这部分信息做任何具体的规定,这导致一些专家推测,NSA 正在利用这一法律灰色地带实行声纹建立。 针对一系列详细的问题,NSA 给出了如下的回应:「根据长期政策,NSA 将不确认也不否认该文所指的涉及的美国政府信息的准确性。」 无所不用其极 星期四,参议院投票通过扩大外国人情报监视法案(FISA)的 702 条,这使得 NSA 有权对那些与外国人沟通的美国人进行暗中监视,且不需要许可证。这种再授权行为,与上周在众议院的行动类似,证实了那些评论家的观点,他们认为 NSA 对其法律权力的解释整日益强硬——同时日益模糊。 计算机科学家和监控研究专家 Andrew Clement 在斯诺登披露相关信息之前就已经在调查 NSA 的无许可窃听活动。他坚信,该机构对美国公民的声纹识别的利用并未收到任何限制。他解释说,该机构经常选择将收集到的所有信息进行分类,直到达到人类分析员能够将其作为元数据来进行听或读为止。「那只是一个巨大的漏洞,」他解释说,「看来,他们会把通过算法方式从内容中获取到的任何信息,都简单地归类为元数据。」 Clement 类比了 NSA 对待电话号码和电子邮件地址的方式,来类比 NSA 会如何将建立声纹的行为合法化。斯诺登在 2013 年披露的 XKeyscore 项目,就允许工作人员从截获的电邮中提取出电邮地址(它们被归类为元数据)。这些工作人员还可以对关键字进行全文搜索,它们同样被归类为上下文信息而不是内容。 然而 Edgar 认为,如果政府把我们的声音也算作元数据,那么他会大吃一惊。「你可以试着辩解说,声音特点不等于说话内容,」Edgar 说,「但是为了做声纹识别,你还是得收集一通国内电话的内容,并对其进行分析以便提取出声音。」 目前还不知道 NSA 收集、取样或保留了多少国内的通话内容。但 EFF 的 Jamie Williams 指出,NSA 不一定非得通过收集美国人的电话录音来制作美国人的声纹库,因为民营企业就一直在记录我们的声音。他们正拥有越来越多的音频资源。汽车、恒温器、冰箱、电灯泡,甚至是垃圾桶,都已变成了「智能的」(即互联网化的)语音设备。Gartner 预测,今年有三分之一的人机交互将通过与语音系统的对话来进行。最近,谷歌和亚马逊的「智能音箱」都推出了声纹识别系统,用以区分家庭成员的声音。「一旦公司拥有这些声音数据,」Williams 说,「在理论上,执法机构就能拿到它,只要他们有一个有效的法律程序。」 这位前政府官员指出,原始语音数据可以存储在民营企业那里,并供 NSA 通过秘密协议进行访问。比如在 Fairview 计划中,该机构与 AT&T 是合作伙伴关系。尽管美国国会试图控制 NSA 对国内电话记录的收集行为,但该机构一直在寻求获得我们提供给企业数据库的原始数据。(例如与 Verizon 和 AT&T 的合作伙伴关系,对 Xbox 游戏系统的渗透,以及对万千网友的在线元数据的暗中收集,这些只是几个最近的例子。)「电信公司持有数据,而没有什么可以阻止他们运行一个算法,」这位前官员说。 Clement 想知道的是,对于 NSA 而言,可能声纹识别能力比其内容识别能力更为重要。「这可以让他们把你和你自己的其他身份联系起来,并确定你和其他人的关系,」他说。 这似乎才是 NSA 的最终目标。在 2010 年的一次关于「一次前所未有的机会,了解 NSA 如何将其创造性的能量用于个人跟踪」的会议上,NSA 的高层领导谈到如何将「全生活(whole life)」战略纳入他们的目标。他们描述了将生物特征数据(比如声纹)与传记资料(如社交网络和个人历史)进行整合的需求。用该机构自己的话说,「一切都是关于在空间和时间上进行个人定位、跟踪和维护的连续性。我们不局限于传统的通讯方式——我们无所不用其极。」 原文章作者:机器之心Pro,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-6-29
    最后回复 钞暖童 2021-6-29 21:45
    3545 3
  • 都知道指纹,可没想到声纹竟然也可以这么玩?
    你知道吗,每个人说话时的语声都是独一无二的。在很熟悉的人之间,可以只听声音而相互辨别出来,如果用电声学仪器来测绘声波频谱,那么每个人的声波频谱都不一样。这就是声纹。 现代科学研究表明,声纹不仅具有特定性,而且有相对稳定性的特点。成年以后,人的声音可保持长期相对稳定不变,无论讲话者是故意模仿他人声音和语气,还是耳语轻声讲话,即使模仿得惟妙惟肖,其声纹却始终不相同。 可不可以利用声纹的这种独特性来做些身份鉴别的事情呢?比如,定制一款hei Siri神马的。 但是要想准确分辨声音特征却并非易事。首先,声纹识别系统性能会受说话者发声状态影响,说话者的身体状况、情绪等都会影响识别准确度。其次,环境的嘈杂度,以及采集、传输音频的硬件配置,都会在不同程度上对识别系统造成干扰。 好消息是,国内语音 AI 领军企业云知声率先攻破了这一难点。近日,云知声与医疗健康生态平台平安好医生共同研发的“声纹登录系统”(又称声纹锁)经过多次模型优化和升级迭代后,登录成功率接近 99%,达行业一流水准。 据悉,云知声声纹技术团队先后攻破了语音信号前端处理技术、信道处理、声纹识别等复杂技术。其产品可准确地捕捉到人声并进行背景噪声消除,同时,基于云知声超算平台和海量声纹训练数据,使得其算法模型得以学习到数万说话人、每人多种发声的特性,在AI的助力下,使得声纹识别效果越来越好。 此次推出的声纹登录系统只是声纹应用案例之一。也许在未来,付款可以不输入密码、不用指纹,而只要说一句“付钱吧”。 作者:金婉霞 编辑:李晨琰 原文章作者:文汇网,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-6-26
    最后回复 褛垂宸 2021-6-26 11:09
    2496 0
  • 分分钟钟了解中科汇联智能声纹识别解决方案
    声纹是一种非接触生物特征,同人脸、虹膜、指纹、指静脉、掌纹等人体生物特征一样,具有身份唯一性,即通过说一句话可以唯一确定一个身份。声纹识别,相比较其他认证技术,更加方便,更加安全。 中科汇联根据信息化发展的现状和各行业对信息安全的需求,与清华大学语音与语言中心合作,进行声纹识别核心技术研发,并形成国内领先的声纹识别引擎,实现“说话识人”的声纹识别服务。为信贷风控反欺诈、电话客服中心身份认证、移动端金融身份认证以及安全监控提供无接触、无感知、无隐私的智能识别服务。 方案优势 1、技术沉淀 中科汇联智能声纹识别技术团队语音和语言技术中心成立于2007年2月,其团队人员来自清华大学信息科学技术学院相关课题组,语音和语言技术中心包括三个实验室,分别是语音识别实验室(ASR Lab)、声纹识别实验室(VPRLab)、自然语言处理实验室(NLPLab),还聘请国际和国内知名专家组成顾问委员会委员,以指导其建设和研发具有自主知识产权的技术和应用,推动应用基础研究和技术创新。 2、国家标准制定 以下所有标准,中科汇联&清华语音语言实验中心,均作为起草单位,参与起草工作。 《安防声纹确认应用算法技术要求和测试方法》公安部GA/T 1179-2014 《安防生物特征识别应用术语》公安部 TC100/SC22010 《声纹识别应用系统技术要求》公安部 TC100/SC22012 《自动声纹识别(说话人识别)技术规范》工信部 2008 《移动金融基于声纹识别的安全应用技术规范》JR/T0164—2018 金融领域-信标委生物特征识别标准工作组 TC28/SC372009 目前,中国建设银行、中国民生银行、浦发银行、光大银行、广发银行等银行,已经上线声纹产品,为金融安全提供全方位保障。在国外,英国巴克莱银行、美国花旗银行、澳大利亚国家银行、万事达卡机构等都已开始引入声纹技术。 3、语音质量检测 语音质量检测是声纹识别系统的第一道关口。中科汇联智能声纹识别解决方案提供了三种语音端点检测的方法,分别为:基于能量的语音端点检测、基于深度说话人特征的语音端点检测以及基于深度发音特征的语音端点检测。在不同应用场景下,通过合理地应用三种端点检测方法,高效精确地实现人声和非人声的检测、有效音和无效音的分离。 考虑到实际应用中常见的语音质量问题,我们基于上述语音端点检测算法,提出了基于无效语音段能量大小的音量检测、基于信噪比SNR的噪音检测、基于高频分量统计的伪截顶检测等,从多个角度评估输入音频的语音质量。 4、噪音鲁棒性 中科汇联智能声纹识别解决方案为了提高声纹识别系统的噪音鲁棒性,我公司针对不同噪音类型,在特征域和模型域上分别采取了相应措施。 在特征域,对于平稳加性噪音,提出了基于功率谱减法,实现噪音抑制;对于复杂噪音(卷性、缓变、冲击噪音),我们提出了基于降噪自动编码器(DenoisingAuto-encoder)的噪音补偿模型,将带噪语音特征映射到干净语音特征,实现噪音消除。 在模型域,我们采用数据增强的训练机制,将噪音数据通过随机高斯的形式加入到声纹模型的训练中,使得训练后的模型对噪音数据具有更强的鲁棒性。 5、短语音鲁棒性 中科汇联智能声纹识别解决方案为了提高短语音鲁棒性,提出了基于短时帧级别的模型训练机制,使模型能够在极短的语音时长(约0.3秒)下即可完成声纹识别。在此基础上,我们在模型训练中引入了更多高阶的统计信息和正则化准则,进一步提升了模型在短语音条件下(2~3秒)的识别精度。 除了上述在算法层面的解决方法,中科汇联智能声纹识别解决方案还结合具体业务场景,设计与使用者相关的对话内容,例如提出相关问题,或要求朗读协议内容。这样一来可以收集到足够长的有效语音,二来通过对话内容,比如相关问题的答案,可以进一步判断用户的身份,进一步提高安全性。 6、模型小型化 中科汇联智能声纹识别解决方案采用模型小型化的方法,解决实际应用中的问题。 采用基于矩阵或者张量分解的压缩方法,通过若干个低秩矩阵或者张量的累积实现对原始矩阵的重构,以此达到网络存储压缩的目的。 采用定点化训练的方法,实现对网络参数的量化。此外,还可以采用局部敏感哈希或汉明距离度量等方法,将高精度的声纹模型映射到一个近似的二进制空间,完成声纹模型的二值化,并通过汉明距离即可快速实现两个声纹模型的比对。 采用基于神经元或连接边的网络裁剪,实现对网络拓扑结构的压缩和对网络的稀疏化,完成网络压缩。 7、快速自适应 中科汇联智能声纹识别解决方案采用声纹模型快速适应方法,解决了在特定应用场景中,受录音设备、业务内容影响的问题。 8、防录音攻击 中科汇联智能声纹识别解决方案从特征域和模型域等角度采取了不同的检测策略,解决了声音模仿、语音合成、声音转换和录音重放等题。 9、实用性 中科汇联声纹识别解决方案可与全国公安局在用的刑专平台无缝对接,采集的数据通过平台进行分发。可与全国公安分局在用的标准化人员信息采集系统无缝对接,通过标准化人员信息采集系统进行数据采集、入库,实现对采集数据的统一管理、应用。 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-6-25
    最后回复 乔雅娴 2021-6-25 06:30
    4442 0
  • 【黑科技大揭秘】揭秘神奇的骨声纹技术!
    让你的语音可识别的骨声纹黑科技,升级就可以体验到,快来阅读文章了解升级信息 你心目中最理想最自然的人机交互是什么样的?是像钢铁侠的Javis一样?随时随地待命,不仅认识你而且懂你。其他人可使唤不了Javis,而Javis也不会不给钢铁侠面子:“请先证明你是Tony Stark。” 基于对这种交互的追求,华为FreeBuds 2 Pro 创造性地在耳机中植入了骨声纹传感器,所谓骨声纹就是从头骨传导的声纹加上空气传播的声纹,这两个信息合在一起构成了独一无二的生物信息。 当机主说出语音命令的时候,骨声纹传感器包括放大器和处理器就对骨声纹信息进行收集并进行双重验证。同时启动耳机mic识别语音命令,您无需对手机进行解锁,一句话就能实现机主身份信息验证。 接下来,请大家一起看看骨声纹识别的原理以及能给我们的生活带来哪些改变。 骨声纹识别技术及其应用 生物识别技术利用人体固有的不可复制的独一生理特性(如指纹、脸象、虹膜等)和行为特征(如声音、步态等)来进行个人身份鉴定的技术。 骨声纹识别技术作为声纹识别的一种,是骨纹ID+声纹ID共同作用而进行鉴权的全新生物识别技术,在声纹识别的基础上增加了骨纹识别技术,利用人类头骨的唯一性,采用双重ID识别,既增加了声纹识别的精确度,又弥补了声纹识别的不足。 通过人的颅骨、骨迷路、听觉中枢来传递声波,采用骨传导技术将声音转化为不同频率的机械振动,打造一套骨声纹识别系统,实现实时的响应和骨声纹的鉴别。实现既能随叫随应,又能够分辨这是你的声音,完成对手机的解锁。 目前这项全新的技术被华为应用于无线蓝牙耳机/新款手机上。 拥有了骨声纹技术的Freebuds 2 Pro,就像一个随时听命的专业助手,能够自动识别出机主身份,无需对手机进行解锁等操作,通过语音命令即可直接打开支付二维码。对比一般的支付过程,骨声纹支付就是一句话的事儿。 升级进展 已有HUAWEI Mate 20系列 丨荣耀Magic2 丨荣耀V20支持,另有HUAWEI P20 系列 丨 Mate RS 保时捷设计丨Mate 10 系列 丨 nova 3丨荣耀Play 丨 荣耀10 丨 荣耀V10 丨 荣耀Note10 升级到EMUI 9.0.181即可支持,暂未收到升级信息的用户可进入“服务”APP的“升级尝鲜” 优先获取体验。 升级完成后,就能实现一句话直达支付界面,同时支持HWA高清音质和开盒自配对弹窗功能,快来一起体验骨声纹黑科技吧! 原文章作者:华为商城,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-6-21
    最后回复 允裘 2021-6-21 22:39
    1075 0
  • 华为EMUI9.0又有一项黑科技!骨声纹ID识别到底牛在哪?
    继“吓人的技术”GPU Turbo和“5G来临前最具革命性的通信技术"Link Turbo相继推出之后,华为EMUI系统再迎重要技术创新。根据华为EMUI官方微信发布的最新消息,华为P20 系列 、Mate RS 保时捷设计、Mate 10 系列、nova 3、荣耀Play、荣耀10、荣耀V10 、荣耀Note10这八款机型升级EMUI 9.0.181版本之后可支持FreeBuds 2 Pro骨声纹ID识别功能,语音解锁、声控支付统统不在话下。 不同于GPU Turbo在提升手机游戏性能上的增分加成,Link Turbo在移动上网体验方面的通信革新。骨声纹ID识别意在将先进的生物识别技术作用在无线蓝牙耳机产品上,带给用户更加便捷的交互方式。 究竟骨声纹ID识别是什么,背后蕴含着哪些技术原理呢?又能为我们的生活和工作带来哪些便利呢?下面我们就来深度探讨一下。 骨声纹识别技术是骨纹ID+声纹ID共同作用而进行鉴权的全新生物识别技术。此次,华为在Freebuds 2 Pro中加入了骨声纹传感器,通过人的颅骨、骨迷路、听觉中枢来传递声波,采用骨传导技术将声音转化为不同频率的机械振动,打造一套骨声纹识别系统,实现实时的响应和骨声纹的鉴别。 骨声纹识别系统包括骨声纹传感器、信号放大器、模数转换单元(ADC)、信号处理单元、结果输出五个部分。利用骨传导技术原理,通过传感器从头骨的振动转化电信号,信号通过放大器放大后模数转换单元介入,将模拟信号转换成数字信号,信号处理单元再按照专用的算法和参数,将数字信号加工处理后得到最终结果。 骨声纹传感器能够感应通过头部骨骼传导的振动并开启MIC, 自动响应佩戴者的语音命令,杜绝环境音和其他人的语音造成的误触发。耳机内置骨声纹传感器拾取通过头骨及相关的固体介质传导的骨声纹,加上MIC拾音,双重对比机主独一无二的声纹特征进行鉴权,使得Freebuds 2 Pro能自动识别出用户发声的启停,区分头骨振动来源于环境音还是用户,保证在正常发声时才启动MIC录音。这种封闭性和活体检测,让骨声纹识别可以防止录音攻击和合成攻击。 在华为Freebuds 2 Pro和P20的完美配合下,利用骨声纹识别技术,通过语音控制,耳机就能自动识别出用户身份,进行解锁、打电话、查找地图、设置闹钟等操作。特别是在进行移动支付时,只要佩戴上耳机,并说出支付软件名称,P20就可自动识别机主身份并直接跳转到相应的支付界面,动动嘴就能完成支付操作。 骨声纹识别技术的搭载,不仅让用户得以享受更自由的使用体验,其更重要的意义在于,华为全面聚焦用户用机时的痛点,不断进行自我提升。回顾GPU Turbo和Link Turbo的发布,华为EMUI攻克了诸多技术壁垒,以接连不断的技术成果促动智能手机生态完善。未来,相信会有越来越多像华为EMUI这样具有探索精神的前行者,在科学技术的飞速进步中,将创新技术应用到实际生活中,给人们的科技生活创造极大便利。 原文章作者:咔嚓爱科技,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-6-17
    最后回复 躬甍 2021-6-17 12:03
    1482 4
  • 声纹识别:非接触式,更保护隐私之余会否成为手机标配?
    近年来,隐私保护愈发受到人们的关注,智能手机的普及,人们日常生活许多隐私都会储存进手机当中,一定的保护是免不了的。从一开始的手势密码和数字密码,逐渐发展到现在的指纹识别和面部识别,而近日有新消息称声纹识别可能即将开始普及。 据报道,继去年广州等地推出“微信身份证”后,我国首个基于声纹识别技术的互联网身份认证云项目落户贵州,致力于为百姓提供网络身份认证服务。 据笔者了解,其目前的认证方法大概如下:基于共享密钥的身份认证、基于生物特征的身份验证和基于公开密钥加密算法的身份验证。而其中声纹识别是根据语音中所蕴含的说话的个性特征去识别该段语音说话对象的身份的过程。 声纹识别最大的特点就是与其他生物特征识别相比,声纹识别不会存在遗忘和忘记,且不需要记忆和使用方便等等。简单来说,声纹识别就是将声信号转换成电信号,再通过计算机进行识别的技术,可以用于多方面领域的公共认证服务。 原文章作者:CoN9洋葱,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-6-9
    最后回复 噙周损 2021-6-9 15:49
    2921 0
  • 声纹识别公司SpeakIn完成近亿元融资,IDG 领投
    投资界(ID:pedaily2012)5月29日消息,专注于声纹识别的人工智能公司SpeakIn(势必可赢科技)及其全资子公司国音科技,宣布已于5月完成近亿元人民币融资,创下声纹识别领域最大单轮融资纪录,本轮融资由IDG资本领投。 据悉,SpeakIn 2015年创立于美国硅谷,是一家全球领先的声纹识别与身份安全人工智能公司,面向全球提供领先的解决方案和专业服务。国音科技有限公司是SpeakIn旗下全资子公司,以人工智能技术为核心的行业综合方案提供商,面向国内的国安国保、公共安防、司法与反恐等领域提供科技产品和大数据服务。 本轮领投方IDG资本资深合伙人杨飞表示:“声纹识别技术最近发展得很快,这是个世界前沿的技术阵地,是人工智能时代的一个重要组成部分。随着声纹大数据的不断积累,声纹识别技术将快速成熟,其应用场景将快速丰富起来。我们投资势必可赢,看到了这家公司技术的领先地位,在国际同行业都是领先的,二是中国的应用场景更加丰富。另外,这家公司的创始人陈昊亮非常独特,他不仅学识渊博,而且激情中不失沉稳,举重若轻,执行力强而又有人格魅力,这是难得的创业人才。相信他有能力把势必可赢带成中国智能产业园中的一棵奇葩,馨香世界。” 原文章作者:投资界,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-6-9
    最后回复 牝筒 2021-6-9 09:43
    1623 0
  • 骨声纹识别遥不可及?快更新你的手机,或许也能支持这项高级功能
    据华为商城官方宣称,目前多款荣耀以及华为手机全网升级推送新的版本更新,此次更新新增了一项功能,就是适配了荣耀FlyPods Pro耳机,包括骨声纹支付唤醒词,还有荣耀FlyPods Pro和荣耀FlyPods的HWA高清音质、开盒自配对弹窗功能。 这次更新所覆盖的机型目前已经有14款:华为P20、华为P20 Pro、华为Mate 10 Pro、华为 nova 3和华为Mate 20系列。荣耀Play、荣耀10、荣耀V10、荣耀Note 10、荣耀Magic 2和荣耀V20。 荣耀FlyPods Pro的骨声纹识别技术可以用来识别机主身份从而解锁手机。同时也可以设置唤醒词,比如,当你佩戴着耳机时,只需说出“微信支付”或“支付宝支付”,手机自动识别机主身份并直接跳转到相应的支付界面。包括打电话、查找地图、设置闹钟等等均可轻松搞定,很大程度上解放双手。 不过目前,骨声纹识别功能只能配合荣耀FlyPods Pro使用。 原文章作者:极果网,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-6-8
    最后回复 呆贺兖 2021-6-8 14:52
    1683 13
  • 黑科技!声纹识别加入广发信用卡
    如何证明你是你?这个莫名其妙的问题一问出来,相信不同的人都会有不同的答案,比如身份证、指纹、面容识别等......但如果说,广发信用卡可以通过你的声音识别到你是你,是不是感觉十分有黑科技? 声纹识别也被称为“说话人识别”,和指纹、人脸等生物识别技术一样,声纹识别也有帮助确认身份从而规避欺诈风险的功能。随着声纹技术成熟和发展,目前已在很多场景有了广泛应用,金融场景就是其中之一。广发银行近年来不断加大金融科技的研发和应用力度,今年6月,广发信用卡95508热线引入业界领先的声纹识别技术,将说话人声音特征作为身份唯一ID,切实提升用户体验,进一步实现数字金融服务升级。 那么,声纹识别在信用卡的实际使用中能给我们带来什么便利呢?在信用卡反欺诈工作中,识别用户真实身份是第一关,也是最难的一关。声纹辨认作为一种标识个人身份特征的手段,越来越受到重视。该技术基于建立的黑声纹库,对黑声纹电话过滤,实现线上实时防控,辅助提升信用卡业务办理风险分析和预防。当持卡人需要操作业务授权确认时,后台系统通过声纹搜索黑声纹库,做1对N的辨认,将识别具有相同声纹但登记了不同身份信息的可疑人员进行备注。以此举来防范欺诈风险的发生,同时,声纹辨认技术也节省了业务办理时间,从而提升了客户体验。声纹辨认技术强化了风控体系,做到高精准、高安全、全自动的身份欺诈识别和欺诈拦截。 原文章作者:零一渡科技,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-6-7
    最后回复 我厢 2021-6-7 22:45
    2974 0
  • 智能运维之电力设备声纹在线监测(12月11日)
    电力设备运行的在线监测是保证可靠运行的重要技术手段。目前 有多种状态监测方法,但是这些方法常常采用的是接触检测技术,目前高压电力设备的运行状态监测方法不够成熟,现场环境复杂存在着广泛的电晕放电、开关动作产生的冲击以及相邻高压电气设备内部可能出现的局部放电等干扰源。而声纹状态监测技术的声纹信号的获得无须接触电力变压器,不会影响其工作状态,在高电压及强电磁场中也不会受到影响。 我公司研发了一种基于声纹分析的声纹电力变压器监测系统基于 Cmfmc2.0 技术的跨信道声纹识别准确率 达到 99%以上,远超国内外同行的 40~60%。 声纹电力在线监控系统 集AI+物联网+5G 为一体,响应了国网提出的泛在电力物联网的号召, 并且提供了电力设备在线检测的新的有力手段,目前可以对变压器, 开关柜,母线等主要设备提供 24 小时在线检测,主要对变压器的各 种故障状态及时预警, 并实时显示在监控中心大屏和巡检人员的手机 APP 上,对非正常状态的故障现象进行人工智能的深度学习,为运检人员提供设备全生命周期的变化监测曲线,为正确运检决策做出辅助研判。 声纹识别技术是的提取说话特征来判断说话人的方法,它通过提取不同说话人声音信号的特征向量组成特征向量库,进而比较特征向量相似度来确定说话人身份。 由于运行中的变压器噪声信号蕴含着丰富的设备信息,且与变压器结构、运行状态等密切相关,因此可将声 纹识别技术应用于变压器噪声识别,对复杂的噪声机理进行有效分析 并识别出不同的设备状态,为变压器状态监测提供依据。 原文章作者:长供电力,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-6-7
    最后回复 销晃尸 2021-6-7 15:19
    2459 0
  • 京东数科“猪叫识别”亮相数字中国声纹识别成“智能兽医”
    搜狐科技讯 “猪的叫声其实分很多种,平时是‘哼哼’,寻觅伴侣时‘呼噜呼噜’,身心舒畅的时候也会发出满足享受型的‘哼唧’,京东数字科技在做的事情,就是从叫声来探测猪的身心健康状况,让一只猪受到无微不至的呵护,生活得更有尊严。” 5月6日至8日,第二届数字中国建设峰会于福建省福州市举行,京东数字科技智能农牧养殖解决方案亮相成果展。其中,可用于疫病预警的“猪叫识别”技术颇为新鲜。 “猪叫识别”技术,根据猪的叫声来检测疾病,并且在第一时间进行疫病预警,汇报给猪场的兽医或饲养员。与传统中医诊治“望闻问切”相类似。 据京东数科介绍,每年我国出栏的生猪数量约为7亿头,占据全球生猪总出栏量一半之多。但我国的养猪水平距离发达国家还有很大的差距,疫情判断基本靠肉眼。 除了“猪叫识别”,还有24小时工作的养殖巡检机器人代替人工管理员,精准捕捉猪的数据,比如为猪测量体温、观察猪的进食量变化;基于猪脸识别技术,智能农牧养殖解决方案会判断小猪的具体营养需求,用饲喂机器人精准控制发放的饲料总量;此外还有智能化的温湿度环境控制,农业专用摄像头24小时监测,伸缩式猪栏保障每一头猪都可以单独进食,让每一头猪提高生活质量。 京东数科表示,基于这套解决方案,养殖企业可以节省30%以上的人力成本、8%-10%的饲料成本,最终缩短生猪出栏时间5-8天,实现了养猪的“多快好省”。 目前京东数科已经与吉林精气神、哈尔滨信诚、重庆六九畜牧、四川元宝枫等养殖企业签署订单。 原文章作者:搜狐科技快讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-5-28
    1897 0
  • 声纹识别公司SpeakIn 完成近亿元融资,IDG 领投
    日前,声纹识别人工智能公司 SpeakIn(势必可赢科技)及其全资子公司国音科技,宣布已于 5 月完成近亿元人民币融资。据悉,此轮融资创下声纹识别领域最大单轮融资纪录。SpeakIn 的本轮融资由 IDG 资本领投。 SpeakIn 与 2015 年创立于美国硅谷,是一家全球领先的声纹识别与身份安全人工智能公司,面向全球提供解决方案和专业服务。 国音科技有限公司是 SpeakIn 旗下全资子公司,以人工智能技术为核心的行业综合方案提供商,面向国内的国安国保、公共安防、司法与反恐等领域提供科技产品和大数据服务。 本轮领投方 IDG 资本资深合伙人杨飞表示:“声纹识别技术最近发展得很快,这是个世界前沿的技术阵地,是人工智能时代的一个重要组成部分。随着声纹大数据的不断积累,声纹识别技术将快速成熟,其应用场景将快速丰富起来。我们投资势必可赢,看到了这家公司技术的领先地位,在国际同行业都是领先的,二是中国的应用场景更加丰富。另外,这家公司的创始人陈昊亮非常独特,他不仅学识渊博,而且激情中不失沉稳,举重若轻,执行力强而又有人格魅力,这是难得的创业人才。相信他有能力把势必可赢带成中国智能产业园中的一棵奇葩,馨香世界。” SpeakIn 创始人兼 CEO 陈昊亮表示:“AI 已经从深度学习的技术爆发时期过渡到了收获期,从局部过渡成了标配,技术的普及使得 AI 成为了行业的基础服务。接下来考验人工智能公司的是要在继续做好底层技术积累的同时,也要不断积累行业领域认知,把技术形成的竞争优势转化为商业效率上的优势。这次融资主要用于两方面:一是继续投入基础科研,为将来底层技术上的范式转移做积累;二是扩展技术与各行业结合的横与纵,加速产品的开放化。” 声纹识别公司 SpeakIn 完成近亿元融资,IDG 领投动点科技。 原文章作者:动点科技,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-5-18
    最后回复 允裘 2021-5-18 15:50
    1120 0
  • 声纹识别公司SpeakIn获数千万元融资,IDG资本领投
    亿欧5月2日消息,声纹识别与身份安全方案提供商SpeakIn(势必可赢科技)今日宣布完成数千万元新一轮融资,由IDG资本领投,弘治资本、福鱼资本跟投。 2015年SpeakIn创建于美国硅谷,目前总部位于深圳,在广州、硅谷均有办事处。SpeakIn的定位是为全球提供领先的方案与服务。目前SpeakIn已为国内多个地区的公安、金融、社保、安防等机构和知名企业量身定制了多种基于声纹识别的身份安全解决方案。 声纹识别系统是根据人声的特质来自动识别说话人的身份的系统,声纹是由波长、频 率以及强度等百余种特征维度组成的生物特征。声纹具有唯一性,是重要的生物特征数据,采集方便,无需专用设备,可进行远程采集和远程识别。 例如在公安领域,SpeakIn为公安及司法机构提供专属定制的声纹识别系统安全解决方案,服务体系包括重点人员的声纹数据库建设、声纹自动识别系统、声纹鉴定等。通过声纹识别和声纹大数据技术进行重点管控人员监管、反电信诈骗、反恐、 刑事案件侦破、身份查询与核验,助力公安有效遏制与打击犯罪,构建和强化安全的社会公众环境。 除了SpeakIn之外,国内做声纹识别的公司主要有两大巨头:科大讯飞和百度。今年4月11日,百度研究院院长、深度学习技术及应用国家工程实验室主任林元庆在“第五届百度技术开放日”上表示,声纹识别跟语音识别不一样,语音识别是识别声音本身,而声纹识别是识别谁在说话,因为声音有很多的噪声,这个技术难度非常高。 为什么声纹识别这么重要?林元庆认为这主要体现在两个方面: 1、身份认证非常重要,比如在银行领域,对精度的要求非常高,其实美国标准是同时有两种方法认证,即同时有人脸识别和声纹识别。 2、人机交互最初指的是键盘、手机触摸,现在已经进入到了下一代:语音。语音产品要基于语音自然交互场景,而声纹识别可以帮助实现说话的人是谁。 SpeakIn公司团队核心成员均来自哈佛大学、麻省理工学院、香港科技大学、香港中文大学、中国科学技术大学、微软亚洲研究院等国内外顶尖高等学府和科研机构,SpeakIn云集了一批顶尖的声纹识别算法与机器学习的科学家和来自BAT等知名互联网企业的产品研发团队,具有很强的科研实力及产品研发能力。 SpeakIn创始人兼CEO陈昊亮表示,此轮融资,将会加速声纹识别底层技术的创新和产品研发的迭代,加大市场拓展与培育投入。 本文作者许伟军,亿欧专栏作者;微信:xuweijun24(添加时请注明“姓名-公司-职务”方便备注);转载请注明作者姓名和“来源:亿欧”;文章内容系作者个人观点,不代表亿欧对观点赞同或支持。 注:文章中所涉投融资额度来源于企业或相关机构或公开资料,亿欧已经尽量核实,不对融资额度做品牌背书;欢迎各方监督核实,如融资额度不实,欢迎向亿欧举报。 原文章作者:亿欧,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-5-18
    最后回复 蔑卷刖 2021-5-18 11:02
    3151 0
  • 声纹的安全性和隐私性优势
    序言 按一下手指或对着摄像头刷个脸或注视镜头扫一下眼睛就能快速识别身份、通过分析声音波形就锁定犯罪嫌疑人等等,过去人们在电影中才见得到的这一幕幕酷炫的情节,都已经在现实生活中上演。从2D到3D,从静态到活体,从指纹到声纹,各种生物识别技术已经广泛应用在人们的各种生活场景。 想象一下,如果银行的客户仅凭声音即可访问其账户信息—无需密码或手机验证码;或是另一个场景,在致电银行客服咨询中,通过声音识别完成繁复的身份验证过程,一路畅通无阻,无需输入账户号及电话银行密码。声纹技术仅凭客户说话的声音即可对客户进行身份验证。它比密码更安全更便利,更加受到客户的青睐。 听起来不错吧?由于越来越流行的声纹识别技术,建行、平安银行、广发银行等越来越多的银行已经开始应用声纹识别技术。2018年10月中国人民银行颁布《移动金融基于声纹识别的安全应用技术规范(标准编号:JR/T 0164-2018)》,这是我国金融行业第一个生物识别技术标准。这一年可以说是“声纹元年”,从而声纹识别迈向产业化。 声纹反欺诈,正成为声纹识别应用的一大领域。目前,声纹反欺诈已经在国内多家大型金融机构落地,中国银联、太平洋保险、阳光保险集团等均部署了“声纹识别反欺诈解决方案”,在电话端实现高精度、远距离的身份认证与身份反欺诈。只需要一通电话,仅需几秒钟就能远距离确定说话人的真实身份。 什么是声纹? 当我们说话的时候,声带振动产生声波,声波通过空气、水等介质进行传到我们的耳中,我们就听到了声音。 声纹:是用电声学仪器检测到的,携带言语信息的声波频谱。 声纹识别:是从说话人发出的语音信号中提取声纹信息,并对说话人进行身份验证的生物识别技术。 因为人的发声器官实际上存在着大小、形态及功能上的差异,这些微小差异导致发声气流的改变,造成了音质、音色上的差别。且成年后,人的声音可保持长期相对稳定不变,所以声纹和指纹、虹膜等生物特征一样,具有唯一性和稳定性的特征。无论讲话者是如何模仿他人声音和语气,其声纹却始终不相同。 声纹识别的优势 “声纹识别技术实际上比其他生物特征识别方法更容易”,美国的《Biometric Technology Today》杂志中谈到“您无需去任何地方或触摸任何东西即可验证您的生物特征。” 而且它与指纹识别或虹膜扫描不同,“它只需要一个麦克风作为我们智能手机中已经内置的输入设备即可”。 声纹通过分析一个人的声音的数百个单独成分进行识别。这是生物识别安全趋势的一部分,它可能最终使密码授权的方式过时,但与其他生物识别方式(包括指纹识别,面部识别和虹膜识别)相比,它提供了某些优势,每一种都需要个人的实际存在才能直接与设备进行交互。 与指纹识别、人脸识别相比,声纹识别在实际应用中具有以下独特优势: (1)采集成本低:语音采集装置造价低廉,只需电话/手机或麦克风即可;不受光线、背景环境的影响。 (2) 造假成本高:声纹口令可动态变化,不用担心密码的以往、丢失和窃取问题,造假成本高,因此非常适合需要远程身份验证的场合; (3) 更符合用户习惯:声音是人最自然的生物特征,收集方便。 (4)具有更高的隐私性:声音数据与个人身份信息匹配较困难,减少个人信息如肖像信息被随意使用、冒用、篡改、造假等风险。 Reeftoken钱包声纹识别技术的应用 Reeftoken钱包目前支持人脸、声纹、活体等多种生物识别技术,多重保障用户数字资产的安全。我们采用Finnovant公司SAY-TEC AI声纹技术,该技术获得了美国visa安全支付专利。用户在使用Reeftoken 钱包进行转账交易时,钱包会对当前操作人进行声波识别等活体验证,技术验证通过之后才允许继续进行交易,大大提高资产安全性。 对于一个特定的声纹识别系统来说,以错误接受率为横坐标,错误拒绝率为纵坐标,通过调整阈值得到错误接受率与错误拒绝率之间的关系曲线图,即DET曲线。DET曲线离原点越接近,系统性能越好。 在DET曲线上,第一象限角平分线与其交点处,错误接受率和错误拒绝率的值相等,该错误率称之为等错误率(ERR)。显然等错误率值越小,系统性能越好。同时它也是代表了声纹识别系统的一个大约性能,是衡量系统性能的重要参数。 Reeftoken钱包从根本上实现了声波安全和易用的双向定位,在声波识别和安全方面做到了世界领先水平。 生物识别|人脸|声纹|活体|区块链|新型经济产业 原文章作者:Reeftoken,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-5-17
    最后回复 噙周损 2021-5-17 22:17
    1607 0
  • 快商通肖龙源:国内首家10亿检索,声纹识别率达80%
    5月25日,亿欧2018安防AI创新峰会上,快商通CEO肖龙源发表《声纹识别+安防:助理平安城市建设升级》主题演讲,肖龙源指出,快商通声纹识别率已经达到80%,高于市面的60%的平均水平。快商通通过高技术壁垒、快研发速度、优良团队和与其他技术达成多维度多层次合作,响应国家社会治安立体化防控政策。 快商通是一家专注于声纹识别技术的人工智能技术领域的高新技术企业,成立于2009年6月,以"产品和技术服务30亿人"为企业愿景,目前已挂牌新三板。创始人肖龙源曾入选国内人工智能创业30人榜单,入选厦门杰出青年及青年创新创业(青年双百)人才,兼国立华侨大学统计学院兼职教授,厦门大数据科学研究基地名誉院长。 四个核心竞争力 目前,快商通声纹识别技术主要应用在金融领域,为从事信贷业务的金融公司提供专属定制声纹信贷反欺诈系统,让企业能够在信用审核时进行严谨、及时的身份识别。 在声纹识别技术上,快商通CEO肖龙源接受采访时说,快商通的核心竞争力有四点:第一是专,快商通2013年开始入局人工智能,选择深耕的技术就是声纹识别,已经积累了不少的技术壁垒;第二是快,在技术研发上到商业落地上,快商通步伐较快,目前已经与公安局、电信公司展开合作,建立了动态声纹数据库,支持十亿级声纹库实时检索,能够快速进行1:N大规模检索。 讲到这里,肖龙源补充道:"十亿差不多就是中国网民的数量,目前能支持这个级别的声纹实时检索的,我们是业内首家。" 第三,出色团队;快商通声纹研发团队核心成员100%具有国内外名校博士学位,目前,通过快商通声纹引擎建立的声纹模型数已超过五千万,在稳定性、识别率和处理速度上都领跑行业。 第四,声纹技术的可适用性很强,能与其他技术做组合使用,提供多维度多层次的立体安防体系。讲到多维度和多层次的立体安防体系,肖龙源详细解释:"多维度是指音视频能够相融合。多层次是指声纹识别在完成身份鉴定后,还能通过语音识别技术,把人所说的话表达出来,翻译成文字,以供思考。" 声纹识别和人脸识别都属于安防领域的智能技术,各有长短。肖龙源指出,声纹识别的优势在于,比起人脸识别,人们的抵触心理更弱,只需要一段任意内容的声音即可,资源占用少,性价比高。:"现在所有的安防都只用一个东西就是能看,其实人还有一个功能是能听,能思考,这个就没用上。" 在合适的时机起飞 2017年,快商通营收增长8%,当被问及绩效的主要发力点和动力时,肖龙源说,这得益于当下的政策和行业发展趋势。 快商通起家于智能营销客服机器人业务,服务超过26w+的企业用户,用户量和付费用户仍在增长。2013年,介入人工智能领域,提供声纹反欺诈、智能财务、营销洞察等服务,利用自身的AI能力赋能产业升级,并建立了人工智能引擎平台(Airpower)。 随着政府对人工智能产业的扶持力度增加,市场对AI的需求渐渐强烈,市场出现供不应求情况,也为快商通提供了机遇。 "我们利用自身的AI能力为政府和企业做项目升级,与公安部门建立联合实验室,将声纹识别运用到"平安城市"监控体系中。目前公司项目已经落地金融、司法公安、国家电网等行业。所以这些是我们一些业绩的增长的大部分原因。" 提供一体式解决方案,不断拓展新领域 声纹识别技术需要寻找更多的新场景,挖掘用户痛点,进行大规模商业化落地。肖龙源总结快商通的来时路,也为2018及未来的发展路径做好了规划,他提出,不论是人工智能项目还是企业服务产品线,快商通会两手抓。 "在人工智能项目上,我们会利用我们的技术优势进行能力的开源,助力传统产业升级,同时我们也会利用我们的声纹识别技术在金融、社保、新零售领域做更多一体化的解决方案,服务更多的市场用户;在企业客服这条产品线上,我们会打通售前、售中、售后整体的产品解决方案,全方位,多维度地为客户提供营销解决方案,打造营销客服行业生态链。" 基于声纹识别技术的可使用性强的特点,肖龙源对声纹识别在多领域与其他企业的合作可能性抱有很大信心。"声纹识别技术可以轻松与其他技术作组合使用,许多做安防应用的企业都可以成为我们洽谈的对象。" 原文章作者:壹媒体,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-5-17
    最后回复 司书仪 2021-5-17 15:21
    2145 0

快速发帖

还可输入 80 个字符
您需要登录后才可以发帖 登录 | 立即注册

本版积分规则

在本IOT圈子中寻找帖子
IOT圈子地址
[复制]
Weiot(威腾网)是一家以原创内容、高端活动与全产业渠道为核心的垂直类物联网产业媒体。我们关注新兴创新的物联网领域,提供有价值的报道和服务,连接物联网创业者和各种渠道资源,助力物联网产业化升级。
15201069869
关注我们
  • 访问移动手机版
  • 官方微信公众号

© 2014-2020 Weiot.NET 威腾网 北京微物联信息技术有限公司 ( 京ICP备20000381号-1 )