请选择 进入手机版 | 继续访问电脑版
专注物联网产业服务
微信二维码
威腾网服务号
游客您好
第三方账号登陆
  • 点击联系客服

    在线时间:8:00-16:00

    客服电话

    17600611919

    电子邮件

    online@weiot.net
  • 威腾网服务号

    随时掌握企业动态

  • 扫描二维码

    关注威腾小程序

智能语音交互
智能语音交互
智能语音交互是基于语音输入的新一代交互模式,通过说话就可以得到反馈结果。典型的应用场景—语音助手。自从iPhone 4S推出SIRI后,智能语音交互应用得到飞速发展。中文典型的智能语音交互应用如:虫洞语音助手、讯飞语点已得到越来越多的用户认可。
  • 重新定义车载语音交互:服务“全家人”的“自由对话”
    车载智能语音已经成为了日常用车非常重要的高频功能之一,但当前绝大多数语音交互系统的使用感受,其实并不愉悦。 其中,大多数车载智能语音系统谈“听得清”、“听得懂”尚显得差强人意,更谈不上能够顺畅的自由“对话”和“互动”。 被诟病的较多的问题,主要在于: 一是需要一遍又一遍的唤醒系统,还往往需要等到语音系统完整复述完并且处理完上个指令后,驾驶员才能开口提其他需求,太考验人们的耐心;二是说出指令需要刻意记住关键词才能成功识别,太考验记忆力。 又或者是一个人开口,其他人都需要“闭嘴”,这是因为语音系统很容易受到其他语音干扰。如果一旦有“熊孩子”在一旁“捣乱”,往往会导致语音系统无法正常识别指令。 几天前,理想汽车正式发布了其智能语音系统“理想同学”2.2版本,重点针对上述痛点进行了改善。该公司相关负责人表示,新版本的核心目标是:服务“全家人”的“自由对话”。 2.2版本的“理想同学”主要升级了四个方面的功能,包括连续对话、可见即可说、四音区锁定、跨音区上下文对话。 1、连续对话 理想同学2.2版本可以支持单次唤醒后的连续指令下达。在上一个指令成功执行后,智能语音系统有20秒的时间,来等待乘客发出下一个指令。 这样的好处就是,用户在需要连续操作时,不再需要一遍一遍的重复“理想同学”来再次唤醒系统。 除了以上,连续对话功能还有一个特点在于支持随时插话,而不需要耐心静待系统完成上一条指令之后再开口,系统会自动录入指令队列,然后按照顺序执行。 比如,你可以连续下达“空调调到20度”、“打开音乐”,“打开后排座椅通风”等等多个指令而无需间歇等待,让语音功能操作变得便捷而高效。 除了这些,理想同学令人印象深刻的还有一点在于“无效文本拒识”功能。在智能语音开启过程中,即便有其他人插话和交谈,理想同学能够“聪明”地识别到哪些是需要执行的指令,哪些是车内的交谈内容。 2、可见即可说 用户在使用理想同学控制某个APP时,乘客不用再刻意记住指令、关键词这类触发语,只要看到屏幕上所显示的菜单栏写着什么就说什么,系统可以自动识别并执行。 当然,这需要理想的智能语音系统与外部应用APP深度绑定和开发,目前首批支持的应用包括QQ音乐、喜马拉雅、蓝牙电话、车辆中心。 值得一提的是,考虑到安全因素,车辆中心里有关驾驶的设定并不支持非主驾区域的语音控制,也就是说这部分内容只能由驾驶员控制。 3、四音区锁定 在已经实现了全车多音区均能进行智能语音对话外,理想同学2.2版本对全车多音区应用再次做了精细化的体验升级:支持除主驾之外任意一个音区的识别关闭。 作为一辆家庭用车尤其家有多个小朋友,往往会出现对语音控制的“话语权”争抢,尤其是有些“熊孩子”的故意捣乱,往往会影响家长的正常使用。 这个时候,主驾驶只要说“关闭后音区”、“不要听副驾驶”等指令,就可以关闭相应位置的语音识别,避免熊孩子捣乱。 4、跨音区上下文对话 当前,智能语音被诟病死板的场景之一在于同一个功能指令下的重复啰嗦,更在于不同驾驶位的人员明明是类似的需求,不仅需要主驾多次唤醒语音助手,还需要针对不同座位来重复同样的指令,来完成不同区域的调整。 而理想同学2.2针对这些场景有了升级,可以针对上条指令内容进行上下文关联对话,并对其他座位上的乘客需求进行调整。 比如,针对空调、座椅、车窗等调整,第一次如果不满意,就可以再次说再大点/冷点,温度调到XX度,风量调到XX档等; 主驾调好后,可以说“副驾也是”等一键同步到其他座椅位置;并且在相同的指令语境下,其他座椅位置的乘客,也可以唤醒理想同学后,说“我也要”。 发布会结束后,我们对理想同学2.2版本进行了体验。整体感受来看,理想同学的四音区应答能力非常好,连续对话、可见可说,以及跨音区的上下文对话能力都已经能做到,已经优于市面上大多数语音交互的体验,相信OTA升级后的理想同学将成为理想ONE的核心卖点之一。 本次智能语音系统“理想同学”2.2版本只是理想汽车2021年OTA升级计划的一部分。按照计划,这套智能语音系统在今年将陆续启动FOTA2.1、FOTA2.2、FOTA2.3三个阶段的产品升级。 随着2021款理想ONE上市,FOTA2.1正式推出,搭载了自研的理想同学引擎,底层能力替换为地平线 + 思必驰 + 微软,增加四音区锁定和唤醒打断功能,并可实现语音控制动力模式、驾驶模式; 如今FOTA2.2版本的升级也主要是早期规划部分,包括自由对话、连续对话、想说就说、无效文本拒识、可见即可说&可想即可说、跨音乐上下文对话、 HIFI 级情感化语音合成。 官方显示,OTA2.2版本更新将于9月15日前陆续开启推送。 接下来的FOTA2.3升级则包括四音区副驾屏语音系统、可见即可说 II 期、多应用控制及仲裁策略、视频应用接入、全车媒体应用接入。 在此之前,理想ONE采用的是第三方供应商提供的智能语音系统,随着自研理想同学语音引擎上线,底层能力也被替换,理想智能语音功能不仅体现出极大地个性化,针对当前语音交互的痛点来实现优化升级。 这背后,是车企对深度自研的需求与能力体现。 对车企来说,只有 “深度自研”才能拥有不受制于供应商的开放能力和主导权,有了更大的发挥空间,来更加灵活实现属于品牌自身特色的差异化与个性化,并能快速拓展引入功能和场景细化,实现跨垂类生态和语音控制场景全链条的逐步打通。 在供应商提供底层技术和基础框架的基础上,其他的大部分,如交互架构搭建、操作系统、上层的功能开发和应用等将由主机厂自我研发实现。当前来看,几家头部新势力企业都倾向于自研模式。 在本次发布会上,理想汽车还推出了基于车载应用生态的应用中心,对于接入的应用,理想汽车制定了一定的标准和要求。 首先,理想汽车和第三方公司共同定制专属理想汽车的车载App,接入的应用统一实现符合理想车机系统风格的UI设计。其次,接入的应用要与理想车机系统做深度融合,比如需要全方面支持语音控制,需要符合理想汽车的交互逻辑。 这样第三方应用可以更好地适配理想ONE的显示屏以及车机系统,界面效果、系统流畅性、使用感受都会大幅提升。目前这类第三方的应用程序增加到了9个。 理想汽车与其他新势力的显著区别有两点,一是走增程路线,另外是只卖一款车,一个配置,一种价格。 一直以来,理想汽车强调的都是用户体验,更舒适、更愉悦的空间, 而智能座舱、智能语音等均是理想汽车主打的核心技能之一。 2021款理想ONE标配全栈自研的理想AD高级辅助驾驶系统,在原有的 Level 2级别辅助驾驶基础上,升级NOA导航辅助驾驶的能力。 该系统计划在9月份升级,配合高精地图的覆盖,新增导航辅助驾驶、虚实线识别、锥筒识别、限速识别。在第四季度新增车辆朝向识别、停止线识别、斑马线识别、地面标识识别、城市路口增强、信号灯提醒、离车泊入、一键泊出。 此前,理想汽车设定的销量目标是单月突破一万台。5月25日新款(2021款) 理想ONE上市后,6-8月都保持了连续高增长的态势。 数据显示,8月份理想ONE交付量已经达到9433辆,同比增幅高达248%。目前来看,距离目标仅一步之遥。 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于8 小时前
    最后回复 倪腴 8 小时前
    1797 0
  • 支持原生智能语音交互,科沃斯发布首款家用服务机器人3.0产品|钛快讯
    科沃斯首次提出“家用服务机器人3.0”概念 钛媒体9月15日消息,科沃斯机器人召开主题为“多维进化”的新品发布会,带来包括行业首款全能扫拖机器人地宝X1家族、AI智能语音助手YIKO以及多功能空气净化机器人沁宝Z1等新品。 同时,科沃斯也通过提升家用服务机器人在功能性、智能性和交互性上的体验,首次提出了“家用服务机器人3.0”的概念。 新发布的科沃斯地宝X1家族,其定位是全能扫拖机器人,在清扫方面,地宝X1具备5000Pa吸力,拥有95%的CE值,这也是目前行业内的最高水平,拖地系统也升级为OZMO Turbo 2.0,进一步增加了自清洁能力以及拖地力度。 科沃斯地宝X1技术升级 与地宝X1搭配的全能基站OMNI STATION内置2.5L容量密封尘袋,还搭载自动集尘、自动回洗拖布、自动补水、自动除菌和自动烘干的功能。 同时,针对目前扫拖一体产品基站中出现的拖布清洁环节容易造成二次污染的问题,科沃斯开发了除菌率达到99.9%的银离子除菌模组。智能体验方面,科沃斯地宝X1集成了自主研发的RGBD传感器,配合全新的AIVI 3D技术,可以将家庭清扫地图升级成为三维形态,不仅可以识别房间布局,还能识别具体的家具以及物品。 旭日3芯片 此外,该产品还采用了地平线的智能芯片旭日3,它具备5 TOPS等效算力,60毫秒最低延迟,2.5WATT低功耗和416FPS的AI真实性能,物体识别种类从5种大幅扩展至15种,AI处理速度提升400%,科沃斯家用服务机器人总经理钱程在活动中表示:“这颗芯片拥有满足L2+辅助驾驶AI计算需求的同等性能表现。” 发布会上,科沃斯还带来了家用服务机器人行业首个自然语言交互助手YIKO,通过简单的“OK, YIKO”召唤机器人,语音AI算法与视觉AI算法的深度融合,实现了自然语言交流和多模态交互,与机器人产品功能的深度绑定。 自然语言交互助手YIKO 与很多第三方的智能接口不同,YIKO的内置设计让它可以获得更高效的沟通体验,在发布会的展示当中,YIKO不仅可以执行开启、停止清洁等简单操作,还可以实现队清洁模式的切换以及对房屋具体范围清洁任务的指令执行。 除了家用清洁服务机器人产品,科沃斯也对空气净化机器人产品线进行了更新,推出了新一代产品沁宝Z1,它内置多维传感器,能够应对不同的空间大小、空气品质以及工作场景,并且还集成了净化、UV除菌、移动香氛和全屋加湿四重空气焕活系统,该产品将于明年3月正式上市。 多功能空气净化机器人沁宝Z1 总体来说,在家用服务机器人领域当中,科沃斯此次首先是拉升了扫拖一体机器人产品的表现力。一方面通过引入智能语音系统带来更加易用、高效的交互逻辑,另一方面则在基础的清扫、拖地能力上进行升级,并对基站的自清洁环节进行了进一步完善,从而带来了家庭地面清扫完全脱离人为干预的体验。 其次,还能看到科沃斯对于其他种类机器人的探索也在加速,依托目前在清洁机器人领域积累的避障、地图导航、数字地图搭建技术,通过机器人+场景化功能的方式来不断扩展其在家用领域的应用边界。 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于16 小时前
    最后回复 帕昆 16 小时前
    5522 0
  • 建设银行发布“一句话”产品,开创语音交互新模式
    2021年9月17日,“科创中国:第五届金融科技创新大会”在京召开。 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于昨天 17:01
    最后回复 畴酉 昨天 17:01
    2846 0
  • 家页观察|语音交互时代,谁将成为智家中台的主宰?
    导读:智能音箱在全屋智能中的作用不应仅仅是一个语音中台,更应该是通过APP实现全终端交互的媒介。 近日,百度旗下小度科技宣布已经完成B轮融资,投后估值高达 330 亿元人民币。 小度科技原为百度旗下智能生活事业群组业务,于2018年3月6日正式成立,由百度“度秘事业部”、“硬件生态渠道部”和“Raven Studio工作室”共同组成。 2020年9月,百度宣布旗下小度科技完成了独立融资协议的签署。小度科技在组织架构上成为独立公司。但是,百度作为大股东,融资后仍保持对小度的绝对控制权。 此次融资后,智家业务再次成为行业热议话题,也让人们对智家入口产生了更多的思考。 小度围绕语音助手 扩充多品类智能硬件 数据显示2020年中国智能音箱总销量为3676万台。其中,阿里巴巴、百度、小米三家的销量共占市场份额超过95%,呈三强争霸的态势。 随着国内智能音箱市场竞争进入白热化,小度科技也在拓展新的智能硬件品类。目前,小度智能产品有:耳机、音箱、智能屏、巨屏电视等。无论硬件如何更新,小度科技生产的智能产品始终围绕语音交互进行升级。 语音交互被很多人认为将是人工智能时代最流行、最普遍的交互方式。当下,语音助手正在加速与各产业进行深度融合。随着产品智能化的深入,搭载语音助手的智能终端数量不断增长。 2020年我国智能语音助手市场规模达到241.1亿元,同比上年增长50.0%。而小度的语音交互是通过小度助手APP实现的。 在产品端,小度助手和硬件相结合,以此实现软硬件一体差异化的产品服务,即通过软件来定义硬件,提升用户体验。在AIoT生态建设上,小度助手通过智能分发、植入等方式与合作伙伴的产品进行打通。 目前,小度助手已经应用在包括智能家居、随身设备、智能车载三大场景中,应用产品覆盖智能音箱、智能手机、智能电视、智能手表、智能汽车、机器人等多种硬件。 无论小度的智能硬件终端品类如何扩展,其核心科技仍是能够实现语音交互与产品互联的小度助手。今年6月,小度助手语音交互总次数达到58亿次,比去年同期增长了57%。 语音交互成为小度科技业务发展的核心,百度也借此撬动了智能家居的风口。 全屋智能的 终极目的是万物互联 小度科技自2020年9月以来,在一年时间内完成了三轮融资,融资金额分别为200亿人民币、29亿美元和51亿美元。 资本的青睐,最根本原因就是小度科技声称其语音交互功能在全屋智能时代下对智家中台的升级价值,最终跑出了完整的商业链条。 智能家居概念的出现,可以追溯到上世纪。1984年,美国建造了世界上第一栋将空调系统、电梯、防火防灾等各子系统计算机相连的智能建筑。 到了1994年,比尔盖茨将灯光、暖通、家电等集成在电脑系统中,建造出智能化豪宅。智能家居概念就此出现。 随着通信技术、自动化控制、大数据、人工智能等技术的发展,搭载蓝牙、传感器、WiFi、自动控制等技术的智能设备开始进入人们的生活,智能家居进入了单品智能设备时代。 在互联网进入5G通信时代后,万物互联概念兴起,单品智能设备已不能满足新生代消费群体对于“万物互联”的需求,全屋智能成为行业努力奔赴的目标。 实现全屋智能的根本是要有合理、高效的智家中台,以此作为“万物互联”的枢纽。 但是目前,智家市场上仍未有一款能够实现万物互联的智家中台设备。究其原因主要两点:一是品牌限制导致应用层面无法实现互联互通,二是软件核心能力不足无法实现空间互联互通。 在政策方面,住建部等16部委联合发布的《指导意见》明确提出,推进智能家居产品跨企业互联互通和质量保障,规范智能家居系统平台架构、网络接口、组网要求、应用场景。 在物联网领域,只有让企业在应用层面开放生态、达成统一标准才能真正实现智能家居产业的“万物互联”,从而打破品牌壁垒,实现应用层面的互联互通。 所谓应用层的互联互通可以理解为将各个智能家居设备厂商的所有终端放到一个可以具有统一访问方法的“设备池”中。 不同品牌的智能家居平台都可以通过移动端应用、智能音箱、智能面板等中枢在用户的许可下获得设备的访问权限,进而实现对设备的控制。 于企业而言,其核心设备的控制及相关数据依旧集成在自有平台上,但于用户而言,则可以自主选择平台,突破生态限制。 智家产品空间的互联互通是指对于智能产品的控制不能仅限于近距离操作,而是要实现通过不同终端登陆同一软件远程操控家中的所有智能设备,这也是当代消费群体对于智能家居最主要的需求之一。 事实上,无论是小度助手,还是天猫精灵,正是在大的市场范围内,绕过了部分想要大包大揽的巨头,具备了这一空间互联的潜质,才使他成为其它单品类企业的智家中台,从而画出了“万物互联”的大饼。 多终端交互的 软件能力才是真刚需 在智能家居领域,智能音箱是覆盖率较高的智能硬件之一,也是目前最主要的智家中台设备之一。2020年,全球智能音箱和带屏音箱出货量已经达到了1.51亿台。 智能音箱无论发展到什么阶段,其组成部分都是硬件+软件。智能家居、物联网同样是由硬件与软件组成,硬件中最重要的是芯片,软件中最重要的是操作系统。 物联网分成多个设备,每个设备中的芯片具备一定的信息处理能力。华为发布的鸿蒙系统,就是分布式物联网操作系统,可以调用各个设备的芯片,来进行互联操作。 但是通过鸿蒙系统这类的芯片实现多终端同步功能既受品牌限制又有成本过高的弊端,目前国内芯片技术也未达到普及程度。 通过软件技术革新,实现多终端同步捆绑并操控家居设备是目前商业选择上相对容易操作的选择,这也是小度助手和天猫精灵能够成功的原因之一。 但这种选择,也会将某些其它模式下的正常商业选择的劣势极度放大。比如小度助手语音交互功能仅支持小度音箱,对于其它终端登录小度助手,仍仅支持手动操作。 当代消费群体,是把“懒”发挥到极致的一代人,谁能用最简单快速的方式实现他们想要的生活,谁就将获得市场的话语权。 语音交互是“懒”的外在形式,多终端互通的语音交互软件是实现“懒”的内核,也是全屋智能的真刚需。 数据显示2016年,我国智能家居市场规模为620亿元。随着智能家居产品与消费者需求契合度逐渐提高,2020年我国智能家居市场已经突破了1700亿元。近几年的行业规模均保持双位数增长,智能家居赛道潜藏巨大发展空间。 谁解决了全屋智能的核心难题,破解多终端交互软件的密码,或许就会成为智能家居赛道井喷式发展的引爆者! 作者 | 小燕 本文为家页原创文章,著作权归家页所有,未经授权不得以任何形式转载,如有转载需求请及时通过评论处与我方联系。 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于5 天前
    最后回复 窑屋 5 天前
    4925 0
  • 理想one的一次ota升级,让我明白语音交互的痛点有多痛
    “小爱同学”、“小度小度”、“天猫精灵”,你是否听说过? 智能音箱 在家庭智能音箱已经较为普及的时代,如果你还没听说过这些,那你确实需要再“年轻一些”了。如今的智能音箱丰富和简化了我们的生活。天气预报、生活常识、音乐、相声等等,都可以用一个语音指令轻松听到,这也让家中的手机终于有时间“倒休”了。 家庭智能音箱的流行,也让车企看到了商机。于是,很多车型的车机系统增加了语音交互功能,甚至有的新能源车型还声貌并用,配置了有表情的机器人。 再后来,语音交互系统成了新能源电动车的必备功能之一,并且还在不断更新和优化。其中,做的好的一些车型,给自己的驾驶舱升级了新名词——“智能座舱”。 2021年9月9日,理想汽车在北京举办了一场“理想家庭智能座舱媒体沟通会”,此次活动实则就是介绍理想ONE车机系统OTA升级后的2.2版本。 但我还体会到了理想ONE所营造的家庭氛围,更是让我回忆起了家里的智能音箱的痛点到底有多痛! 我感受到了家庭氛围 理想ONE车型在中国造车新势力中算是佼佼者,销量一直居高不下。我也曾好奇买理想ONE的车主图什么? 我原以为只是为了增程式和配置的性价比。因为中控大屏别的品牌也能实现,大空间也不是家家都需要。直到这次参加了小范围媒体分享会我才知道,原来理想ONE它“顾家”。 厂家工作人员在分享会上告诉我们,很多有小孩儿甚至是二胎的家庭,会选择理想ONE。除了空间大以外,理想ONE也更愿意照顾到家人的需求,智能语音交互和娱乐系统是他们所爱的。这让带孩子出行的家长不用特意用手操作车辆,很安全很方便。 此外,厂家也格外尊重和愿意倾听家庭用户对理想ONE的意见和升级建议。因为理想汽车的调查数据显示,副驾驶的使用率超过了65%。也就是说,理想ONE更多情况下是多人使用和乘坐,而不是驾驶员单独驾车更多。一台车努力营造家庭氛围,为全家服务的初衷感融化了我这直男的心。 为语音交互痛点出“药方”1、升级为“智能、自由对话” 家庭智能音箱无法聪明地连续交流,连续的指令要一次次唤醒。即便是可以连续识别指令的音箱,可能经常出现语意理解错误,这是一个很“痛”的体验。理想ONE的此次更新,就是要解决连续对话死板和连贯的问题。 升级2.2版本以后,理想同学可以实现: 连续对话:一次唤醒,20秒内可连续对话;想说就说:不用等理想同学把话说完,随时插话,理想同学也能逐一识别;无效文本拒识:可识别出哪些指令是对理想同学说的,哪些是车内交谈或打电话,减少对用户的打扰和错误的识别。连续对话:一次唤醒,20秒内可连续对话;想说就说:不用等理想同学把话说完,随时插话,理想同学也能逐一识别;无效文本拒识:可识别出哪些指令是对理想同学说的,哪些是车内交谈或打电话,减少对用户的打扰和错误的识别。 也就是说,理想同学可以一直聪明地倾听用户的需求。20秒内,不仅不需要反复用“理想同学”激活指令,同时还可以不停地与其交流,缩短等待时间。 在连续说话的情况下,理想同学也会聪明地识别哪些话是对它说的,哪些不是,截取是指令的语句进行分析和执行,这一点足够聪明和人性化。 2、语音控制无需“静音”他人 理想ONE配有4个收音麦克风,分别位于主副驾驶位和第二排座位的棚顶拉手处。这4个麦克风可以实现4区域独立语音控制,且互不打扰。 在过去,语音识别几乎是有声音就识别。车内有一人唤醒车机系统,所有人都要闭嘴,这瞬间的全车安静,无奈又尴尬。 理想同学就完全解决了这个困扰,因为理想同学会专注于第一个下达指令位置的收音,而将其他位置的麦克风降噪。 比如说,主驾驶位唤醒理想同学,这时副驾驶和后排乘客大声聊天,理想同学也完全不受影响。同时,如果后排想唤醒理想同学,只需要再次呼叫理想同学即可,这时又会集中服务于新呼叫者的指令。 值得一提的是,在理想汽车收集用户需求的时候发现,有时后排的“熊孩子”会反复唤醒理想同学,影响正常驾驶或车内环境。所以,更新后的系统还可以单独关闭四个收音区的麦克风,以保证行车的安全与舒适。 3、跨音区上下文对话 此次2.2版本系统还增加了跨音区的上下文对话功能,该功能可以让繁琐的一次次操作合并成一次。 比如,前排乘客让理想同学降低了空调温度,还加大了风量,之后又继续执行了打开座椅按摩,这属于三次连续指令。如果后排乘客或副驾驶也想同样的设定,只需要说一声“我也要”即可实现。 而2.2版本的理想同学,可以在界面显示的所有功能性文字上实现“可见即可说”。这种完全用语音代替手指触屏的方式,很多车企都还未能实现。 不过,因为研发效率有限,所以2.2版本的“可见即可说”功能只支持QQ音乐、喜马拉雅、蓝牙电话、车辆中心这几个模块,其他APP和功能在逐步升级中。 理想同学的2.2版本除了更新语音交互功能外,还增加了更接近于人声的语音包,摆脱了机械化发声,在交流中更有真实与人对话的感觉。 当然,2.2版本的升级不仅限于以上和语音交互相关的功能升级。还新增了360°全景影像对于周边障碍物的距离显示,并以“cm”为单位;新增了“按时出发模式”,支持设置一个出发时间,提前启动空调、座椅加热、方向盘加热,提高出发时舱内的舒适度; 总结: 理想同学的这次OTA升级除了上述功能外,其实还有很多细节更新。不过,这其中最为“智能座舱”长脸的就是语音交互的大幅度升级。 如今竞争激烈的新能源汽车市场,续航里程和豪华配置已经不算是绝对优势了。而谁对于用户的思考更多,谁更愿意提升用户的用车体验,谁才会收获更多的用户支持。 理想ONE在拥有优秀销量表现的同时,也在为家庭用户不断升级和改造,这个努力的过程我看见了,相信用户也看得见。既然理想给自己贴了上了“顾家”的标签,我们也可以期待一下越来越聪明的理想ONE还能创造出哪些人性化功能。 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于6 天前
    最后回复 向望慕 6 天前
    1956 0
  • 理想汽车即将发布全新OTA升级包 重点优化语音交互能力
    近日,理想汽车表示将在9月中旬为所有理想ONE车型推送固件版本为2.2的全新OTA升级包。据官方介绍,升级包将主要为“理想同学”语音交互系统进行优化升级,同时给车机系统装配一个应用中心,为日后上线更多应用提供保障。 在升级包正式推送之前,我们有机会提前体验了一下车机系统的部分功能,尤其是提升了“聊天”技能的“理想同学”。接下来,我们为大家详细介绍一下新功能到底好不好用。 自由对话模式 首先,“理想同学”的一大新技能是“自由对话模式”,我们需要在中控屏的“设置”内选择“理想同学”来开启该模式,让“理想同学”具备“连续对话”、“想说就说”以及“可见即可说”能力。 https://p6.toutiaoimg.com/large/motor-img/9309d07e9df444449e2e35e39126b7fc 和升级前相比,“理想同学”更有耐心了,因为它有了20秒的“连续对话”能力,在此期间我们可以随时给它指令,而“理想同学”的响应也很及时,并不是单纯的“待机”。有意思的是,在这个机制下,理论上我们可以不间断地和“理想同学”聊天。 在实际体验中,当我们尝试连续给“理想同学”发出指令时,它的接收精准度比较高、速度也比较快,然后会按部就班地执行命令。 作为一个面向全家出行的车型,理想ONE车里经常出现嘈杂的环境。这时候在唤醒状态下的“理想同学”会通过人工智能对“无效文本拒识”。这是因为装配在理想ONE上的人工智能具备了识别拒识、语意拒识、对话拒识三个端到端的拒识能力,同时利用大量的对话类数据进行训练。 https://p5.toutiaoimg.com/large/motor-img/21fc9bda7a8f4603815e64b63a8313c0 △“理想同学”会更好地无视“废话” 那如果在网不好的时候咋办呢?据理想汽车介绍,“理想同学”具备了队列保持策略的能力,当网络不稳定的时候它会先将指令信息收集排列好,等网络通畅了再逐一进行云上传。这就好像路口左转红灯时,车辆可以先停进待转区中,等绿灯时就可以快速左转,保持了路口的高效运行。此外,该能力也为另一个功能提供了重要的技术支持,我们后面会说到。 不过对于习惯了“一问一答”交互节奏的用户来说,对20秒的等待周期恐怕还需要有个适应的过程。在体验过程中,我每一次下达完命令之后,总是很自然地再次呼唤“理想同学”。 理想汽车通过对用户的调查,发现新用户在拿到新车之后,对“理想同学”的使用率较高,然而过段时间之后,“理想同学”的服务频率只有一开始的三分之二。另外还有一些指令新用户不爱用,但老用户非常依赖,这表明之前的“理想同学”的适应学习成本比较高,新用户需要很长时间才能自如地通过语音操作各个功能,有些甚至成为“宝藏指令”。 https://p3.toutiaoimg.com/large/motor-img/eb76df74563440b8b330e91c65b4f293 “可见即可说”就是降低用户对语音交互的学习成本,快速适应有“理想同学”陪伴的日子。不过该功能主要还是在低速和静止状态下才能使用,在高速状态下,我们还是需要通过“点击”来操作智能系统。 不过目前应用在车机内的可见即可说还没有实现全覆盖,只有车辆的基本控制、设置,比如“勿扰模式”、“按时出发”等,以及车载应用喜马拉雅的各种功能,比如“发现”、“下一曲”、“搜索歌单”等。理想汽车的工作人员表示,目前“可见即可说”在语音交互上应用已经跨过关键的“First Step”,就是适配第三方应用,接下来在整个车机系统的普及会很快。 https://p9.toutiaoimg.com/large/motor-img/178b4928ce0d4ce282187453cb04b203 △图中蓝色光点就是“理想同学”根据语音指令点击相应页面 此外在网络状态不好的时候,“可见即可说”功能依旧可以使用,这是因为它采用了一个端到端的,基于边缘计算的语音识别和语音理解交互引擎。所以很多页面显示标签已经存在了本地“语音库”里。 “想说就说”功能是指在和“理想同学”沟通的时候,我们可以很任性地随意打断它,来发出新的指令。从实际体验效果来看,这个功能的反应还是比较灵敏的,能够快速停止当前的动作,执行新的指令。 四音区优化 在理想ONE的车内,语音识别系统会划分为四个音区,此前的语音交互具备音区定位和抑制能力,可以准确接收主副驾和第二排乘客的指令。在此次升级之后,四音区还会增加两个功能,分别是四音区自由对话和音区关闭功能。 其中四音区自由对话功能是让不同音区的人在唤醒“理想同学”之后,可以对前一个指令进行复制。我认为该功能就是利用了队列保持策略能力实现的先进功能,因为只有在有“聊天记录”的情况下,才能实现指令的顺延和复制。 从实际体验来看,“理想同学”响应不同音区的速度还是挺快的,如果有相同的需求,只需说一句“我也要”即可。比如下图所示,后排左侧乘客通过语音开启座椅加热之后,后排右侧乘客只需要说“我也要”,座椅也开始加热。 https://p6.toutiaoimg.com/large/motor-img/11b3a6a33e0d4cf6b887ee9bfd74e51b https://p6.toutiaoimg.com/large/motor-img/5998aeecf34d419daec488946448444a 另外一项音区关闭功能是除了主驾音区以外,其它三个音区都可以随意通过语音进行开启或关闭。这样有两个好处,一个是可以让“理想同学”少听点“废话”,另外就是避免“熊孩子”对车辆进行一些误操作,比如乱开天窗或者空调等,影响驾乘体验。 https://p6.toutiaoimg.com/large/motor-img/506b8d8391f94792bc9e577e2f871c3f 除了以上几个功能,此次“理想同学”还新增和优化了69个技能,涵盖地图、电台、媒体控制、车控车设等领域。让它更智能、更高效地为驾乘人员服务。 车载应用中心 除了优化了语音交互能力以外,全新版本的车机系统还将内装一个车载应用中心,其功能类似于苹果的APP Store,所有理想汽车自研或第三方应用都会在这个平台下进行搭建/适配、测试、审核、上线。 https://p3.toutiaoimg.com/large/motor-img/7b13dfdc7f0940b3942e3911da4beb86 这个平台有三个特点,其中最重要的是能够让所有第三方应用更好地适配理想ONE的显示屏以及车机系统。以新上线的“喜马拉雅”为例,无论是小节目图标,还是大的专题页面,都能够很好地和中控显示屏以及副驾显示屏适配。另外当我们将“哔哩哔哩”的视频从副驾显示屏切换到中控显示屏的时候,也不会因为需要重新适配而出现卡顿。有意思的是,在理想ONE里的APP界面都会实现高度统一,尤其是同一类型的应用,上手难度极低。 https://p3.toutiaoimg.com/large/motor-img/ddf5660c59af4e6aa20dcf3f2763c1bc https://p5.toutiaoimg.com/large/motor-img/a3b7fac731654b079a3549f29d0bd1d4 第二点是可以进行卸载,每个APP都可以独立删除,当有需要的时候也可以重新安装。而最后一个特点就是所有APP可以独立更新,并不需要跟着车辆整体的OTA升级,就能时刻处于最新版本。 邦点评 通过体验,我认为“理想同学”的能力确实提升了一个档次,能够给车内所有驾乘人员更“专一”、更顺畅的交互体验。而随着更多APP的入驻,以及“所见即所说”功能的全系统覆盖,理想ONE的驾乘体验也会更加出色。不过在活动现场,我也给工程师提了一个建议,就是希望“理想同学”针对不同“音区”的指令,可以通过音区附近的扬声器内进行回应,比如副驾驶“音区”就是通过副驾车门扬声器,后排音区通过后车门上的扬声器,这样不但有专属感,同时也不会影响其它驾乘人员。 原文章作者:电动邦,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-10
    最后回复 意福浏 2021-9-10 13:02
    2505 0
  • 酷开系统海量资源+语音交互,打造极致视听体验
    为什么酷开系统这么受欢迎?近些年来随着客厅经济兴起,酷开系统所打造的极致视听体验,正吸引着越来越多家庭成员回到客厅。 酷开系统整合了海量内容资源,包括爱奇艺、腾讯视频、QQ音乐等海量视听内容,视频内容则涵盖了腾讯和爱奇艺等海量影视资源,包括4大片库、12个频道、包含着16000+部电影、4000+部电视剧、3100+部综艺等海量正版影视资源,基本上能想到、搜到片名的影片,酷开系统都有了。 酷开系统在首页中还添加了专门针对儿童设立的栏目,少儿栏目的总体设计很有特点,采用鲜艳的大色块配合卡通的贴纸设计,贴近儿童审美,让小孩一看就能喜欢。 除了动画片,酷开系统还内置了海量的金牌名师的课堂资源,”开学季栏目涵盖了从少儿、小学、初中、高中四个体的教育内容,让孩子在家里也能享受到原汁原味的优质教育。 儿童栏目里的内容涵盖了从0到12岁的学习资源,让小朋友在看电视的时候也能学习有用的知识,这对于很多妈妈来说,究竟应该给孩子看什么的问题得到了解决。 频道内还有精心筛选儿童喜欢的TOP资源,融合40000+集动画、少儿综艺、儿歌, 同时将不适宜儿童观看的内容全部隔离,在防蓝光教育电视上看,更能给孩子的眼睛和心灵双重保护。 在酷开系统上,AI语音得到了全新升级,不管是找片、听歌、天气、股票、百科、快进暂停都不是问题,联合百度的AI平台,在语音环境下,你只需要动动嘴,在电视上就能实现想知道问题的答案和电视的各种操作,比如让电视声音大或者小一点,让电视剧快进等等操作。在某种意义上,有了酷开系统,遥控器都已经不再是电视必需的搭档。 未来,酷开系统仍将以提升家庭幸福感为目标,打造更加完善和丰富的大屏生态。 原文章作者:京创优品,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-10
    最后回复 裘谦 2021-9-10 11:59
    2686 0
  • 我听起来有病吗?
    本文来自微信公众号:CyberMed丨赛博医客(ID:cybermed2050),作者:LY,头图来自:视觉中国 通过一个6秒钟的元音“啊——”,或者从50大声数到70,就能“听”出你是否得了COVID-19,是不是很不可思议? 没错,作为一种算法驱动的安全、可访问且非侵入式的筛查工具,它正势不可挡地直面公众。日前国际权威期刊《柳叶刀·数字健康》发表一篇述评称,“这些技术有潜力通过在个人设备上运行的快速、经济的诊断,显著改善全球健康——这是对抗流行病的完美工具。” 在与新冠病毒的斗争可能长期化的大背景下,语音生物标志物(Biomarker)在数字健康领域的应用热点正在加速度发展,并促动院外生命体征监测、家庭场景下的个体化医疗市场成为“香饽饽”。 那么,AI技术真的能确定“我有病吗”? 在对抗COVID-19中显山露水 在新冠肺炎疫情肆虐的美国,语音生物标志物技术公司Sonde Health正在协助“听音判病”。Sonde Health成立于2015年,总部位于波士顿,可基于语音生物标志物进行声学分析,从而诊断和监测人体健康状况,提供疾病筛查和管理解决方案。 用户通过智能手机访问名为Sonde One的应用软件,即可看到“呼吸系统症状风险”的部分,完成一份简单问卷(包含7个问题)之后,按要求吸气并保持一个元音“啊——”的语音至少6秒钟,该应用程序就会告诉用户其所处的风险状态。 该应用程序依赖于Sonde Health建立在从80000多个人收集的超过100万个人类声音样本上的机器学习模型,感知和分析声音中的细微变化,来识别例如咳嗽、哮喘、COPD(慢性阻塞性肺疾病)等呼吸系统疾病的症状,6秒钟的语音采样可以实现检测的准确率达70%以上。 Sonde Health首席执行官David Liu表示,“无论是呼吸系统疾病、哮喘还是COVID-19,给我们6秒钟的声音片段,即可清楚地告诉用户,他的健康状况怎样”。 虽然应用程序筛查不能代替临床医生的诊断,但可用作COVID-19的早期预警系统。而且,这种操作,就如同测量体温或血压一样简单。 目前,美国和印度的10家公司正在使用Sonde Health的技术来帮助员工筛查COVID-19,David Liu表示,如果每天有很多人使用它,其语音筛查测试可能有助于遏制激增的流行病。 另一家以色列初创公司Vocalis Health同样聚焦于医疗领域的人工智能和语音分析应用。 今年2月份,Vocalis Health宣布,其COVID-19筛查工具Vocalis Check在大型临床研究中成功验证,并已获得CE标志,成为首个获得CE批准的 COVID-19筛查医疗设备。 Vocalis Check是一款软件,同样可通过智能手机或Web应用程序访问。用户只需从50数到70,其录音就会被转换为包含512个语音生物标志物组成的图像,即频谱图,应用人工智能,这些图片与基于临床试验中COVID-19阳性参与者的录音的合成图像进行比较,以确定它们之间的相关性。在不到一分钟的时间里,Vocalis Check将做出判断,再通过随后的拭子测试进行验证或否定。 Vocalis Health一直在收集公共声音样本,并与以色列国防部协调,从而获取明确感染者的频谱图。据称,Vocalis Health的COVID-19声音生物标志物在评估一个人是否感染 COVID-19的风险方面准确度超过80%。 目前市场上检测COVID-19主要是PCR核酸检测法,这是一种相对昂贵、资源密集和耗时的方法。而利用声音生物标志物这样的高度可扩展的筛查方法可以填补当前COVID-19筛查方法的空白。 Vocalis Health还与大孟买市政公司(MCGM)合作,在COVID-19大流行期间设立的医疗中心开展为期一个月的声音测试试点,测试了2000多人,包括英语、印地语、马拉地语和古吉拉特语等,以突破语言本身的限制。 Vocalis Health首席医疗官Shady Hassan博士认为,声音生物标志物检测并非旨在取代PCR测试,这是为了筛查,而不是诊断。 通过快速广泛的筛查提供可靠的风险评分来指导可能需要额外诊断测试的人,从而使卫生系统能够更有效地分配诊断资源,这也是声音生物标志物检测的重要价值之一。 心理和精神疾病领域的探索 相对于像COVID-19这样的生理疾病,也许更引人关注的,是人工智能驱动的语音生物标志物识别技术是否能够帮助诊断心理和精神疾病。 以前,我们总将生理疾病的考虑优先于精神疾病,因为生理疾病更容易被监测和治疗,而现在,人们正在更加开放地看待精神健康问题,那么,语音生物标志物可否用于精神疾病的“数字化”? 人类在说话时,哪怕是一个简单的词语,都需要大脑中的多个神经回路进行复杂协调、对呼吸系统进行精确的控制、掌握好协调的肌肉骨骼系各个部分的激活时间,这样才能控制整个声道的发音清晰度。人体在发声时对于全身系统协调的依赖,可为研究机构提供监测疾病的新思路。 因为人体发声的同时会产生相应的生物标记物,当身体出现健康问题时,疾病的特异性干扰会对某个系统或多个系统产生细微、难以察觉、但具有特性的变化,生物标记物含量由此产生变化。而这种变化,是可以利用机器来进行分析计算的。 此类变化和关联无法被人耳识别,但却可以被语音生物标记技术检测到。这和我们的视力很相似,人眼可以看到一个特定的光谱,但实际上现实中还存在更多的光谱,我们肉眼并不能看到。 以抑郁症为例,患者往往会表现出言语迟缓、音量不稳定、发声颤抖、语言韵律异常等症状。麻省理工学院(MIT)林肯实验室的研究发现,抑郁症患者治疗前较治疗后,声带发声的时刻和强度在每次声带振动的周期中,波动都比较显著,并且波动程度与抑郁症的严重程度呈正相关。 随后,他们利用自动分类算法,实现了精确度可以达到80%~90%的抑郁症预测。Sonde Health已在这项技术的基础上,研发了用于检测和诊断精神疾病的产品。 Sonde Health很早就意识到声音对个人健康有意义的预测指标,开始研究语音和不同疾病之间的关联。比如,建立语音和MRI脑白质(抑郁症诊断)之间的关联,语音和海马体萎缩(老年痴呆诊断)之间的关联,等等。 目前,Sonde Health已经经过临床实验证明,通过智能手机,在不记录人们具体说话内容,仅提取语音特征的情况下,通过分析患者语音的短片段,便可查找可能指向早期健康状况的异常现象,监测从呼吸系统疾病到帕金森病、慢性老年病等各种疾病,以及人体精神问题,包括抑郁症、产后抑郁、认知障碍和脑震荡等。 Sonde Health的语音识别技术在不断发展迭代。第一代技术在使用时,要求用户必须阅读固定文本或回答问题,且用户必须处在特定环境中进行。目前,Sonde Health技术已可导入手机等随身电子设备中,通过语音实时监控用户健康情况,并及时提供治疗方案。 Sonde Health首席运营官Jim Harper声称,“当我们分析语音时,并不关心内容,而是关注语音中各指标的变化。” 其实,Sonde Health并不是第一个将语音生物识别技术应用于心理疾病检测的组织。 2015年,纽约大学Langone医学中心的研究人员便探索出了机器学习AI软件在健康领域的用途,该软件旨在通过语音生物特征识别PTSD(创伤后应激障碍)、抑郁症以及其他心理疾病。 研究人员使用神经网络发现了30种语音特征,比如,机器学习算法显示,在250多名患有创伤后应激障碍的个体中,发音中的元音间隔明显缩短等。这些特征可能区分出创伤后应激障碍的退伍军人和未受影响的退伍军人(或健康对照组),这个方法被用于一项为期5年的前瞻性大型队列研究。在开发的早期阶段,研究人员就发现该系统可以诊断PTSD的准确性为77%。 2016年,梅奥诊所与以色列语音分析公司Beyond Verbal(该公司后与Healthymize公司合并为Vocalis Health)合作的研究发现,13个语音特征和冠心病存在相关性,其中一个语音特征会增加冠心病19倍的发生概率。这项研究首次发现语音特征和纯粹的身体疾病存在相关性,这意味着,医生可以使用语音分析的软件作为一种无创、辅助诊断工具。 目前,语音生物标志物技术领域除了Vocalis Health与Sonde Health,还包括抑郁症诊断语音分析领域的龙头Ellipsis Health(该公司刚完成2600万美元A轮融资),AI语音诊断技术研发商Winterlight Labs,以及专注识别焦虑和抑郁等疾病的Kintsugi(该公司刚完成一轮800万美元的种子轮融资)。 市场研究和咨询公司Fact.MR的报告预测,在2018~2027年的预测期内,语音生物标志物的全球市场将达到23.3%的年复合增长率。 但一些计算机科学家对使用人工智能来追踪精神障碍,特别是像抑郁症这样的严重障碍持保留意见,认为通过语音检测抑郁症的想法很难提供出高度精确的结果。另外,担心该技术避免不了AI技术的“偏见”顽疾,出现误诊。 打开个体化医疗之门? 语音技术一直是这两年资本市场和巨头追逐的宠儿。从苹果的Siri,微软的Cortana,谷歌的google Assistant这样的语音助理,以及Amazon Echo和Google Home进入客厅和卧室的智能音箱,到科大讯飞不断提升的语音识别技术。 语音技术已融入我们日常生活的很多场景,而现在,它正在健康医疗领域开疆拓土。 对于个人的健康监测来说,医院的监测往往只是一个“快照”,无法扑捉连续的问题发生,持续监测则可以捕获医院中遗漏的重大身体变化。如何将持续的数据与临床相结合?家庭场景下能保证监测精度的语音生物识别工具,或许是个有效解决方案。 基于声音的疾病检测技术无创伤、便宜,可实现实时、长期监测,且尤其适合在远程医疗中使用,这意味着可以覆盖到更广阔的地区,惠及更多人群和扩大数据采集范围。它将可能成为亚健康人群或疾病患者的刚需,亦或健康人群进行身体健康管理的工具。 这一领域背后存在的巨大商业机会,吸引着后来者不断进场。有业界人士表示,手机上的身体健康指标的监测有着非常大的市场需求,如果搞定它,将获得巨大的回报。 Jim Harper表示,医疗健康领域最古老的工具之一温度计,因其简单易操作以及在临床环境之外的广泛可用性,成了最有价值的医疗工具之一。Sonde Health则希望利用每天数十亿的语音交互,来创建一个21世纪的“温度计”,提供精准医疗和早期医学模式下所需的广泛数字医疗的决策支持。 反观国内,虽然“声量”不大,但也有企业已经介入语音诊断技术。比如,科慧健远研发的AI病理机器人,正在入局儿童自闭症及语言发育障碍市场。 其研发的AI病理系列机器人利用人工智能人脸识别技术、眼线眼动数据分析技术、病理语音数字分析技术、自闭症及语言相关障碍筛查系统,对语言发育迟缓、儿童构音障碍、自闭症、语言运动全面发育迟缓等疾病进行筛查和识别。 其中,病理语音数字分析技术通过提取相关声学特征参数,计算出综合声学参数,采用双模块权重综合的方法,筛选出儿童构音障碍。 而专注做“情绪体检”的想象科技在2017年成立了Wonder AI Lab,以探索AI+心理健康的可能性。他们的感知AI模型通过实时识别个人情绪,再综合心理、精神疾病等多学科知识交叉运用,基于EQ专家所标记的350多万个情感音频数据,从而应用到智能语音心理健康平台上。据称用户情绪识别精准度高达95%。此外也可提供可视化的情绪卡片解读,并生成调节方案等服务。 当下,我国越来越重视生命科技和基础科学研究,医疗健康产业提升到了前所未有的战略高度。 而随着经济的发展和社会的进步,“预测性、预防性、个体化、参与性”(Preventive、Predictive、Personalized、Participatory)的“4P”医学将替代传统以治为主的诊疗方式,个体化医疗正越来越受到临床医学界的重视。 目前全球个体化医疗检测的市场主要分布在北美、欧洲、日本等发达经济体国家。而在中国,个体化医疗市场需求正在“抬头”。生物标志物是实施个体化医疗的基础,其中,语音生物标记物诊断市场或许会成为增量巨大的热点之一。 未来在可观的业务收入及利润空间的吸引下,可以想象,随着各方有实力的玩家入场,AI语音诊断市场将迎来属于自己的新格局。 本文来自微信公众号:CyberMed丨赛博医客(ID:cybermed2050),作者:LY 本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com 正在改变与想要改变世界的人,都在 虎嗅APP 原文章作者:虎嗅APP,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-10
    最后回复 经清韵 2021-9-10 10:12
    2573 0
  • 亿咖通科技赋能星越l免唤醒深度语音交互体验
    在汽车智能化发展的大背景下,汽车人机交互方式呈现出多元、复杂的发展态势,数字触屏、语音交互、手势控制、多模交互等全新车载交互技术蓬勃兴起。语音交互因其便利性和高效性,能够令驾驶者专注驾驶、确保驾驶安全,正演变为智能座舱的主流交互方式。 亿咖通科技走在语音交互技术创新与人性化设计的前端,通过深度定义语音能力,同时注重智能座舱语音交互人性化有温度的一面,为吉利汽车旗下旗舰SUV星越L打造突破性的“主驾极客模式”功能。“主驾极客模式”为主驾提供专属的、永久在线的免唤醒语音交互,并且可以直接执行带有变量的复杂交互指令,真正做到“有事直说,有求必应”,开启车载语音交互向更高阶段发展的新篇章。 免唤醒语音交互,全时响应,“有事直说” 在车规级高通骁龙8155芯片算力与亿咖通科技自研的语音语义边缘计算解决方案的配合下,亿咖通科技为主驾打造出进化版的专属语音交互体验。星越L座舱内配备7个麦克风,语音交互系统会通过强大的算法进行精准的四音区抗干扰拾音,准确定位声源,全时锁定主驾的每一句轻声细语,只为主驾提供免唤醒服务特权。 这种全时在线的语音交互模式与“延时聆听”功能有很大的本质区别。延时聆听需要用户先进行一次唤醒,唤醒后语音交互功能可以实现一段时间的在线保持,直至休眠。星越L的“主驾极客模式”一旦开启,之后每次启动车辆后“驾乘助理”都会自动上线,减少了车机交互输入的时间和精力成本,为主驾提供全程陪伴的专属语音服务,带来更为舒适、人性化的出行体验。 智慧聆听复杂指令,去伪存真,“有求必应” 得益于亿咖通科技自研的语音语义边缘计算解决方案以及8155芯片超强算力的加持,“主驾极客模式”下的语音交互体验则更显智慧。系统会对主驾语音进行实时语义分析,“甄别”主驾所表达的语句是否为有意义的真指令,继而判断是否需要做出响应;对于无意义的“伪”指令,则不予理睬。亿咖通科技智能语音解决方案目前对无效语音指令的识别率超过90%,确保了人机交互体验更接近与真人的沟通。 普通场景下,系统会预先将一些不含变量的诸如“打开导航”、“下一首”等语句设置为车机可直接执行的唤醒词。而开启了“主驾极客模式”后,对于包含变量的复杂语音指令,主驾同样可以用免唤醒的方式与车机进行交互,实现更加人性化的自然沟通。诸如“打开空调调到23度”、“查北京到杭州低于1000元的机票”、“推荐杭州人气最高的法餐”这类需要整合多个信息点进行判断的语句,这位“驾乘助理”完全可以实现智慧聆听,深度理解,快速反馈,真正做到“有求必应”,整个交互过程更加高效、愉悦。 亿咖通科技以“加速汽车智能化,创建人车新关系”为使命,在智能座舱语音交互技术上不断创新和突破,让语音交互功能成为全新人车关系的纽带,让汽车成为用户智慧的“驾乘伙伴”。在带给星越L用户人性化、富于情感的交互体验的同时,亿咖通科技也引领汽车行业人机交互方式完成了一次新的迭代。未来,亿咖通科技将赋能更多汽车品牌带给用户更安全、人性化的智能座舱交互体验,不断探索智能座舱发展新方向,引领汽车行业快速智能化变革。 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-9
    最后回复 蕾闩蹈 2021-9-9 11:18
    1407 0
  • 理想汽车即将发布全新ota升级包重点优化语音交互能力
    近日,理想汽车表示将在9月中旬为所有理想ONE车型推送固件版本为2.2的全新OTA升级包。据官方介绍,升级包将主要为“理想同学”语音交互系统进行优化升级,同时给车机系统装配一个应用中心,为日后上线更多应用提供保障。 在升级包正式推送之前,我们有机会提前体验了一下车机系统的部分功能,尤其是提升了“聊天”技能的“理想同学”。接下来,我们为大家详细介绍一下新功能到底好不好用。 自由对话模式 首先,“理想同学”的一大新技能是“自由对话模式”,我们需要在中控屏的“设置”内选择“理想同学”来开启该模式,让“理想同学”具备“连续对话”、“想说就说”以及“可见即可说”能力。 和升级前相比,“理想同学”更有耐心了,因为它有了20秒的“连续对话”能力,在此期间我们可以随时给它指令,而“理想同学”的响应也很及时,并不是单纯的“待机”。有意思的是,在这个机制下,理论上我们可以不间断地和“理想同学”聊天。 在实际体验中,当我们尝试连续给“理想同学”发出指令时,它的接收精准度比较高、速度也比较快,然后会按部就班地执行命令。 作为一个面向全家出行的车型,理想ONE车里经常出现嘈杂的环境。这时候在唤醒状态下的“理想同学”会通过人工智能对“无效文本拒识”。这是因为装配在理想ONE上的人工智能具备了识别拒识、语意拒识、对话拒识三个端到端的拒识能力,同时利用大量的对话类数据进行训练。 △“理想同学”会更好地无视“废话” 那如果在网不好的时候咋办呢?据理想汽车介绍,“理想同学”具备了队列保持策略的能力,当网络不稳定的时候它会先将指令信息收集排列好,等网络通畅了再逐一进行云上传。这就好像路口左转红灯时,车辆可以先停进待转区中,等绿灯时就可以快速左转,保持了路口的高效运行。此外,该能力也为另一个功能提供了重要的技术支持,我们后面会说到。 不过对于习惯了“一问一答”交互节奏的用户来说,对20秒的等待周期恐怕还需要有个适应的过程。在体验过程中,我每一次下达完命令之后,总是很自然地再次呼唤“理想同学”。 理想汽车通过对用户的调查,发现新用户在拿到新车之后,对“理想同学”的使用率较高,然而过段时间之后,“理想同学”的服务频率只有一开始的三分之二。另外还有一些指令新用户不爱用,但老用户非常依赖,这表明之前的“理想同学”的适应学习成本比较高,新用户需要很长时间才能自如地通过语音操作各个功能,有些甚至成为“宝藏指令”。 “可见即可说”就是降低用户对语音交互的学习成本,快速适应有“理想同学”陪伴的日子。不过该功能主要还是在低速和静止状态下才能使用,在高速状态下,我们还是需要通过“点击”来操作智能系统。 不过目前应用在车机内的可见即可说还没有实现全覆盖,只有车辆的基本控制、设置,比如“勿扰模式”、“按时出发”等,以及车载应用喜马拉雅的各种功能,比如“发现”、“下一曲”、“搜索歌单”等。理想汽车的工作人员表示,目前“可见即可说”在语音交互上应用已经跨过关键的“First Step”,就是适配第三方应用,接下来在整个车机系统的普及会很快。 △图中蓝色光点就是“理想同学”根据语音指令点击相应页面 此外在网络状态不好的时候,“可见即可说”功能依旧可以使用,这是因为它采用了一个端到端的,基于边缘计算的语音识别和语音理解交互引擎。所以很多页面显示标签已经存在了本地“语音库”里。 “想说就说”功能是指在和“理想同学”沟通的时候,我们可以很任性地随意打断它,来发出新的指令。从实际体验效果来看,这个功能的反应还是比较灵敏的,能够快速停止当前的动作,执行新的指令。 四音区优化 在理想ONE的车内,语音识别系统会划分为四个音区,此前的语音交互具备音区定位和抑制能力,可以准确接收主副驾和第二排乘客的指令。在此次升级之后,四音区还会增加两个功能,分别是四音区自由对话和音区关闭功能。 其中四音区自由对话功能是让不同音区的人在唤醒“理想同学”之后,可以对前一个指令进行复制。我认为该功能就是利用了队列保持策略能力实现的先进功能,因为只有在有“聊天记录”的情况下,才能实现指令的顺延和复制。 从实际体验来看,“理想同学”响应不同音区的速度还是挺快的,如果有相同的需求,只需说一句“我也要”即可。比如下图所示,后排左侧乘客通过语音开启座椅加热之后,后排右侧乘客只需要说“我也要”,座椅也开始加热。 另外一项音区关闭功能是除了主驾音区以外,其它三个音区都可以随意通过语音进行开启或关闭。这样有两个好处,一个是可以让“理想同学”少听点“废话”,另外就是避免“熊孩子”对车辆进行一些误操作,比如乱开天窗或者空调等,影响驾乘体验。 除了以上几个功能,此次“理想同学”还新增和优化了69个技能,涵盖地图、电台、媒体控制、车控车设等领域。让它更智能、更高效地为驾乘人员服务。 车载应用中心 除了优化了语音交互能力以外,全新版本的车机系统还将内装一个车载应用中心,其功能类似于苹果的APP Store,所有理想汽车自研或第三方应用都会在这个平台下进行搭建/适配、测试、审核、上线。 这个平台有三个特点,其中最重要的是能够让所有第三方应用更好地适配理想ONE的显示屏以及车机系统。以新上线的“喜马拉雅”为例,无论是小节目图标,还是大的专题页面,都能够很好地和中控显示屏以及副驾显示屏适配。另外当我们将“哔哩哔哩”的视频从副驾显示屏切换到中控显示屏的时候,也不会因为需要重新适配而出现卡顿。有意思的是,在理想ONE里的APP界面都会实现高度统一,尤其是同一类型的应用,上手难度极低。 第二点是可以进行卸载,每个APP都可以独立删除,当有需要的时候也可以重新安装。而最后一个特点就是所有APP可以独立更新,并不需要跟着车辆整体的OTA升级,就能时刻处于最新版本。 邦点评 通过体验,我认为“理想同学”的能力确实提升了一个档次,能够给车内所有驾乘人员更“专一”、更顺畅的交互体验。而随着更多APP的入驻,以及“所见即所说”功能的全系统覆盖,理想ONE的驾乘体验也会更加出色。不过在活动现场,我也给工程师提了一个建议,就是希望“理想同学”针对不同“音区”的指令,可以通过音区附近的扬声器内进行回应,比如副驾驶“音区”就是通过副驾车门扬声器,后排音区通过后车门上的扬声器,这样不但有专属感,同时也不会影响其它驾乘人员。 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-8
    最后回复 羿荏辣 2021-9-8 15:14
    4377 0
  • 服务全家人的语音交互系统“理想同学”2.2版本真的很好用
    随着科技的进步,虚拟货币逐步代替纸质货币,实现两张二维码完成收/付款等一系列事情。可以说,科技改变了我们的生活方式,也让未来充满幻想。随着科技的进步,汽车领域也迎来诸多改变。今年8月,小鹏汽车打造出最接近人声的AI语音,柔美的声线更贴合人声对话,在功能相同的情况下营造更好的使用体验。 如今,理想汽车带来了“理想同学”2.2版本。官方称,它实现了跨越性升级,为用户打造更好地语音交互体验。为此,我们借着本次体验活动来感受下“理想同学”2.2版本都带来了哪些惊喜,能否惊艳到我。 “理想同学”2.2版本都带来了什么: 其实,“理想同学”2.2版本升级的重点在于自由对话与服务“全家人”两大方面。自由对话的关键词是“连续对话”、“可见即可说”以及 “跨音区上下文对话”。在此前版本中,唤醒“理想同学”只能完成单条指令。在多种需求场景下,频繁唤醒“理想同学”显得很繁琐。如今,“理想同学”支持单次唤醒后可在20秒内进行连续对话,唤醒一次“理想同学”即可完成多条指令。 “可见即可说”就是以聊天的方式对“理想同学”下达指令,无需通过特定指令对其进行控制。例如,对它说“有点冷”,它就会打开暖风;“想透气”,它就会开启天窗与相关音区的车窗。更贴近聊天方式的语音交互显得不再刻板,也能为用户提供更好的使用体验。 服务“全家人”是通过前/后排座椅上方的收音设备提取四位乘客的声音,并通过识别机构提取聊天过程中的有用信息并执行。通俗的讲,前/后排四位乘客可自行唤醒“理想同学”下达指令,享受智能语音交互系统带来地便捷体验。 更有意思的是,“理想同学”可关闭除主驾驶外的任何一个语音识别音区,避免孩子在行车过程中肆无忌惮地调侃“理想同学”。与驾驶相关的功能上,“理想同学”只完成主驾驶位下达的指令,副驾驶与后排乘客下达的指令将不被执行,对行车安全有积极作用。 “跨音区上下文对话”是在“连续对话”和四音区基础上带来的全新功能。唤醒“理想同学”开启空调系统后,可以对它说“大点/小点/冷点/热点”。当温度调好后,其他乘客在唤醒“理想同学”后可以对它说“副驾驶也要,后排也要”,此时“理想同学”就会按照音区调整空调的温度与风量。就本次体验来看,“理想同学”能精准识别语义,并完美执行指令。在四音区共同说话时,它也能在海量信息中识别真正的指令并完成。 值得注意的是,“理想同学”2.2版本在失去网络的情况下也支持“可见即可说”。其实,品牌方在做市场调研后发现,理想ONE车主经常会进行自驾游,在失去网络的情况下智能语音交互系统也会短暂消失。为此,“理想同学”2.2版本完善了失去网络下的功能缺陷,让用户在任何场景、任何情况下都能享受到“理想同学”的便捷之处。 更贴近人声的AI语音: 现阶段,智能语音交互系统提供的语音充满机械感,没有情感的它显得与生活格格不入。而“理想同学”2.2版本基于深度神经网络的云端语音合成技术,实现了更贴近人生的AI语音。它不仅像人类声音般生动自然、充满生命力,还非常细腻动听,能通过语气和语态表达更多情绪,独特的沉浸式体验宛如拥有生命一般。 在功能方面,车机系统新增应用中心APP,用户可根据自身需求安装或卸载应用中心提供的APP。现阶段,应用中心共提供9款APP,它们分别是微信车载版、网易云音乐、新浪新闻、爱奇艺、卡拉OK、荔枝播客、爱趣听、哔哩哔哩以及喜马拉雅。上述9款APP与车机系统进行了适配,QQ音乐与喜马拉雅能够通过“理想同学”进行控制;哔哩哔哩可使用手机会员观看,并提供弹幕功能。 理想汽车官方表示,所有在车机系统内上架的APP均会进行适配。它们将拥有相同的UI风格,操作也更为简单化。目前车机系统已经完成底层架构搭建,未来将适配更多APP供用户使用。 写在最后:理想车机2.2版本共有68项升级,在地图、电台、多媒体以及车辆控制等多方面进行优化。不可否认,“理想同学”在2.2版本中带来的更多有意思的功能,做到了真正意义上的革新。目前,理想车机2.2版本正在进行内部测试,预计将在9月中旬与大家见面。 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-8
    最后回复 桑晶 2021-9-8 12:27
    3782 0
  • 江都区使用语音交互机器人、无人机等助力疫情防控
    扬州网讯 (通讯员 江萱 侯瑞芳 王宇 记者 李彬彬) “您好,我是江都区疫情防控工作人员。目前扬州疫情形势严峻复杂,为了您和家人的健康,需要向您核实几个问题……”连日来,江都区很多市民都接到了这样的电话。这其实是该区大数据管理局通过智能语音交互机器人系统拨打的调查电话,也是江都助力疫情防控的“黑科技”之一。 此前,江都区仙女镇、丁沟镇被列为中风险地区,智能语音交互机器人系统在流调筛查中发挥了重要作用。该系统对江都区重点人员是否进行过核酸检测,是否前往过中高风险地区,是否有咳嗽、发烧、腹泻、味觉减退等症状信息,全面进行了语音问询和数据调研,运用大数据处理技术对26万人次的交互信息进行分析,织密了疫情防控动态数据网。 “对于省、市交办协查的数据,我们通过‘1+N’大数据平台进行了去重、核查,及时下发至各镇基层网络。”江都区大数据管理局局长朱伟介绍,经过对前三轮次全区全员核酸检测参与人员,进行后台数据比对分析、梳理汇总,最终核实有213人尚未检测,相关人员及时跟踪调查情况,通知其前往检测点检测,有突发情况的上门检测。 8月17日上午8点多,江都区第四轮全员核酸检测正在进行。江都城区的检测采样点上空,无人机正在盘旋,不时“喊话”提醒市民做好个人防护。疫情期间,江都区大数据管理局每天组织3架无人机、10名飞手,在城区重点住宅小区、交通道口上空,播放区防指最新管控措施、通告内容等,每日飞行范围覆盖城区约30平方公里。在“喊话”宣传的同时,无人机自带的视频挂载还可实时巡查现场情况,一旦出现突发情况,会立即上报系统,安排人员第一时间前往处理。 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-8-27
    最后回复 摒晴 2021-8-27 14:51
    1103 0
  • 新风行t5支持语音交互控制
    新风行T5拥有4460/1820/1720mm的超大车身尺寸, 以及2720mm的越级超长轴距, 能够为女神创造出宽敞舒适的乘坐空间, 新风行T5的后备厢容积更能够在515L至1560L之间自由变换, 轻轻松松在后备厢中塞满鲜花、装饰灯和礼品。 此外,这一趟行程怎么少的了浪漫抒情音乐烘托氛围? 新风行T5拥有海量在线娱乐服务, 近2000万首QQ正版音乐曲库资源也让你随时随地聆听高品质好歌, 且支持语音交互控制,整个车内氛围在美妙的旋律下被烘托至顶峰。 http://i1.go2yd.com/image.php?url=0X2QVyyaC5 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-8-27
    最后回复 鄂书仪 2021-8-27 07:56
    5199 0
  • 人脸测谎、语音交互……这家企业带来金融“黑科技”
    智汇八方,博采众长。8月23日-25日,2021中国国际智能产业博览会(以下简称智博会)在重庆举行。在智博会展厅现场,能够实时互动的“多模态智能客服系统”吸引了众多参会者的眼球,这是由长安汽车金融有限公司带来的金融科技产品。 http://i1.go2yd.com/image.php?url=0X0Qm1ZiIR 图/多模态智能客服系统 (新闻来源:微博@华龙网) 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-8-26
    最后回复 周映雪 2021-8-26 02:23
    2654 0
  • 语音交互机器人、无人机等“黑科技”助力织密“防控网”
    扬州网讯 (通讯员 江萱 侯瑞芳 王宇 记者 李彬彬) “您好,我是江都区疫情防控工作人员。目前扬州疫情形势严峻复杂,为了您和家人的健康,需要向您核实几个问题……”连日来,江都区很多市民都接到了这样的电话。这其实是该区大数据管理局通过智能语音交互机器人系统拨打的调查电话,也是江都助力疫情防控的“黑科技”之一。 此前,江都区仙女镇、丁沟镇被列为中风险地区,智能语音交互机器人系统在流调筛查中发挥了重要作用。该系统对江都区重点人员是否进行过核酸检测,是否前往过中高风险地区,是否有咳嗽、发烧、腹泻、味觉减退等症状信息,全面进行了语音问询和数据调研,运用大数据处理技术对26万人次的交互信息进行分析,织密了疫情防控动态数据网。 “对于省、市交办协查的数据,我们通过‘1+N’大数据平台进行了去重、核查,及时下发至各镇基层网络。”江都区大数据管理局局长朱伟介绍,经过对前三轮次全区全员核酸检测参与人员,进行后台数据比对分析、梳理汇总,最终核实有213人尚未检测,相关人员及时跟踪调查情况,通知其前往检测点检测,有突发情况的上门检测。 8月17日上午8点多,江都区第四轮全员核酸检测正在进行。江都城区的检测采样点上空,无人机正在盘旋,不时“喊话”提醒市民做好个人防护。疫情期间,江都区大数据管理局每天组织3架无人机、10名飞手,在城区重点住宅小区、交通道口上空,播放区防指最新管控措施、通告内容等,每日飞行范围覆盖城区约30平方公里。在“喊话”宣传的同时,无人机自带的视频挂载还可实时巡查现场情况,一旦出现突发情况,会立即上报系统,安排人员第一时间前往处理。 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-8-25
    最后回复 呆贺兖 2021-8-25 12:51
    5272 0
  • 除了优化语音交互哪吒v最新ota升级还新增v2l和单踏板模式
    8月20日哪吒V推出OTA 1.5.0版本,除了此前官方公布的针对车内智能语音交互系统也进行全面优化,涵盖语音对话、识别、唤醒等功能以外,还将新增V2L车物充电功能,以及牵引、单踏板两大模式,同时7月前出厂的哪吒V的全触控无边大屏主题模式,也得到了优化。 http://i1.go2yd.com/image.php?url=0Wyo3p2xa7 本次升级V2L车物充电功能的车型是哪吒V 401公里续航版本。升级后,慢充接口即可提供车辆对外放电功能,但需自备放电线,可以支持220V、输出功率3kW的电器。 http://i1.go2yd.com/image.php?url=0Wyo3pHuFJ 同时,对7月前出厂的哪吒V,本次OTA升级还新增牵引和单踏板两大模式功能。当车辆故障需要拖车时,启动牵引模式,车辆便可以自动释放EPB解除驻车制动,在拖车过程中,无需再手动换挡。单踏板模式的增加可以提供更好的动能回收,间接增加续航里程。 单踏板模式用户可以自由选择是采用更省电的单踏板模式还是选择更舒服的自由驾驶模式。值得一提的是,哪吒V OTA 1.5.0版本还对车内主题进行了细分,可选背景为浅色的白天模式和背景为黑色的黑夜模式。 http://i1.go2yd.com/image.php?url=0Wyo3pczlh http://i1.go2yd.com/image.php?url=0Wyo3p5hhY 在语音对话功能上,本次升级将优化“全双工连续对话功能”,当连续对话模式开启时,支持在导航,媒体,车控等场景任意时刻快速打断语音播报,并立刻得到回复响应;新增“语义打断/拒识”功能,当连续对话模式开启时,可以通过说出任意的命令,对语音播报进行打断,另外当连续对话模式开启时,语音输出为闲聊等非指令意义内容时,则不打断语音播报,也不开启新的对话;新增“可见即可说”功能,语音设置、系统设置两大菜单中的开关和选项,现在可以直接通过语音控制。比如说“播报声音切换为男声”、“唤醒灵敏度为灵敏”;新增“对话视觉引导”功能,语音识别启动时,屏幕底部显现波浪形动画进行视觉引导;新增“抢麦模式”,趣味抢麦模式,系统自动定位说话人的方向,并快速执行该侧的语音指令。 在识别功能上,此次升级将新增“动态断句语音识别”功能,可完整识别停顿前后的说话内容,还能支持用户自定义停顿时长。 http://i1.go2yd.com/image.php?url=0Wyo3pxZRy 在唤醒方面,升级后系统将优化“延时聆听”功能,30秒内免二次唤醒;新增多唤醒词,同时支持使用“你好,哪吒”和“哪吒、哪吒”等短句唤醒语音助手;新增“语音自定义唤醒词”功能,您可以将唤醒词修改为喜欢的名字,如“哪吒、哪吒,你现在可以改名为敖丙”;新增“Oneshot 开关”功能,唤醒词与指令可以一起说出,无需唤醒后再下指令。如“你好哪吒,打开空调”,空调就会打开;优化“唤醒及识别速度提升”功能,支持语音动态识别,唤醒速度提升30%,识别结果显示速度提升20%。 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-8-24
    最后回复 返羽糖 2021-8-24 22:59
    5490 0
  • 长城风骏7解析,采用智能语音交互系统,搭载2.0t柴油发动机
    长城风骏7解析,采用智能语音交互系统,搭载2.0T柴油发动机 汽车的市场真是千奇百怪,它的变化也会跟随着消费者的眼光前进,汽车厂商将不断地探索,极力打造一款既满足产商的原则,又在汽车市场有着不错的发展前景的汽车。长城汽车将结合动力充足、还能有一定的载物能力的方向打造了旗下全新皮卡产品风骏7汽车,这款车将会推出8款车型。它将在长城汽车旗下作为第三款皮卡出行,它在内饰外观上进行了更具亲和的设计,配置上也有智能联网系统进行强化,同时还在动力上也不马虎,搭载了一台2.0T柴油发动机。 外观方面,全新的长城风骏7并没有采用家族系列的设计,反而朝着相反的方向发展,不过它还是会在它们前款汽车上取长补短,在进行革命性的优化,使得汽车的外表更加具有刚性。新车的大灯造型非常成熟刚硬,与非常粗壮的镀铬中网相连,给汽车的力量感增强,再就是下边的进气格栅,有着不一样的蜂窝形状设计,这样就不会显得皮卡在前脸没有神情色彩,以至于非常的呆板。皮卡车的长宽高分别是5095/1800/1760mm,轴距是3050mm,还有一个就是对于需要载物需求的消费者完善的货箱尺寸是13890/1460/480mm。 内饰方面,全新的长城风骏7在内饰上已经抛弃了国内皮卡车的样式设计,已经最大化的朝着家用车方向发展,搭配粗壮有力的四幅式方向盘,使得汽车在力量感方面毫不逊色,中控台的用料为硬质塑料,夹杂着纹路设计,也就不会显得那么寒酸。要说皮卡车在内饰上最吸引眼球的设计就是在中控台的悬浮式屏幕了,样式精美高雅,最主要的还是它具有智能网联和语音控制功能,可通过它来进行控制导航、空调等,还可通过它对周边地区的天气和酒店实时在线查询,起到了很好的驾驶辅助作用。 动力方面,全新的长城风骏7搭载了一台2.0T涡轮增压柴油发动机,最大功率为105Kw,最大马力为143Ps,峰值扭矩为315Nm,传动系统匹配的是6MT手动变速箱。并且还具备高速两驱、高速四驱和低速四驱多种多样的功能。 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-8-23
    最后回复 经清韵 2021-8-23 23:09
    5524 0
  • 全场景智能语音交互,将计划变得更完美!哈弗f7x
    从整体外观来看,哈弗F7x采用大胆的线条勾勒,给人感觉非常张扬,霸气十足。而从外观来看,它的造型设计很有特点,也符合当下年轻人的审美观念,六边形的进气格栅,内部为交织样式的网格结构,还采用镀铬材质进行加持,提升了整体的质感。从产品实际表现来看,它有着非常不错的颜值和设计,还有着丰富的配置。 内饰也同样如此,虽然不如哈弗F7X全黑内饰那么有运动感,但是在设计风格上更加稳重。同时,该车还配备了多功能按键,支持语音识别,触控按键会带来较高的技术便利。在材质应用方面,哈弗F7X也丝毫没有吝啬,大量的皮革、软性材质以及金属装饰在车内都能够找到,其档次之高,我想设计师这样设计的初衷也是出于对消费者诉求的考虑。 此外,哈弗F7x还具备全景影像、全自动泊车、手机无线充电等功能,而L2级自动驾驶系统将可能出现在新车上。而哈弗采用的则是本特勒的一个可以伸能缩的球头,这也是我们之前中文象征性logo之一,在国内,这种设计的车型也非常的少见。"这个记录意义非比寻常,它是基于通过车辆周围摄像头、毫米波雷达及智能。 主被动安全性能都有了,开起来更加得心应手。在不那么轰轰烈烈的相濡以沫中,他们对车辆的主被动安全和舒适性有着极高的要求。我们先来说一说哈弗F7X的智能安全系统,哈弗新车配备了全方位保护的主动式安全头枕,当我们发生追尾事故的时候。 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-8-23
    最后回复 允裘 2021-8-23 16:32
    1174 0
  • 智能音箱语音交互技术,乐鑫esp32-h2芯片应用,无线wifi芯片模组
    物联网从家庭自动化领域到如供暖、通风与空调(HVAC)、车库门和电风扇等控制领域,以及在建筑和工业自动化领域的加速应用,市场对高度集成、可靠和安全的物联网连接性的需求增加。 伴随物联网的落地实现,智能语音交互的场景(如智能家居等)变得越来越多,而智能音频SoC芯片为智能终端设备的核心器件,必将带来持续的发展空间。 SoC(System on Chip)称为系统级芯片,也称“片上系统”。它是一个集成电路,包含完整系统并有嵌入软件的内容。SoC芯片结构复杂,相比于传统的微处理器系统,SoC芯片在性能和功耗上具有明显优势。 智能音频SoC是SoC的细分,相较于SoC,智能音频SoC的应用偏向于智能语音音频化的设备,如:TWS耳机、智能音箱、智能可穿戴设备以及智能家居等智能终端产品,符合芯片技术未来的发展方向。 飞睿科技代理乐鑫WiFi芯片模组,特意推出乐鑫的IEEE 802.15.4 + Bluetooth 5.2 (LE) RISC-V SoC ESP32-H2芯片。 ESP32-H2 SoC集成IEEE 802.15.4和Bluetooth 5.2 (LE) 技术,搭载RISC-V 32位单核处理器,为物联网设备提供行业领先的低功耗和安全的连接能力,可以应付很多复杂的物联网应用。 ESP32-H2融合了两种无线连接技术:IEEE 802.15.4 针对低功耗mesh网络场景,使其拥有广阔的应用领域;Bluetooth LE支持点对点、广播和mesh组网等多种拓扑结构,并能够与智能手机直接通信。 ESP32-H2集成了 Bluetooth 5.2 技术,使芯片可支持下一代蓝牙音频技术LE Audio。LE Audio 不仅具有增强的蓝牙音频性能,还支持广播音频,可实现音频共享。ESP32-H2还提供了对Bluetooth mesh协议的支持。 IEEE 802.15.4 和 Bluetooth LE 的结合,也将赋能 ESP32-H2 构建基于 Matter 协议的智能家居设备,实现多生态系统的互联互通。 基于ESP32-H2和其他Wi-Fi系列SoC,乐鑫能够提供Matter协议解决方案,包括使用Wi-Fi或Thread连接的终端设备,以及使用SoC组合搭建的边界路由器。 ESP32-H2搭载RISC-V 32位单核处理器,主频达96MHz,内置256KB SRAM,支持扩展外部flash。它具有26个可编程GPIO管脚,支持 ADC、SPI、UART、I2C、I2S、RMT、GDMA 和 PWM。 ESP32-H2还拥有完善的安全机制,包括基于ECC的安全启动、基于AES-128/256-XTS的flash加密、用于保护设备身份安全的数字签名和HMAC模块,能够为物联网设备提供可靠的安全连接性能。 这款产品拥有丰富的外设,这也让其能拥有足够的能力应付各种场景的应用需求。与此同时,ESP32-H2即在不同的干扰、不同的温度变化下,仍有稳定的性能。 随着智能物联网的快速发展发展,智能家居具有广阔的市场前景。而语音交互作为人类自然的交流方式,成为打通智能家居的突破口。 目前智能音箱在传统音箱基础上增加了智能化功能,包括WiFi 连接、语音交互、海量内容等功能,智能音箱在智能家居领域中逐步占据较大的地位。 智能音频产品种类和出货量上涨,智能音频行业逐渐向人工智能、语音协同、万物互联领域迈进。更多终端设备正在走向智能化,包括照明、门锁、空调、冰箱、车载支架等设备正在快速的语音化,越来越多的消费者要求终端设备具备智能语音交互能力。 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-8-19
    最后回复 盯袈 2021-8-19 08:38
    4436 0
  • 百度发布“汽车机器人”:没有方向盘无需人类驾驶,还可语音交互主动提供服务
    北京商报讯(记者 魏蔚)8月18日,百度CEO李彦宏首次提出了“汽车机器人”概念,并发布了Apollo“汽车机器人”。 百度汽车机器人提供三种能力:具备L5级自动驾驶能力,无需人类驾;具备语音、人脸识别等多模交互能力,分析用户潜在需求,主动提供服务;具备自我学习和不断升级能力,是服务各种场景的智慧体。外观上,百度汽车机器人具有自动鸥翼门、全玻璃车顶与外部传感器;汽车机器人车内不设方向盘、踏板,且拥有超大曲面屏、智能控制台、变光玻璃、零重力座椅等智能化配置。 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-8-18
    4490 0
  • 百度发布“汽车机器人”:没有方向盘无需人类驾驶,还可语音交互主动提供服务
    北京商报讯(记者 魏蔚)8月18日,百度CEO李彦宏首次提出了“汽车机器人”概念,并发布了Apollo“汽车机器人”。 百度汽车机器人提供三种能力:具备L5级自动驾驶能力,无需人类驾;具备语音、人脸识别等多模交互能力,分析用户潜在需求,主动提供服务;具备自我学习和不断升级能力,是服务各种场景的智慧体。外观上,百度汽车机器人具有自动鸥翼门、全玻璃车顶与外部传感器;汽车机器人车内不设方向盘、踏板,且拥有超大曲面屏、智能控制台、变光玻璃、零重力座椅等智能化配置。 原文章作者:北京商报,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-8-18
    最后回复 臂欲讶 2021-8-18 11:14
    1793 0
  • 详解ASR语音标注场景下的VAD语音端点检测丨曼孚科技
    20世纪50年代,人类开启了对机器语音识别的探索历程。 60年后的2016年,在深度神经网络技术的帮助下,机器语音识别的准确率第一次达到了与人类相近的水准,智能语音产品进入大规模商业化应用阶段。 目前,语音识别技术已深入日常生活的方方面面,语音助手、智能音箱、智能客服等都是较为典型的应用场景。未来随着IoT设备的逐渐普及,人机语音交互场景将向更多方向延伸,在识别精度、场景优化等层面,对语音识别技术提出了更高要求。 一.语音识别技术 语音识别技术又被称为“机器的听觉系统”,即通过特定方式将语音信号转换成相应的文本或命令,以供机器识别与学习,最终产出可实用语音算法模型的过程。 目前,常见的语音识别方法主要为模式匹配法。这种方法下,语音识别过程可分为两部分: 第一部分为训练阶段,将收集到的语音数据或特定用户的场景化语音数据,经标注处理,提取出特征矢量作为模板存入特定数据模型库中; 第二部分为识别阶段,将输入语音的特征矢量依次与数据模型库中模板进行特征比对,并将相似度最高者作为识别结果输出。 这套语音识别方法对数据库的“量级”要求较高,原因在于语音识别系统的准确度受诸多因素影响,包括但不限于不同说话人、说话方式、环境噪音、传输信道等。 提高系统鲁棒性,尽可能扩充数据模型库中特征矢量种类,使系统可以在不同应用环境、条件下均可以稳定运行且有效识别,是提升语音识别模型适配性的关键。 这就需要在数据库搭建环节,尤其是语音标注处理环节提供更为精准且覆盖场景更为多样的训练数据集。 二.VAD语音端点检测 一段语音数据经过处理后,会呈现出如下的波形曲线: 在这段语音数据中,不同的波动幅度代表着不同的情感特征。当波动幅度较大时,讲话者可能正处于情绪激动的状态中,音量会增加,音调也会发生改变;当波动幅度较小时,讲话者则可能处于情绪平和的状态中,音量会变小,语速也会变慢;而当无波动时,讲话者则处于沉默的状态。 因此,振幅的结构、发音的持续时间、说话速度等语音信号都是语音处理过程中需要着重关注的特征点。 在进行语音识别的过程中,系统的处理对象是有效语音信号,即有波动的部分,无波动的沉默部分因不具备语音信号所具备的特征点而需要被舍弃。 所以,在语音标注处理的过程中,往往需要从一段语音数据中找到语音部分的起点和终止点,从中抽取语音情感识别所需的信号特征,这样的“切分”过程就被称为语音端点检测,也即VAD。 VAD的英文全称为Voice Activity Detection,中文名称为语音活动检测、语音端点检测或语音边界检测、静音抑制等。 VAD处理的目的是从声音信号流里识别和消除长时间的静音期,将有效的语音信号和无用的语音信号或者噪音信号进行分离,以使后续的语音转写、语音情感分析等工作更加高效,是语音数据标注过程中常见的处理方式。 三.标注场景下的VAD 在语音标注,尤其是ASR语音转录标注场景下,VAD切片通常是需要率先完成的工作内容。 我们以曼孚科技SEED数据服务平台为例,详细展示在语音转录的标注场景下,如何完成VAD切片的处理。 SEED数据服务平台在语音标注模块下,提供手动与AI自动两种VAD切片处理方式。 手动模式下,标注员需要自行判断语音的起始点,并根据具体需求,决定是否预留相应的静默音部分,具体操作如下: AI模式下,可一键自动处理整条数据,同时完成VAD自动切片与自动文本转录。目前,SEED数据服务平台在语音标注场景下提供的AI辅助为“全局辅助”,即AI会自动处理一整条数据,完成全部切片内容以及转录内容。 此外,AI辅助也会自行判断语音信号,并在切片前后预留一定的静默音部分,以供后续调整: 经过VAD切割处理后的语音数据,即可在此基础上完成下一步的语音转录处理。 原文章作者:曼孚科技,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-8-17
    最后回复 特灼拷 2021-8-17 23:33
    2348 0
  • 科大讯飞iFLYBUDS Lite耳机评测:全方位录音转写,提升办公效率
    科大讯飞大家应该都比较熟悉了,是目前国内智能语音和人工智能市场顶部玩家之一。科大讯飞在2020年正式进入了TWS耳机市场,推出了首款真无线智能耳机“iFLYBUDS”,基于其在智能语音领域的技术,给予了TWS耳机智能录音、实时转写、翻译等新功能。 近日,科大讯飞又推出了迭代新品——iFLYBUDS Lite智能录音耳机,依旧定位于商务办公人士,有效提高办公效率。iFLYBUDS Lite在外观上延续了上代产品的设计,柄状的半入耳式耳机搭配超轻体积,长时间的会议通话,也能保证舒适无感的佩戴。 功能配置上,内置14mm大尺寸驱动单元,提供醇厚音质;蓝牙5.2,支持开盖即连,单/双耳使用;智能录音支持通话录音、音视频录音和麦克风录音三种模式,多种语言,并可实时将录音转文字。cVc智能通话降噪,提升拾音准确性,AI声纹识别技术,区分讲话人和语义自动分段。下面就让我们来详细体验一下这款产品吧~ 一、iFLYBUDS Lite智能录音耳机开箱 产品包装和配件 https://p6.toutiaoimg.com/large/pgc-image/632b748a42cb41db9c734a6fb17f606e 包装盒上相较于上代做了全新的设计,黑色背景,橙色点缀,凸显产品,并增加了腰封设计。正面展示有iFLYBUDS讯飞智能耳机产品名称,产品外观渲染图,“22年专注AI科技”字样,以及通话录音、即转文字的产品突出功能。 https://p9.toutiaoimg.com/large/pgc-image/696b00ea1d8c43278ca74794147875fd 包装盒背面是产品充电盒整体外观渲染图,底部标签信息有包装盒内物品、输入功率:5V-0.5A,输出功率5V-0.2A,制造商:科大讯飞股份有限公司。以及“iFLYBUDS”APP下载二维码。 https://p5.toutiaoimg.com/large/pgc-image/6aca5bda2e474ab2b7b0c19187c3dcd2 包装盒一侧是科大讯飞品牌LOGO。 https://p26.toutiaoimg.com/large/pgc-image/a6e6006c91ab496bb8f0feec52ec8465 另外一侧是产品名称iFLYBUDS。 https://p9.toutiaoimg.com/large/pgc-image/e8bfa88248ed499887c323c9ea28fe8b 打开包装盒,顶部放置有一张卡片,一侧是操作指南和APP下载二维码,另外一侧是保修卡和电子说明书二维码。盒盖内侧与耳机对应位置设置有圆形海绵垫,加强固定。 https://p26.toutiaoimg.com/large/pgc-image/bdd9217eedd54953973ef3a9bc6c292a 包装盒内有耳机和充电线。 https://p6.toutiaoimg.com/large/pgc-image/8fedcab34eb34a9badcdb2b460cda5bb 充电线固定在在盒体上,防止运输途中滚动。 https://p6.toutiaoimg.com/large/pgc-image/7bb43c91ea40445fb4024c157c4bfc51 充电线为USB-A to Type-C接口,更加便于使用。 产品外观设计 https://p5.toutiaoimg.com/large/pgc-image/7ba36c85cfd34f06ad7e7d88eea96bb5 iFLYBUDS Lite智能录音耳机充电盒外观形似“抱枕”,中间凸起,四角收缩。整体机身作了弧度处理,没有任何棱角,搭配钢琴烤漆工艺处理的机身,触感光滑圆润,在灯光下不同角度呈现不同的光泽。 https://p26.toutiaoimg.com/large/pgc-image/58eef25ec26e419d904b3b1cb575b498 充电盒正面开盖处设置有条形指示灯,通过不同颜色和闪烁反馈充电盒状态。 https://p6.toutiaoimg.com/large/pgc-image/ef28bddc1e7e48599f24a362cef92d1a 充电盒背面设置有一颗圆形功能按键,用于蓝牙配对连接。 https://p3.toutiaoimg.com/large/pgc-image/ea60f1de175d4809bcca7d4cf782c588 Type-C充电接口位于充电盒底部,设置有银色装饰环,同时提升了接口强度。 https://p5.toutiaoimg.com/large/pgc-image/a94c20d2b2b245e69cecc54377d4f451 科大讯飞iFLYBUDS Lite智能录音耳机整体外观一览。 https://p5.toutiaoimg.com/large/pgc-image/096b9107d50448cc8cc812fe81fa6ca0 iFLYBUDS Lite耳机采用了柄状的半入耳式设计,外观结构酷似老式“烟枪”。 https://p6.toutiaoimg.com/large/pgc-image/c5a56b5af11f4ef7bc12d6525b2f00c1 耳机同样采用了钢琴烤漆工艺处理,底部充电接口处采用了橘红色配色点缀,整体外观非常具有设计感。 https://p26.toutiaoimg.com/large/pgc-image/32ea953cd8bb4a9aa96f5fa4538de457 耳机柄底部,两颗充电触点搭配拾音麦克风,形成了“目瞪口呆”的表情包。 https://p6.toutiaoimg.com/large/pgc-image/410f868ceb8644fe84c7a7bba7eee337 耳机柄底部侧边有L/R左右标识。 https://p26.toutiaoimg.com/large/pgc-image/94a7dbc263b84045bf712f36b87039f6 耳机柄顶部是一颗降噪麦克风,用于麦克风录音拾音,搭配cVc通话降噪技术,提升录音的准确性。这里同时也是触控操作区域。 https://p6.toutiaoimg.com/large/pgc-image/e6a8d9735f894f969946aa9b2e586dd0 耳机顶部还设置有一颗泄压孔,平衡耳机内外耳压,提升佩戴舒适性。内部防尘网覆盖,防止异物进入。 https://p9.toutiaoimg.com/large/pgc-image/61af33de24ee437dbb5238387eacb3f1 耳机内侧较大的泄压孔同样采用金属防尘网防护。 https://p6.toutiaoimg.com/large/pgc-image/632f78294eb64e74b5b67cdb4b74990c 旁边黑色圆点是光学入耳检测传感器开窗,用于精准检测佩戴状态。 https://p9.toutiaoimg.com/large/pgc-image/5bef6c298a5b4b8c9e3975a3019ed2e5 耳机出音嘴特写,内部细密金属网罩防护,防止异物进入音腔。 https://p9.toutiaoimg.com/large/pgc-image/bc858a087a4443d3a422a9ad5e1e7e14 经我爱音频网实测,iFLYBUDS Lite智能录音耳机整体重量约为46.8g,非常小巧轻便,便于携带。 https://p26.toutiaoimg.com/large/pgc-image/67d4be10c3f2435c9cebe73c7da3de36 单只耳机重量为4.5g,相对比较轻盈,佩戴舒适无感。 科大讯飞iFLYBUDS Lite智能录音耳机在外观设计上无论是充电盒还是耳机都非常的具有辨识度,整机采用的钢琴烤漆工艺,提升了产品的质感。耳机光滑圆润,小巧轻便,可提供长时间的舒适佩戴,满足通话会议需求。 二、iFLYBUDS Lite智能录音耳机功能体验评测 交互体验 https://p26.toutiaoimg.com/large/pgc-image/ae14700c2c4d4135a1af2cfb9fd86d41 iFLYBUDS Lite智能录音耳机在配对连接上拥有两种方式,第一种是普通的,通过手机蓝牙搜索“iFLYBUDS”进行配对连接,另外一种是通过“iFLYBUDS”APP的弹窗进行快速连接。首次配对成功后后续使用开盖即会自动回连,使用非常方面。 https://p5.toutiaoimg.com/large/pgc-image/b086fb9f4b3a41479f01934176bcd647 iFLYBUDS Lite耳机支持触控和语音两种交互方式。触控区域位于耳机柄顶部曲线位置,支持双击,区分左右耳,可在APP内自定义双击功能。通话时,双击可设置为接听/挂断和开始录音;音乐模式支持暂停/播放、上下曲切换、唤醒语音助手。 iFLYBUDS Lite 还支持入耳检测功能,摘取耳机自动暂停音乐播放,佩戴自动恢复播放。并且摘掉耳机后触控、语音唤醒等功能同时关闭,避免了未佩戴时的误操控问题。 录音及转写 iFLYBUDS Lite耳机配置上搭载了两颗麦克风单元,采用了cVc智能通话降噪技术,提供更加精准的麦克风拾音;AI声纹识别技术,用于自动区分讲话人,并根据语义进行分段。 https://p9.toutiaoimg.com/large/pgc-image/0a029743dde34b27a84b8c1545f31b7a 智能录音功能支持三种模式,分别是通话录音、音视频录音和麦克风录音。录音支持实时转写,支持普通话、方言、中英混合,以及英、日、韩外语。使用时需根据通话主体人提前预设,从而实现更加精准的语音转写。 通话录音方面,iFLYBUDS Lite支持传统手机通话和微信、钉钉、腾讯会议、Skype等多媒体通话。我爱音频网使用语音通话测试了这款产品的录音转写情况,下面是iFLYBUDS APP记录的我爱音频网小音和小爱的通话内容。 https://p5.toutiaoimg.com/large/pgc-image/aa075bc552ad439ba3963d5245a718d9 iFLYBUDS Lite的转写准确率与说话人的语音标准程度有着直接的关系,口齿越清晰转写的准确率肯定也会更高。通过我爱音频网以普通用户的角度使用测试的录音转写可以发现,iFLYBUDS Lite语音转写准确率可以达到了90%以上,错误主要出现在专有名词上。 在完成通话测试后,APP内转写记录会自动提醒是否需要区分说话人、以及选择说话人人数。分析结束后,语音转写记录便会更新为说话人1、说话人2的分类记录,分类也较为准确。 https://p6.toutiaoimg.com/large/pgc-image/5290c0eacb924dc4bab99d6f713e54ea 英语的录音转写测试,录音转写精准度同样能达到90%以上。并且APP内会根据通话录音自动翻译。但由于区分说话人和分段是在录音完成后才能自动分析,因此在录音过程中英文对话混合在一起,翻译相对不是很准确。通过自动区分讲话人后再进行翻译,则相对更为准确。 麦克风录音其实相当于通话录音的一个分类,只是少了对方的语音。这一功能对于需要时刻记录突然迸发的灵感的创作型职业非常有用,可以通过耳机记录自己的想法,并实时转录为文字便于保存。 在体验过程中,麦克风录音还支持两只耳机两个人同时使用,可同时记录两人的语音,并实时转换为文字。 https://p6.toutiaoimg.com/large/pgc-image/0299992f89d240e39bfa0b3fae51777f 音视频录音也是一项非常便于办公使用的功能。打开iFLYBUDS Lite连接设备的音频或者视频,点击音/视频录音功能,APP便开启录音并实时将录音转写为文字。并且同样支持实时的外语翻译功能,但由于有一定延迟,充当字幕使用有点困难。 在办公场景中,可以使用这一功能将其它设备在会议上的录音音频转为文字使用。又或者是记录的会议视频,也可以通过iFLYBUDS Lite将视频内的会议讲解音频再次录音并转为文字。对于不懂的外语,则可以通过录音转写翻译后辅助理解。 音乐体验 在音乐表现方面,iFLYBUDS Lite智能录音耳机采用了与上代产品相同的配置,内置了14mm大动圈单元,采用了生物碳纤复合振膜和高分子TPU悬边。整体听感低音表现较为优越,低频震感澎湃有力,且非常舒适;中高频人声和乐器也表现不俗,乐器清晰可辨,人声清澈。 https://p26.toutiaoimg.com/large/pgc-image/0e5017dd3bb24a659be676dba5b8deb4 iFLYBUDS APP“发现”内还设置有类似于电台的功能,分为放松空间、睡眠音乐和冥想空间三种不同风格的音乐菜单。菜单内有非常丰富的音乐、白噪音以及大自然的声音,帮助用户享受音乐、放松心情和助眠。遇到喜欢的可以点击“心”图标收藏以便于后续再听。还支持计时功能,到时自动暂停音乐播放。 通话降噪 https://p26.toutiaoimg.com/large/pgc-image/23a9b628489c4cfc9db2ff297eb753dc TWS耳机通话功能是商务人士在日常生活中使用最多的一项功能,iFLYBUDS Lite通过内置的两颗麦克风单元,搭配cVc智能通话降噪技术,有效降低通话时的环境噪音,提升麦克风的拾音准确性,从而保障了用户在通话时能够清晰准确地将想要表达的信息传输给对方。 充电、续航 https://p5.toutiaoimg.com/large/pgc-image/bb8d6403d1d945438bf58e22ee7cb54c 在充电续航方面,iFLYBUDS Lite智能录音耳机采用了Type-C充电接口,目前使用较为便捷。耳机通话录音转写单次续航时间为2h,充电盒可为耳机提供4次的额外充电。仅聆听音乐的话,续航时间则更加持久。 耳机支持单双耳使用,可在会议途中两只耳机循环使用,实现20小时的不间断续航,满足日常办公需求。 三、我爱音频网总结 科大讯飞iFLYBUDS Lite智能录音耳机在外观设计上非常的有特点,充电盒体积小巧,机身曲线圆滑,外形神似“抱枕”;柄状的半入耳式耳机,外观结构酷似老式“烟枪”具有很强的辨识度。4.5g的重量,搭配开放式佩戴,保证长时间佩戴的舒适性。 功能体验上,最突出的当然是其主打的通话录音转写功能。通话录音、音视频录音和麦克风录音三种模式,满足了日常办公使用的方方面面。在语音转写文字上,精确度也相对较高,并且支持多种不同的语言方式,以及外语翻译。在音乐、通话等基础功能体验上也能够满足日常的使用需求。 总的来说,iFLYBUDS Lite智能录音耳机是一款定位非常精确的产品,凭借着在智能语音领域的技术优势,为用户提供了更加丰富的TWS耳机功能,为商务办公人士提供了更多的工具选择,提升办公的效率。 原文章作者:我爱音频网,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-8-11
    最后回复 脉肄 2021-8-11 21:09
    1482 0
  • 小冰CEO李笛:智能语音助手尚处于早期,最好的方式是不用唤醒词
    《AI十二谈》第一期 出品 | 搜狐科技 作者 | 梁昌均 编辑 | 杨锦 “今天,AI产品或者是智能语音助手,都还处在特别早期的阶段。”对于已经发展了十年的智能语音助手,小冰公司CEO李笛依然认为其远远还未成熟。 十年前,苹果公司的Siri作为智能手机的语音助手正式面世,由此掀起一场风潮,从智能手机、智能音箱,到智能手表、智能耳机,乃至于当下的汽车智能化浪潮,语音助手都成为标配,各家科技巨头也在谋划布局。 2013年加入微软亚洲研究院的李笛也在随后推出了智能助理小冰,其也由此成为“小冰之父”。近日,在搜狐科技全新栏目《AI十二谈》首期的直播现场,作为嘉宾之一,李笛表示,自己经常会用智能语音助手,而小冰就是想探索智能语音助手终极形态的产物。 但智能语音助手的终极形态会是什么样?李笛表示,很难去下一个定义。“是完成任务的,还是无所不能、无所不知的才是最好的助理?很难说,每个用户有不同的需求。” 这种定义上的不清晰在或许一定程度上也导致了智能语音助手的发展缓慢,“人工智障”的吐槽暴露出其发展中的问题。当下,几乎所有的智能语音助手都依赖于关键词实现唤醒,但偶尔会出现失灵情况。 不过,李笛表示,智能语音助手最好的方式是不需要唤醒词,应该像人一样,能够判断人是不是在跟它去交流,同时能够和人之间不停地边听边说边想,这就是所谓的全双工的方式。这在今天可以做到,只不过准确性可能不能用户所期望的那样好。 小冰公司CEO李笛 李笛的感觉是,用户对智能语音助手的期待其实比较高。他认为,Siri更大的价值是尝试给智能语音助手一个相对比较拟人化的定位,这给用户营造了一个非常科幻的很高的期望值。“我们一直都还在为这个期望值而奋斗,努力去达到,但这条路还很长,非常长。” 李笛还分析了智能语音助手答非所问的原因,主要有三方面因素。一是智能语音助手的交互场景缺乏弹性空间,自身很难判断回答到底好不好,难以形成数据和训练上的交互回路。 其次,在跟智能语音助手交互的时候,获得各种各样的知识和事实的比例很小,更多时候是观点,而观点没有正确与错误,且有很多不同分支,这样给训练智能语音助手提出很多新的难题。此外,测试者的心态也挺重要,如果测试者不停问智能助手问题,那么语音助手通常表现也不会很好。 尽管智能语音助手还存在不少问题,但目前应用已比较广泛,未来可能会更加深入,语音交互也被视为新一代人机交互方式。这就伴随着新的问题,该如何看待智能语音助手的定位? “如果你把它定位成助理,容忍度不会特别高,但把它定位成朋友,容忍度就会高一些。”李笛说,当我们认为交互的是一个系统时,会把它物化,那么就不会去关注它的其它方面,容忍度也会相应低很多,防备心也会高很多。当把它视为有情生物的时候,它就可以成为对等的交互对象。 他认为,对于智能语音助手来说,真正重要的是越长越好的交互,交互里面的topic(主题)覆盖越丰富越好,人的状态越放松越好。“当更多人在跟智能语音助手交互的时候,它的topic分布和其他人的交互topic分布越来越接近的时候,表明语音助手越来越被当做一个人来看待。” 但不可否认的是,智能语音助手在给我们带来便捷的同时,也会存在伦理和隐私问题。李笛提到,全球范围内,AI伦理还处于非常早期的阶段,数据到底应该怎么使用,应该由企业自己去监督还是怎么样,数据是不是可以从A企业到B企业或B研究机构,这些都还没有明确。 “某种意义上,只能靠我们自律。”他说。 原文章作者:搜狐科技,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-8-10
    最后回复 严蒙雨 2021-8-10 23:21
    1364 0
  • 语音交互和文本搜索的本质区别
    最近一直在思考一个问题:当一个用户跟一个机器人或者其他语音交互的智能硬件进行语音交流的时候,和他(她)在一个搜索引擎的输入框里输入文字查询有什么本质区别呢? 我思考这个问题是我发现很多人认为语音交互就是把语音变成文字,然后交给搜索引擎去搜结果。连行业内很多从业者都是这么认为的。 但语音交互产品的使用者却不是这么看,他们期望机器人或者其他语音交互的智能硬件能像人一样聪明,理解自己。 有一次我们一个客户跟我反馈,说他在自己机器人知识库存了条知识“注册商标怎么收费”,可是在机器人界面提问却不能正确回答。他问我是怎么回事?我在他的机器人界面检查,发现的确有这个问题,问“注册商标怎么收费”不能正确回答。后来我仔细检查,发现他在知识库里存的知识是“商标注册怎么收费”。我发现我们算法不能把“注册商标”和“商标注册”当成同义词。我把这两个词当成同义词以后,客户的问题就解决了。我给客户解释说这是同义词问题,客户说,“什么?我存的是商标注册怎么收费啊?不都是一个意思吗?” 注意:当用户用语音表达时,用户脑子里没有文字,用户只是表达自己意图,通过语音。一个人不认识字,他一样能说话,能表达清楚自己的意图。用户表达同一个意图,在不同的时候,可能用的语言是完全不一样的。这个时候连用户自己可能都没有意识到。这是我要讲的第一点。 请看这个笑话: 小明是个非常严谨的人。 有一天快吃饭了,小明媳妇喊他,“小明,去买两瓣蒜回来。”小明出去了一圈,回来手里果然只拿了两瓣蒜。 又有一天,家里又没蒜了。小明媳妇喊小明去买蒜,这次她说的是“小明,去买几块钱的蒜回来。”小明反问到“到底几块钱的?”小明媳妇说“估计5块钱的就可以。”一会小明回来了,手里拿着几颗蒜。 又有一天,家里又没蒜了。小明媳妇喊小明去买蒜,这次她说的是“小明,去搞点蒜回来。”小明出去了一会就回来了。没一会,有人敲门,小明媳妇开门,发现是菜市场卖蒜的,就问,“你有啥事?”卖蒜的说,“你家小明偷了我家几颗蒜。我来找他赔钱。”小明媳妇问小明是咋回事。小明说,“你不是让我搞点蒜回来么?” 故事里,小明媳妇说的“小明,去买两瓣蒜回来”“小明,去买几块钱的蒜回来”“小明,去搞点蒜回来”其实都是一个意思。但小明却听出了不同的意思。小明媳妇可能根本没意识到这几句话有啥不一样,反正她表达的都是一个意思。实际上我们正常人都能理解这几句话是一个意思,但小明这样“严谨”的人照着字面处理,反倒会理解错他老婆的意图。 语音交互我们要处理的是用户通过语言表达的意图,而不是语音识别转化出来的文字。用户的表达可能是不一样的,但表达的语义(意图)可能是一样的。语音识别在把语音转化成文字的过程,可能也会出错。如果按照错误的结果去处理,给用户的反馈肯定就是错的,交互就进行不下去了。 正如上文提及,两个人说话的时候,不存在把语音转化成文字的过程,都是在语音信号上做处理。对话的参与者透过对方说出来的话去理解对方的意图。这个处理的过程绝对不是个搜索的过程,而是一个复杂的思辨的过程。机器人只有学会这个思辨的过程,才能拥有真正的智能。搜索基本上是处理文本,文本输入什么就照着什么处理。就像小明那样,搜索认为“小明,去买两瓣蒜回来”“小明,去买几块钱的蒜回来”“小明,去搞点蒜回来”是不一样的。 其次,当我们说话的时候,我们会自然而然认为对方是聪明的,能理解我们的;当我们在搜索引擎输入框输入文字时我们自然而然认为我们需要自己从搜索结果里找出我们想要的东西。当我们说话时,我们期望获得对方的理解;而当我们搜索时,我们知道我们在操作一台机器。 我们经常觉得有人跟动物说话非常奇怪。那是因为我们认为动物听不懂人话。同理,当我们跟一个人说话的时候,也会考虑对方能不能听得懂。比如,我们跟老人和孩子说话时就会尽量说他们能听得懂的词。 当我们对一台机器说话时,我们已经默认它能听得懂我们了。如果结果并不是那么理想,我们也就不再对它说话了。 当我们操作一台机器时,我们会先学会它怎么用。我们要理解它的使用规则。这和跟机器说话是完全不同的。我们操作机器是我们已经知道它听不懂我们说的话了。 以前大家可能会觉得,对一台机器说话是不大正常的行为。因为那时候没有机器能理解人类语言。 现在当我们对一台机器说话的时候,我们已经认为这台机器是具备智能的,是能理解我们的,是不需要(学习它的操作方法)操作的。 于是我们可以把机器分为可以语音交互的机器和需要人操作的机器。前者需要具备智能,理解人类语言。 第三,当我们说话的时候,总是基于一定对话场景表达的,经常是在多轮对话中表达清楚意图的,我们输出和获取的信息是多维的。而搜索往往只处理用户输入的文本这个一维的信息。所以语音交互实际上是处理一个过程,这要比搜索处理文本复杂多了。 基于以上三点认识,我认为语音交互和文本搜索是有本质区别的。 要做好语音交互,用做搜索的方法肯定是不行的。搜索只能处理文字,不能处理语义。搜索不能主动服务,不能给用户智能的体验。做好语音交互,关键是做好语义理解,提高机器智能。(待续) 原文章作者:氖星智能客服,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-8-10
    最后回复 票麒褊 2021-8-10 21:26
    1139 0
  • 做好智能语音交互,让客服机器人更好服务社会
    智能客服机器人可以实现客户服务的及时性和连续性,提升客户体验。具体来说,机器人自动回复的时间一般不会超过一秒,可以提高客户回复的响应速度;此外,机器人可以实现7*24小时客服接待,使客户在非工作时间也能获得客服服务。 如今,语音交互已经成为人工智能领域最成熟也是落地速度最快的技术。尤其是深度学习的起势,让语音识别、语音合成以及自然语言处理的发展速度提升到了一个新的高度。其中,国内很多公司都在不断深入,结合人工智能领域技术开发出来的人工智能语音识别机器人产品已成功替代了人工销售工作,改变了传统企业营销模式。 什么是智能语音识别系统?语音识别实际就是将人类说话的内容和意思转化为计算机可读的输入,例如按键、二进制编码或者字符序列等。与说话人的识别不同,后者主要是识别和确认发出语音的人并非其中所包含的内容。语音识别的目的就是让机器人听懂人类所说的语言,其中包含了两方面的含义:第一是逐字逐句听懂而不是转化为书面的语言文字。第二是对口述内容所包含的命令或请求加以领会,做出正确回应,而不是仅仅拘泥于所有词汇的正确转换。 作为实体客服机器人典型代表的氖星智能机器人在深耕近二十年的技术积淀,历经近十年的产品打磨与完善,现在面世的氖星机器人大脑平台和氖星智能机器人世界可以较好的服务与填充政务服务中对客服机器人服务的较为棘手的问题与需求。作为客服机器人内核的氖星机器人大脑,能够根据实际需要帮助分析用户的语义,进而进行自然语言的处理。再加上由若干客服机器人组成的机器人集群的机器人世界,当用户在机器人世界提出问题时,若干客服机器人能够较好的按照相关的路径进行抢先回答用户提出的问题,这是氖星智能机器人在的具有优势的地方,能够较好的解决目前市场的需求。 电销机器人回答问题准确,可以预测客户询问的疑难问题,剩下的更难的问题直接转接到销售人员的人工服务,大大的节省了员工精力的浪费。 智能语音机器人语音体验更真实,男声、女声不同沟通风格供企业按照产品特性选择合适的声音,客户体验更佳。智能语音机器人更快速的ASR识别,智能互动销售虚拟助理语音识别本地化。 原文章作者:氖星智能客服,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-8-9
    最后回复 4727k0ycu4 2021-8-9 19:08
    1454 0
  • 第三代哈弗H6#个性化语音交互系统
    这年头谁还手动开窗?#第三代哈弗H6#个性化语音交互系统,化身秒懂小助手,和不便麻烦say bye bye~#智慧生活,伴你身边# 原文章作者:南康名忠哈弗4S店,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-8-6
    最后回复 峰帷 2021-8-6 17:11
    1014 0
  • 未来10年,语音助手将迅速崛起,键盘打字时代将终结
    近日,美国知名投资机构Mangrove Capital Partners(曼格鲁夫资本)发布2020年“语音技术报告”,指出语音技术将从根本上改变人机交互关系,并预测称,“我们不再需要打字,而是可以使用语音和手势,键盘可能会消亡。” Mangorve投资者相信,语音将成为未来10年决定性的主题之一,语音技术将通过颠覆性的方式为人类提供服务,将在办公、生活陪伴、医疗服务、商业创新等方面发挥深远影响。 语音对话,就人类最自然、最便利、最高效的沟通方式,因此,从技术演化的角度讲,像科幻片中常见的语音交互,注定会成为最主要的人机互动方式。 那么,语音技术什么时候才能取代键盘鼠标和触屏?这取决于两个前提:一是机器能否准确地将我们的语音转化为文字,二是机器能否准确地理解文本内容。 随着机器学习技术的发展,人类在语音识别(语音转文字)和自然语言处理(识别文本中的指令)两方面已经获得了长足进步——语音系统的单词识别准确率已超过95%,可以通过联想和推测来“联系上下文”,以实现多轮对话型阅读理解,这意味着语音助手已经初步具备了与人类相仿的语言理解能力。 从实际情况看,中美两国用户使用频次最高的技能大同小异,无非是听音乐、听故事、听新闻、查询天气、定闹钟和控制智能家居设备。 在中国,语音服务的普及更快,阿里巴巴在中国的智能音箱市场处于领先,在语音经济的探索尝试上也走的更大胆。而小米公司的小爱同学早就推出了控制家居设备的功能,用户动动嘴就能让语音助手帮忙开灯关灯、调低空调温度等操作。 中国小米公司的MIoT生态目前在全球也是很大的智能硬件IoT生态,目前已经接入的设备近2.71亿台,其小爱同学音箱支持遥控2000+款设备。 这得益于米家生态相对完整度很高(各种智能家居产品品类很多,同种产品也有各种型号配置),如果想在家里搭配一整套智能家居产品,从小家电到大家电,你都能在米家产品中找到。 我在最初使用小米手机的小爱同学的时候,并没有对搭建智能家居有什么特别的想法,仅仅是想让下班做饭的自己能够不必顾忌油渍菜汁,随意动嘴即可享受到喜爱的音乐。 而购置后的体验远远超过了我的预想。除了平时和我进行心灵上的交流,它的AI通话功能还能帮我阻挡千军万将的诈骗骚扰和推销电话,感觉自己有被“保护”到。 再后来,家里购置了越来越多的小米智能家居设备,我也变得越来越懒。下班回家躺沙发上,喊小爱打开扫地机器人拖下地。晚上睡觉时,觉得空调开高了,喊小爱同学调低空调温度。 最近小爱还更新了协同唤醒功能,之前我一呼唤小爱同学,电视、手机、音响一呼百应。现在的小爱会根据设备的距离、使用场景等条件进行判断,选择更适合设备应答并倾听我的呼唤,聪明多了。 总之,“语音时代”即将到来,而在引领全球进入语音互联网的过程中,阿里巴巴和亚马逊、小米、百度等巨头将扮演重要角色。 #小爱同学隐藏玩法# 原文章作者:科技小白虾说师,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-8-5
    最后回复 镘怃 2021-8-5 21:58
    2866 10
  • 像人一样自然交流地对话,人机交互还有多远的路要走?
    在科幻电影中,我们经常会看到这样的场景:机器人可以像人一样行走,说话,拥有着人的外貌特征。如果不仔细辨认,有可能还分不清真人和机器人。机器人除了没有人类的情感外,其它与正常人无异。机器人之所以能如此地智能,如此自然流畅地说话,这一切都离不开自然语言处理技术的支持。 作为人工智能的一个子领域,自然语言处理(NLP)指的是机器理解并解释人类书面语和口语的能力,目的在于使计算机像人类一样智能地理解语言和用语言表达,弥补人类交流(自然语言)和计算机理解(机器语言)之间的差距。目前,NLP 已经具有了广泛的应用领域,如信息提取、文本生成、机器翻译、情感分析、知识图谱、智能问答、对话系统等。 其中,对话系统在最近几年发展非常迅速,特别是在 NLP 顶会上的论文数量逐步增多。如果说,自然语言处理是 AI 皇冠上的明珠,那么对话系统就是「NLP 皇冠上的明珠」。我们以小爱、小度、微软小冰等为例。这些AI语音助手与人对话聊天的机制已经非常的成熟了。尤其是微软小冰,可以说是虚拟的AI人物,完全可以实现与人对话交流,对答如流。 何谓智能对话系统? 智能对话系统,就是在各种智能算法的支撑下,使机器理解人类语言的意图并通过有效的人机交互执行特定任务或做出回答。随着技术的不断发展,任务型对话系统在虚拟个人助理、智能家居、智能汽车(车载语音)等领域有了广泛应用。聊天型对话系统也在娱乐和情感陪护领域找到了应用场景。一直以来,实现人机交互都是我们奋斗追求的目标,目的就是让机器像人一样自然流畅地说话。 人机交互发展历程 随着科技信息化智能化水平的提高,人机关系也发生了重大变化。机器智能的提升以及语音交互、图像识别、AR、VR等技术的广泛应用,都给人机交互带来了新的发展机遇。人机交互(Human - Computer Interaction, 简称HCI)是研究机器和用户间交互关系的技术,机器既指计算机的软件和操作系统,也包含日常生活中各种各样的机器。从计算机的诞生到现在,人机交互在几十年间所取得的成就是以往所不可比拟的。人机交互技术的全面应用推动数字生活在根本上有了更加人性化的改变,也推动了新一轮的技术革命。 近几年,AI语音技术的成熟发展,市面上出现了越来越多的智能语音交互产品。比较典型的有智能音箱、智能翻译机、智能鼠标、TWS翻译耳机等等。智能音箱可以说是人机交互早期的最具代表性产品。以百度音箱为例,我们可以通过发布语音指令进行远程隔空操作,将人类的双手从劳动中解放出来。通过对小度音箱发布各种语音指令,听歌、听新闻、查询天气 只需动动嘴就能进行远程操作。 智能翻译机相比智能音箱更加智能,人机交互体验感更强。智能翻译机堪称是随身翻译官。无论是出国在外还是在国内与外国人进行交谈,一台翻译机就足以解决所有的语言翻译需求。云集智能翻译机,支持上百种语言实时在线互译,拥有丰富的语料库,服务器遍及全球,0.5秒的响应速度,即说即译。多种翻译模式任意选择,如拍照翻译、对话翻译、语音翻译等。在日常生活、工作、学习中与外国人进行任何社交活动的时候,借助翻译机即可实现外语自然聊天。 虽然说从 智能音箱到智能翻译机,人机交互迈向了一个更高的层次,但是人机对话依然停留在机械性的对话交流中。比如翻译机,虽然翻译水平很高,堪比专业的翻译人员,但是翻译僵硬,只能按照字面意思一板一眼的翻译,丝毫展现不了语言本身的魅力,要想进行深入的交流和探讨非常困难。 当前人机交互面临最大的问题无非就是:交互性问题。被系统控制的机器只能与用户进行机械性的对话交流,没有一点个性,千篇一律。对于人机交互性问题,我们更希望机器能与用户进行情感、情绪上的交流,实现交互性很强的对话。 未来的人机对话要想真正的实现机器像人一样自然流畅的对话,那么一定要实现这两方面的能力:其一满足用户的信息需求,其二满足用户的社交需求。科技终究是为人类而服务的,机器无论再怎么智能,也需要具备满足用户需求的能力,这样才有其存在的价值与意义。就好比智能音箱、智能翻译机无论多么的智能,也不能脱离它原本的功能。一个是AI语音助手,一个是语言翻译助手,这两个最基本的功能就是用户的信息需求。 在满足了用户信息需求的前提下,再去考虑社交需求。我们希望机器能像人一样自然流畅地说话,能够具备个性,有固定的人设和身份。从心理学的研究可以知道,个性(personality)是一个研究得非常深入的概念,在游戏、客服以及虚拟智能体上都有非常重要的作用。如果一个智能系统能够体现出一致的个性,则这个系统更值得信任,能够进行有效的社交交互。 此外,如何实现人机交互系统中的共情和情感支持也是关键。我们知道在人类的智能行为里,情绪智能是一个非常重要的特点。如果人机交互系统能够很好地去理解情感和情绪,不仅能提升用户表现和用户满意度,还能更少地使对话陷入了僵局。 总结,如果机器能够理解人类语言,像人一样自然流畅的对话, 我相信人类与机器、人工智能之间打交道的途径就会变得非常的简单,那么实现人机交互的愿景也是来日可期! 文章部分素材引用:公众号:机器之心 原文章作者:深圳云集智能,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-8-5
    最后回复 逄方方 2021-8-5 19:59
    2431 0
  • 声姿丨小米电视ES 2022款,年轻人的性价比优选
    近年来,小米电视不断发力高端市场,推出多款OLED电视产品、量子点电视产品,通过这些创新显示技术的加持,布局高端。 除此之外,作为年轻人首选品牌的小米也没有放弃一贯的高性价比作风。2021年6月底,小米举行了画质双旗舰电视的发布会,其中就推出了小米电视ES 2022款,拥有高性价比的智能化电视,提供55″/65″/75″三种尺寸,定位专为年轻用户打造的画质轻旗舰。 “小爱同学”,你的全屋智能控制中心 小米电视ES系列搭载思必驰线性四麦前端信号处理、语音唤醒等技术,支持远场语音控制,无需遥控器,不管是内容点播、音量调节,或者是查天气,智能家居联动…大事小事,喊一声“小爱同学”,这台电视,就是全屋智能控制中心。 对于年轻人来说,“小爱同学”的智能化服务可满足于日常生活需求。不管是在下班后回到家中,还是周末宅家的时候,都可以体会到思必驰智能语音技术在小米电视ES 2022款的畅快应用。 多分区 画质轻旗舰 除了智能化,小米电视ES 2022款高亮度、高色准、多分区,在画质体验上,相比上一代产品有了跨越式提升。相比同价位段电视产品,为用户带来更多画质选择。 在硬件层面,小米电视ES 2022款本次最大的亮点就是采用了星幕锐影像多分区背光系统,其中55寸、65寸、75寸版本分别采用了32个、45个、60个背光分区。此外它还能够实现4096级别的精密调光,屏幕峰值亮度也达到700nits。 性能方面,小米电视ES 2022款搭载MT9638处理器,这是联发科专为具有 MEMC 功能的中高端 4K 60Hz HDR 智能电视而设计的芯片。内置四个Cortex-A55核心,采用Mali- G52 MC1图像处理单元。根据官网介绍,小米电视ES 2022款支持MEMC运动补偿、AI超分辨率算法等技术,能有效解决画面拖影、清晰度不足等问题。 思必驰作为行业领先的对话式人工智能平台公司,将持续助力彩电行业智能化升级,打造更好的全屋智能体验。 原文章作者:思必驰语音交互,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-8-5
    最后回复 蝴邸隋 2021-8-5 18:19
    1573 0
  • 小CAN持续进化 语音交互领跑业内
    “嗨,小CAN” “怎么啦?” “你蕞孤独的时候是哪一刻?” “第二杯半价”; “你多大了?” “我的生日就是遇到你的那一天,很年轻吧” 被调戏、找乐子,承受着一个机器人不该承受的逗比,这就是智趣领航员小CAN日常被迫营业的真实写照。随着HYCAN 007的正式上市,越来越多的用户与可爱、软萌的小CAN亲密接触,这个小小的车载智能机器人成了大家的日常欢乐源泉;专业声优的甜美声线加持,也让小CAN更加地生动活泼,有温度。 语音交互6到飞起,智趣驾驶小能手 脱胎于NOMI的小CAN,可不仅仅是一个逗比,功能更是强大。一句“嗨,小CAN”,即可随时随地轻松唤醒,真正做到去APP化的交互体验。开关空调、查询地图、访问通讯录、收听电台、查天气等操作,全都一句话就搞定,小CAN做到了一机包揽车内80%的驾驶员操作任务,还能圈粉自拍党。只要对小CAN说一句“我要拍照”,就像拥有一个车载自拍小助理,随时随地抓拍驾车靓照,自拍党怎能不爱! 以往在驾车过程中,想要调节音乐音量等,就必须得对车辆够熟悉,蕞好盲操,否则分散注意力盯着中控台,极有可能引发交通事故。有了机智的小CAN,就能实现一个语音指令全面控制HYCAN 007车载“7字”飞梭三体屏,不止科技感飙升,安全感更是满满。在小CAN和“7”字飞梭三体屏的加持下,HYCAN 007实现了全触控、无实体按键的数字智能座舱设计概念,在新能源汽车行业中处于领先水平。 全系标配,轻松拥有“学霸”小伙伴 要做一款蕞IN的车载机器人,除了要情绪有温度,智力更是安身立命之本。所幸小CAN天赋异禀,能够7 x 24小时不间断学习,不断快速迭代升级。工程师们收集了海量数据,作为小CAN的学习“资料”,让它时刻学习蕞新“知识”,成为更懂用户的机器人;这还没完,HYCAN还将合创理念运用到小CAN的“调教”中。去年就在社区发起“小CAN训练师”活动,用户可以通过对话“调教”小CAN,在各地方言、黑话、段子的投喂下,小CAN简直是要成精;如果有一天小CAN把你怼了,只能说“小CAN训练师”们“名师出高徒”。 随着不断的升级,小CAN的功能也会逐步完善,未来将达到96%以上的唤醒率,95%以上的识别率。在持续不断的学习下,小CAN还将解锁更多功能,真正成为一个无所不能的智趣领航员。与其他车企需要额外花钱选装智能车载机器人不同,HYCAN 007在业内率先实现全系标配小CAN,让用户轻松即可拥有智趣领航员,打造安全又有趣的出行体验。 当5G技术照进现实,移动互联网、物联网和人工智能的飞速发展还会远吗?汽车有了智能的“外挂”,再度引领传统工业腾飞不远矣。当下语音交互已成为入局智能汽车领域的突破口,车载智能机器人必将扮演更重要的角色。 作为合创汽车的开山之作,HYCAN 007业内首个全系标配车载智能机器人、L2+智能辅助驾驶系统等众多黑科技,诚意满满。现在登录“HYCAN合创”小程序/APP下定,即可收获智慧高能HYCAN 007,领养有趣有料有温度的机器人萌宠小CAN哦。 活动时间 2021年8月4日 至 2021年8月4日 原文章作者:合创汽车玲玲,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-8-5
    最后回复 应云亭 2021-8-5 00:13
    2102 0
  • 小鹏P7全新OTA升级包开始推送 优化交互语音和NGP过弯能力
    8月3日,小鹏汽车表示小鹏P7全新的OTA升级包已经开始向车机上推送。此次升级包的版本号为2.6.1,将主要在语音交互和NGP自动导航辅助驾驶两个方面进行优化和升级。 在语音交互功能上,车机内的语音系统将采用全新的AI声音,声音通过全新一代超大规模在线神经网络语音合成引擎制作,听起来将更好听、更生动、更拟人。另外全新AI声音拥有14种情绪和风格储备,可以通过识别用户语气变换。 本次升级还将优化NGP的过弯能力,将调整车辆在弯道时NGP的限速逻辑,尤其是当弯道视野不佳的时候会进一步降速,保证车辆过弯的安全性和平稳性。 另外XPILOT 2.5自动驾驶辅助系统新增加了DSM疲劳监测功能。当驾驶辅助开启时,车辆能够根据驾驶员驾车时长、操作车辆的动作等条件来判断驾驶员是否处于疲劳状态。如果发现驾驶员疲劳,车辆会进行及时提醒。 原文章作者:电动邦,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-8-4
    最后回复 得曜 2021-8-4 22:50
    1345 0

快速发帖

还可输入 80 个字符
您需要登录后才可以发帖 登录 | 立即注册

本版积分规则

在本IOT圈子中寻找帖子
IOT圈子地址
[复制]
Weiot(威腾网)是一家以原创内容、高端活动与全产业渠道为核心的垂直类物联网产业媒体。我们关注新兴创新的物联网领域,提供有价值的报道和服务,连接物联网创业者和各种渠道资源,助力物联网产业化升级。
15201069869
关注我们
  • 访问移动手机版
  • 官方微信公众号

© 2014-2020 Weiot.NET 威腾网 北京微物联信息技术有限公司 ( 京ICP备20000381号-1 )