请选择 进入手机版 | 继续访问电脑版
专注物联网产业服务
微信二维码
威腾网服务号
游客您好
第三方账号登陆
  • 点击联系客服

    在线时间:8:00-16:00

    客服电话

    17600611919

    电子邮件

    online@weiot.net
  • 威腾网服务号

    随时掌握企业动态

  • 扫描二维码

    关注威腾小程序

阿里智能
阿里智能
是全球领先的云计算及人工智能科技公司,致力于以在线公共服务的方式,提供安全、可靠的计算和数据处理能力,让计算和人工智能成为普惠科技。
  • 阿里人工智能实验室新增两名首席科学家
    北京商报讯(记者魏蔚)9月18日,阿里宣布前高通首席工程师陈颖和加拿大西蒙弗雷泽大学终身副教授谭平入职阿里人工智能实验室(以下简称“阿里AI Labs”),将关注视觉领域。业内人士表示,这意味着阿里AI Labs开始从语音交互向视觉交互布局,未来智能助手天猫精灵在视觉领域或推出更多功能。 陈颖曾任美国著名芯片公司高通首席工程师,是首个获得高通“知识产权成就奖”的华人。加入阿里AI Labs后陈颖将担任人工智能和边缘计算首席科学家,重点攻克家用智能终端视觉技术,降低物联网视觉芯片门槛。 谭平是加拿大西蒙弗雷泽大学终身副教授,研究领域是真实感的三维重建技术,可通过真实物体的照片自动对物体进行3D建模,是3D视觉领域的标杆式人物。加入阿里 AI Labs后,谭平担任计算机视觉首席科学家,专注三维建模和全息技术研发,建立真实世界的三维数字化版本。 公开信息显示,目前阿里AI Labs除了陈颖、谭平外,核心产品及技术研发团队还包括实验室负责人陈丽娟、语音技术首席科学家聂再清、机器视觉杰出科学家李名杨、首席设计师李剑叶、硬件终端总经理茹忆、产品运营总经理杜海涛等。 原文章作者:北京商报,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于前天 04:21
    最后回复 祉足 前天 04:21
    1041 0
  • 智能座舱的2019年终总结:华为、阿里、谷歌的系统级战争开启
    随着2019年进入倒计时,循例对汽车行业细分领域进行盘点。 本文要盘点的是智能座舱领域,在2019年,智能座舱成为了比车联网更热的行业名词。一方面在于车联网概念的局限性,智能座舱则更能体现车内空间的价值;另一方面在于车联网一直缺乏明确的商业模式,智能座舱有着更广阔的空间。 智能座舱涵盖的范围更广,但,其中需要一个基础,这个基础在车智看来,就是一个车载操作系统,这个操作系统更多的是指中控台操作系统。目前来看,全球范围内的车载操作系统屈指可数,未来能在中国市场掀起波浪的,可能就三家。 分别是华为的智能座舱操作系统——鸿蒙Harmony OS,阿里巴巴的AliOS(或者称之为斑马智行系统),还有就是一个外来的和尚——谷歌的AndroidAutomotive OS。 至于其他基于Android改造的车载操作系统,就不在本文讨论的范围内。在车智看来,现阶段智能座舱的战争一定是系统级的战争,任何没有核心系统能力的玩家,未来都面临着被淘汰的危险。 参考一下特斯拉的车载操作系统,完全自研自用,打出了属于自己的一片天地,为特斯拉的车主提供了前所未有的用户体验,让用户趋之若鹤。目前,特斯拉正在努力将中国的服务,嵌入到特斯拉的车载系统里,这就是车载服务的地域性特点决定的。 回到文章开头提到的,为何是华为鸿蒙Harmony OS、阿里AliOS和谷歌Android Automotive OS,是有机会在中国掀起风浪的。在过去的2019年,这三大系统,又发生了什么,又将如何影响行业的发展。 01 华为鸿蒙Harmony OS 在2019年8月9日的华为开发者大会上,余承东宣布推出万众期待的华为操作系统——鸿蒙Harmony OS。 按照官方的描述,鸿蒙Harmony OS是一款“面向未来”的操作系统,一款基于微内核的面向全场景的分布式操作系统,将适用于手机、平板、电视、智能汽车、可穿戴设备等多款终端。按照计划,在2020年,2.0版本的鸿蒙Harmony OS将可在车机上使用。 在2018年10月底的世界智能网联汽车大会上,华为轮值董事长徐直军半年内再次解读华为汽车战略的时候,华为提出了基于“CC架构的”三大“平台+生态”的战略,其中涉及到智能座舱的平台是CDC智能座舱平台。 在CDC智能座舱平台上,华为将基于智能手机麒麟芯片(或将推车规级版本)+鸿蒙OS,打造智能座舱平台,除了提供娱乐服务,未来自动驾驶实现后,会有更多的乘客服务和安全服务。关于华为的CC架构和三大“平台+生态”,请点击《解读华为CC架构:“平台+生态”打造全新汽车未来》。 华为进攻智能座舱的核心抓手是计算能力——自研芯片,操作系统——鸿蒙Harmony OS,核心竞争力则是Harmony OS与其他智能终端的交互,包括手机、智能家居、可穿戴设备等等。 在智能座舱领域,华为率先推出了一个轻量级的应用——华为HiCar,这被华为定义为2.0版本的映射功能,除了可以实现类似苹果CarPlay或谷歌Android Auto的映射功能外,HiCar最大的特点在于硬件互助,简单理解就是车机可以调用手机算力、还可以调用其他的外界硬件设备,特别是I/O的传感器和交互设备等。 今天,搭载HiCar的新宝骏RC-6正式上市。关于华为HiCar白皮书,请点击《华为发布智慧车载解决方案HiCar生态白皮书【PDF】》。 很明显,HiCar只是华为智能座舱战略的餐前小吃,真正的主菜是CDC智能座舱平台,车用版的麒麟芯片+鸿蒙Harmony OS操作系统。当汽车、手机、智能家居、可穿戴设备等都使用了鸿蒙HarmonyOS操作系统,会让消费者得到不一样的用户体验。这种用户体验,是有可能超越目前特斯拉能够给用户提供的用户体验。 02 阿里AliOS(斑马智行) 如果说2015年,阿里与上汽共同出资10亿成立持股比例50:50的斑马网络,是阿里智能汽车战略的开端,那么2019对于阿里的智能汽车战略来说,应该是划时代的一年。 因为这一年,阿里如愿以偿的成为了斑马的大股东,并且对其进行重组,将阿里的AliOS资产注入斑马成立新斑马,并且空降了原阿里YUNOS(AliOS前身)的总裁张春晖与斑马CEO郝飞,共同出任新斑马的联席CEO。 在完成了重组后的新斑马,在两天前宣布与共和国的长子——中国一汽签署战略合作协议,双方将以斑马智行系统为基础,打造面向未来的下一代智能网联汽车。对于阿里而言,其与上汽合资的斑马,打造了第一款互联网汽车——荣威RX5,并且获得了市场的认可,RX5的月销量一度超过2万,即便是今天,月销量也是超过1万。RX5的成功,也成就了斑马网络。 RX5热销之后,上汽自主品牌,包括名爵、大通等,其旗下新车型,纷纷搭载斑马系统,另外,斑马网络还和东风雪铁龙、长安福特、观致等合资、自主品牌进行战略合作,为这些品牌提供定制化的车载系统。 随着新斑马与一汽达成战略合作,在不久的将来,我们应该能够看到搭载着斑马智行系统(本质上是定制化的AliOS系统)的红旗上市。对于阿里而言,成功拿到斑马的控制权,是其投入资源发展斑马的前提,这一步在2019年已经成功实现了。接下来的2020年,就看张春晖如何带领斑马,一步步实现阿里的智能汽车战略意图了。 03 谷歌Android Automotive OS 在2019年,谷歌的车载操作系统AndroidAutomotive OS,首次搭载在量产车型——Polestar 2上,这是沃尔沃旗下独立的纯电动高端品牌,Polestar 2是一款对标特斯拉Model 3的车型。 在2019年5月举办的谷歌开发者大会Google I/O 2019上,在2017年发布的Android汽车操作系统Android Automotive OS,成为了今年开发者大会的主角之一。在5月1日,谷歌在Android开发者官方博客上,撰文宣布数百万的开发者可以为AndroidAutomotive OS开发应用程序。 作为一款原生的操作系统,让谷歌和车企都有着非常广阔的空间,更重要的是,汽车制造商允许Android汽车操作系统与底层汽车系统紧密结合,车主将能够使用助手来调整气候控制、管理电动里程,以及做其他需要系统集成的事情。 在Google I/O 2019大会后,第三方开发者将能够开始为Android Automotive OS创建媒体应用程序,之后将是通信和其他软件。谷歌仍将以安全的名义,对那些希望进入Play store的以汽车为重点的应用程序,保持与Android汽车应用程序同样的严格控制。 谷歌的车载操作系统Android Automotive OS,得到了众多的国际车企的支持,包括了沃尔沃、通用、日产-雷诺-三菱联盟等,有统计显示,宣称要使用Android Automotive OS的汽车品牌销量,占据全球汽车销量的50%以上。 在中国市场,有消息显示,博世正在为上汽通用在2021年量产的车型搭载的Android Automotive OS正在进行本土化的改造服务。是的,对于车载操作系统而言,本土化与汽车底层交互两个方面,是开发者们的机会。关于谷歌Android Automotive OS,更多的内容可以点击下面链接:谷歌重磅宣布:数百万开发者将可为汽车操作系统开发应用程序 谷歌汽车操作系统正式上车,全球开发者迎来黄金创业机会谷歌开发者大会:全球开发者这样为汽车操作系统开发APP【PPT+视频】在2019年,智能座舱迎来了真正的巨头级的车载系统的战争,在2020年,战争可能还不会白热化,但必然是在悄然进行着,能参与这场战争的巨头不多,对于创业者或者开发者而言,可能需要静候的是,系统生态建设的机会。 在即将到来的CES 2020,智能座舱方面,会有什么样的新进展呢?敬请关注车智的报道。 原文章作者:车智Inveh,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于3 天前
    最后回复 大覃神 3 天前
    1474 11
  • 阿里人工智能这五年:天才的野心与自证
    采访 | 四月 撰文 | 四月 过去五年,阿里在全球人工智能的激烈赛道上悄然跑进了第一梯队,背后一群以达摩院称号对外示人的科学家群体愈发神秘撩人。 这是一群野心勃勃的科学家,亲手打破旁人艳羡的舒适区,踏入充满禁忌的未知地,只为寻觅更广阔的舞台。他们一生都致力「求证」,或于学术理论,或于技术价值,并愿意承担随之而来的冒险和境遇窘迫。 这五年,阿里经历了人工智能技术长征的发端与突围,而他们,也经历了一场巨大的冒险与自证。 初见之时,你或许会讶异他们滔滔不绝地谈起「买单」、「落地」、「规模化」等商业味浓厚的字眼,全然没了学究气,仿若一位身居一线的创业者心心念念…… 直到你听说过那段既艰难又幸运的岁月,一切便了然于心——唯有越了解真相,才会变得越务实。 人生的绝妙之处也在于此,改变他们的不是早年风光的求学路,也并非当下所拥有的物质地位,而是源于一次又一次被质疑和误解后的绝地「自证」——不同于象牙塔里、试验台前的公示推理和仿真验证,商业场上的「自证」需要拿出实实在在的业务指标和实际效果,正如阿里办公区里那句随处可见的标语——「NO DATA,NO BB」。 强压之下的「自证」氛围造就了科学家们近乎苛刻现实的技术价值观。 待繁务卸下,他们重拾赤子之心,沉浸于算法公式和理论推理的乐趣。但人生并不总有自由浪漫的时刻,更漫长的是披荆斩棘的孤独与煎熬。 通过和近十位阿里巴巴人工智能科学家的对话与交流,本文试图还原阿里打造人工智能技术体系的荆棘路,以及路途中科学家们的内心征途。 1 . 既艰难又幸运 多年以后,遇上北京的雾霾天,漆远没准依然会想起那个加班的春节——西大望路的阿里妈妈会议室里,一桌人戴着口罩开着会,工位上的空气净化器呼呼作响,窗外是望不到对面楼的雾霾天。 回国前,漆远已经在脑海中罗列过一连串的适应清单,以备回国后的各种挑战,而「迷雾危机」大概是被遗漏的最重要的一条,它不仅来自于北京的天气,还包括那个大胆的决定。 漆远曾走过一条无数理工男梦想的坦途:31 岁麻省理工大学博士毕业,39 岁成为一流大学终身教授,定居美国,拥有宽敞明亮的实验室和独栋别墅,一位美丽的太太以及两个可爱的孩子,一年两次固定的长假足以让他兼顾工作和生活的完美平衡。 直到一次大胆的决定,漆远亲手打破了这种平衡。在拒绝谷歌、Facebook、百度等公司的邀约后,漆远决定归国到杭州工作,选择了当时看起来「最没有技术范儿」的阿里。 2014 年 9 月 19 日,时任阿里巴巴合伙人的王坚带着漆远来到纽交所,共同见证了阿里巴巴的上市,7 位敲钟人全是阿里电商的买家和卖家,却没有一位是科学家。 面向华尔街,这家彼时市值 2400 亿美金的公司并不满足被定义为一家「电商公司」。他正在谋划一个崭新而宏伟的「想象力故事」,以便让公司在未来获得更强劲的增长动力。 他明白,前沿技术会是这个故事的主角,紧接着 iDST(数据科学与技术研究院 Institute of Data Science & Technologies)宣布成立,漆远和金榕成为早期创始人。 但彼时彼地,故事听起来不免有些冒险主义——中国互联网市场仍处在模式创新的初级阶段,一家以商业利益为本的企业凭什么打造技术驱动的研究院?国内几乎没有任何成功的营运模式可以参考。 未知的挑战首先降临到了早期创始人和研究机制身上。 漆远,现达摩院金融智能实验室 负责人 加入阿里后,漆远接到的首个任务是打造一套大规模机器学习平台,落地到淘宝的广告平台阿里妈妈。他清楚地记得,当时手里攥着两千万特征,14 天的数据。由于数据量太少,他计划积累到半年数据后再启动。 同时,他还提交了一份申请数千台服务器的计划。这并不是一笔小数目,直到现在一块英伟达的计算卡依旧要价 2000 美金,计划讨论后就被否决了。 等了半年,服务器仍没有拨下来,巧妇也难为无米之炊。「当时没有 GPU 集群,整个集团都没有」,漆远说道,「同事们认为,『你们这帮教授老师过来,基本不懂业务,也不懂技术』」。 秀才遇到兵,有理说不清。漆远的团队陷入了不能「自证」的悖论里:没有 GPU 集群,如何证明自己的算法和技术高效?不能证明自己的算法和技术高效,如何争取到 GPU 集群? 漆远曾试图据理力争,僵持状态几近半年,「团队一度走在解散的边缘」。 金榕是 iDST 的另一位创始人,美国密歇根州立大学终身教授,曾获得过美国国家科学基金会奖(漆远也获得过该奖)——有超过 200 位诺贝尔奖得主都获得过这个奖金的资助。 金榕,现达摩院机器智能研究领域 负责人 金榕带领团队为「聚划算」提供流量分发的技术优化,团队很自然地把低价商品排列在搜索和推荐结果的前列以提升成交量,却忽视了对业务本质的理解——低价虽可刺激购买,却让目标用户群从二三城市转移到三四线城市。 「虽然 GMV 上去了,但产品的价值都变了」,金榕说道。 业务为技术开路,科学家们却在无意中篡改了产品的内核,「短板暴露得非常明显」,金榕谈道。当时团队多为研究背景,精通基础理论,却缺少业务理解和工程实践经验,所以看不到技术到产品中间的巨大鸿沟。 「你们要想在阿里发挥出真正的价值,就必须克服这些困难」,当时的阿里 COO 张勇找到金榕和几个骨干说道。 既然不够熟悉业务,那就去到第一现场吧! 于是,iDST 的早期科学家们兵分多路,以电商和金融两大核心业务为首,深入到产品和工程里。金榕带着团队进入到淘宝和天猫的搜索事业部,漆远和几位同事去了蚂蚁金服,做语音的团队则留在了阿里云。后来这被称为阿里科学家们的「上山下乡」运动。 技术的觉醒并不止于高层,更早些,一股从下至上的创新力量就窜上了头,内部创新的文化开始流行——「只要你的老大不反对,就是对你最大的支持」。 2013 年的十一国庆,李昊印象尤其深刻。他没有旅游计划,也不用回老家走街串巷,而是一人闷头在办公室里捣鼓。一连七天,他都在工位上敲打着键盘,像是着了魔。 终于,赶在假期结束前,他长舒一口气——Demo 跑通了,由一块 GPU 搭上一台主机,纯手写的用于图像搜索的深度学习算法。再简陋不过的装置,但结果令人欣慰——比传统算法的准确度有了明显提升。 正值第三次人工智能浪潮起势,ImageNet 大赛进入到第三届,深度学习教父 Geoff Hinton 和他学生设计的 AlexNet 在赛事中大放异彩,基于深度神经网络的思路一举解决了图像分类的棘手难题,至此开启神经网络百家争鸣的盛况,更深、更宽的网络层出不穷。 李昊从外文网站上读到这些消息时备受鼓舞,他博士毕业于中科院光电技术研究所,来阿里不到一年,满腔学以致用的迫切。 李昊,阿里巴巴资深算法专家 早在 2010 年,谷歌豪掷 1 亿美金收购图像购物搜索网站 Like.COM,掀起全球图像搜索的风口。文字搜索场景有限,图片描述更为加精确,微软、亚马逊、百度纷纷出手,阿里也顺势投资了一家图搜购物网站(现名为「淘淘搜」),通过识别图片上的实体物品来索引网络上对应的店铺链接。 遗憾的是,随着移动互联网时代的到来,图搜风口很快熄火,手机实拍图的普及,让搜索结果越来越不可控,图搜应用体验大幅受挫,不少创业公司濒临倒闭。 「实拍图的比对相比 PC 的原图难得不是一星半点,已经不是传统图搜技术能应付过来的」,李昊说道。 既然传统图搜技术已经无以为继,那在视觉领域技惊四座的深度神经网络能否奏效?为此,李昊花了整个国庆假期来验证这个想法。 「他很兴奋,一直给这个看,给那个看,非常大力地推广」,李昊回忆起将Demo交给主管时的场景。就这样,团队争取到一次向时任淘宝 CEO 展示的机会,这次是直接在手机端演示——手机拍照,实拍图和库里已有图片做比对检索,找到和相似的照片显示——相比传统算法提升了一倍。 很快,「图像搜索」项目在 2014 年正式启动,目标是落地到手淘(手机淘宝应用)平台。 刚来阿里三个月的潘攀被任命为负责人,兼顾算法、工程、产品的统筹,团队力量充沛。潘攀毕业于美国伊利诺伊大学芝加哥分校博士,此前在美国三菱波士顿研究院、北京富士通研发中心从事视觉领域的研发工作。 潘攀,现达摩院视觉智能研究领域 资深算法专家 延续此前团队推动的技术路径,「图搜」采用深度学习技术,随之成为阿里历史上最早采用深度学习技术并上线的 C 端应用产品。 和大多数互联网公司战略先行的思路不同,阿里在技术探索的早期并没有大刀阔斧地批项目,而是从现有的核心业务盘子上找切口,克制而谨慎地实验性验证,然后才推动落地。 「当组织里的算法和研发比较少,更多是由业务和产品构成时,就决定了大家对于技术不确定性的理解会非常有限」,潘攀说道,「对于一家互联网公司,做项目就一定要做出来,看得到结果」。 这是一个又艰难又幸运的过程,当行动早于认知,缺少资源、无人信任、无法施展等困境便接踵而来,这既是商业公司的盈利性质所决定的,也是新生事物萌芽期所必经的考验。 但幸运的是,无论是自上而下的理想主义,还是自下而上的创新力量都得以保留,幸免于昙花一现的口号和想法。 火种尚存便可以燎原。 2. 坐在金山上啃馒头 「坐在金山上啃馒头」,这是漆远加入 iDST 时听马云说过的话。金山就是阿里巴巴拥有的丰富数据。但是即便坐拥金山啃馒头,也难以一口吃成个大胖子,「如果数据的价值不能被挖掘出来,那不过就是普通的土壤」。 随着深度学习算法与模型的普及应用,「调参」工作成为大部分算法工程师的日常,淘宝和天猫的搜索团队一开始也不例外。 因为深度学习算法的不可解释性,很多基于该技术的方案就像是一个「黑盒」,模型中的参数选择和调整成了一件难捉摸的事,往往意味着繁琐而毫无头绪,没有技术含量。 在漆远看来,光是调参远不能建立起技术体系,「虽然属于工程层面的工作,但仍需要科学的思想指导——最好的工程指导就是科学,否则你就只能是一名调参工程师」。 与漆远秉持同一观点的还有金榕。「原来我们都是做些调参工作,直到金榕老师来了之后才把我们带上正轨」,李昊谈道,「他常反问我们,深度学习为什么能奏效?你能从理论上解释吗?」 「图搜」项目之后,李昊便来到了搜索技术部——阿里最为核心的算法部门之一。在这里,李昊遇到了前来深入业务第一线的金榕。 李昊当时的主要工作是为深度学习模型进行压缩与加速优化,一般做法是套用现有模型,但金榕通常会提供新的思路,「他给了我们一堆的公式,让我们去试」,但这一试就是三个月,也没出结果。 当李昊和同事怀着忐忑的心情找到金榕,他并没有因此责备,反而给予鼓励,「如果三个月就能做出来,那就是太简单了,继续去做吧!」直到第四个月算法总算跑通。这套算法将Embedding 技术结合深度学习引入到搜索业务中,明显提升了淘宝主搜索的 GMV。 李昊回忆,当时金榕还做了一套非常长的理论证明,证明算法是可收敛的,并在内部分享,「他当时给予我们的理论指导,正是我们所稀缺的」,李昊对此十分感激。 来到蚂蚁金服的漆远则接到了智能客服的项目,通过智能交互机器人来解决支付宝的客服问题。这一次,他顺利很多,获得当时集团客户服务部负责人戴珊的支持后(戴珊是阿里巴巴早期创始的十八罗汉之一),很快争取到了资金和资源进行技术的验证。 在阿里科技发展早期,以阿里合伙人为代表,形成了一股来自理想主义的推动力量。 2015 年的双十一,首次采用深度学习技术的支付宝客服实现了 94% 语音自助,这意味着有 94% 打来的电话不再需要转接到人工服务,次年,这个数字提升到 97%。去除掉人工智能团队的人员工资和计算资源成本,智能客服项目为公司节省了一个多亿。 所谓「知人善用,人尽其才」,技术工具同样如此,唯有了解 AI,才能用好 AI。 要在一家互联网公司里树立起对于新技术的认知和信仰并非易事,这为科学家们设置了一道又一道的障碍栏,甚至不可避免地造成了人员流失。 但回过头来看,或许正是有了「上山下山」的共事经历,才算是真正打通了「研发」和「业务」的对话体系,让阳春白雪和下里巴人从此互融。 技术之后,便是产品工程化的进阶挑战。 哪怕有高层支持,也不意味着就此被保驾护航,伴随而来的反而是更大的压力。图搜立项的第一年就设定了明确目标——日活过百万,「打从立项之初就不再是实验性的了」。 与初期的深度学习算法探索不同,后期的挑战就像无底洞一样填不满。 「问题的关键在于,我们不是在做一个独立的 APP,而是让它落在手淘上」,潘攀说道,「而且还是阿里最为核心的业务平台」。落地手淘,意味着图搜需要调用手淘的底层接口,需要针对淘宝内部的链路架构做额外定制和调配,而淌通这些链路就是最大挑战。 在视觉领域,大规模图片的压缩极其消耗算力,这为大规模的图搜访问埋下了隐患,一次意外报警让潘攀记忆犹新。 一天,图搜的服务器突然被拖垮,后台出现报警。 经过紧急排查,团队才发现,原来是淘系后台针对图像上传的默认压缩功能拖垮了服务器。默认压缩主要针对低频、小访问量的媒体上传需求,但并没有考虑到图搜的特殊情况——数据规模大,且需要实时识别,所以已经在前端预设压缩功能。换句话说,淘系的图片默认压缩对于图搜反而是一种负担。 在发生警报之前,大家都忽略了这么细微的接口。潘攀谈道,「很多时候就是这样,即使我们自己考虑到位了,但如果要连接到更大的系统上,还是会出问题」。 上线并不意味着挑战结束,比如,还有深不可测的入口。潘攀清楚地记得,图搜第一次上线的位置是手淘的一个四级菜单里。「四级」,则意味着你首先要在首页里找到「发现」,然后点开「特色服务」,点击「更多」,再…… 作为阿里最为核心的业务战场,手淘的态度显而易见——「愿意给技术机会,但也要求风险可控」。 机会需要争取,更需要「自证」其价值。 从最初上线的数千日活,过百万,过千万,一直到突破 2000 万,图搜应用一路跃升为淘宝首页导购类目的第一。但与此同时,外界的质疑声不断,「我印象特别深,每一年大家都在问,数据还能增长吗?……你还在做呀?做啥呢?」潘攀说道。 不被理解似乎成为开拓者的宿命,漆远回忆早期的探索时期,「当时对我最大的锻炼就是,不被理解是正常的」。 这或许可以称之为某种乐观主义,但毋庸置疑,对于技术的信仰正是面对困境和误解时不可或缺的坚实力量。 经历过焦灼而艰难的资源「抗争」后,漆远手中的分布式机器学习平台终于启动,为了尽早让平台上线,团队放弃年底休假,春节期间留守奋战,骨干密集开会头脑风暴。「当时切身地感受到了团队的战斗力,大家真的是非常相信,只要上线效果一定能好」,漆远回忆。 双十一期间,平台首次实现淘宝、天猫个性化推荐的大规模应用。那一年的阿里巴巴集团算法大奖上,漆远带领 80 人的团队包揽了 16 项奖中的 6 项。现在,漆远作为达摩院金融智能方向的负责人,带领团队构建面向金融经济场景的智能分析与决策技术。 另一边,在经历了搜索类目扩增、数据优化、算法迭代等多方面的升级后,「图搜」项目完成三次入口跃迁,终于在 2015 年双十一期间进入首页。让潘攀颇为自豪的是,图搜的数据一直依靠自然增长,几乎没有调用过手淘的商业推广资源。 入口升级的本质是一个不断「自证」的过程,由技术和技术背后的推动者们在一次又一次的挑战中完成,继而固化下来成为阿里技术产品的迭代传统。 不同于象牙塔里、试验台前的公示推理和仿真验证,商业场上的「自证」需要实实在在的业务指标和实际效果,正如阿里办公区里那句随处可见的标语——「NO DATA,NO BB」。 高速增长的背后是两年一次的系统大改,「阿里其实非常讲究创新,我们一般都不炒冷饭」,潘攀说道,他将图搜系统的发展分为三个时期,「每一次升级不仅是算法进步,而是整体思路的提升」。 「数据、系统、算法三个互为一体。对数据认知和处理方法的不同视角,催生了与之匹配的算法和工程系统,所以升级是整个系统层面的」。 项目早期,数据量少,还需要人工标注,所以研究为之匹配的小模型的系统和算法;随后训练数据解放,团队尝试通过用户行为的三类数据(查询数据、点击数据、未点击数据)分析出数据与排序间的逻辑关系,三元组的 Deep Ranking 框架生成,与之对应的训练框架、系统升级迭代;去年,图搜开始接入超大规模并行处理平台,释放数十亿级数据的训练能力。 与百度识图、微信扫一扫、京东拍照购等市面上的其他图搜应用不同,阿里更强调「通用化」能力,比如不仅能支持手淘所有的实体商品检索,还包括二维码、植物、垃圾等非商品的识别与分类。这些功能统统集成在图搜一个窗口里,不用再二次跳转,平均日活达到 2000 万以上。 在研究员的长大道路上,经历一次完整的技术工程化落地的意义重大,它不仅锤炼了实战能力,更为其提供了深入了解业务所想、业务所需的窗口。 「这段经历让我们明白了应该创造和推动什么样的技术,知道哪些技术更有可能落地成为产品,以及如何让一个产品能够有效地支撑业务」,金榕谈道。 可以说,从研发到业务的实战积累正是阿里打造AI 技术落地体系的基石。 如今,这套思想贯彻到阿里大大小小的技术思路中。比如,在语音技术团队今年推出的语音合成技术 KAN-TTS(Knowledge-Aware Neural TTS)中,团队就事先考虑到了不同环境下的模型部署环境,并进行框架设计和效率优化,综合各项需求的关键算法改进多达20余项,最终实现了无论是在云端还是终端,甚至是 CPU 存储有限情况下的最快速度部署。 一项技术能否在设计之初就考虑到项目部署阶段遇到的各种实际问题,正是技术落地体系成熟的重要标志。 3. 中国研究院没有Benchmark 「它是阿里巴巴国际化业务的技术生命线,如果没有这些能力,阿里巴巴很难称之为一家国际化公司」,这段底气十足的话出自司罗。 他是阿里达摩院语言技术实验室负责人,带领百余人的队伍进行自然语言理解、机器翻译、认知智能等底层技术的开发,这些技术被誉为人工智能皇冠上的明珠。 司罗,现达摩院语言技术实验室 负责人 司罗专注于机器学习、NLP 等领域的研究,2012 年成为普渡大学计算机系终身教授后,一举奠定了其在学术圈的地位。同金榕、漆远一批,司罗在 2014 年加入 iDST,是阿里建立人工智能技术体系的早期成员。 相较于视觉、语音更贴近前端用户的技术,语言则更偏向底层,以原子化能力的形式起作用,扮演着赋能和支撑的角色。正因为这个特点,它对于大型互联网技术公司而言往往不可或缺,但技术团队却又是极其分散的。 既然如此,为何不集中力量打通? 于是,语言技术恰好成为了技术平台化的最佳试验场。 2016 年 10 月,对于司罗和 NLP 团队而言是一个重要的时间节点。此前,他们忙于承接一个个「项目」,先后参与过「聚划算」、「AIios」「淘宝头条」等项目。 在这之后,司罗领到任务——将 NLP 的「大中台」建立起来,换句话说,阿里各业务线的 NLP 不再各自为营。 为了让其他业务线接入平台,司罗采取了「品牌效应」的打法。 是的,在公司内部,同样需要建立品牌,尤其在打造规模化平台的过程中。 「首先要有非常贴身的服务,然后让重点的头部用户用起来,逐步地让他们认识到 NLP 平台和解决方案的好处,再通过种子用户将我们的技术价值传播出去」,司罗知无不言地分享了品牌效应的打造「套路」。 而正是因为技术平台化的出现,让这只百余人的队伍能够支持阿里系 600余个业务方,每天调用量达到了两万亿次。 这是 NLP 技术影响力从量变到质变的飞跃。 沿用同样的思路,司罗带领的另一条技术分支——机器翻译技术也实现了规模化的业务支撑能力,为阿里全球化电商平台上的买卖双方提供 20 多种语言,48 种语言方向的机器翻译服务,覆盖欧洲、亚洲、美洲与中东地区的绝大多数国家。 阿里的图搜应用在技术平台化升级后,从最早的支持手淘平台到目前落地到淘系的六个主流 APP,一举成为全球最大的图搜应用系统。「这是淘系业务的市场份额决定的」,潘攀说道。 从单个功能应用,到十个、百个、数百个的业务方支持,每天被亿级用户使用,技术平台化的战略得到了有效验证与认可。尤其对于技术人员而言,通过平台化的过程,单点技术的影响力不断被泛化,技术的品牌效应不断地被放大。 但对于当下的阿里而言,平台化尚非终点,「上云」更是一片广阔的天地。 阿里内部的海量业务和长期实战的检验,为技术与方案移植到阿里云平台提供了硬核实力。司罗表示,NLP 平台和机器翻译平台已经先后在阿里云上的人工智能板块上线,供第三方的云计算客户使用。 从单纯的技术算法,到集成为业务和应用中的产品,再到平台化和大规模可复制化的云计算商品,这是一条阿里人自己走出来的 AI 落地路。 是时候将这条路子固化下来了! 2017 年 10 月 11 日,是阿里人工智能技术体系开宗明义的日子。 阿里巴巴 CTO 张建锋宣布成立达摩院 杭州云栖大会现场,阿里巴巴 CTO 张建锋宣布达摩院正式成立,计划未来 3 年里投入超过 1000 亿元,用于涵盖基础科学和颠覆式技术创新的研究。iDST 作为达摩院旗下最大的机器智能实验室分支,由金榕任带队。 时至今日,再谈大公司建立研究院已不是新鲜事,但适应于中国本土市场环境的成功模板依旧寥寥可数。 培养出中国最早一批 AI 研究员的微软亚洲研究院被冠以「黄埔军校」之名频频提起,投入巨大过于前沿的谷歌 X 实验室、DeepMind,IBM Waston 研究院形象「高大上」却不够接地气。 中国互联网公司已经开始重点布局,但难以与公司业务平起平坐,百度几大研究体系已被收编进技术平台,腾讯四大实验室依附于各大业务呈分散状。 至于阿里,在达摩院之前的三年探索和走过的弯路为其积累了不少宝贵经验,但如何乘胜追击更进一步成为领导者的新命题。 在金榕看来,达摩院的设立主要有两个目标:一是把达摩院的 AI 基础能力(原子能力)放到平台上支撑所有业务。比如阿里内部跟语音识别有关的业务都会使用达摩院的底层语音平台,但会根据具体业务做定制化的改变。 二是上云,通过内部核心业务验证后,用户的接受度和满意度达到一定指标,产品上云商业化,进一步放大价值,服务整个社会。 说到这,四年前王坚为金榕描绘 iDST 蓝图,三句不离「Benchmark」的画面在我眼前浮现。 「我记得从第一天起,王坚就一直跟我们说 iDST 的 Benchmark 的是什么?」金榕说道。(Benchmark,基准,常用于性能测试中的表达。) 王坚认为是斯坦福研究院(简称 SRI,1970 年脱离斯坦福大学后,更名为「斯坦福国际咨询研究院」)。「那里的基础研究和其他地方都不一样,不仅创造出了最好的理论知识,还能把技术变成产品,产品收益再反哺到学术」,金榕回忆道,那时常举的一个例子就是鼠标的发明。 不止于鼠标,从手术机器人到航天静电放电棒,从个人助理 Siri 再到癌症治疗,二战后的斯坦福研究所几乎成了硅谷高科技公司科技创新的「智慧之源」,不仅创造了新的行业、数十亿美元的市场价值,还有持久的社会价值。 「一旦看到收益,人们很容易就聚焦在收割单个业务的成果上,而缺少更深入挑战的动力」,金榕认为这也是达摩院——阿里 AI 技术中台设立的意义——跳出单个业务成果,让技术更深入,再往前跨一步,用更少的人力实现价值最大化。 经过两年的建设,达摩院人才济济,超过半数科学家具有名校博士学位,部分是美国、欧洲学成回国,办公室分布在四个国家、八个主要城市,其中机器智能团队拥有 20 多位知名大学教授,近 10 位 IEEE FELLOW。 而在达摩院之外,阿里还有一些更为分散化、业务化的人工智能能力,并非走中台化的路子,但仍是不可或缺的一环。比如天猫精灵、搜索和广告部的人工智能技术应用、蚂蚁金服的客服机器人等,它们与核心业务方贴合地更为紧密,以便技术更快地产生效益。 要为这样一支庞大而高规格的研究团队设置课题并不是件容易事。 此前,我在与某公司 AI 实验室负责人交流时,对方就曾透露过选题上的两难局面——一方面既要兼顾业务需求和 KPI 导向,另一方面还不能忘记前瞻性研究和技术布局。 整日埋头对接业务需求容易退化为业务部门的附属团队?但面对前沿课题的不确定性,究竟该冒多大的险,才能保证既有结果又具备开创性? 当我将同样的问题抛给阿里的人工智能科学家时,得到了相似的回答,「这看起来是个问题,但在阿里就不是个问题」。 延续技术到产品、产品再到商业化的研究和落地机制,技术研发与商业利益的问题将得以平衡,而且必须平衡。 「在阿里如果只是发发论文、做做研究则意味着工作只做到了一半,无法获得真正的认可,或者是比较低的认可」,潘攀说道。 与此同时,在技术平台化与产品规模化的过程中,还伴随着水到渠成的技术成果转化。 在被誉为人工智能世界杯的 CVPR 2019 WebVision 竞赛中图像分类竞赛中,阿里以 82.54% 的识别准确率获得冠军,而这背后的技术能力正是阿里「图搜」应用开出的果实。 谈到更为宏观的议题布局,金榕认为投资者思维或许是一个思路。 作为一名投资人,标的无非两种,一是比较切实可靠的项目,但是收益比较少;另一种则是高风险,但回报高,即所谓的「High Risk High Take Off」。几乎所有投资公司的投资组合都是这两种的混合。 作为研发部门,金榕会将技术资源进行分层。一部分投资在相对较容易见到结果的领域上,具备确定性;还有一部分投入在可长周期回报的项目。「在这样一个投资组合中,肯定有项目要失败,但能保证团队整体的长大和健康」,金榕谈道。 正好,他刚带队打完了一场「High Risk」的战役。 那是阿里正在研发的自主云上人工智能加速芯片 NPU,达摩院承担了部分算法工作,让 NPU 在阿里的技术架构上跑出最高性能。 为了能拿到 CTO 的「战投」,金榕预先设置了一个非常高的指标,即假设所有条件都处于非常理想的条件下,相比 GPU 的性能有了不小的提升。 硬着头皮上,一年多下来,终于收获了理想结果。在金榕看来,设定高目标虽然可能会引发焦虑和不适,但高目标的每一次落地都将为团队实力带来显著提升,「这对于打造荣誉感,提振团队士气非常奏效」。 在阿里内部有一句话,「最好的团建就是打一场胜仗」,融入阿里文化后的科学家们也开始明白这个道理了。 金榕身上所展现的冒险精神,一部分来自他的个人性格,一部分还受到阿里早期技术氛围的感染。早年间,王坚力排众议主导开发阿里云计算平台时,就常以一个「疯子」的形象活跃在公司内部。 「如果你当真要解决难题,就需要调动你所有的胆量和勇气去接受挑战」,金榕谈道。 在计算机研究领域,通常将非常棘手的问题称之为「NP-Hard」,大多数研究员一旦碰到这样的问题都会给出否定的结论。但金榕的团队所推崇的恰是「Solve The Ban Problem」。 「在商业社会,用户和商家才不会在乎这个,你不能因为 NP-hard 就止步」,金榕谈道,「这对我来讲是非常重要的原则,但凡这个研究是能够产生巨大价值,就应该全身心投入」。 不畏「禁忌」、冒险而大胆——这是我从他人口中未曾听说过的达摩院。 一脉相承的风格不可避免地将渗透进团队,一旦拔得头筹就将能让每个成员体会到以一当十的惊险,拥有胜者的姿态,继而发展成为阿里 AI 精神内核的一部分。 当上层建筑搭建完整,更为底层的技术正亟待突破,最为核心的指标在于算力。 早年间漆远接手的首个项目大规模分布式机器学习平台,随后由达摩院智能计算实验室负责人周靖人带队不断迭代和完善,已经进入到第三代版本 PAI 3.0。今年三月加盟阿里的 AI 知名青年科学家贾扬清还将为 PAI 注入更多力量。 贾扬清毕业于美国加州大学伯克利分校计算机科学博士,加入阿里前在 Facebook 担任工程总监,负责大规模人工智能平台的架构。他是 AI 深度学习框架 Caffe、Caffe2、Pytorch 的重要贡献者之一,并曾参与谷歌人工智能平台 TensorFlow 的工作,GoogleNet 作者的之一。 因为深度学习框架领域的诸多贡献,贾扬清在人工智能开发者群体中具有颇高人气,在今年 7 月的阿里云峰会上,贾扬清首次以阿里人身份亮相,不断有年轻人过来和他谈话与合影。 贾扬清,现阿里巴巴计算平台事业部 总裁 正值浙江一带的酷暑,采访室十分闷热。「我是绍兴人,没法抱怨这天气」,贾扬清笑着说道。清华硕士毕业后,贾扬清就长居海外,因为转战阿里而经常回国。绍兴距离杭州不到 80 公里,来到阿里,不仅是回国,更是回乡,贾扬清脸上有些止不住的喜悦。 和贾扬清前后脚来到阿里的还有黄非,在金榕和司罗两位老师的力荐下加入。黄非毕业于卡内基梅隆大学博士,曾任 ACL、NLPCC 等领域主席、IJCAI 资深程序委员,在 Facebook 时负责机器翻译和知识平台。加入阿里后负责组建和领导国际化机器翻译创新团队。 一如当年的漆远、金榕一样,这些年轻科学家们带着由衷的使命感和期待来到「金山」,期待着实现自我价值的同时,也为阿里经济体和中国互联网做出应有的贡献。 4. 阿里的底牌 当一件事物愈发完美或者强大,外界在其身上所寄托的期望值也将越来越高。 「最开始,公司只是希望技术能用在业务上得到一个好效果。今天,是真正希望我们能够用技术创造未来,一个新的由技术驱动的阿里巴巴」,金榕停了一会继续说道,「这个期望远高于技术难题,是一个非常大的命题」。 一个技术驱动的阿里巴巴?可能吗? 在绝大部分人的眼中,对于阿里的定义依旧是一家依靠电商业务驱动的互联网公司。在 2019 财年的财报里,阿里的核心业务包括电商业务、阿里云、大文娱和创新业务四大板块,其重要性依次排开。其中,电商业务创造了 3234 亿收入,总营收占比高达 86%。 「这正是外界看不太懂的地方,我们可不可能创造未来?」 在金榕眼里,这个未来似乎已经依稀可见,「我给你举个例子,至少我自己是非常受激励的,5G 技术就是突破口之一。随着 5G 和高清视频技术的发展,整个视频内容产业链都会带来全新的变化,是对每一个环节的重塑……」 AI 之后,5G 之前,前瞻性的技术布局和技术融合或将为阿里踩准下一个时代节点。 让我们把时间线拉近一些,现在或者近期的几年内,在阿里的主营业务之下,还有什么能称之为源动力或者底牌的东西? 欧文武,阿里巴巴资深算法专家 眼前这位入职阿里 12 年的算法专家或许知道答案。 他叫欧文武,娃娃脸上时常挂着微笑,憨态可掬。他被视为「最懂中国女人的男人」,因为他好像总能猜到你想买点什么,然后在恰当的时候送到你眼皮底下。 欧文武是阿里巴巴搜索事业部总监,资深算法专家,负责淘宝推荐算法团队,利用搜索和推荐技术让电商产品推荐流,也就是人们常说的「千人千面」。 谈到推荐业务,贾扬清曾在他的内部分享《关于人工智能的一点浅见》中这样描述:在阿里和很多互联网企业中有一个「沉默的大多数」的应用,就是推荐系统:它常常占据了超过 80% 甚至 90% 的机器学习算力,如何将深度学习和传统推荐系统进一步整合,如何寻找新的模型,如何对搜索和推荐的效果建模,这些可能没有像语音和图像那么为人所知,却是公司不可缺少的技能。 在阿里就有两支重要团队负责这个「沉默的大多数」的应用——搜索事业部与阿里妈妈。 虽然都做推荐系统,技术与平台相通,但和阿里妈妈强调变现的属性不同,搜索事业部的推荐业务更看重用户体验,强调探索和发现的乐趣以增加平台粘性,商业味道更淡薄。 而这看似的放手实则意味深长。 在 2018 年 Q3 财报会议前夕,阿里巴巴董事会临时做出了一个反常决定——短期内不对推荐推送等广告库存增量进行货币化。简言之就是停止对淘系平台上的个性化推荐的规模商业化。 随后的财报会议上,高盛银行、汇丰银行、花旗银行的分析师们对该决定穷追不舍地发问,商业化时间点、利润率、广告创收等被反复提及,可见其分量和位置。但高管们仍守口如瓶。 「千人千面」正是这块「暂时未被商业化」业务背后的核心技术力量,它被视为「阿里的底牌」,是阿里基于技术驱动业务的核心体现,有望成为驱动阿里未来营收增长的新引擎。 在电商业务的转型期,推荐流业务蕴藏着极大的价值潜力。随着平台上的商品越来越多,对所有用户采用同一套搜索算法,已经不能再满足用户的多样化需求。垂直电商领域新型竞争对手的出现也倒逼着阿里对推荐业务进行更深入的探索。 「它不仅仅展示了流量的增长,更体现出转化率的增长」,阿里巴巴集团 CFO 武卫说道,「推荐流为商家创造的价值,与淘宝在 10 年或 15 年所带来的流量和交易价值并不是一回事,这背后还有消费者参与的价值。该模式为商家提供了操盘工具,能够亲手来运营和管理他们的用户群体」。 极大的价值潜力,同时也意味着极大的业务挑战。 光是在工程层面要应付大规模数据就是一个难题。一般地,T 级(1 Tera Byte(TB)= 1024 GB)已经是相当大体量的数据存储单位,但在欧文武部门,每天面对的是上升了三个数量级以后的 P 级(1 Peta Byte(PB) = 1024 TB)数据。 「这么大量的数据,数据处理的方法,计算数据的准确性和一致性都是挑战」,他说道。 目前淘宝和天猫平台有 7 亿多用户,每个用户在平台上留下的行为特点、诉求方向都极其分散,即重叠的数据很少,体现在技术层面就是数据的稀疏性,这对算法模型的体量和复杂程度提出了更高要求。 阿里内部有个说法,推荐部门的算法是阿里最难进的算法岗位。在招人方面,欧文武表示,他更倾向于应届生,团队目前 50 人左右,博士生 40%,清华北大毕业的将近一半。 团队维持在每年两到三次大规模升级的节奏,「大升级就是以前那套全推翻,重建一套」,欧文武说道,小规模的升级,比如加些新特征,改改模型等,则频率高很多。 阿里每个财年都会依据各部门制定相关 KPI,欧文武并没有透露具体的 KPI。但他会在公司的KPI基础上给团队开个小灶,制定一套「内部 KPI」——比公司的要高出不少。 他通常会逐一拆分成许多个小目标,有人做用户数据,有人做匹配,有人做个性化排序……大概 20 多个小目标同时推进。 欧文武将其比喻成造车,车体需要拆分成很多零部件,大问题也要拆分成子问题,这样每个子问题就能更准确地评价,依据每个小问题再设定成不同的目标,然后拼凑在一起以求大目标可控。 目标要可控,但算法讲究灵活。 和一般算法追求极致的精准性不同,推荐的算法还需要投其所好,新颖性和多样性都是欧文武团队要考虑的维度。 以前,传统推荐算法主要是通过历史日志训练模型,缺少对用户未知需求的探索,十分有限;技术迭代后,现在多采用演化算法、强化学习算法、非传统的 AI 算法等多种算法融合,以求解决一个多目标平衡的问题。 当算法推荐不再局限于财务指标,欧文武希望建立一个与用户共同长大的 Life-Long 式模式。在欧文武看来,当下的推荐,停留在用户单次访问时长和浏览深度的指标优化;而更长远来看,用户能否留存才是关键。 「满意度不止在短期,而是长期的满足和收获。比如在购买之后,商品的安装、使用、保养……全链路的购物体验都可以做」,欧文武说道。 参照线下的传统购买场景,推荐的角色将不再局限于一名「导购员」,因为用户触达商品的每一个阶段都在发生改变,推荐的内涵也正在从商品推荐扩宽消费推荐,这也正是「李佳琦卖口红」效应兴起的逻辑。 据阿里员工透露,推荐算法目前在关键指标数据上有超过搜索的趋势,未来潜力可观。正如腾讯在微信广场实验广告位的价值,在推荐机制下,广告除了带来交易的价值,还有品牌展示和市场推广等更多元的价值。 「我们在这个方面依旧很克制,希望保持可持续性的增长」,欧文武说道,「不能用今天透支未来」。 在电商业务之后,云计算业务已经上升到集团的主要营收的第二位,阿里云智能总裁张建锋在今年提出了「ALL in Cloud」的战略。依托于云计算平台,阿里搭建了 AI 技术向 B 端产业赋能的各级大脑模块,比如已经长大为国家级人工智能开放创新平台的城市大脑。 城市大脑是阿里第一个「原生于云场景」的重点业务,它完全构建在云上,打破了摄像头与红绿灯的割裂,让摄像头看到的数据,告诉红绿灯应该如何优化,从而实现大规模实时交通事故检测。 3 年多以来,阿里的城市大脑走出杭州,在北京(西城、通州)、上海、苏州、澳门、吉隆坡等境内外十几个城市落地。据城市大脑的技术负责人——达摩院高级研究员华先胜透露,平均一个星期的时间,城市大脑就可完成一个城市的技术部署。 华先胜,达摩院城市大脑实验室 负责人 而在计算层,「新一代计算引擎」已经成为支撑起阿里千亿成交额、每秒数万笔交易的核心底层技术,MaxCompute(离线计算)、Flink(实时计算)、PAI(人工智能)被视为这项技术背后的「三驾马车」。 贾扬清领导的阿里云智能计算平台事业部,主要负责大数据计算和人工智能平台。对于将大数据和人工智能两大平台打通这件事,贾扬清深有感触,「这样的融合很具有前瞻性,阿里是全球少数的几个把大数据和人工智能放在一起的部门。未来大数据和人工智能未来的结合将越来越紧密。」 在谈到与达摩院的合作时,他将其比喻成「我们都是『躺平了』来支持」。 所谓计算平台,要义之一,则是解决算力瓶颈。 这也是阿里的新一代神经网络芯片 NPU 的设计初衷,在贾扬清看来,通过更底层的技术探索更大的计算潜力,切口在于「解耦」。 虽然谷歌用 TPU & TensorFlow 证明了硬件与框架融合模式的算力无穷,但别忘了还有英伟达——没有框架,依旧成为了王者——背后的心法就在于「解耦」——解开硬件与框架绑定的枷锁。 「解耦」的关键在于定义模型并让其标准化,这需要下溯到编译器层面。 「编译器的优化不仅能够挖掘出现有硬件平台的更强算力,还将在新硬件平台上基于机器学习自动迭代,大大缩短人力优化软件的时间」,而这也正是贾扬清加入阿里后的目标所指。 当更深、更强、更底层的算力挖掘成为全球人工智能市场的主旋律,阿里 AI 迎来了「算法+芯片」的AI2.0时代:先后投资寒武纪、耐能等 AI 芯片团队,收购中天微、先声互联等芯片标的,成立「平头哥」芯片公司。 目前,阿里已经发布基于 RSIC-V 架构的智能 IoT 芯片玄铁,AI 语音 FPGA 芯片 Ouroboros设计,基于云端的神经网络芯片「Ali-NPU」也已经在路上。它们标志着阿里 AI 技术「从软到硬」的深化,也预示着 AI 将更为长久地驱动着阿里经济体长大。 「因为业务需要发展,原来很多技术精力都聚焦在业务上,直到有一天,我们会非常迫切地希望,从技术出发,用科技来驱动业务,然后培育出一些全新的业务」,蒋国飞聊起蚂蚁金服的技术发展路线时说道。 他是达摩院金融科技研究领域负责人,同时也是蚂蚁金服副总裁。对照阿里巴巴,他认为,「阿里体量更大,所以已经走到了前头」。 当技术晋升为一家互联网公司的必需品时,打造行之有效的研发体系则是不可回避的议题。 研究院或者实验室等机构的设定本取自于学院体系,外壳借用倒是无妨,但如果连内核和运营模式也一同照搬到商业场,很大的概率就是水土不服止于襁褓。 在外壳之下,研究的机制、团队的建设、不同对话体系的打通、技术与业务的平衡,前瞻性与KPI的融合…才是商业公司研发体系的灵魂,一切尚需从长计议。 从2014年设立阿里最神秘部门iDST到如今人才济济的达摩院,阿里人工智能走过了既艰难又幸运的五年,梳理出这套技术体系的机制和脉络得以看清阿里人工智能的底色,推而广之,或将成为互联网公司打造人工智能技术体系的方法。 原文章作者:机器之心Pro,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于4 天前
    最后回复 姘违 4 天前
    1014 2
  • 一文读懂阿里曾鸣推的商业智能(BI)
    下载报告请【点击头像】私信,回复关键词【下载】,获取下载方法~公众号《侠说》近800份新技术、新金融及新电商报告下载,坚持不易! 阿里曾鸣很早就推商业智能这个概念和战略,本《商业智能(BI)白皮书》旨在明晰商业智能的概念价值、功能技术、工具等内容,并基于我国的市场环境、企业需求,对商业智能工具的概念进行重新梳理,同时在此基础上引入生态学思维,构建商业智能生态系统模型,以期统一商业智能的大众认知,规范国内的市场行为,指导我国企业的商业智能建设与数字化转型。 当前的时代是信息爆炸的时代,数据已经成为新的生产要素,其价值愈发凸显。作为数据的生产者和消费者,企业需要思考的是如何利用生产运营过程中产生的数据反哺生产运营。数据驱动决策的需求正在不断地推动企业寻找信息化建设与数字化转型的新方式,而商业智能便提供了一个绝佳的思路。 商业智能问世已有二十余年,受到广大企业的青睐与追捧,硕果累累。虽然不少企业没有特别强调商业智能这一概念, 但是商业智能的广泛应用已成既定事实。商业智能市场规模增长迅速,国内市场增速更是大于全球市场。Gartner在《Market Share: Analytics and Business Intelligence, Worldwide, 2018》报告中出,分析和商业智能软件市场在2018年增长了11.7%, 达到216亿美元。现代BI平台继续以23.3%的速度增长,增速最快,其次是数据科学平台,增长19.0%。 《2019年中国大数据BI行业预测报告》显示,国内BI市场在2018年增速达到25.8%,高于全球市场增速。企业数字化转型进程已经迈入商业智能阶段。尽管商业智能已被企业广泛应用,概念上的普及却“相形见绌”,国内民众对商业智能的认知仍是千人千面。 一方面, 商业智能起源于国外,信息化基础的差异让商业智能的引入过程发生了“变异”。另一方面,我国缺乏类似Gartner的研究机构来持续教育与引导国内市场。市场需要教育和孵化,相较欧美,我国还任重道远。因此,帆软数据应用研究院结合文献材料、企业调研以及我国的市场环境,形成本白皮书。 下载报告请【点击头像】私信,回复关键词【下载】,获取下载方法~公众号《侠说》近800份新技术、新金融及新电商报告下载,坚持不易! 原文章作者:侠说,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于4 天前
    最后回复 东门琦巧 4 天前
    2943 6
  • 国内智能音箱市场现状:阿里小米百度三分天下,谁是最后的王者?
    在5G技术发展、AIoT的风口之下,世界科技巨头都已按捺不住内心的激动,准备加入到这一场创新之战中去。智能音箱作为IoT时代的一个重要潜在入口,引发了科技巨头的关注,在过去的几年时间里亚马逊、谷歌、苹果、华为、阿里、小米、腾讯、百度等公司争先恐后的入局智能音箱市场,智能音箱市场也因此呈现出一幅高烧不退的景象。 由于厂商的大力推动,消费级市场对于智能音箱的认可度也是十分高,根据相关数据统计,目前中国大约有5000多万家庭拥有智能音箱,现有用户对这些设备持非常积极的态度,近90%的用户表示它们比预期要有用得多,甚至还有59%的中国用户表示他们将无法想象没有智能音箱的生活。不可否认,智能音箱已经成为了部分家庭的标配,伴随着智能音箱的发展,其也将会被更多用户所青睐。 在这些庞大的数字背后,是智能音箱在智能家居控制中心的关键作用,也正是因为这个核心作用,互联网巨头纷纷入局智能音箱市场。在经历过前期的市场占领大战之后,国内智能音箱市场中,阿里、小米和百度三家的销售份额占比达90%,而到2019年底,中国智能音箱的零售市场销量预计将达5990万台,这一数字还只是智能音箱发展的初期成果。 在经历了一段短暂的推广时间之后,国内智能音箱市场的格局也已经开始显现。可以说,国内的智能音箱市场由阿里、百度和小米三家领跑,虽然阿里、百度和小米推出的同为智能音箱产品,但是三家在对待智能音箱未来的发展定位,以及宣传策略却有着极大的不同。 在发展方向上,阿里主打的天猫精灵致力于通过技术+内容为消费者带来更好的服务体验;百度的小度音箱则希望在未来可以赋予万物对话的能力;小米的小爱音箱则希望借助手机+AIoT的双引擎战略,聚焦IoT领域并提供入口服务。 由于阿里、百度和小米三家产品的定位有着明显的区别,这也导致三大品牌的营销策略也是各有不同。阿里的天猫精灵,目前市场销量最高,这也得益于阿里的强大影响力;百度的小度智能音箱,营销力度最大,消费者关注度也比较高;而小米小爱音箱,则主打单一品牌IoT类目齐全,借助小米手机的优势迅速推广。 虽然各家方向和营销策略都各有不同,但产品的实力强弱还是要拿市场的数据表现来证明。根据相关的统计数据来看:阿里的天猫精灵领先其他两家占据4成销售份额,而小米的小爱音箱和百度的小度音箱则各自占据25%的市场份额,值得一提的是,在2019年的618当天,天猫精灵的销量高达253万台。 同时,根据StrategyAnalytics最新发布的《2019年智能音箱用户调查-中国结果》显示,国内市场非智能音箱用户中有63%计划在一年内购买智能音箱,另有22%的人表示,他们晚些会购买智能音箱,这表明至少会有额外的85%非智能音箱用户会购买智能音箱。在未来几年中,智能音箱将在绝大多数中国家庭中普及。 可以说,国内智能音箱市场已经完美启动,并且智能音箱的市场普及率迅猛增长,由此我们也可以推测,智能音箱将在国内市场迎来爆炸式的增长。而在智能音箱的增长之下,智能音箱市场也将来更加细分的针对性产品。 首先,是针对人群的划分。由于儿童、老人、女人等细分人群拥有者不同的需要,未来将会出现不同的细分智能音箱。比如,目前已经出现的针对儿童设计的儿童模式,内置课文朗读,儿童绘本等;针对老年人,天猫精灵CC推出了陪伴功能;甚至未来还会有针对追星族的定制化智能音箱产品。 天猫精灵CC 其次,是针对使用场景的优化。通过场景驱动用户的购买行为,例如:通过明星、节目、节日,对应不同的场景下,通过营销进行产品销售。同时,还可以在场景下赋能其他物联网产品。而带屏智能音箱则可以承载更多的内容与信息,可以进行视频电话、看视频和图片、拍照和相册查看、查看地图、视频教辅学习等功能。 最后,是技术创新的提升。在产品方面,智能音箱几大巨头均在语音交互、语音合成和语义理解方面加大投入,如阿里巴巴可以提供端到端的语音合成解决方案,提供更加流畅的语音输出;百度在语音交互方面,正在输出连续对话的极客模式;另外针对消费者抱怨不支持方言方面,阿里巴巴投入1亿成立方言保护专项小组保护方言。 综合来看,智能音箱作为家庭交互的入口可以更多的实现和人的交互与互动,进而收集更多的用户行为数据,通过数字化实现算法的优化,反哺于人,给用户提供更好的体验。这也让智能音箱成为了几大巨头的争夺中心,而三大巨头则是各具优势和特色。但无论各家的方向有何不同,从长期来看,一个虚化的带有科技感的有趣的语音生活助手才是未来智能音箱的终极目标。 原文章作者:智哪儿,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于5 天前
    最后回复 允裘 5 天前
    1062 0
  • 阿里发布安全技术能力清单:人工智能覆盖所有治理场景
    文章来源:阿里安全官网 顾客点击下单,商家确认发货,快递物流配送……在一个普通的淘宝订单背后,有1258个算法模型保障买卖双方的交易安全。12月31日,阿里巴巴发布安全技术能力清单,阿里巴巴集团安全技术总经理钱磊表示,2019年安全AI技术已经覆盖营商环境优化、知识产权保护等平台治理场景。通过人工智能实现“商家安心卖、消费者放心买”的同时,阿里安全坚持“用技术解决社会问题”的理念,把人工智能的前沿技术能力充分应用到反诈和野生动物保护等社会公益领域。 安全AI覆盖上百商业场景 全年商家向平台反馈的恶意行为投诉量减少70%、商家主动整改让无意违规量下降65%。近日,阿里巴巴首次公布年度营商环境治理情况。网络营商环境全面优化、各项治理指数大幅下降的背后,是一个拥有上千算法模型、覆盖数百个商业场景的安全AI防护体系。 2019年8月,基于安全AI技术和社会共治理念的国内首个营商环境保护产品“营商保”上线,阿里安全试图通过这个产品,集成生态系统内所有和营商安全相关的功能,用人工智能技术让商家在经营中少犯错,把更多精力用在店铺经营上。 图说:安全AI技术体系已覆盖阿里巴巴数字经济治理体系的所有场景 截至2019年底,共有260万商家主动加入“营商保”。他们在接受智能安全服务的同时,也把自身遇到的问题反哺平台,提升人工智能的服务能力。 阿里巴巴集团安全技术总经理钱磊表示,AI能力已经覆盖阿里巴巴的数字经济治理体系的所有场景,3000多名安全专家和不断自我进化升级的1258个算法模型,让千万商家和数以亿计的消费者得到7×24小时的全方位安全保障。 最好的文图视频检测技术 2019年11月,阿里安全在文本、图片、视频的检测技术分别获得了三项国际顶会的最好成绩。这是阿里巴巴利用人工智能打假的核心技术。 “消费者买东西最不放心的是资金安全,最担忧的是假货。”钱磊说,打假是个漫长且艰巨的工程,海量的商品种类需要借助AI实现高效率、高准确率的假货鉴别,“从过去的‘敌动我跟’单点对抗策略,到如今的主动寻找假货特征,综合多方面信息摸底打击,阿里在打假这一领域进化出了知产保护科技大脑。” 阿里安全图灵实验室负责人薛晖介绍说,“知产保护科技大脑”可以对图片、视频、制假售假链条上相关信息进行综合比对、处理,目前96%的疑似侵权链接在上线的一刹那就可以被秒杀。 2019年天猫双11期间,一个主播用暗语介绍、售卖假包,其在淘宝直播画面中未能“存活”超过20秒。被平台发现疑似售卖假货,这名主播的淘宝店和所售商品在直播中被当场处理。 打假并不止于知识产权保护。黑灰产的3D假脸、“伪装”出来的验证码、更换了各种“马甲”的关键词和图片,同样在具备攻防属性的安全AI的识别下无所遁形。 此外,安全AI还能通过NLP算法、深度学习、图算法等识别“炒作好评”和“恶意评价”。 技术助力社会公益新探索 中国信息安全研究院副院长左晓栋此前接受媒体采访时表示,将AI技术运用于知识产权保护等各个领域的趋势已经显现。“除了电商平台积极运用AI技术进行打假外,一些科技公司和企业也将AI运用于打击电信网络诈骗等方面,提升工作效率。” 12月16日,公安部刑侦局联合阿里巴巴推出的“钱盾反诈机器人”正式宣布上线。通过来电显示“公安反诈专号”这一文字,向潜在的电信网络诈骗受害人拨打电话,发送短信、闪信提醒信息,强制阻断诈骗电话,并通过人工智能语音交互的方式第一时间与受害人进行沟通。 钱盾反诈机器人的推出,解决了反诈劝阻电话辨识度低,劝阻人力不足的两大难题。“公安反诈专号”自11月15日在部分地区试运行以来,平均每天劝阻3000多人,劝阻成功率超96%。 “这一产品融合了阿里安全、小蜜、阿里通信等多项技术,尤其人工智能语音交互技术的应用,在劝阻中起到重要作用,已有超过12万人免于被骗。”阿里安全钱盾反诈实验室高级专家反恶说。 “用技术解决社会问题是一个宏大课题,需要社会各方携起手来一起参与。”阿里巴巴集团首席风险官郑俊芳表示,阿里的安全AI技术已经应用于野生动植物保护、寻找失踪儿童等社会公益项目。目前,“团圆”系统三年时间里协助找回3900多个失踪儿童,超3万野生动植物物种在阿里巴巴平台全面禁售。 “在探索优化数字经济治理体系方面,人工智能技术将会起到关键作用,为社会共治提供基础设施。”郑俊芳说。 文章来源:阿里安全官网 原文章作者:用户76615460596,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于6 天前
    最后回复 耿吉星 6 天前
    1371 0
  • 阿里发布智能防骚扰电话技术,这只“二哈”以后专门帮你接骚扰电话
    天下网商记者 王金成 聂再清不是传说中的公关,但是今年315晚上,他还是和十几个同事整整加了一夜的班。 315晚会曝光了机器人拨打骚扰电话,这让他们很气愤,人工智能竟然被这么滥用? 于是,聂再清和阿里巴巴人工智能实验室的同事们决定以夷制夷:着手把人工语音智能运用到天猫精灵中,让天猫精灵帮消费者来“接”骚扰电话。 “喂,你好,贷款考虑一下吗?” “你不会是骗子吧?” “……” 打骚扰电话的人,根本不知道自己“骚扰”的是机器人。 3月16日下午2点,这项智能防骚扰电话技术上线,只要在支付宝里搜索“天猫精灵”就能体验。 对付骚扰电话的秘密武器 经常接到骚扰电话的人,有时候也会佩服这些销售人员,一次次被拒绝被骂了之后,依旧能够心平气和地拨打下一通骚扰电话。 万万没想到,不是他们脾气好,因为他们只是个机器人。 今年的315晚会上,央视曝光了“机器人拨打骚扰电话”的黑色产业链。原来,很多售楼、贷款的骚扰电话,都是由人工智能机器人完成的。 通过语音合成,人工智能机器人可以模仿人类的声音,一天能打1000个电话。有一家被曝光的公司,一年里竟然拨出了40多亿个骚扰电话。 知道真相后,人们真是哭笑不得。 看到这里,阿里的一位员工想起阿里人工智能机器人(内部代号为“二哈”)接推销贷款电话的音频。 长达一分多钟的对话中, “二哈”像人类一样与女推销员交流,向她咨询“北京能不能贷款”“最多能贷多少钱”这样的问题,甚至还“调戏”女推销员:“你之前给我打过电话吧,听起来挺耳熟的” 整个对话过程中,女推销员丝毫没有发现自己在给机器人推销。 (以下是“二哈”与女推销员的对话,白色字体部分为“二哈”) 这位阿里员工把自己想起的这一段发到工作群里,立马得到阿里巴巴人工智能实验室同事们的响应。于是在实验室北京研发中心负责人聂再清的带领下,十多位工程师连夜加班,准备提前发布这项智能防骚扰电话技术。 “二哈”在天猫精灵首秀 经过一夜的工作,到16日下午两点,“二哈”上线。 在支付宝中搜索“天猫精灵”,就可以和“二哈”来一场真正的人机对话。如果想使用这项防骚扰电话技术,可以在天猫精灵app中开通。 点击“我先调戏下”就可以与“二哈”对话 记者试着与“二哈”进行了一次交流,向它推销贷款。电话里,能听到“二哈”周围声音嘈杂,像在街上。交流过程中,“二哈”不仅会询问贷款利息、怎么办理,还懂得如何推诿:“现在这个电话可以联系到你吧?我如果需要了再和你联系。” 想象一下,如果有一天所有骚扰电话都交给“二哈”处理,我们的世界不知道会清静多少。 聂再清介绍,“二哈”应用了他之前提出的“智能聊天”的概念,机器需要理解用户请求,用强大的知识图谱生成知识点,在对话中将知识点“输出”给用户,同时用基于深度强化学习的对话策略引导对方的问题,才能将聊天进行下去。 他说,“大家可能看视频觉得这是一个特别逗的产品,但这里面其实应用了非常多的前沿技术。我们现在已经申请了几十项人工智能领域的技术专利。” 在天猫精灵app里可以开通电话防骚扰功能 当然,这项技术如果只用在防骚扰电话上,似乎也有点大材小用。 聂再清表示,“二哈”未来的应用场景非常广阔,“在解决了一些技术和安全问题后,打电话、语音信息、留言系统……这些场景都有很大的需求。你可以把它看作是你的‘声替’,可以用任何喜欢的声音替你接打电话。我想过一种可能,是不是还可以帮助聋哑人打电话?这不是异想天开,技术的进步可以延伸人的能力,也可以弥补人的缺陷。” 目前,在手机上体验到的只是一个“早鸟”版的“二哈”,功能还不完善。不过,这项技术目前已经基本成熟,预计今年就可以正式搭载一款全新的产品。 “缺德”机器人,终究会有正义的机器人来对付! 原文章作者:天下网商,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于6 天前
    最后回复 缑希月 6 天前
    3327 1
  • 不必羡慕京东、阿里智能仓储,用此方法0基础做专业仓储管理系统
    京东的“X仓储大脑” 京东的仓储管理绝对算得上是行业内顶尖的水平,比起三通一达的专业仓储物流管理,也是不遑多让。 京东的“X仓储大脑”,可以做出类似于人脑的智能决策,能够快速的依据实际情况做出反应,有强大的订单处理和自动化设备运维能力。 像京东、阿里这样强大的仓储管理系统,背后是及其强大的信息化团队作为保障和支撑,所投入的资金和人力成本都是巨额的,很多有仓储需求的企业和个体户也只能望洋兴叹,退而求其次,选择很普通的仓储管理软件。 这个方式,低成本,却绝对不输京东 现在,小编就告诉你,完全不用羡慕,京东的智能仓储管理虽好,但是用下面这个方法做出的软件,在实用性上完全不输! 对大部分企业来说,这种方法绝对是性价比最高的。像中国铁建、中国电信、南方物流、恒逸石化、航天科工委等国内的大型集团企业也都在用,中小企业和个体户用的就更多了! 小编说的方法,就是用无代码开发的方式来搭建WMS智能仓储管理软件。 无代码开发,在管理软件的开发领域里属于最先进的开发方式。 用其开发管理软件,具有天然的优势,逐渐成为了管理软件的主流开发方式,它的效率是传统代码开发的5到10倍,且能节约大量的信息化成本。 同时无代码开发的开发门槛很低,没有计算机基础的人也能自己学会用来开发,是名副其实的全员开发,很多企业都是利用云表自主开发专业级别的软件的。 在国产无代码开发平台里面,最具有代表性,应用最广的是云表企业应用PaaS开发平台。以下将用云表开发的WMS仓储案例来教大家怎么0基础开发软件。 开发案例 企业简介: 青岛佳固五金商贸是一家专业化、规模化的橱柜衣柜专用五金产品商贸企业,批零兼营。年销售规模过亿,平均日订单量200余票,多个仓库异地分布、产品SKU种类多达3000余个。 信息化动因: (1)出错多:电话接单,造成漏单,错单,多发少发现象很多。 (2)货不准:无法准确及时统计库存,即便盘点也无济于事。 (3)效率低:因人工无法准确记住货物存放位置,导致发货时不能及时找到货,甚至找不到货,发货效率很低。 (4)管理难:仓库管理分工不明确或者执行不到位,不能实时记录发货过程,即使出错,也无从追溯 (5)仓库利用率低:高层货架放货害怕忘记找不到,导致高层货架都没有放货,仓库空间利用率只有40% (6)找货难:仓库没有合理库位通道布局,货位记不住,导致工人拣货时要走很多冤枉路,浪费了大量的人力和时间。 (7)对人要求高:库内作业对人要求及高,工人如果对货物和库位内部情况不熟悉,很难上手。 云表提出的解决方案: (1)全方位介入企业管理咨询,制定完善的仓库管理方案 (2)建立上下游一体化的供应链信息平台,打通内部部门间和上下游客户数据协同共享 (3)建设现代化智能型仓库管理系统(WMS),实现由传统的库存管理模式向现代化仓库管理的转化 (4)制定完善的配套管理制度,实现管理制度化,为全面推进信息化管理提供保障 系统介绍: 依托云表企业应用平台(简称云表)建立的供应链+WMS系统,实现了对前端的销售业务及后端的仓库管理过程的实时管控,建立订单生命周期管理,从客户下单、系统接单通知仓库发货、以及库内作业包括仓库上架、拣货、移库、打包、出库复核完整周期的跟踪,实现了销售业务部门和仓库之间的信息实时共享,实现仓库数据实时可查、仓库管理精准有效;工作效率和整体服务质量显著提升。 (篇幅受限,更详细的介绍可以在云表官网查看哦) 应用价值 (1)企业向现化管理迈出了坚实的一步,尤其是仓库管理真正实现了智能化管理改造。 (2)建设了整套业务支撑系统,实现了用系统驱动人,从而减轻了企业对员工的依赖度,降低了运营风险。 (3)实现了对人力、仓库、资金等企业资源的有效整合和合理利用,提高了效率,降低了成本 (5)建全了制度,规范了企业员工的工作行为,有效规避了企业管理中存在的漏洞,减少了不必要的损失。 手机APP版 最后是免费获取方式,速来! 1、直接点击文章下方的“了解更多”,进入链接就可以免费获取了,里面有安装引导还有教学视频 2、在今日头条手机APP上点开我的头像,私信我回复“XX”或者“小云”,我都会发给你 3、转发+评论与我互动,我还会送你免费的进销存 推荐阅读:用一个纯绿色的浏览器,就能做出价值百万的软件,而且还无需编程 原文章作者:乐图软件,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-18
    最后回复 注淆 2020-1-18 11:12
    3591 3
  • 「报告分享」阿里达摩院2020十大科技趋势(附下载链接)
    今天给大家分享的报告阿里达摩院于2020年1月发布的报告《阿里达摩院2020十大科技趋势》。2020是如此科幻的年份,步入2020年,彷佛回到久违的未来。科技浪潮新十年开启,蓄势已久的智能革命将迎来颠覆性的技术变局。达摩院发布的220十大科技趋势,希望与你共同见证那些期待已久或从未料想的变化,并且循着技术演进的曲线,找到我们的来处和去向。 文末附报告全文下载链接。 更多细节请关注公众号“智能推荐系统”,并回复“103”,下载报告全文查看。 原文章作者:智能推荐系统,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-17
    最后回复 茸舔 2020-1-17 16:56
    2299 0
  • 全球智能燃气表龙头!19年订单增长三倍,与华为、阿里深度合作
    摘要: 1、被动元器件:市场规模超200亿美元,预计到2020年将达到286亿美元,其中电容器占据一半的市场份额;MLCC在电容中性能更优越,下游汽车和手机需求量翻倍,叠加库存去化开启新周期,同时2020年薄膜电容和电感需求也有望上升;建议关注MLCC电容三环集团、风华高科,薄膜电容龙头法拉电子,电感龙头顺络电子。 2、恒为科技:国内网络可视化领军企业,受益于5G通信数据流量的提升,400G可视化产品准备就绪,中标移动大单,奠定业绩拐点;嵌入式计算业务迎国产化机遇,与飞腾、龙芯等国内知名芯片厂商建立合作;未来3年净利润有望保持30%的复合增速,机构给予目标价33.6元。 3、金卡智能:全球市占率第二的智能燃气表龙头,根据年报业绩预告,四季度业绩环比改善;公司业务覆盖全球近30个国家,2019年公司NB-IoT产品订单量同比增长三倍,并与华为、阿里等企业建立战略合作,构筑NB-IoT生态圈;机构认为其股价被低估,业绩和估值具备修复空间,给予目标价20.70-24.15元。 正文: 1、电子元件必备材料!广泛应用于新能源汽车、5G,2020年即将开启新周期(中泰证券) ①被动元器件市场规模超200亿美元,电容占据一半市场份额 电容、电阻、电感等被动元器件是电路中的必备元件,2017 年,全球被动元器件市场规模在238亿美元左右,其中电容、电感、电阻分别占66%、14%、9%左右,预计到2020年将达到286亿美元。 国内被动元器件行业处于产业转移初期,进口替代空间大。 ②MLCC下游汽车和手机需求量翻倍,库存去化开启新周期 MLCC广泛应用于消费电子、汽车电子、IT设备、无线通讯等领域,性能比其他电容器更优,市场规模146亿美元,未来MLCC 等电子元器件的需求有望进一步增加。 智能手机不断创新升级,单机MLCC使用量逐年增多,iPhone4S MLCC约500颗,iphoneX MLCC上升至1100 颗,使用量翻了一倍多。 汽车电子化提升车用MLCC需求,单车MLCC需求预计从过去的1000-3000增长到3000-6000颗/车,电动汽车的MLCC使用 量是燃油汽车的5倍。 19Q3以来,国巨、华新科、村田、三星电机等元器件厂商库存基本消化,MLCC价格趋于稳定,需求增加叠加库存去化有望开启MLCC新周期。 ③新能源汽车提升薄膜电容需求 薄膜电容器主要应用于新能源汽车、光伏风电、家电、照明等领域,2020年,海外新能源车提速、传统需求回暖,有望推动薄膜电容器实现稳定增长。 电感方面,5G驱动电感需求量价齐升、国产替代提速背景下,国内电感龙头进入发展快车道。 ④产业链上市公司:MLCC电容关注三环集团、风华高科,薄膜电容关注法拉电子,以及电感龙头顺络电子。 2、网络可视化龙头!嵌入式业务迎国产化机遇,未来3年将维持30%复合增速(西南证券) 恒为科技专注于网络可视化产品与嵌入式融合计算领域,已长大为行业领军者,网络可视化业务在未来3年有望保持30%以上复合增速,嵌入式计算保持 40%以上复合增速。 ①受益5G建设,网络可视化业务需求有望激增 未来随着4K/8K、VR等5G应用的兴起,通信网络数据流量每5年将增长10倍,与之带来的是骨干网流量的激增,这就对网络可视化设备提出了更高的要求,公司作为网络可视化的龙头,拥有完善的产品阵列,将充分受益于行业景气度的提高。 国内的带宽逐渐从100G向400G过度,目前中新赛克、恒为科技等主流厂商的400G可视化产品就绪。公司网络可视化业务中标移动6750万元大单,奠定业绩拐点。 ②与国内知名芯片厂商合作,嵌入式业务迎国产化机遇 公司与飞腾、龙芯以及盛科网络等国内知名的芯片厂商均保持着良好的合作关系,搭载国内的 Linux、银河麒麟、中标麒麟等国产操作系统,为客户提供优质的嵌入式国产化设备,主要包括系统与平台产品、板卡与模块等。 国内的嵌入式计算业务主要被诸如凌华科技、锐德世、德国控创等海外巨头把持且空间巨大,公司作为国内优秀的嵌入式计算厂商,有望抓住国产化机遇,扩大市场份额。 ③投资策略:未来3年净利润保持30%的复合增速,机构给予目标价33.6元 3、被低估AIoT标的!核心产品订单增长三倍,与华为、阿里建立战略合作(华泰证券) ①订单逐步企稳,四季度业绩环比改善 金卡智能2019年业绩预告,预计实现归母净利润3.98-4.48亿元,较2018 年4.98亿的净利润下降 10%-20%,复合预期,四季度业绩环比改善。 ②全球智能燃气表龙头,2019年NB-IoT产品订单同比增长三倍 NB-IoT(基于蜂窝的窄带物联网)作为5G的先行者在智慧公用事业领域的应用景气度持续提升。金卡智能是智能燃气表领先企业,2017年全球市场份额排名第二,2019年公司NB-IoT 产品订单量同比增长三倍。 ③发力海外市场,与华为、阿里建立战略合作 公司业务覆盖全球近30个国家,海外订单大幅增长,NB-IoT物联网智能终端已批量出口海外市场。 同时与华为、阿里巴巴以及各大燃气公司建立了长期战略合作伙伴关系,例如华为的NB-IoT生态圈。 ④投资策略:机构认为其股价被低估,给予目标价20.70-24.15元 免责声明:本文仅供参考,不构成具体投资建议,投资有风险,入市须谨慎! 原文章作者:可来股票,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-17
    最后回复 我厢 2020-1-17 16:19
    2481 1
  • 体验阿里首家无人酒店:服务交由人工智能完成,没有一个服务员
    酝酿两年的阿里无人酒店正式开业,整栋楼没有一个服务员,却比任何一家酒店更安全、更干净、更舒适。 这意味着马云离他的的目标越来越近了…… 无人酒店,未来以来 根据阿里旗下飞猪旅行近日公布,阿里无人酒店取名未来酒店,位于杭州西溪园。 它全程没有任何人操作,没有大堂、没有经理,甚至连打扫卫生的阿姨都没有,所有事情统统交给了人工智能。 话不多说,我们直接来看它的体验过程吧! ? 入住: 客人到达酒店后,一个1米高的机器人取代了传统的人工接待。它通过人脸识别技术,首先记住了客人的样子。 登记入住时,客人只需在大堂自助机刷一次脸,这时后台就会对接公安系统确定住户身份信息。随后,客人的个人信息就会覆盖酒店内全场景。 这意味着客人的脸从此成了一张通行证,无需任何服务员引导,只需刷脸就能享受酒店所有服务。 ? 登记完毕后,电梯会启动等候系统,这时机器人带客人去房间就不必再费时间等电梯了。 电梯通过无感体控系统,识别客人身份,判断乘坐电梯的意图后,最后直接在入住的楼层停下来。 ? 到达房间门口后,摄像头识别出身份,房门自动开启,客人就能进去休息了。 吃喝玩乐: 传统酒店进门必须插卡才能取电,但在阿里未来酒店,一切反人类的东西统统消失了。 进门无需插卡,灯光会自动进入欢迎模式,电视机自动开启。房间内的空调、灯光、窗帘等设备全部不用手工操作,客人只要对着天猫精灵下达指令,一切躺着进行都可以。 ? 我们上面说过,登记时酒店系统会记住客人身份,也就是说去餐厅、健身房、游泳池只需带着一张脸就行了。 比如,当客人走进餐厅,人脸识别系统就会识别出他的身份和房间号,所点的餐品将自动被记录到消费清单。 客人不需要再结账或签单,用完餐或者健完身拍拍屁股就能走。 如果你不想出去,只需在手机上点单,机器人就能把食物和水送到你房间。 退房: 我们在传统酒店退房时,前台会派卫生阿姨前去查房,但在未来酒店,客人只需在手机上退房,系统就会弹出客人的所有消费金额。点击确认,随时离店。 ? 在离开房间的一瞬间,电梯也已经启动程序等候客人了。 此时,房间会自动生成一张打扫订单,就像滴滴一样,附近的卫生阿姨接到订单就会前来打扫房间,酒店无需专门请清洁工。 未来酒店凝聚了阿里豪华的阵容:达摩院负责架构、阿里云提供大数据、人工智能实验室设计机器人、智能场景事业部完成酒店数字化运营和智能服务中枢、天猫则为酒店床品提供供应链。 我们从眼前看,服务员在未来酒店失去了用武之地,但长远看来,是不是可以理解为阿里给解放服务员提供了宝贵经验呢? 原文章作者:麦点小峰,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-17
    最后回复 搔皴聿 2020-1-17 15:45
    2605 0
  • BAT2019投资版图:百度聚焦人工智能,阿里腾讯共同投资21家企业
    在刚刚过去的2019年,创投市场持续降温,PE/VC机构感受到了极大的压力。而作为投资界的另一股重要力量,曾投出中国新经济领域半壁江山的CVC是否依旧活跃?他们的投资呈现出哪些新特点?《每日经济新闻》记者对其头部代表BAT过去一年的投资情况进行了梳理统计(均不包含相关公司的投资,如蚂蚁金服的投资不计入阿里巴巴)。 百度:聚焦人工智能 发力内容生态 与2018年的93起投资相比,百度在2019年的投资步伐明显放缓。CVSource投中数据显示,2019年全年百度投资数量大幅下降,仅为41起,投资的多数项目处于发展早期,集中在B轮以前。 从其投资的标的来看,肩负为百度占领下一个技术风口的使命,百度投资延续了自身长期以来的技术基因。记者注意到,人工智能是百度2019年投资中依然重金押注的一个领域。在人工智能的底层技术方面,其偏爱投资海外早期技术研发项目,如专注机器人流程自动化的人工智能初创公司Automation Hero,以及2019年4月投资的机器人初创公司Covariant。ai等。 而人工智能对传统行业的赋能和改造是百度2019年投资的重点。过去一年,其所投资的项目大量集中在医疗、金融、工业、农业等有明确落地场景、能够利用人工智能、大数据等技术实现降本增效的领域。 其中,百度在医疗健康领域的投资值得关注——2019年合计投资数量达到8起。2019年3月,百度全资收购医疗人工智能数据服务提供商康夫子健康;9月又14亿元大手笔投资东软控股;此外,百度还投资了脑机接口研发企业博睿康、医疗支付和保险解决方案提供商诺惠医疗等企业。从医疗器械到智能医疗,再到产业化布局,2019年可谓是百度重回医疗的一年。 此外,百度在内容生态上的布局也值得关注。2019年,其接连投资了果壳、凯叔讲故事、七猫小说、知乎等头部优质企业。作为信息入口的百度,一方面已拥有由百家号、百度知道、百度百科等产品组成的平台矩阵,另一方面又通过上述一系列投资引入各个垂直类的优质内容,其目的或在于构筑内容分发护城河,以期取得内容战场的主导权。 阿里:保持高度介入 投资分布均衡 2019年阿里投资热情同样低迷。 CVSource投中数据显示,阿里资本去年的投资数量为42起,这一数字创下了5年来新低。从投资轮次的偏好来看,阿里保持了先投资、再并购、最后全资收购的高介入模式。事实上,其投资的多数商业形态最终都成为了阿里的一部分。 从具体的投资项目来看,企业服务也是阿里资本2019年重点布局的一个赛道,共投资9起。其中,最大的一笔投资是近47亿元并购“德殷德润”,而后者是申通快递的股东。物流方面,阿里先后投资了菜鸟网络、申通快递以及交通运输信息化企业千方科技。 在技术方面,其投资了云计算公司谐云科技、九州云腾,主攻半导体芯片的恒玄科技、人工智能企业旷视科技等。 此外,在文化传媒、医疗健康方面,阿里也都保持有较高的关注——入股B站,领投网易云音乐,加持阿里健康和体检机构美年健康、爱康国宾等。与此同时,其在本地生活、零售等领域也均有捕获。整体而言,阿里围绕主营业务进行投资,以巩固竞争护城河,投资领域分布也相对均衡。 在去年9月阿里巴巴的公开活动上,CFO武卫曾对阿里的投资进行总结。她透露,阿里巴巴的战略性投资价值约830亿美元,彼时的阿里已经退出50多个投资项目,实现投资收益180亿元。同时她表示,阿里已经将核心业务利润的三分之一投资到物流、全球化、本地服务以及新零售等。阿里不做财务投资,每一笔投资都需要整合到阿里生态,通过投资产生更大的协同效应。 腾讯:押注企业服务 偏爱中后期 同样在2019年放缓投资脚步的还有,以买遍天下互联网著称的腾讯。 CVSource投中数据显示,2019年腾讯共有62起投资记录。不同于百度、腾讯,其投资不仅范围更为广阔和分散,轮次也偏向晚期。 从具体的项目来看,企业服务是腾讯在2019年着重出手的一个领域。 2018年9月,腾讯进行了自成立以来的第三次大规模组织架构调整,成立CSIG云与智慧产业事业群,官宣向产业互联网进军。而这一战略在其投资业务中也有迹可循。据统计,2019年腾讯在企业服务领域的投资共有17起,涉及数据信息服务、IT基础设施、企业安全、营销推广等多个细分赛道。这其中既有偏底层的技术企业,也有纯SaaS企业。 此外,文化传媒、游戏领域因与腾讯主营业务协作紧密,是其历来一直持续加码的领域。 2019年,腾讯在文化传媒领域的投资较为全面,覆盖了动漫、直播、影视、短视频等几个主要赛道,投资数量为8起,代表性案例有知乎、快手、好枫青芸等。公开资料显示,好枫青芸曾打造了火爆全国的女团青春长大综艺节目《创造101》。 值得关注的是,作为全球最大的游戏投资人之一,腾讯2019年在游戏领域的出手却乏善可陈,仅有两笔投资,均为早期项目。这一现象的出现或与资本寒冬、国内文娱行业的退潮等原因相关。 阿里腾讯共同投资21家企业 此外,作为创投市场的重要一极,互联网巨头们的扶持与投入撑起了中国新经济领域的半壁江山。尽管不同公司的投资策略、方法各有风格,但随着母公司竞争的加剧,旗下的投资也不断延长交错——从各自的核心业务拓展到社交、网约车、支付等诸多领域,这其中既有旗帜鲜明的对抗,也有同台相逢的联手投资。 而在竞争最激烈的腾讯与阿里之间,记者梳理发现,滴滴、哔哩哔哩、美团等21家企业背后均有双方投资的身影。 整体来看,二者共同投资的公司主要来自互联网、文娱影视等行业。尤其是在快手、美团、滴滴等明星新经济公司背后,双方均不止一次出手加持。 公开资料显示,腾讯曾4次投资滴滴出行,阿里共注资两次;美团点评背后,腾讯出手3次,阿里投资两次。 另外,双方的联手不只局限于国内,Lyft、Aiming等海外项目背后也均有二者的身影。 记者注意到,不仅是先后出资,阿里、腾讯还曾在百望股份、华谊兄弟、微鲸科技等8家公司的投资中,选择同一时间、同一轮次联手进入。而在剩余13家公司的投资中,腾讯9次优先出手。 此外,还有一个有意思的现象是,似乎投资的先后顺序与企业的倾向性并无直接关系。比如,腾讯率先投资的饿了么,最终被纳入阿里版图;而阿里率先加持的美团点评,最终却倒向了腾讯系。 本文来自每日经济新闻 原文章作者:企业应用研究,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-15
    最后回复 我厢 2020-1-15 20:26
    3603 0
  • 阿里平台催生数字化新职业 人社部拟发布“人工智能训练师”新职业
    从0到20万,“人工智能训练师”从概念发展为新职业,只用了四年时间。 中国就业培训技术指导中心和人社部职业技能鉴定中心昨日发布的《关于拟发布新职业信息公示的通告》显示:人工智能训练师以及智能制造和工业互联网领域的16个新职业已评审论证,经人社部统同意进入公示阶段。 人工智能训练师是近年随着AI技术广泛应用产生的新兴职业,他们的工作是让AI更“懂”人类,更好地为人类服务。人们熟悉的天猫精灵、菜鸟语音助手、阿里小蜜等智能产品背后,都有人工智能训练师的身影。 早在2015年,阿里巴巴集团客户体验事业群(CCO)就在其客服团队孵化了国内第一批人工智能训练师,帮助训练服务领域的人工智能客服机器人,这比国外最早提出人工智能训练师的美国麻省理工大学领先了两年时间。 目前,整个阿里巴巴生态内,人工智能训练师从业者已逾20万人。 今年7月,阿里巴巴向人社部提交了《新职业信息建议书》。建议书中,阿里巴巴提出了“人工智能训练师”的定义,即指使用智能训练软件,在人工智能产品实际使用过程中进行数据库管理、算法参数设置、人机交互设计、性能测试跟踪及其他辅助作业的人员。 公示内容显示,人工智能训练师新职业属于软件和信息技术服务业,主要工作任务包括:标注、加工原始数据、分析提炼专业领域特征,训练和评测人工智能产品相关的算法、功能和性能,设计交互流程和应用解决方案,监控分析管理产品应用数据、调整优化参数配置等。 随着人工智能在智能制造、智能交通、智慧城市、智能医疗、智能农业、智能物流、智能金融及其他各行各业的广泛应用,人工智能训练师的规模将迎来爆发式增长。预估到2022年,国内外相关从业人员有望达到500万。 阿里CCO和阿里人工智能实验室方面表示,定义人工智能训练师这一新职业和相关的技能标准,将有助于规范和引导人工智能应用的就业岗位,推动传统行业更好的拥抱人工智能,帮助实现社会生产力的整体跃升。(李经) 原文章作者:光明网,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-15
    最后回复 蟾思 2020-1-15 19:22
    2383 1
  • 阿里人工智能“鲁班”5月将对商家开放,今年目标营收1亿
    匿名爆料者称,阿里人工智能 “鲁班”今年5月份会面对商家开放,另外,爆料人还称阿里今年给“鲁班”团队定下1亿营收目标。据悉,去年双11,“鲁班”就已凭借平均每秒P图8000张而在AI界大放异彩。(亿邦动力网) 原文章作者:36氪,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-15
    最后回复 蕾闩蹈 2020-1-15 19:16
    1138 16
  • 首次披露!阿里线下智能方案进化史
    阿里妹导读:AI 技术已经从互联网走向零售、汽车、银行等传统行业。受限于延时、成本、安全等多方面的限制,单一的云解决方案往往不能满足场景需求。线下智能方案逐步成为了智能化过程中重要的一环,今天,我们就一起来了解这一环,希望这些内容可以让同学了解线下智能的前景和其中待解决的技术点。 前言 阿里巴巴机器智能实验室线下智能团队从16年底开始涉及线下智能领域,从算法、工程、产品化、业务落地多个方面入手,与合作伙伴们一起取得了一些小小的成绩。算法方面,我们提出了自主研发的模型压缩方法,新型模型结构和目标检测框架;工程方面,我们研发出一套非数据依赖的量化训练工具,并且针对不同硬件平台,研发了高效推理计算库;同时我们也和服务器研发团队一起抽象出了一套软硬件产品化方案,以服务多样的业务形式,并在真实业务场景中实验落地。 在后面的篇幅中,我们主要会从算法探索、训练工具、推理框架、产品化和业务模式等方面对之前的工作做一个总结和分享。 算法探索 基于 ADMM 的低比特量化 低比特量化是模型压缩( ModelCompression )和推理加速( Inference Acceleration )中一个核心的问题,目的是将神经网络中原有的浮点型参数量化成 1-8Bits 的定点参数,从而减小模型大小和计算资源消耗。为了解决这个问题,我们提出了基于 ADMM(Alternating Direction Method ofMultipliers)的低比特量化方案。在公开数据集 ImageNet 上,我们在 Alexnet,ResNet-18,Resnet-50 等经典 CNN 网络结构上做了实验,无论是精度上还是速度上均超过了目前已知的算法。我们可以在 3-bit 上面做到几乎无损压缩。目前该方法已经被广泛应用到各种端上目标检测和图像识别的实际项目中。相关成果已经在 AAAI 2018 上发表。 统一量化稀疏框架 量化技术可以通过简化计算单元(浮点计算单元->定点计算单元)提升推理速度。 稀疏化( Pruning ) 技术则是通过对神经网络中的通路进行裁剪来减少真实计算量。我们很自然的将这两个技术融合到了一起,来获取极限的理论加速比。在剪枝过程中,我们采用了渐进式的训练方法,并结合梯度信息决定网络中路径的重要程度。在 ResNet 结构上,我们可以做到90%稀疏度下的近似无损压缩。 在稀疏化研究过程中,我们发现了一个问题,更细粒度的裁剪往往会获得更高的精度,但是代价是牺牲了硬件友好性,很难在实际应用中获得理论加速比。在后面的章节中,我们会通过两个角度来解决这个问题: [*]软硬件协同设计,从软硬件角度同时出发解决问题; [*]新型轻量级网络,从软件角度设计适合更适合现有硬件的结构。 软硬件协同网络结构 通过量化和稀疏技术,我们可以获得一个理论计算量足够低,所需计算单元足够简单的深度网络模型。下一个要解决的问题就是我们如何将其转换成一个真实推理延时低的算法服务。为了挑战极限的推理加速效果,我们和服务器研发团队一起,从软硬件联合设计出发解决该问题。在该项目中,我们提出了以下几个创新点,其中包括: [*]软硬件协同设计方面,我们针对硬件物理特性提出了异构并行分支结构,最大化并行效率。 [*]算法方面,我们利用量化、稀疏、知识蒸馏等技术,将理论计算量压缩到原始模型的18%。 [*]硬件方面,我们通过算子填充技术解决稀疏计算带来的带宽问题,利用算子重排技术平衡PE负载。 通过上述方案,我们只需要 0.174ms 的 latency 就可以完成 resnet-18 复杂程度的模型推理,达到业内最佳水平。该方案在对 latency 敏感的领域具有极大的优势。相关成果已经在 HotChips 30 上展出。 新型轻量级网络 软硬件协同设计是一个非常好的推理解决方案,但是改方案的开发成本和硬件成本都很高。某些特定的场景对于 latency 和 accuracy 的容忍度比较高(例如人脸抓拍)。为了解决这类需求,我们提出了一种多联合复用网络 (Multi-Layer Feature Federation Network, MuffNet) ,该结构同时具有3个特点: [*]稀疏的拓扑结构,同时更容易获取高频响应; [*]密集的计算节点,保证硬件友好性; [*]针对低成本硬件充分优化,小计算量下精度提升更明显; 我们提出的新型网络由于每个单元的计算比较密集,并不存在过多的碎片操作,是非常适合在通用硬件上运行的。在公开数据集 ImageNet 上,我们在 40MFLops 计算量上相比目前业内最优的 shufflenetv2 结构,准确度绝对提升了2%。 端上目标检测框架 相比图像识别类任务,目标检测类任务的适用场景更广泛。高效的目标检测框架具有很高的研究价值。针对端上场景,我们提出了一个 LRSSD 框架( light refine single short multiboxdetector ), 该框架包括以下几个特点: [*]简化 SSD HEAD,采用共享预测层 设计特征融合模块; [*]融合不同尺度下信息 级联形式的 bbox 回归; [*]对检测模型做全量化处理。 如上表所示,相同 backbone 网络的情况下,我们提出的 LRSSD 在减少 SSD HEAD 计算量的同时,mAP 可以稳定提升3%-4% 。从另一个角度来看,在保证检测精度不变的情况下,我们的方法可以将模型复杂度减少到原来的50%左右。如果再考虑到量化带来的速度加成,在相同精度下,相比原有全精度模型,我们可以获得总共约2-3倍的真实速度提升。 小结 上文给出了我们近2年内在线下智能—模型压缩领域所做的一些技术积累。归纳起来如下: [*]量化方面:我们可以做到 3-bit 量化几乎无损压缩! [*]稀疏方面:对于传统网络结构,我们可以做到90%稀疏度下的几乎无损压缩! [*]软硬件协同设计方面:我们联合服务器研发团队,达到0.174ms/张的resnet18 极限推理速度,目前已知业内最佳效果! [*]轻量级网络设计方面:我们在 40MFlops 计算量下,相对目前业内最好结构,在 ImageNet 数据集上绝对提升2%! [*]端上目标检测方面,我们在保证精度不变的情况下,速度提升约2-3倍! 在技术探索的同时,我们也在积极的将上述技术应用到实际的业务中。在这一过程中我们发现了下列几个问题: [*]易用性: 业务场景往往需要快速的迭代能力和灵活方便的部署能力,因此非标准化的方案很难被广泛应用。 [*]理论速度 vs 真实速度: 除了算法和硬件以外,真实的模型推理速度是需要一个高效的工程实现作为支撑的。 [*]集成化 :线下智能需要同时考验团队在硬件和软件方面两方面的实力,这对业务而言往往太过沉重。 在本文后半部分,我们首先会针对上述的几个问题介绍我们已经做过的尝试和沉淀出的解决方案。最后,我们列出了一些实例,展示如何在具体的业务场景中应用线下智能技术,希望可以给各位同学一个更直观的认识。 训练工具 在实际业务推广过程中,我们遇到的第一个问题是易用性问题: [*]不同业务往往使用的深度学习库多种多样,例如 Caffe, Tensorflow, Mxnet 等等; [*]不同业务使用的基础技术差异比较大,有分类识别、检测、分割、语音等等; [*]不同业务的数据安全级别差异比较大,有些可以公开,有些则需要完全物理隔离; 为了让更多的场景都可以用上我们的服务,获得 AI 的红利,我们提出了一套标准化的量化训练工具。 如上图所示,首先,我们的工具输入支持多种模型格式( TensorFlow,Caffe,Mxnet 等)。其次,我们提供了两种不同的模型量化方法,一种是支持不同任务(分类,检测,分割等)的数据依赖型压缩方法( Data Dependent Compression ) , 适用于对数据安全要求不是很高,希望追求精度最大化的业务;另一种是数据非依赖压缩方法( Data Independent Compression ),适用于对数据安全要求高,或者业务逻辑不是特别复杂的场景。 最后,在量化工作完成后,我们的工具会自动完成推理图的优化和模型加密,生成可以实际部署的模型文件。配合对应的推理加速库即可在端上运行。从易用性和数据安全性角度出发,我们推荐使用数据非依赖性的压缩方法。 目前,该套工具作为MNN推荐的量化工具广泛应用在阿里集团内多个线下业务场景中。 推理框架 实际中遇到的第二个问题就是真实推理速度问题,毕竟光有易用性是不够的,实打实的业务效果才是业务最想要的。这里我们使用阿里集团其他的兄弟团队提供的推理框架: [*]ARM 架构: 我们采用淘系技术团队研发的 MNN 作为推理框架; [*]GPU 架构: 我们采用机器智能技术团队研发的 falcon_conv 卷积库作为推理框架; [*]FPGA 架构:我们采用服务器研发团队研发的推理框架。 MNN MNN 是一个轻量级的深度学习端侧推理引擎,核心解决深度神经网络模型在端侧推理运行问题,涵盖深度神经网络模型的优化、转换和推理。目前,MNN已经在手淘、手猫、优酷、聚划算、UC、飞猪、千牛等 20 多个 App 中使用。选用常见的深度神经网络模型 MobileNet V2 和 SqueezeNet V1.1 作为测试样本:Android 方面,以小米6为例,MNN 在 CPU 和 GPU 上领先业界至少30%;iOS 方面,以iPhone 7为例,MNN 在 CPU 和 GPU 上领先业界至少15%。 FPGA FPGA 上的推理框架由服务器研发团队完成。ResNet18 网络的推理时间只需要0.174ms,目前已知业内最佳性能。在边缘计算产品 alibabaedge 上,基于硬件实现的高效算子,推理速度为边缘 GPU 的两倍。在后面,我们会结合产品形态整体的介绍这一方案。 GPU falcon_conv 是机器智能技术团队开发的一款由 CUDA C++编写,在 Nvidia GPU 上运行的低精度卷积库,它接受2份低精度( INT8 )张量作为输入,将卷积结果以float/int32 数据输出,同时支持卷积后一些常规操作( scale,batchnorm,relu… )的合并。我们在单张 Tesla P4 GPU 上,对 falcon_conv 的性能与 Nvidia 官方计算库Cudnn v7.1 做了比较,如图所示。几乎所有情况 falcon_conv 都优于 Cudnn ,个别用例有高至5倍的提升,用例选自 RESNET 和 VGG 中耗时较多的卷积参数。 产品化 在业务支持过程中我们遇到的第三个问题是集成化,产品化问题。除了手机类场景外,其他线下业务均需要额外的硬件平台作为支撑。在早先时候,我们更多的是依赖第三方提供的硬件设备,这时候成本,稳定性,可扩展性 成为制约线下项目拓展的几个主要问题。为了解决这些问题,我们根据以往的项目经验,对硬件设备进行归纳,沉淀出两类比较通用的线下产品化方案:智能盒子和一体化相机。每类产品均包含不同型号,以适应不同需求的场景。 智能盒子 我们提供的第一个方案为智能盒子方案。我们可以简单的把智能盒子当作一个适合于中小型场景的边缘服务器。盒子本身提供了多种接口,可以外接 usb/ip 相机,语音模块等传感器。直接本地部署,数据安全性高。我们针对业务特点提供了高低两个版本的智能盒子。其中,高端版本采用阿里巴巴自研的边缘计算产品 Alibaba Edge 。除了完善的硬件设计和高效的推理框架,该盒子还包含完善的编译器支持,具有非常好的易用性。 低端版本则为纯 ARM 的盒子。下面表格给出这两种盒子在性能,成本和适用场景的一个对比。 在这里我们着重介绍一下阿里巴巴自研的边缘计算产品 Alibaba Edge,该产品除了具有高达 3TGFlops 的AI计算能力外,相对边缘 GPU 方案有大幅的价格优势,同时具有云端一体化部署功能,产品平台化,可快速上线,支持大规模运维。 在下面的表格中,我们对比了 LRSSD300+MobileNetV2 的不同硬件设备上的运行时间,希望可以给大家一个更直观的认识。 一体化相机 我们提供的另一个集成方案为一体化相机。一体化相机特别适合云+端的部署模式:线下做相对比较简单的处理功能,云端则深度处理线下传回的信息。达到节约带宽,降低云成本的作用。同时,一体化相机具有方便部署,批量化生产后成本优势高的特点。目前一体化相机已经作为一个重要的载体形式被应用到我们所承接的对集团外合作项目中。 业务合作 在过去的2年间,我们尝试过多种不同的业务模式。在这里我们会列出主要几个不同形式的实例。 菜鸟未来园区 在菜鸟未来园区项目中,我们主要负责基础视觉类算法的输出,由菜鸟智慧园区团队同学负责业务算法和工程服务研发工作。经过半年的共同努力,我们先后完成了离岗睡岗检测,消防通道异常检测,车位占用检测,行人越界检测,入口计数检测等多个功能。 在项目合作的过程中,我们发现计算单元成本高是制约算法大范围推广的一个主要原因。为了解决这个问题,我们联合了服务器研发团队,开发出一版定制化软硬件解决方案:该方案的硬件平台为我们在上文中提到的边缘计算产品 Alibaba Edge,同时配备特别定制的高效模型结构和自研的快速检测算法。新版方案在检测精度几乎无损的情况下,推理速度提升了4-5倍,成本相比边缘 GPU 方案下降了1/2。 模型压缩加速 我们协助阿里集团不同业务同学完成对已有算法模型的量化瘦身与加速工作。例如:手机端 OCR 识别、手机端物体检测、手淘实人认证和刷脸登录/验证、菜鸟自提柜、阿里体育赛事刷脸入场、神州鹰人脸识别云相册等。 总结与展望 经过近两年的努力,机器智能技术实验室线下智能团队深耕线下智能领域。算法方面:我们在低比特量化、稀疏化、软硬件协同设计、轻量级网络设计、端上目标检测等多个方面取得了一定的积累,多项指标达到了业内最佳水平。工程方面:我们积累出了一套 高灵活性,高数据安全性 的训练工具 ; 并在合伙伙伴的帮助下,在ARM,FPGA,GPU 等多个平台下达到了业内最佳的推理性能。产品化方面:我们与合作伙伴一起,研发出适合于不同业务场景的智能盒子与一体化相机。最后,我们很幸运可以在集团内外多个不同形式的业务场景内打磨我们的技术。 原文章作者:阿里技术,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-15
    最后回复 平雪粉 2020-1-15 17:32
    1030 1
  • 连续三年研发投入第一,阿里巴巴人工智能 "黑科技"又来了
    从全球范围来看,人工智能已经正式成为巨头们的新战场。作为中国的科技巨头,阿里巴巴在人工智能方面也是早有布局,马云也曾多次在公开场合中表示,阿里巴巴的未来离不开人工智能。 在近日刚刚结束的全球人工智能"世界杯"中,阿里巴巴在人工智能上的表现就非常抢眼,阿里AI以82.54%的识别准确率击败了来自世界各地的 150 多支队伍,获得了冠军。 据了解,WebVision是由谷歌、美国卡耐基梅隆大学、苏黎世联邦理工大学等机构联合全球视觉技术领域顶级学术会议CVPR发起,要求参赛的AI模型将 1600 万张图片精准分类到 5000 个类目中。这一赛事也被业界誉为人工智能的"世界杯"。 除了人工智能,近几年阿里巴巴在前沿科技领域也是遍地开花,先后建立了全球性研究机构达摩院、平头哥半导体公司、阿里云等等机构,将大量的精力都投入到了芯片、云计算、量子计算等前沿领域的研究中。 阿里巴巴对前沿科技如此重视,自然离不开重金的投入了。根据前不久普华永道公布的数据显示,阿里巴巴已经连续三年成为中国上市公司研发投入支出第一名,为36亿美元(约249亿元人民币),在全球排第45位,并且还是全球研发投入50强中唯一的中国企业。另外,研发不仅要看总量,更要看投入/收入占比,数据显示,阿里巴巴以15.5%的研发强度排在全球第一。 从这些数据可以看出,在研发投入方面,阿里巴巴是非常重视的。可以预见,未来阿里巴巴会持续在人工智能、量子计算等前沿科学领域上加码。 原文章作者:科技焦点,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-15
    最后回复 岘昂 2020-1-15 12:14
    1470 20
  • 阿里长出100种新职业?垃圾分类师、人工智能训练师…你听过吗?
    AI流行预测师、直播选品师、海鲜饲养员、大米经纪人、垃圾分类师、人工智能训练师、AI芯片设计工程师……1月13日,阿里巴巴公布,2019年阿里巴巴经济体诞生了超过100种新职业。 2019年,许多新职业从0到1涌现,还有许多新职业因为荷塘效应,在过去一年积少成多,成为趋势性、常态化的社会就业。这些新职业,有的在创造性满足新消费需求的过程中诞生,有的在引领社会科技创新的领域中出现,还有绿色、脱贫事业带动的普惠型就业……过去一年,这些新职业的从业者们共同为社会创造了许多新价值增量。 超过100种新职业涌现,是平台经济开放性和创造性的结果,也是中国数字经济活力在就业领域的体现。 在数字经济时代,创新者有了更丰富的内涵。 2019年阿里巴巴经济体诞生了超过100种新职业 新消费领域诞生的新职业最多 新消费新在哪?形式新,产品新,服务新,就连就业也是新的。 阿里巴巴新职业报告显示,高品质消费需求催生了海鲜饲养员、水果猎人、大米经纪人等新职业,服务消费领域也诞生了服务体验师、情感工程师、垃圾分类师、负能量回收员等,这些新职业的出现,都是源自对消费需求的创造性满足。 2019年双11当天,淘宝直播带动成交额近200亿元。作为新消费场景,与直播相关的新职业也越来越热门:专业主播、助播、直播粉丝运营师,以及主播背后的选品、供应链管理、直播间布景……都成了年轻人的热门就业选择。 2019年,品牌在天猫发布的新品数量突破1亿款。这背后是“AI流行预测师”、“新品创新官”等新职业。他们通过洞察消费者需求,让新品成爆品不再靠运气,而是靠数字化能力。2019年底,就有500个商家与天猫合作成立了“互联网新品部”,几乎涵盖全消费行业的“新品创新官”,将通过创造性满足消费者需求,成为供给侧改革的新力量。 盒马配送员送货上门 数字化服务正在让最后一公里实现“像素级打通”,这中间是城乡末端物流环节上的无数就业机会。例如人们生活中早已离不开的外卖小哥,以后将有望成为官方新职业“网约配送员”了。新零售业态盒马鲜生就诞生了许多“网约配送员”,他们将优质产品和服务以最快30分钟的速度送货上门。据了解,在盒马鲜生的配送员中,35岁以下青年占比76.6%,近20%的配送员学历在大学本科/专科以上,50%以上的配送员每月收入超过8000元。 科技创新成为普通人的力量 2019年9 月 25 日,阿里巴巴发布第一颗自研芯片,它是全球最高性能的AI推理芯片含光800。这背后离不开的一个新职业是“AI芯片设计工程师”。 据统计,在2019年4月人社部发布的13个新职业中,数字化管理师、云计算工程技术人员、物联网工程技术人员等超半数新职业,都能在阿里巴巴数字经济体中看到。 但科技创新领域的就业并非高不可攀。恰恰相反,技术的力量要成为全社会的力量、成为普通人的力量,这一趋势正在阿里巴巴经济体的新职业中清晰。 例如,人社部拟公布的第二批新职业名单中,“人工智能训练师”就是AI产业红利外溢的结果,从业者是你我一样的普通人。 人工智能实验室-AI豆计划学院 1997年出生的朱鑫燚就是一名人工智能训练师,她训练的对象叫“店小蜜”——淘宝天猫上的机器人智能客服。“店小蜜不是冷冰冰的机器人,更像是人们的购物小助手,而训练师就是帮助店小蜜更懂消费者。” 2019年8月6日,支付宝公益基金会、阿里巴巴人工智能实验室联合中国妇女发展基金会启动了“AI豆计划”,这一“AI+扶贫”的公益新模式,帮助贫困群体享受AI产业红利,在家门口实现就业脱贫。截止目前,AI豆计划已经在贵州省万山区、陕西省清涧县建立2个扶贫培训基地,培训了251名学员,其中118人已通过考核,正式成为“人工智能训练师”。 数字化令新职业更普惠 普惠是阿里巴巴经济体创造新职业的一个关键词,每个从业者都能通获得尊严与掌声。 网商银行和支付宝的分析显示,2019年,以网店、街边店、路边摊等组成的各类小店,一半以上增加雇员,撑起3亿社会就业。87%的从业者认为,明年生意会比今年更好。 在三线及以下城市和农村地区,过去一年,平均每天有二十多万人加入大病互助计划相互宝。这背后是“相互宝调查员”这个新职业。他们全凭一双脚,为急需救命钱的病人跑出公平和信任,一年时间累计救助了11928名重症成员。 村播“大晶”在农户家中直播 2019年3月,阿里巴巴启动“村播”计划,计划在全国100个县培育1000名月入过万农民主播。目前,淘宝平台上已经有5万多名农民主播,通过淘宝直播推广家乡的农产品。2019年9月,中国外交部发布《中国落实2030年可持续发展议程进展报告(2019)》,阿里巴巴探索出的“互联网+脱贫”模式,作为中国脱贫经验之一被写入报告,成为首个入选的企业案例。 据了解,阿里巴巴平台上约50%的创业者为女性;淘宝创立16年来,入淘创业者的平均年龄为26岁;2019年,淘宝直播带动400万就业机会;在内蒙古、甘肃等地,有18万名沙漠种植员和护林员,为蚂蚁森林种下1.22亿棵真树,让荒漠正一点点变回绿色…… 这些丰富多彩的新职业,正在成为中国数字经济带动新就业的重要组成。分析人士认为,新职业本质上诞生于对新消费需求的满足,在中国这个超大规模市场,随着越来越多的美好生活需求得到满足,越来越多的新职业将会诞生。 原文章作者:牛镜,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-14
    最后回复 仑舜牵 2020-1-14 21:00
    1588 1
  • 如何打造“智能助理”?阿里对话开发平台这样做
    阿里妹导读:一个合格的智能助理能够帮你预约开会时间,处理日常办公需求,还能打电话提醒你要还信用卡了,作为用户或者消费者,我们已经越来越习惯对话机器人提供的各色服务。但对于企业来讲,搭建提供这些服务的对话机器人是一件门槛及成本都很高的事情。阿里巴巴达摩院小蜜Conversational AI团队的高级算法专家李永彬(水德)为我们带来了分享——小蜜智能对话开发平台,围绕平台来源、设计理念、核心技术、业务落地四大维度讲述了如何赋能各行各业开发自己的对话机器人。 平台由来 为什么要做一个平台?我觉得还是从一个具体的任务型对话的例子说起,在我们日常工作中,一个很高频的场景就是要约一个会议,看一下我们内部的办公助理是怎么来实现约会议的:我说“帮我约一个会议”,它会问“你是哪一天开会?”,跟它说是“后天下午三点”,接下来它又会问“你跟谁一起开会啊?”,我会把我想约的人告诉它,这个时候它在后台发起一次服务调用,因为它要去后台拿到所有参会者的日程安排,看一下在我说的这个时间有没有共同的空闲时间,如果没有的话它会给我推荐几个时间段。由于我说的那个时间段大家没有共同的空闲时间,于是我改了时间。 我说“上午十一点吧”,它会接着问,“你会持续多长时间”,我会告诉它“一个小时”,它再问“会议的主题是什么”,于是,我跟它说“我们讨论一下下周的上线计划”,到此为止它把所有的信息收集全了,最后,它会给我一个 summary,让我确认是不是要发送会议邀约,我回复确认以后,它在后台就会调用我们的邮件系统,把整个会议邀约发出来。 这是一个非常典型的任务型的对话,它满足两个条件,第一,它有一个明确的目标;第二,它通过多轮对话交互来达成这个目标。像这样的任务型对话在整个办公行业里面,除了约会议以外还有查考勤、请假、定会议室或者日程安排等等。 如果我们把视野再放大一点的话,再看一下电商行业,电商行业里面就会涉及到开发票、催发货、查物流、改地址、收快递等等,也会涉及到很多很多的这样的任务型对话场景;视野再放大一下,我们再看一下电信行业或者整个运营商的行业里面,会有查话费、查流量、买套餐、报故障或者是进行密码的更改服务等,也会有大量的这种任务型的对话场景。如果我们再一步去看的话,像政务、金融、教育、文娱、健康、旅游等,在各行各业的各种场景里面我们都会发现这种任务型的对话,它是一种刚需,是一种普遍性的存在。 所有的这些场景落地到我们小蜜家族的时候,是通过刚刚介绍过的三大小蜜来承载:阿里小蜜、店小蜜和云小蜜。我们不可能给每一个行业里面的每一个场景去定制一个对话流程,所以我们就沿用了阿里巴巴一贯做平台的思路,这也是我们整个智能对话开发平台的由来。这款产品在内部的名字叫对话工厂(Dialog Studio)。 以上主要是给大家介绍我们为什么要做智能对话开发平台,总结起来就是我们目前面临的业务,面临的场景太宽泛了,不可能铺那么多人去把所有的场景都定制化,所以我们需要有一个平台来让开发者进来开发各行各业的各种场景对话。 设计理念 再看第二部分,对话工厂的一些核心设计理念。整个设计理念这块我觉得概括起来就是“一个中心,三个原则”。一个中心就是以对话为中心,这句话大家可能觉得有点莫名其妙,你做对话的,为何还要强调以对话为中心呢? 这是有来源的,因为在过去几年全世界范围的技术实践以及直到今天很多巨头的对话平台里面,我们能看到的基本还是以意图为中心的设计模式,它把意图平铺在这里,比如你想完成音乐领域的一些事情,可是你看到的其实是一堆平铺的意图列表,完全看不出对话在哪里。 我们在这次对话工厂的设计中彻底把它扭转回来,对话就是要以对话为中心,你在我们的产品界面里面看到的不再是一个个孤立的意图,而是关联在一起的、有业务逻辑关系的对话流程。以意图为中心的设计中,你看到的其实是一个局部视角,就只能实现一些简单的任务,比如控制一个灯,讲个笑话,或者查个天气,如果你想实现一个复杂的任务,比如开一个发票,或者去 10086 里开通一个套餐,它其实是较难实现,很难维护的。我们把整个理念转换一下,回到以对话为中心以后,就会看到全局视野,可以去做复杂的任务,可以去做无限的场景。 整个对话工厂刚刚也说过了,它是一个平台,要做一个平台就会遇到很多挑战。 第一个挑战就是对用户来说,希望使用门槛越低越好;第二个挑战是要面对各行各业的各种场景,就要求能做到灵活定制;第三个挑战是上线以后所有的用户肯定都希望你的机器人,你的对话系统能够越用越好,而不是停留在某一个水平就不动了。这就是我们平台所面临的三大挑战。 为了应对这三个挑战,我们提出了在整个平台的设计以及实现过程中始终要遵循三个原则。 第一个原则是冷启动要快,其实就是要让用户的使用门槛低一点;第二个原则是要有灵活定制的能力,只有这样才能满足各行各业的各种场景需求;第三个是要有鲁棒进化的能力,就是模型上线以后,随着时间的变化,随着各种数据的不断回流,模型效果要不断提升。 这三个原则里面,冷启动这一块,其实就是要把用户用到的各种能力和各种数据都尽量变成一种预置的能力,简单来说就是平台方做得越多,用户就做得越少;第二块关于灵活定制,就要求我们把整个对话平台的基础元素进行高度抽象,你抽象的越好就意味着你平台的适应能力越好,就像是经典力学只要三条定律就够了;第三块就是鲁棒进化,这一块就是要在模型和算法上做深度了,语言理解的模型,对话管理的模型,数据闭环,主动学习,在这些方面能够做出深度来。以上说的都是一些理念和原则,接下来给大家介绍一下具体在实现过程中是怎么来做的。 核心技术 讲到技术这块的话,因为我们做的是一个平台,涉及到的技术非常广,是全栈的技术,从算法到工程到前端到交互所有的技术都会涉及到。我摘取里面算法的核心部分来给大家做一个介绍。 对话工厂首先是用来做对话的,人机对话有两个主体,一个是人,一个是机器,人有人的逻辑,人的逻辑使用什么来表达呢?到今天为止主要还是通过语言,所以我们需要有一个语言理解的服务来承载这一块;机器有机器的逻辑,机器的逻辑到今天为止还是通过代码来表达的,所以我们需要一个函数计算的服务;在人和机器对话的过程中,这种对话过程需要有效的管理,所以我们需要一个对话管理模块。整个对话工厂最核心的三个模块就是语言理解、对话管理和函数计算。 第一个模块是语言理解。 我们先看一下这个图,在整个这个图里面,横轴是意图的多样性,纵轴是频次,这样说有点抽象,我举一个具体的例子,比如说我要开发票,这是一个意图,如果去采样十万条这个意图的用户说法作为样本,把这些说法做一个频率统计,可能排在第一位的就是三个字“开发票”,它可能出现了两万次,另外排在第二位可能是“开张发票”,它可能出现了八千次,这些都是一些高频的说法,还有一些说法说的很长,比如“昨天我在你们商铺买了一条红色的裙子,你帮我开个发票呗”,这种带着前因后果的句式,在整个说法里面是比较长尾的,可能只出现了一次或两次。 我们统计完以后,整个意图的说法的多样性分布符合幂律分布。这种特征可以让我们在技术上进行有效的针对性设计,首先针对这种高频的部分,我们可以上一些规则,比如上下文无关文法,可以比较好的 cover 这一块,但是基于规则的方法,大家也知道,规则是没有泛化能力的,所以这时候要上一个匹配模型,计算一个相似度来辅助规则,这两块结合在一起就可以把我们高频确定性的部分解决的比较好;对于长尾的多样性的这一部分,基本到今天为止还是上有监督的分类模型,去收集或者去标注很多数据,把这一块做好;在规则和分类模型之间,我们又做了一部分工作,就是迁移学习模型,为什么要引入这个模型呢?我们看下一张图。 在冷启动阶段,用户在录入样本的时候,不会录入太多,可能录入十几条几十条就已经很多了,这个时候按照刚才那个幂律分布,二八原则的话,它的效果的话可能也就是 70% 多,它不可能再高了。但对于用户的期望来说,如果想要上线,想要很好的满足他的用户需求,其实是想要模型效果在 90% 以上,如果想要达到这个效果,就需要复杂的模型,需要标注大量数据。所以其实是存在一个 gap 的,我们引入了迁移学习模型。 具体来说,我们把胶囊网络引进来和 few-shot learning 结合在一起,提出了一个网络结构叫 Induction Network,就是归纳网络。整个网络结构有三层,一层是 Encoder层,第二层是 Induction,归纳层,第三层是 Relation 层。 第一层负责将每一个类的每一个样本进行编码,编码成一个向量;第二层是最核心的一层,也就是归纳层,这里面利用胶囊网络的一些方法,把同一个类的多个向量归纳成一个向量;然后第三层 Relation 层把用户新来的一句话和每一个类的归纳向量进行关系计算,输出他们的相似性打分。如果我们想要一个分类结果就输出一个 One-hot,如果不想要 One-hot,就输出一个关系的 Relation score,这是整个 Induction network 的网络结构。 这个网络结构提出来以后,在学术圈里面关于 few-shot learning 的数据集上,我们以比较大的提升幅度做到了 state-of-the-art 的效果,目前是最好的,同时我们将整个网络结构上线到了我们的产品里面,这是语言理解。 第二块我们看对话管理。 对话管理其实我刚刚也说过了,如果想要让平台有足够的适应性的话,那么它的抽象能力一定要好。对话管理是做什么的?对话管理就是管理对话的,那么对话是什么呢?对话的最小单位就是一轮,一个 turn,我们进去看的话,一个 turn 又分为两部分,一个叫对话输入,一个叫对话输出;在输入和输出中间,有一个对话处理的过程,就像两个人互相交流一样,我问你答,但其实你在答之前是有一个思考过程的,如果你不思考就回答,那你的答案就是没有质量的,所以就会有一个中间的对话处理过程。 我们把对话抽象到这种程度以后,整个平台就三个节点,一个叫触发节点,一个叫函数节点,一个叫回复节点。 触发节点是和用户的对话输入对着的,函数节点是和对话处理对着的,回复节点是和对话输出对着的。有了这一层抽象以后,无论你是什么行业的什么场景,什么样的对话流程,都可以通过这三个节点通过连线把你的业务流画出来。 举两个例子,先看一个简单的,你要查一个天气,很简单,先来一个触发节点,把天气流程触发起来,中间有两个函数节点,一个是调中央气象台的接口,把结果拿过来,另一个是对结果进行一次解析和封装,以一个用户可读的形式通过回复节点回复给用户。这里面稍微解释一下就是增加了一个填槽节点,填槽节点是什么意思呢?就是在任务型对话里面,几乎所有的任务都需要收集用户的信息,比如你要查天气,就需要问时间是哪一天的,地点是什么地方的,这样就叫做填槽,填槽因为太常用太普遍了,就符合我们冷启动快里面做预置的思想,所以通过三个基础节点,我们自己把它搭建成填槽的一个模板,需要填槽的时候从页面上拖一个填槽节点出来就可以了。 我们再看一个复杂的场景,这是在线教育里面的一个外呼场景,家里有小孩的可能知道,这种在线教育特别火,在上课之前半小时,机器人就会主动给用户打电话,指导软件下载,指导怎么登陆,登陆进去以后怎么进入教室,所有的这些流程都可以通过机器人进行引导。 通过这两个例子我们就可以看到,无论是简单还是复杂的场景,通过这三种抽象节点的连线都可以实现。有时候我们开玩笑就会说,整个这种连线就叫一生二,二生三,三生万千对话。 讲了抽象以后,再看一下具体的对话管理技术。从实现上来说,这张图和大家刚才看到的语言理解那张是一模一样的,因为很多东西的分布其实是遵循着共同规律的,区别在与把意图换成了对话。 举一个例子,比如像查天气这样的,如果采集十万个查天气的样本,对这些用户的说法进行一个频率统计的话,大概就是这样一个曲线,用两步能够完成的,比如说查天气,先填槽一个时间再填槽一个地点,然后返回一个结果,通过这种流程来完成的,可能有两万次;中间可能会引入一些问 A 答 B 的情况,这样的 B 可能有各种各样的,就跑到长尾上来了,这样整个对话其实也遵循一个幂律分布。 对于高频确定的部分,可以用状态机进行解决,但状态机同样面临一个问题,它没有一个很好的容错能力,当问 A 答 B 的时候,机器不知道下面怎么接了。在这种情况下,需要引入一个类人能力,对状态机的能力进行补充,状态机加上类人能力以后,基本上可以把高频的对话比较好的解决了。对于长尾上的对话,目前对于整个学术界或者工业界都是一个难题,比较好的解决方式就是上线以后引入在线交互学习,不断跟用户在对话过程中学习对话。在状态机和在线交互学习之间其实是有 gap 的,因为状态机自己没有学习能力,所以需要引入增强学习。接下来我会介绍在类人能力以及增强学习方面的一些工作。 先看一下类人能力。我们把人说的话,做一下分类大概可以分为三种:第一种就是用户说的话清晰明了只有一个意思,这种其实对机器来说是可理解的;第二种机器压根儿不知道在说啥,也就是 unknown 的;还有一种就是用户表达的意思可以理解,但是有歧义,有可能包含着两个意图、三个意图,就是uncertain,不确定的。确定性的,状态机其实是可以很好地捕捉和描述的,类人能力主要关注拒识的和不确定性的。 对于拒识这块,比如还是在线英语的这个例子,机器人打来一个电话,问现在方不方便调试设备,这个时候从设计的角度来说希望用户回答方便或者不方便就OK了,但是一旦这个用户回答了一个比较个性化的话,比如,“呃,我刚扫完地,过会儿可能有人要来”,这时候我们的语言理解模块很难捕捉到这是什么语义,这时候需要引入一个个性化的拒识,比如说,“您好,不好意思,刚才没听明白,请问您现在是否方便调试,如果您不方便,我过会儿再给您打过来”,这个就是对话的兜底,是对 unknown 的处理。 第二个我们看一下澄清,用户说的一句话里面,如果是模糊不清的怎么办?我们通过大量的数据分析发现这种模糊不清主要出现在两种情况下,一种是用户把多个意图杂糅在一段话里来表达;第二种是用户在表达一个意图之前做了很长的铺垫,对于这两种长句子现在的语言理解给出的是意图的概率分布,我们把这个概率分布放到对话管理模块以后就需要让用户进行一轮澄清。比如这个例子,这是移动领域的一个例子,这句话理解有三种意图,到底是想问花费明细,还是套餐的事情还是想问合约的低保,把这三个问题抛给用户进行澄清就可以了。 从技术上来说是怎么实现的呢,我们看一下这个图,开发者负责把对话流程用流程图清晰描述出来,然后像澄清这种其实是我们系统的一种内置能力,什么时候澄清是通过下端的这两个引擎里面的能力来决定的,第一块是 Error Detection,它用来检测用户当前说的这句话是否需要触发澄清,一旦它觉得要触发澄清,就会交给下一个模块,究竟用什么样的方式澄清以及怎么生成澄清的话术,这是目前我们整个智能澄清这块做的工作。 再看一下我们在增强学习方面的工作。在对话管理模型里面,经典的分成两个模块,一个是 neural belief tracker,用来做对话状态追踪的,另一个是 policy network,用来做行为决策的。在整个框架下,要去训练这个网络的时候,有两种训练方式,一种是端到端的去训练,用增强学习去训练,但这种方式一般它的收敛速度会比较慢,训练出的结果也不好;另外一种方式是先分别做预训练,这个时候用监督学习训练就好了,不用增强学习训练,训练完以后再用增强学习对监督学习预训练的模型进行调优就可以了。 无论是端到端的一步训练还是先预训练再调优,只要涉及增强学习这一块,都需要有一个外部环境,所以在我们的实现架构里面,引入了模拟器的概念,就是user simulator。模拟器这主要分为三大块,一个是 user model,用来模拟人的行为的;第二个是 error model,模拟完人的行为以后经过 error model 引入一个错误扰动,用 user model 产出的只是一个概率为 1 的东西,它对网络训练是不够好的,error model 会对这个结果进行扰动并给他引进几个其他的结果,并且把概率分布进行重新计算一下,这样训练出的模型在扩展能力或者泛化能力上会更好一些;第三个模块是 reward model,用来提供 reward 值。这是我们今天在整个增强学习的对话管理这块的一些工作。 最后看一下函数计算。 函数计算是什么东西呢?还是举一个例子吧,比如说,10086 里面用户说要查一下话费,10086 那边的机器人就会回复一句是发短信还是播放语音,表面看来就是简单的一入一出,其实在这背后要经过多轮的服务查询,才能完成这个结果,因为当要查话费的时候,先要经过函数计算查一下现在是哪一天,如果是下账期的话是不能查话费的,就是每个月的最后一天不能查话费,如果可以查话费的话,先看一下用户是否存在话费,如果存在花费的话第三步调用的服务看是不是停机了,因为停机了的话只能语音播报不能接收短信。所以看一下在一个简单的一入一出的对话背后,是走了一个复杂的流程的,这些流程今天都是在机器端用代码来实现的。函数计算的引入,使对话工厂可以去处理复杂的任务。 业务应用 最后我们看一下对话工厂的业务应用情况。这是我们在浙江上线的 114 移车,当有市民举报违规停车挡路后,就会自动打一个电话让他移车。第二个是在金融领域里面关于贷款催收的例子。在刚刚过去的双十一里面,对话工厂在整个电商里面也有大量应用,主要是在店小蜜和阿里小蜜里面。 店小蜜主要是一些开发票、催发货、改地址这样的流程,这里是一个开发票的例子,用户可能会先说一个开发票,进来以后要进行复杂的流程,一种是在说的时候其实他已经把它的订单号送进来了,如果没有说订单号的话需要去后台系统查订单号,查出来以后弹一个订单选择器选择订单,接下来如果是个人发票就走这个流程,如果是公司发票走另一个流程,接下来会问是普通发票还是增值税发票,如果是普通发票接着往这儿走,如果是增值税发票需要获取企业增值税的税号,最后汇总到一个节点,调用后台开发票的系统,把发票开出来。这是这次双十一里面用到的开发票的一个例子。 阿里小蜜主要是负责阿里巴巴集团内部各个 BU 的业务,手淘是一个最大的业务,进入手机淘宝以后,进入“我的”里面有一个客服小蜜,就是阿里小蜜;上个月我们刚刚在优酷上线了优酷小蜜,星巴克是 9 月份上的,是属于新零售的一个最大的尝试点,还有很多其他的场景。 在钉钉上,通过智能工作助理,对话工厂为千万企业提供智能考勤、智能人事等对话服务。 最后看一下我们整体的落地情况。目前整个对话工厂在阿里巴巴经济体内部各业务(如淘宝、优酷、盒马等)、淘宝天猫上的商家、钉钉千万量级的企业、公有云企业、私有云重点行业(政务行业、运营商行业、金融行业等)、国际化(东南亚新加坡、印尼、越南、泰国、菲律宾、马来西亚等6国)等业务中开始大规模应用,赋能各行各业开发者自主构建对话机器人。 作者:李永彬 本文为阿里云原创内容,未经允许不得转载。 原文章作者:阿里云云栖号,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-14
    最后回复 益玮琪 2020-1-14 20:32
    1307 0
  • 复盘BAT2019投资版图!百度聚焦人工智能,阿里腾讯共同投资21家企业,腾讯优先出手9次
    每经记者:姚亚楠 每经编辑:肖芮冬 在刚刚过去的2019年,创投市场持续降温,PE/VC机构感受到了极大的压力。 而作为投资界的另一股重要力量,曾投出中国新经济领域半壁江山的CVC是否依旧活跃?他们的投资呈现出哪些新特点?每经记者对其头部代表BAT过去一年的投资情况进行了梳理。 (注:以下统计均不包含相关公司的投资,如蚂蚁金服的投资不计入阿里巴巴) 百度:聚焦人工智能,发力内容生态 与2018年的93起投资相比,百度在2019年的投资步伐明显放缓。CVSource投中数据显示,2019全年百度投资数量大幅下降,仅为41起,投资的多数项目处于早期,集中在B轮以前。 数据来源:记者据CVSource投中数据不完全统计,下同 从其投资的标的来看,肩负着为百度占领下一个技术风口的使命,百度投资延续了自身长期以来的技术基因。记者注意到,人工智能是百度2019年投资中依然重金押注的一个领域。在人工智能的底层技术方面,其偏爱投资海外早期技术研发项目,如专注机器人流程自动化的人工智能初创公司Automation Hero,以及2019年4月投资的机器人初创公司Covariant.ai等。 而人工智能对传统行业的赋能和改造是百度2019年投资的重点。过去一年,其所投资的项目大量集中在医疗、金融、工业、农业等有明确落地场景、能够利用人工智能、大数据等技术实现降本增效的领域。 其中,百度在医疗健康领域的投资值得关注——2019年合计投资数量达到8起。2019年3月,百度全资收购医疗人工智能数据服务提供商康夫子健康;9月又14亿大手笔投资东软控股;此外,百度还投资了脑机接口研发企业博睿康、医疗支付和保险解决方案提供商诺惠医疗等企业。从医疗器械到智能医疗,再到产业化布局,2019年可谓是百度重回医疗的一年。 此外,百度在内容生态上的布局也值得关注。2019年,其接连投资了果壳、凯叔讲故事、七猫小说、知乎等头部优质企业。作为信息入口的百度,一方面已拥有由百家号、百度知道、百度百科等产品组成的平台矩阵,另一方面又通过上述一系列投资引入各个垂类的优质内容,其目的或在于构筑内容分发护城河,以期取得内容战场的主导权。 腾讯:押注企业服务,偏爱中后期项目 同样在2019年放缓投资脚步的还有,以买遍天下互联网著称的腾讯。 CVSource投中数据显示,2019年腾讯共有62起投资记录。不同于百度,腾讯的投资不仅范围更为广阔和分散,投资轮次也偏向晚期。 从具体的项目来看,企业服务是腾讯在2019年着重出手的一个领域。 2018年9月,腾讯进行了自成立以来的第三次大规模组织架构调整,成立CSIG云与智慧产业事业群,官宣向产业互联网进军。而这一战略在其投资业务中也有迹可循。据统计,2019年腾讯在企业服务领域的投资共有17起,涉及数据信息服务、IT基础设施、企业安全、营销推广等多个细分赛道。这其中既有偏底层的技术企业,也有纯SaaS企业。 此外,文化传媒、游戏领域因与腾讯主营业务协作紧密,是其历来一直持续加码的领域。 2019年,腾讯在文化传媒领域的投资较为全面,覆盖了动漫、直播、影视、短视频等几个主要赛道,投资数量为8起,代表性案例有知乎、快手、好枫青芸等。公开资料显示,好枫青芸曾打造了火爆全国的女团青春长大综艺节目《创造101》。 值得关注的是,作为全球最大的游戏投资人之一,腾讯2019年在游戏领域的出手却乏善可陈,仅有两笔投资,均为早期项目。这一现象的出现或与资本寒冬、国内文娱行业的退潮等原因相关。 阿里:保持高介入模式,投资分布均衡 2019年阿里投资热情同样低迷。 CVSource投中数据显示,阿里资本去年的投资数量为42起,这一数字创下了五年来新低。从投资轮次的偏好来看,阿里保持了先投资、再并购、最后全资收购的高介入模式。事实上,其投资的多数商业形态最终都成为了阿里的一部分。 从具体的投资项目来看,企业服务也是阿里资本2019年重点布局的一个赛道,共投资9起。 其中,最大的一笔投资是近47亿并购“德殷德润”,而后者是申通快递的股东。物流方面,阿里先后投资了菜鸟网络、申通快递以及交通运输信息化企业千方科技。 在技术方面,其投资了云计算公司谐云科技、九州云腾,主攻半导体芯片的恒玄科技、人工智能企业旷视科技等。 此外,在文化传媒、医疗健康方面,阿里也都保持有较高的关注——入股B站,领投网易云音乐,加持阿里健康和体检机构美年健康、爱康国宾等。与此同时,其在本地生活、零售等领域也均有捕获。整体而言,阿里围绕主营业务进行投资,以巩固竞争护城河,投资领域分布也相对均衡。 在去年9月阿里巴巴的公开活动上,CFO武卫曾对阿里的投资进行总结。她透露,阿里巴巴的战略性投资价值约830亿美元,彼时的阿里已经退出50多个投资项目,实现投资收益180亿元。同时她表示,阿里已经将核心业务利润的三分之一投资到发展物流、全球化、本地服务以及新零售等。阿里不做财务投资,每一笔投资都需要整合到阿里生态,通过投资产生更大的协同效应。 阿里腾讯共同投资21家企业,腾讯优先出手9次 作为创投市场的重要一极,互联网巨头们的扶持与投入撑起了中国新经济领域的半壁江山。尽管不同公司的投资策略、方法各有风格,但随着母公司竞争的加剧,旗下的投资也不断延长交错——从各自的核心业务拓展到社交、网约车、支付等诸多领域,这其中既有旗帜鲜明的对抗,也有同台相逢的联手投资。 而在竞争最激烈的腾讯与阿里之间,每经记者梳理发现,滴滴、哔哩哔哩、美团等21家企业背后均有双方共同投资的身影。 整体来看,二者共同投资的公司主要来自互联网、文娱影视等行业。尤其是在快手、美团、滴滴等明星新经济公司背后,双方均不止一次出手加持。 公开资料显示,腾讯曾4次投资滴滴出行,阿里共注资两次;美团点评背后,腾讯出手3次,阿里投资两次。 另外,双方的联手不止局限于国内,Lyft、Aiming等海外项目背后也均有二者的身影。 记者注意到,不仅止步于先后出资,阿里、腾讯还曾在百望股份、华谊兄弟、微鲸科技等8家公司的投资中,选择同一时间、同一轮次联手进入。而在剩余13家公司的投资中,腾讯9次优先出手。 此外,还有一个有意思的现象是,似乎投资的先后顺序与企业的倾向性并无直接关系。比如,腾讯率先投资的饿了么,最终被纳入阿里版图;而阿里率先加持的美团点评,最终却倒向了腾讯系。 每日经济新闻 原文章作者:每日经济新闻,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-14
    3595 11
  • 全球智能音箱出货量排名:亚马逊第一,阿里第三,苹果第六
    近日,美国研究公司Strategy Analytics近日发布了《2018年第三季度全球智能音箱市场报告》!报告显示:全球智能音箱出货量第三季度达到2270万,同比增长197% 。 以下是2018年Q3的全球音箱市场占有率排名: ? ① 亚马逊 720万台,市场占有率31.6% ② 谷歌 520万台,市场占有率22.7% ③ 阿里 220万台,市场占有率9.5% ④ 百度 190万台,市场占有率8.4% ⑤ 小米 190万台,市场占有率8.4% ⑥ 苹果 110万台,市场占有率4.8% 大家觉得如何呢?欢迎大家的积极留言!也欢迎你关注头条君【科技小浪】(微博【科技小海】)哦,小编每天会第一时间为你带来更多精彩、及时的手机数码资讯。 原文章作者:科技小浪,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-14
    最后回复 严蒙雨 2020-1-14 18:44
    3502 0
  • 阿里 AI——智能互动设备的探索设计
    5号小蜜:智能互动设备的初期准备 在如今智能硬件设备,语音互动的大趋势下,我们针对实体智能互动的硬件,从想法 – 设备 – 技术 – 设计 – 场景,总结沉淀了部分探索经验。 首先交代一下背景: 在阿里小蜜语音助手的形态下,延伸出了很多智能相关的研究和探索,其中智能硬件也是我们想要去发展的一部分。在这种情况下,以“5号小蜜”为名称的智能互动硬件设备应势而生。 (名称解释:在决定做这个产品的初期,是以落地到公司的5号行政楼为场景的前提下进行的设想,所以叫“5号小蜜”)。 在有了这个想法后,5号小蜜进行了1.0版本的研究和设计,在项目初期我们的承载硬件主要是以55寸,比例为16:9的液晶屏幕为主,用机器人的虚拟形象进行语音的互动,其中的场景设定也是在访客进入到5号行政楼进行互动的能力。 智能互动设备的框架拆解 在有了初步的进展之后,我们以设计师的视角总结了智能互动类设备的基础框架,为我们之后的升级和完善进行了整体的方向指导。 首先智能互动设备的核心支撑能力一定是算法的能力,而当前市面上的智能硬件大多数是以语音助理的形态出现的,因此对于设计师来说,VUI是重要的一环,5号小蜜不单单是语音的交互,也是视觉上的交互。因此在感知层面的设计上来说,是“VUI+GUI”也就是听觉和视觉的互动(但在硬件多样发展的今天,触觉类也应该是要考虑到感知层面的一部分)。 VUI+GUI对比传统语音交互会有一些优势体现:在互动方面,语音可以理解为面,单一面传递信息是有限的,如果语音和界面结合起来,就是从两个单一面形成了空间,可以承载更多的信息。 举个例子:人与人在交流中不止是语言传递的互动,可以从面部表情、传递出喜怒哀乐;肢体语言传递出兴奋度和性格特质。综合起来,我们的交流才会更顺畅。 在物理层面而言,是硬件设备的选择:液晶屏幕、玻璃屏幕(透明、非透明)、全息投影等。 在初期,我们的选择是液晶屏幕,这个是最基础的承载硬件,也是成本最低的硬件。而其它选择的硬件也有优劣之分,透明玻璃屏适合导购的场景,背后是否有商品的出现,是从传统的触觉互动进行了更多承载信息的进化。非透明玻璃屏适合更沉浸的助理场景,全息投影会更接近真人的感受,也是智能感受最强的一类,每一种硬件方式都有适合的场景,这个是我们需要去权衡的。 在以设计师的身份参与过程中,我们更多的是以设计的视角和硬件、场景、技术等进行搭配合作,所以在过程中,会参考多方面的因素,影响最后落地的结果。 感知层面的设计策略:视觉层 在2.0初期,我们先整理了最直接的感官层的一部分——视觉感受,以此为基础为产品定调,以最直接的表现层为手段帮助产品建立视觉体系。 首先我们内部脑暴统一同步了本次升级的目标:让小蜜更智能,更有服务感。一个是本身我们在做的事情就是智能相关的研究,另外在落地的场景访客中心承载的也是服务的属性,所以在设计方面就抓取了两个心智方向的关键词:智能、服务。 在关键词的引导下,先建立情绪版,整合出表现层的特性。 抽出智能感受类的关键词,可以是抽象或者具象的描述。 接着整理出服务相关的视觉属性。 根据关键词的延展,得到了视觉语言的方向,但是在推导中我们发现智能和服务有些画面更像是互补色之间的关系,有一定的对立面,所以要从中调和每个关键词在界面中的占比。同时要考虑是不是有减少两者冲突的办法,所以在多次尝试后决定将1.0版本中的机器形象换成真人。 首先在行政楼场景中,真人会带来更多的亲切感,与服务场景更契合; 其次界面关键词的分配方面也会有考量,在氛围中我们更希望带来智能感受、在对话中我们更希望是亲切的服务感,因此真人的形象出现是一个比较合适的策略。 而且服务的视觉概念也从我们常常感知到的二维变成了多维的角度,从单一的界面变成了人设、服装、肢体语言、面部表情等多方结合的综合体。因此这两个关键词延展出来的部分就有了各自的分工:智能感更多的体现在界面氛围上;服务感更多体现在人物上,两者结合的会更加润滑。 下图是关键词占比的界面尝试过程灰机稿。 在尝试过程中,画面一步步清晰了起来,智能+服务也能更多体现出来,最终通过提炼过程中的视觉语言,形成了最终的画面。 在整体视觉感受设计的同时,人物的视觉点也在同步进行,我们对人物进行了性别、着装、动作、面部表情的设定,整体目标以之前服务感中总结出的友善、轻松为关键词。 最终画面(其中一款服装是考虑之后场景的拓展性,整个以智能感受为主)。 感知层面的设计策略:听觉层 在描述完视觉设定后,来看一下听觉的方面,也就是语音的互动。 首先,语音互动的核心能力还是在算法上面,因此语音交互也是和技术能力相辅相成,5号小蜜的技术手段也比较丰富,主要是以下几种:ASR、TTS、QA、面部跟踪、面部重塑面部跟踪渲染等AI技术模块。理论上只要获得充足的人物视频+语音数据,技术可模拟任意指定人物。数据越多,面部和语音的还原度越逼真。 其中,为获取原始数据,需要进行数据的采集,主要是在采集室里对语音、图像进行收录,大致技术的流程如下所示: 在这些技术背景下,语音的互动更多的是考虑如何在与真人的对话中,体验更加顺畅。 下图为核心的Flow: 在小蜜与用户交流的部分做了标记,也是语音交互的核心内容区。为了方便整个流程连贯起来,还是从最初的部分开始,讲述一个完整的剧本。 用户从行政楼走进,一般会有几种意图:开会(查找会议室)、来访(了解阿里文化等)、参观(闲聊)根据这些场景我们进行了两个关键节点的设定:吸引、交流。由于结束对话属于弱互动,所以暂不列入重点。 以上为语音互动的核心部分,其余还有用户结束对话的声音动作反馈——“再见”+挥手等;未知问题的回复处理——进行多种兜底话术的配置;中途离场的用户——小蜜15S内回复初始状态等。 物理层面策略:硬件、场景 在考虑界面语音互动的同时,也要考虑硬件方面待给体验的影响,比如设备的主要构成,MIC、音响、支架、外观显示器等主要硬件。 MIC的技术手段是单轨拾音,因此需要保证在有效距离内收音(机器前会张贴最佳距离的脚印贴纸,以保证对话收音)。显示器会制作可调整的15°角倾斜,考虑反光、身高视角等情况。机器总高度控制在1.8M,用户眼睛与小蜜眼睛保持平视,最佳观看高度在1.7M左右的平均值,以覆盖大部分用户的使用感受。 (年会亮相图) 下图为整个硬件的构成部分以及运作传输图。 在硬件组装完毕后,会进行收音的测试,在实际使用场景 – 公共环境(嘈杂环境)下用录音(ASR识别)的方式来收集不同位置的收音状况(保证同等条件下,比如分贝相同)来收集数据,最后判定这个MIC的硬件是不是最合适的。 经过综合多方位设计后,设备才能见到雏形,本身智能互动领域就是多维度的综合体,设计师参与在其中也会从单一的视觉、交互维度去向更全面的维度思考,使每一个环节串联起来,打造更好的UX体验。 最后的思考 从这次的项目来看,我们在做事情的初期就需要有一个完整的目标定义,Lot设备的应用场景考量等等,这次综合升级只是考虑了单一的行政场景,解决的是咨询类的问题,因此设计的链路也是单一且浅薄的。但是产品的发展一定是要向商业化迈步的,比如:热门的导购场景,与淘系新零售的战役契合,结合淘宝生态配合多种垂直行业,机器人作为智能客服出现在售前、售中、售后的服务等等。 设计也需要在每个场景中分别做出判断,行业通用的部分沉淀,以及行业特性的个性化设计思考,都是需要不断的去尝试和打磨的。而智能互动设备作为一种趋势,也是设计师去发挥所长的沃土。 本文由 @喵了个汪 原创发布于人人都是产品经理。未经许可,禁止转载 题图来自 Pixabay,基于 CC0 协议 原文章作者:人人都是产品经理,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-14
    最后回复 票麒褊 2020-1-14 18:05
    2766 0
  • 新加坡未来社区、阿里智能房产,你将住上这种高级的房子
    比起2017年的高歌猛进和2018年的前扬后抑,2019年的杭州楼市多了一分笃定。 这一年,市场预期被控制在一个相对合理的区间;这一年,大专生落户放开、限价不放松等等利好和利空交替出现;这一年,就是在你悲观的时候给你未来的希望,在你乐观的时候让你冷静思考。 现在,我们站在新一年的起点,迎来的是新的挑战、新的困难,同时也必定迎来新的机会、新的收获。 2019年9月,全媒体地产中心自主研发了“i购房宝”小程序,上线以来,pv用户迅速突破500万。 今天,i购房宝小程序2.0版本也正式上线,我们将依托自身平台千万级用户大流量,实现点对点引流,第一时间将精准用户推荐给合作楼盘的专属置业顾问,打造一个线上引流与线下锁客的服务新平台。 “2020,向新而行”,1月7日,由钱江晚报全媒体地产中心主办的2019中国(杭州)房地产峰会暨第16届房地产风云榜颁奖典礼在今天下午圆满落幕。 新的一年,让我们一起携手前行,不负初心! 制作:小时视频 1 向新而行,总结旧经验,提出新想法 听听嘉宾怎么说 2020,向新而行。是放下以往的包袱,重新上路;是调整步态,再一次审视你前方的道路。 今天,我们特别邀请了三位在各自不同领域都拥有着傲人成就的演讲嘉宾,跟大家分享其他行业正在发生的变化以及他们自身所作出的应对。 七彩文化科技集团副总裁、七彩文旅控股公司副总裁 杨攀: “未来社区-从新加坡经验到浙江实践” 2019年1月,在省两会上,未来社区作为标志性民生工程被首次写入政府报告。浙江有望继特色小镇之后再造中国经济社会转型样本。2019年6月27日,浙江省首批24个未来社区试点创建项目名单公布。 什么是未来社区?这或许是一次城市经营变革,也是一次生活方式升级,更是一次数字创业转型。今天,七彩文化科技集团副总裁、七彩文旅控股公司副总裁杨攀为我们详细介绍了全省首个已经落地的未来社区样本。 这个未来社区就是瓜沥七彩社区,未来萧山瓜沥镇核心。从2013年携手新加坡企业发局,已在2018年实现一期交付运营。 2019年8月22日,央企名企走进“四大建设”未来社区推进大会上,袁家军省长指出在未来社区建设中向新加坡先进经验学习借鉴,点赞萧山瓜沥七彩社区率先借鉴新加坡模式,充分运用新加坡TOD社区模式建设理念,建成符合中国老百姓生活习惯的“新城镇文化生活综合体”,预计受益居民1.3万人以上。 阿里云智能IOT智能地产业务总经理 邢超: “智能地产” “在过去20年的互联网主要实现了‘人联网’做信息化,而未来20年的互联网是‘物联网’为主,去实现空间在线,主要做数字化。”一开场,阿里云智能IOT智能地产业务总经理邢超便总结并预测了过去20年和未来20年互联网发展趋势。 他也提出杭州争做数字第一城,其中数字地产是关键的一环。 目前,地产“智能+”发展趋势已经从单系统联网发展至多设备互联互通的阶段,并继续朝着空间智能方向发展。邢超结合阿里云AIoT智能地产物联网平台,分别对全屋智能、智慧社区、智能办公楼宇以及园区进行了详细的举例分析。 他认为,地产的平台化与智能化的建设主要为了实现服务运营化、空间智能化以及场景运营化三个目标,从而使业主享受到的服务更加精准,生活场景更加联动,服务入口更加便捷。 蓝城集团副总裁 蓝城乐居集团总裁 裘黎明: “造五星级的保障房” “住房是安居之本、民生之要、社会稳定之基。在住房制度改革不断深化过程中,加快推进保障房建设,解决中低收入群体的住房问题,实现全体人民住有所居,是各地普遍面临的重要现实课题。”蓝城集团副总裁、蓝城乐居集团总裁裘黎明在演讲的最开始如是说道。 最美保障房在杭州的频频出现,源于近年来杭州市积极推动政府投资项目的建设改革,在全国率先探索保障房全过程代建开发模式,确保保障房建设速度和品质同步提升,把民生工程切实建成民心工程、阳光工程、廉政工程、优质工程。 而在这其中,作为专业从事政府投资项目代建管理服务的蓝城乐居集团,率先响应政府号召,承接保障房全过程代建开发业务,应运蓝、绿城多年房地产开发经验与全产业链资源,营造“五星级”的保障房,让原住民感受到高品质的居住体验,实现了百姓、政府、社会和企业多赢局面。 2 2019中国(杭州)房地产峰会 暨第16届房地产风云榜颁奖典礼 已经过去的2019年,是杭州楼市从2019年下半年的谷底逐渐回温的过程。 这一年里,有的房企创造了多个“万人摇”,成为了市场的佼佼者;有的房企在交付大考中经受住市场的考验,建立起令购房者信赖的大品牌;在这之中,还有不少行业领袖从中脱颖而出…… 我们地产风云榜到今天已经是第十六届了,在这十六年当中,我们见证了数百个杭州房产楼盘的高光时刻,见证过数百个行业翘楚的叱咤风云,也见证了众多新品牌的锋芒毕露,老品牌的欣欣向荣。 那么,过去的这一年中,杭州房地产市场究竟有哪些人,哪些楼盘,哪些品牌房企做出了特殊的贡献,交出了满意的答卷呢? 今天,在2019中国(杭州)房地产峰会暨第16届地产风云榜颁奖典礼上,我们颁发了2019中国(杭州)年度地产风云人物、2019中国(杭州)年度品牌房企、2019中国(杭州)年度风云楼盘、2019中国值得尊敬的地产品牌企业、2019中国城市新地标、2019中国美好生活典范楼盘、2019中国(杭州)最具社会责任感地产人物等奖项。 原文章作者:钱江晚报杭州房产,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-14
    最后回复 牵嫣 2020-1-14 17:57
    2692 0
  • 阿里前总参谋长曾鸣:智能战略的六大超越丨21读书
    每周一本书 让阅读,丰满人生 在互联网环境下,企业未来的发展方向是智能商业。智能商业的概念已经被广泛接受,可是,绝大部分人依然没有意识到智能商业所带来的变化是全面和根本性的。战略和组织都必须建构在新的原则上,才能迎接这样的商业大变革。 那么,智能战略到底和传统的战略有哪些不同? 21读书 来源丨本文内容综合选自《智能战略》 编辑丨陈思;实习生 思纯 图片来源丨图虫创意 智能战略的第一项原则:利用机器学习和数据智能,将尽可能多的运营决策自动化、智能化。 题记 1 运营模式的重构 从人工决策到机器决策 任何商业要转变为智能商业,一个根本的变化是,运营决策必须由机器取代人直接进行。 这就是智能战略的第一项原则: 利用机器学习和数据智能,将尽可能多的运营决策自动化、智能化。 要实现运营智能化,就需要通过5个步骤对企业的整个运营模式进行全面重构。 第一,尽可能地把物理世界数字化,这往往需要通过创新的物联网产品实现。 例如,智能锁使得单车的远程租赁成为可能,才有共享单车服务的创新。 第二,要将业务软件化,即把核心业务流程软件化、在线化。 例如,淘宝把零售在线化,滴滴出行把打车在线化。 第三,尽可能让数据在机器间自动交互,而不通过人的干预,即利用应用程序接口支持机器间的实时协同。 例如,淘宝平台上海量商家的协同,物流信息的流转,都不是通过人,而是通过调用应用程序接口实现的。 机器协同的效率往往比人的协同效率可以有极大的提升。 第四,完整实时地记录活数据。 例如,今日头条对于读者所有浏览数据的记录。 第五,通过机器学习对所生成的丰富的实时数据进行处理,从而创建数据智能,完成机器的自动化,进行智能决策。 这是所有成功的互联网公司的基础,也将成为智能商业时代所有公司运营的基础。 2 商业模式的重构 从B2C到C2B 由于互联网技术的大发展,企业可以用较低的成本建立起和海量客户的持续互动,获取客户反馈,并在此基础上,通过不断的运营来优化、迭代对客户的服务。 没有这样一个和客户直接互动的界面,就没有实时的客户反馈,所谓的数据智能就无法运转起来,也就不可能建立智能商业。 运营的智能化就是建立在这样一个反馈闭环上。这种以客户为中心的商业模式就是C2B。 C2B和传统的B2C模式并不仅仅是字母顺序的颠倒,它蕴含着对整个商业逻辑的根本性颠覆,也是商业合作从传统的封闭供应链管理走向开放的网络协同的发展。 客户第一是工业时代的最高追求,但是在智能商业的时代,以客户为中心是运营的起点,是任何企业的立身之本,是生死存亡的分水岭。 C2B 模式的核心价值是提供以客户为中心的个性化服务。 个性化需要越高,网络化协同程度越高。 C2B是互联网时代的商业范式革命。 当然,C2B是整体的原则,它在实践中是逐步实现的;同时,也会由于场景的不同呈现出不同的变化,例如S2b2c(大供货商对企业对消费者)或者c2S2b(客户对大供货商对企业)等创新模式。 3 竞争优势的升级 从网络效应到协同效应 过去200年的工业时代,企业竞争优势的来源是规模效应; 过去20年的互联网时代,竞争优势的来源是网络效应; 而未来的智能商业时代,竞争优势的来源是协同效应。 相对于工业时代封闭的线性供应链管理体系,网络化协同是互联网时代的创新合作机制,可以做到实时、动态的全局优化,可以实现个性化、低成本、高速等多维度的全新价值组合。 这种协同机制所创造的新型竞争优势,就是“协同效应”。 “网络效应”,是最简单的二维协同效应,比如滴滴出行协同了乘客和司机这两个角色,它具有网络效应;而淘宝由于协同了卖家、买家、物流商、供货商和各种外包服务商的多元角色,所以创造了强大的协同效应。 4 战略定位的重构 从市场定位到点、线、面、体的网络定位 定位是战略最核心的概念,但由于网络协同对于供应链管理的超越,所以这个概念也需要进行全面重构,可以具象为在点、线、面中的新定位选择。 这个定位选择之所以重要,是因为整个经济正在快速向智能生态的方向演化,而一个企业在这样的生态系统中的定位,直接决定了它的发展轨迹。 在新型的智能生态中,有点、线、面三种核心角色,从而有三种战略定位可选。 “面”是平台。 平台通过广泛连接不同的角色,使之合作协同,同时建立各种机制,促使全局利益优化。 淘宝是典型的“面”。“面”的立身之本并非单一产品或服务的研发能力,其核心价值是协同效应。 “线”是平台上的众多商家。 一条“线”的战略,就是利用“面”的各种基础服务和能力,以较轻资产的方式快速发展。 也就是说,一是充分利用“面”的网络效应; 二是尽量利用“面”上的资源和能力,而不是自己花费巨大精力和成本重复建设; 三是要善于整合“点”带来的机会。 “点”是各种多元服务的参与者。 “面”的崛起,必然催生新的“点”。 例如淘宝这个“面”上不断涌出的新角色,从在线客服,到淘宝讲师、平面模特,再到店面装修工具商和现在的各种数据服务商,这些“点”利用了“面”提供的巨大规模和网络优势,可以快速长大,但他们同时也帮助了“线”的快速扩张。 5 战略体系的重构 从长期规划到vision和action 之间的持续迭代和优化 在智能商业时代,战略制定和执行的体系也需要重构。由于环境变化太快,传统的5年、10年的详细战略规划不再有效。 基于这种长期思考形成的对未来变化的某种判断,就是我们常说的vision(远见)。 远见显示了你对未来最有可能发生的产业终局的一种判断。 这个判断是你的一个假设,这个假设要不断地被实践验证和挑战,然后不断地纠正。这个实践就是快速的action(行动)。 但这种行动不是盲目的行动,它们是在远见指导下的尝试,目的是看这个行动是否是正确的方向。 如果是,就要加大投入的力度; 如果不是,就要调整或放弃。 这是一个持续实验和动态调整的过程,远见越来越清晰,行动的方向越来越清楚,战略也越来越明确。 6 组织原则的重构 从管理到赋能 管理的目的是让员工按公司要求工作。但在创造力革命的时代,员工最主要的驱动力来自创造带来的成就感和社会价值,自我激励是他们的典型特征。 他们最需要的不是来自外部的物质和精神激励,而是赋能,也就是为他们提供能更高效创造的环境和工具。 赋能比激励更依赖于企业文化,只有企业文化才能让志同道合的人走到一起。 组织再也不能用传统的方法去考核与激励创造者,公司的文化氛围对他们而言就是一种无形的奖励,即和志同道合的人一起共同创造出足以改变世界的产品,想想都是一件令人无比兴奋的事情,因而组织的核心职能将演变成文化和价值观的营造。 在工业革命时代,共同的使命、愿景和价值观只是最优秀企业的奢侈追求; 而在创造力革命时代,志同道合是对赋能型企业的基本要求。 赠书福利 《智能商业》探讨了未来的商业模式,即网络协同和数据智能共同构成了新商业生态系统的DNA。在《智能战略》中,曾鸣教授更进一步,讨论了数据和网络如何重塑商业战略,并提供了如何组织企业、创造价值以及打造竞争优势的新思路和可行方法。阿里巴巴作为智能商业的引领企业,它的成功初步验证了智能战略在互联网时代的重要性。曾鸣教授基于对淘宝、支付宝、阿里云计算、菜鸟等公司的战略探索与实战经验,在《智能战略》中详解了阿里巴巴独特的商业演化路径,并提出全新的战略框架和组织原则。 智能战略到底和传统的战略有哪些不同?通过对阿里巴巴集团发展历史的深入研究,以及对众多创新企业的对比研究,本书提出了智能战略对于传统战略在6个方面的超越: ? 运营模式的重构:从人工决策到机器决策。 ? 商业模式的重构:从B2C到C2B。 ? 竞争优势的升级:从网络效应到协同效应。 ? 战略定位的重构:从市场定位到点、线、面、体的网络定位。 ? 战略体系的重构:从长期规划到vision和action之间的持续迭代和优化。 ? 组织原则的重构:从管理到赋能。 《智能战略》 作者:曾鸣 出版社:中信出版集团 现在,21君给大家谋福利啦,免费送书! 如何获得? 在本期周末读书下面留言,获得点赞数前2名(点赞数需不少于50)的读者将获得赠书一本,同时,21君会在前二名以外挑选部分留言走心的读者,也免费赠送《智能战略》一本。 为了给读者提供更多的机会,每四期连续赠书的活动中,同一读者只能获奖1次(同一微信ID、手机号、地址均视为同一读者) 我们将在明晚的夜读中公布获奖名单哟~获得赠书的小伙伴记得按照时间留下你的地址,逾时不候喔~(所以点赞前2的截止时间是11月10日20:00-21:00之间哟~注:准确的时间以21君的截图为准;如遇突发新闻也有可能提前截图。) 21君 小伙伴们,对于文中提到的“智能战略的六大超越”,你怎么看? 和我们聊聊你的看法吧~ 原文章作者:21世纪经济报道,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-14
    最后回复 觐橄件 2020-1-14 17:22
    2881 1
  • 从汽修工到人工智能训练师:让一个普通人看见生活的希望
    三十而立。2020年第一批90后也正式迈入30岁。开始成为一个家庭的顶梁柱。90后郭成斋原先是一名动车维修工,因为技术革新被裁员下岗失业,机缘巧合下进入电商行业,并成为了一名人工智能训练师,没有想到这个行业给他的生活带来了翻天覆地的变化。 以下为郭成斋本人自述: “如果当时我没有走出来,可能就没有现在的我。人有时候是需要对自己狠一点的。” 郭成斋说这句话时目光坚定。作为第一批刚满30岁的90后,郭成斋的身上有种超越同龄人的老练。毕业十多年,他从一个汽修工,到下岗,到老婆剖腹产时拿不出8千元的窘迫。幸运地是,他抓住了机会成为了一名人工智能训练师,还去阿里巴巴参加了由阿里CCO举办的线下培训和人工智能训练师峰会。 被裁员后,他达到了另一个巅峰。 然而,任何一个小命运的沉浮背后,都有一个时代大背景的演绎。 郭成斋的逆袭,是他所从事的这个新职业“人工智能训练师”从零开始发展的大背景。巧合的是,人社部在近期的《关于拟发布新职业信息公示的通告》也显示:包括人工智能训练师在内的16个新职业已评审论证,进入公示阶段。这个新职业,在阿里生态内已有20万人。 我下岗了 你别觉得大专学历不高,在菏泽能上大专也很不容易的。我父母一直觉得有学历、有技术,就不怕被社会淘汰。这样的观念也深深植入在我脑海,高中毕业时我毫不犹豫选择汽修专业,技能型专业。 2013年,我如愿被分配到了一家动车维修厂,虽然离家远,但工作环境干净,收入也不低。23岁的我对这份工作很满意。 郭成斋前工作单位动车维修厂 那年我还认识了一个山东冬枣的姑娘。半年后领证结婚,没几个月,我爱人怀孕了。那时候的我像站到了人生巅峰,成家立业,幸福稳定,未来一片光明。 但没想到幸福生活并未持续很久,我接到了一个晴天霹雳般的消息——有天,车间主任把我拉到办公室说,公司效益不好,为了维持成本,公司要裁员,而我正好在裁员名单之中。 车间主任的语气那么稀松平常,我却像被雷劈中般,愣在现场。脑海想的都是,该如何和怀孕三个月的老婆解释。 我忘了那天是怎么走回家,怎么假装没事人似的和老婆说晚安。连续几天,我像往常一样正常上班,在街上无所事事地晃悠一整天,等下班时间再回家。 郭成斋下岗后,在街头晃悠 我害怕接触到老婆的眼睛,害怕她的关心。正好,当时老婆的爷爷去世,家乡习俗里有身孕的女性不能参加白事,于是我赶紧抓住这个机会,把老婆送回老家养胎,自己替老婆参加了她爷爷的丧礼。 经过内心反复挣扎,最终在送老婆回家前一晚,我还是下定决心和她坦白。没想老婆早就从其他同事那里知道,她说,相比你被裁员,我更加难过的是你的才华没被发现,你不能实现自己的抱负。我内心的提防在这一刻崩溃。看着泪流满面的我,老婆坚定地说,“我老公是世界上最棒的老公。” 丧礼结束后,我径直回了菏泽老家,准备迎接第一个孩子出生。我在老家找了份汽车维修工作,每个工资2000元。老婆产子不顺利,医生建议破腹产,要8000元。我翻遍所有银行卡却凑不齐这8000元,关键时刻,我妈默默地递过来一叠钱,她拍拍我的手,什么都没说。 拿着钱,我无言。身为一个男子汉,父母供我吃住上学娶媳妇,我却连自己孩子出生的钱也没有,以后我该如何面对自己的孩子? 我给孩子取名叫“家悦”,希望能一家人能过上愉悦的生活。我把内心最深处的期待,藏到了孩子的姓名里。但我自己却没能做到,在孩子出生不到4个月,我就离开家乡去上海找工作。 离开那天,家悦发烧了。老婆问我能不能不走,孩子这么小,还发着高烧,怎么忍心抛下她们娘俩离开。我说,为了你和家悦,我不能不走。2000块的工资,无法养活你们。我挂了电话,怕再多听一句,就忍不住下车回家。 从仓库打包员 重新开始 到达上海后,我在同学家寄宿了两周。每天都在轮番面试,但命运依旧没有垂青我。 被逼无奈下,我买了回青岛火车票,去碰碰运气。回青岛的那天正好是双十一,火车上的人都在讨论抢什么商品最划算,我攥着火车票,盘算着身上还有多少钱,还够撑几天。 但临近年关,青岛的工作也并不好找,屡次碰壁后,在公交站台瞟到了一则招聘仓管员的通知。 这是家出售韩国食品电商公司。年货节即将来临,他们临时招聘大量仓库打包员。就这样,我成了一名打包员,非常忙,一天行走步数可有5万步,相当于走了30公里。 郭成斋成为一名打包员 年货节火爆,不仅缺打包员,也缺客服。于是,我被临时拉过去当客服。基于之前对商品的了解,我当起客服来游刃有余。半个月下来,我的业绩排名第二,主管当着所有人的面表扬我,并把我调到了客服团队。 就这样,我留了下来,从临时工变为正式员工,从仓库打包员变成客服。原本只想挣点钱回家过年,没想到人生的轨道竟在这改变。有了之前的经历,我格外珍惜这份工作。 为了多挣点钱,我选择上中班,从中午12点到晚上12点。早上9点起来,还能到仓库打包3个小时,额外挣点钱。同事都说我想挣钱想疯了,没有穷过,又怎么会知道钱的重要性呢? 最高的时候,我一个月做了40多万业绩。那个月,我工资过万。从来没有想过,有一天,我也成为了月薪过万的人。 命运垂青勤奋的人 过完年,我把老婆也接到了青岛,并找了一份打单员的工作给她。 小日子有条不紊地进行着。一转眼,我在售前客服这个岗位工作满两年了,从一名普通售前客服升为客服主管。虽然升职快,但我很清楚,人要有保持危机感,如果放弃了学习和前进,随时都有可能被社会淘汰. 我仍旧保持着每天都加班的工作节奏。为了保持业绩,能秒回用户的每一个问题,我下班越来越晚,陪伴妻子的时间也越来越少,孩子又在老家。看不到我又看不到孩子,她非常孤独,有很多次背着我偷偷抹眼泪。 2017年双11前,一次偶然的机会,我在千牛上看到了店小蜜。说可以帮助减轻客服压力。抱着试一试的想法,我用起了店小蜜。私心想,这样或许可以早点下班陪老婆。 成为人工智能训练师的郭成斋 用店小蜜越多,越发能感受到技术的力量。简单重复的问题店小蜜都回复了,人工客服就没这么大压力。虽然双11大促依旧很忙,但至少有了踹口气喝水的时间。 2017年双11,我拿到了店小蜜行业类目优秀奖,公司额外奖励了我一笔钱。拿着这笔钱,我带妻子去海边吃了一顿海鲜。来青岛这么多年,这是我第一次带她去看海。 2018年4月份,我还接到了阿里巴巴CCO的邀请,参加店小蜜培训。我第一次知道人工智能训练师这个岗位。 这次培训对我影响特别大。阿里的人工智能训练师专家说,现在全社会各行各业都在尝试AI落地,人工智能训练师一定会成为未来企业必备的一个岗位。 人工智能训练师除了线下培训完还有线上认证,有清晰的工作目标和工作模型。也是这次培训我才知道,这个职业兴起于2015年,最早由阿里巴巴集团客户体验事业群(CCO)孵化了国内第一批人工智能训练师。我也算赶上了潮流。 人工智能训练师课程页面 在人工智能训练师这条路上,我并不孤独。我们有一个群,有来自全国各地各行各业人工智能训练师。我们时常在群里交流店小蜜相关的问题。有群友笑称这个群像养娃群,一边交流教育心得,一边暗暗较着劲,怎么他家娃转化率比我家高呢?不行,不能输。 2019年双11,我们家“娃”很争气,拿到了智能服务店铺的“银蜂奖”。 人工智能训练师这个岗位,短短四年间,从业者已经超过20万了。我特别庆幸自己是其中的一员。 其实,我是一个很普通的人,也不觉得自己有多厉害。不过,我已经提前感受过了技术革新带来的淘汰浪潮,幸运的是,我抓住了互联网新职业的浪潮。不知道在下一个淘汰浪潮什么时候到来,但我一定不再胆怯。 2020年,我准备在青岛安个家,把大女儿接来这里上小学。我们一家四口,还有我老婆肚子里未出生的小生命,一起再去看海。 原文章作者:你们的阿里客服,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-14
    最后回复 崎溜 2020-1-14 17:20
    1301 0
  • 阿里智能云营收增长几近“停滞”的背后
    2019年8月15日,阿里巴巴发布了截至2019年6月30日的2020财年第一季度财报。财报显示,来自云计算业务的营收为人民币77.87亿元。与2019财年第四财季营收(人民币77.26亿元)相比,增速几近停滞。 阿里云“失速” 据阿里此前财报显示,到2018财年第三季度为止,阿里云的营收保持了长达11个季度规模翻番的高速增长。 阿里云快速增加的营收也使其在成为阿里巴巴集团内部最重要的业务。2018年11,阿里巴巴集团CEO张勇发出全员公开信,宣布阿里最新一次面向未来的组织升级:阿里云升级阿里云智能。加强技术、智能互联网的投入和建设。升级之后,阿里云事业群升级为阿里云智能事业群。 原本以为,阿里云升级为阿里云智能事业群之后能继续实现高速增长。然而时间进入2019财年后,阿里云智能的营收翻番的增长趋势并未能继续保持。 据阿里巴巴集团2019年5月公布的2019财年第四季度财报及2019财年业绩数据显示,阿里云计算业务的营收同比增长为84%。按照自然季度统计,三季度阿里云增速为90%,二季度增速为93%。这个增长速度从绝对值来看依然不错,但与此前的11个季度营收规模翻番相比,阿里云营收增速放缓已经成了不争的事实。 而且,阿里云不仅营收增长几近停止,其市场份额也呈下降趋势。据IDC最新(8月2日)发布报告显示,当前,国内云计算市场阿里、腾讯、中国电信、亚马逊(AWS)、百度和华为占据了80.2%的市场份额,市场集中度进一步提升。其中阿里云市场份额占比为43%,比去年同期微降0.3%。 阿里云“失速”的背后 玺哥认为,阿里云营收增速之所以出现下滑,一是因为其国际化进程并不顺利,二是其国内竞争对手开始“觉醒”。 阿里云是国际化较早的云计算厂商。早在2009年,阿里云就开始向海外进军,到2016年,阿里云已在海外保有56个可用区,在欧洲、澳大利亚、中东、日本等全球19个地区开展云计算服务。2018年10月,阿里云英国大区开服,成为第一个将云计算基础设施覆盖到全球五个主要市场的中国厂商。 可以说,为了开拓国际市场,阿里云投入了巨量的资源。不过,阿里云虽然投入了众多资源,其国际化征程并不顺畅。以北美市场为例,阿里云当初建设北美数据中心的初衷是为了和AWS、微软、谷歌等对手争夺本地市场。不过目前来看,阿里云在北美市场的战略构想尚未实现,并有可能进行调整。据外媒TheInformation已经透露,阿里云正在改变其原定的市场策略,转向为那些与中国有业务往来的跨国公司提供服务。这等于变相地承认在北美市场遇挫,不得不回头依靠中国市场的优势,争夺在华服务项目。 显然,在欧美地区开拓本地市场,依旧需要客服许多障碍。在这方面取得突破之前,阿里云还只能算是一个地区性云计算厂商。 国际市场不顺的阿里云,在国内市场还面临腾讯云、百度云、华为云等厂商的激烈竞争。当前的国内运市场,已由原本阿里云一家独大的局面,变为了“群雄并起”的新格局。 阿里云在国内的对手中,腾讯云尤其值得关注。腾讯自去年率先提出产业互联网战略后,在腾讯云业务上进行了资源倾斜,进展很快。除了腾讯云外,华为云是阿里云的另一个强劲对手。华为在通讯技术、芯片、数据中心方面的技术优势明显,过去一年中,华为云的市场份额增长了33倍,并迅速跻身市场份额排行前五名之列。另外,百度智能云、中国电信等也在持续加大云计算领域的投入。 未来,阿里云在国内市场将不得不直面“红海”般的市场竞争。 阿里云营收增速、市场份额或继续下跌 玺哥认为,虽然阿里云目前依旧是国内云市场当之无愧的第一,但在复杂的竞争环境下,阿里云如果不做好自身调整的话,其营收增速、市场份额都有继续下跌的可能。 2019年3月,阿里云智能事业部总裁张建锋(行癫)在2019年阿里云峰会上提出了“被集成”思路,并发布了“阿里巴巴小程序繁星计划”。 张建锋提出“被集成”思路的原因,是希望阿里云改变以往的运营思路,不再“冲向第一线”、而是依托自身核心技术优势赋能合作伙伴,让他们去做具体的SaaS产品,并通过他们将阿里巴巴的技术、商业能力与用户连接起来。新计划则是为围绕“被集成”思路而制定的战术计划。 目前来看,张建锋对阿里云智能运营思路的调整尚未执行到位。 玺哥为,在当前复杂的市场环境下,新运营思路的调整是需要时间去适应的。不过这个时间也不能太长,太长的话还会影响下一季度的营收。 上文有说阿里云在国际化进程并不顺利。目前来看,这种不顺利在未来一段时间内还将持续。随着中美两国之间贸易争端在走向白热化,在美国各种不合理打压措施下,中国科技企业出海,将不得不面临更多的限制,而在美国的“示范效应”下,不少欧美国家或会跟风出台更多倾向于保守主义的市场政策,试图为本国企业争取利益。在这种大背景下,至少在未来一段时期内,阿里云恐怕很难继续将高速增长的希望放在海外市场的提升上。 而且,随着国内竞争对手的“觉醒”,云服务市场的竞争将不会再限于技术能力的比拼,而是将更多地向价格、生态、政策等方面延伸。目前阿里云在国内的主要竞争对手,有腾讯云、华为云等。这两家不但在产业互联网、端到端业务场景覆盖等各方面都有自己的“绝活”,而且它们都是有深圳这个“主场优势”。深圳目前已经获得建设“先行示范区”的中央政策支持,在这个示范区建设规划中,中央还赋予了深圳世界级“产业创新能力”建设的重任。不难看出,云计算厂商在这个过程中必将发挥巨大作用、获得前所未有的市场空间,腾讯云、华为云这两个“主场选手”,在深圳“先行示范区”的建设中获得更大的政策支持,恐怕是难免的。 在这个不进则退的市场上,阿里云还得继续努力。 原文章作者:何玺,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-14
    最后回复 骏恰 2020-1-14 16:56
    1138 4
  • 阿里巴巴披露人工智能完整布局 称已成国内最大人工智能公司
    中国商报/中国商网(记者 祖爽)9月26日,阿里巴巴在杭州云栖大会上公布人工智能调用规模:每天调用超1万亿次,服务全球10亿人,日处理图像10亿张、视频120万小时、语音55万小时及自然语言5千亿句。阿里巴巴宣称目前已经成为国内最大的人工智能公司,同时首次披露人工智能的完整布局。 中国商网 彭荣岳/制图 在AI芯片层,平头哥刚刚发布了AI芯片含光800,一块含光800的算力相当于十块GPU。目前已应用于阿里巴巴多个场景,如支持拍立淘索引时间,应用后,时间从一小时缩短至五分钟。 在AI云服务层,阿里云已构建起亚洲种类最全、规模最大的人工智能集群,包括GPU、FPGA、NPU、CPU、超算集群、第三代神龙架构等在内的公共云服务,共同形成面向人工智能产业的最强力支持。日前为某现象级App调集近万片GPU,创下世界记录。 在AI平台层,飞天AI平台、飞天大数据平台、AIoT平台等大大降低了AI开发门槛。其中,飞天AI平台是国内首个云端商业化机器学习平台,支持上百亿特征、千亿训练样本的超大规模经典算法,降低了35%训练成本、多个场景下提升400%训练速度,还首创公共云上可视化建模,为开发者提供了接近本地开发的极致体验。 在AI算法层,阿里巴巴达摩院成立两年来,在自然语言处理、智能语音、视觉计算等领域成绩不俗。其中自然语言处理在SQuAD机器阅读评比中,精确阅读率首次超过人类,智能语音入选MIT Technology Review 2019年“全球十大突破性技术”,其视觉计算可识别超过100万种物理实体。 内部实践中,阿里小蜜每天服务在线及热线用户超500万人次,覆盖全球132个国家和地区的11种语言;天猫精灵是全球最大的中文智能助手,总销量超过2000万台。自动驾驶正从单车智能向车路协同方向进化,2018年获杭州政府颁发的首张无人驾驶路测牌照“浙A4390试”。 对外服务则最早实践产业AI,2015年率先推进互联网技术与传统产业的融合,联合合作伙伴推进产业落地。以城市大脑为代表的产业AI正广泛应用于全产业场景。目前杭州、海口、北京、上海、拉萨、澳门、吉隆坡等国内外23个城市已先后引入城市大脑。 原文章作者:中国商网,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-11
    最后回复 剑爰 2020-1-11 01:19
    3135 11
  • 阿里考察,探索阿里智能商业生态系统与营销经验借鉴
    阿里总部参观——共享经济时代下互联网的发展战略与电商的运营模式 阿里巴巴集团的长远战略目标是服务全球20亿消费者,并帮助全世界1000万家企业在我们的平台上实现盈利。我们就此制定了全球化、农村化、数据化等三大战略。经过近20年的发展,阿里巴巴集团已从一个电商公司,长大为一个横跨商业、物流、娱乐、云计算、金融等各个领域的独一无二又充满张力和创新力的“阿里巴巴数字经济体”。 阿里总部参观——对标考察网万斌 近期,我们单位组织中高管走进优秀企业学习活动,在对标考察网万斌老师的安排下参访杭州标杆企业——阿里巴巴总部西溪园区参观交流学习。初入阿里巴巴园区参访,深入感受互联网时代在改变我们的生活方式,颠覆我们的商业模式,冲击我们的思维方式。 阿里总部参观——参观阿里巴巴西溪园区 进入阿里巴巴西溪园区后,参观咖啡馆、阿里长大历史墙、阿里文化墙(阿里日、倒立文化、愉快桶、阿里土话、阿里战袍、135年陈、武侠文化等)、枫林晚图书馆、食堂、阿里小店等,俯瞰园区整体,了解阿里园区建筑设计理念,体验天猫未来店,感受无人支付。,让大家初步的对阿里巴巴有一个清晰的认知。 阿里总部参观——参观马云接待外国首脑的私密会所 太极禅院是一个以太极为主题,融合有会议服务、餐饮的主题馆,由马云和李连杰发起,其设置目的是向世人传达太极文化健康方式的养生理念。太极禅苑的经营理念为推广太极文化,通过了解学习建立新文化圈子,融合道家、儒家、佛家文化,学会以儒释道理念之本来做企业管理。体验阿里独创太极工间操。 阿里总部参观——阿里巴巴高管交流分享座谈 阿里巴巴文化与创新管理 1、 马云创业前期艰辛历程回顾 2、 阿里文化创新之道 阿里武侠文化如何体现/阿里如何传承价值观 阿里味儿互动小游戏 通过互动深入了解阿里文化,感受传承与落地 3、 阿里管理创新之道 阿里团队管理与激励/阿里政委文化 4、互动答疑 学习收益:系统学习阿里文化如何在阿里落地生根,学习阿里如何通过文化和价值观将员工凝成一个统一的整体,学习阿里如何打造一支超有战斗力的铁军。 阿里总部参观——走进阿里巴巴,探索马云创业前期艰辛历程 此次阿里巴巴参访活动全程由阿里巴巴相关负责人对阿里企业文化,发展历程做了详细的介绍,参观的学员们真切地感受到:这是一个互联网的时代它展示出了传统行业没有的朝气,更有传统行业不敢想象的发展速度。现场分享工作学习经验,通俗易懂气氛活跃收获颇丰。 原文章作者:小鸟爱讲故事,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-9
    最后回复 蒲静秋 2020-1-9 14:38
    1896 0
  • 阿里CEO:数字时代开启,人工智能时代来临
    张勇, 自2015年起担任阿里巴巴CEO,也即将在2019年接任董事局主席一职,并成为近年来全球最具影响力的商业领袖之一。 阿里, 作为快速崛起成为全球零售、电子商务和科技行业的巨擘,成为21世纪最成功的商业传奇之一。阿里的长期目标,是在2036年前支持1000万盈利的中小企业,创造1亿就业机会。 2019达沃斯世界经济论坛聚焦“数字时代的信任和转型”,阿里巴巴集团CEO张勇和世界经济论坛创始人施瓦布在1月24日的对谈,成为整个达沃斯中较受关注的一场。张勇的发言传递出希望和乐观的信息。 “如今我们面临很多不确定性,时代变化很快,人们对未来有很多疑问。但最重要的是,我们一直稳步向前,不断去尝试。”张勇说。 张勇认为,阿里巴巴的20年长大正伴随着互联网的发生和深入,“在数字经济时代让天下没有难做的生意的使命,正是在运用数字技术帮助更多人完成数字化转型。” 技术推动创新的进程从中国社会变迁也中可见一斑。张勇也认为中国在经历比很多国家更快的数字化进程。“我们直接从信用卡时代进入了移动支付时代。基础设施不够完善的时候,给了我们跨越性发展的机会。” 当被施瓦布问到在这个变化迅速的时代,如果做出合适的决定?张勇认为,不要惧怕犯错。“很多时候战略上大的方向是对的,我们处于数字时代,问题在于我们能否找到通往方向的那条路。道路是曲折的,关键在于是不要走回头路,否则你永远不会向前。”张勇说。 针对一些对数字时代充满疑虑的看法,张勇说,“不要惧怕新的变化,不要对年轻人说不。他们可以提出一些你从来没听过的想法。我们也生活在互联网上,可以享受他们的生活方式。如果我有时间,我就会刷直播。要对世界充满好奇心,并从中找到乐趣。” 历史上,人们曾经从自由贸易和技术进步中获得巨大收益。技术变革不仅不可避免,更如湍流无法停止。面对即将到来的人工智能时代,张勇认为,“实际上,整个阿里巴巴的运转都受益于人工智能,只是很长时间它没有被叫做人工智能。人工智能无处不在,我们相信运用新技术不仅能够造福消费者,也可以赋能商家提升运营效率。” 作为平台的阿里巴巴在过去20年带来了进步和大量机会。对谈前一晚,卢旺达总统卡加梅对张勇分享说,因为技术和阿里巴巴合作,卢旺达的咖啡可以卖到中国,农民收入大大提高。去年天猫上线的卢旺达咖啡,仅一天赶上了此前一年的成交量。 张勇认为,阿里巴巴的关键角色正是赋能者,要让平台上参与者更好地成功。“如果你想帮助农民,如果你帮他们更好地卖出咖啡,当地银行就更愿意给他们小额贷款,这可以带来更普惠的经济形态,让社会更美好。” 原文章作者:大冲随笔,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-9
    最后回复 贲乐怡 2020-1-9 09:57
    1330 0
  • 智库大会|智能科技:从万物互联到万物智能
    图说:阿里云智能事业群机器智能首席科学家闵万里在2019新经济智库大会现场分享智能科技话题 资本寒冬的时候,应该是我们思想热浪的时候。 过去几年,阿里云升级为阿里云智能,我们的工程师们走出了一条别人没有走过的道路,阿里云智能ET大脑建设已开发推出分别应用于城市、工业、农业的大脑产品。我们脱离了依靠互联网键盘打天下的传统,走进车间、农田,向老工人学习,向土地问现在的价值空间在哪里。 回顾过去几年,在战场上所经历的一些感悟,再展望未来的十年、二十年,智能经济究竟怎么走,会给我们带来什么样的期待? 智能要应用于传统领域 一年多前,我们提出产业AI的概念,从实战当中去看它的三个核心要素,计算驱动、场景驱动、数据驱动。为什么是一个互联网公司说要做产业的AI? 因为这里面有一个核心的新生产要素就是智能,这个智能跟大家耳熟能详的智能不太一样,不一定是大家听说的IoT、5G、量子计算、无人驾驶就等于智能。我们其实是在传统领域中找到价值空间,所以最大的智能是敢于应用于传统领域的智能。 在今天所谓的智能当中,还有一类更根本性的智能,其实是跟人相关的,这也是我们过去几年走的一个自主道路。重新想一想,在人脑当中,100亿神经元的链接是怎么实时地融会贯通,并产生知行合一的决策?深度神经网络,最大的神经网络在哪里?其实就在大脑里。机器智能的智能不一定是用到大家所知道的新技术、新名词,而很有可能是把我们人脑先研究透之后,反而找到了最大智能的源泉。 都说AI要精准,要预测准确,但是反其道而行之,模糊AI出现了,模糊智能也是我们人脑每时每刻都在做的事。当有冲突信号的时候,比如,当无人驾驶的汽车看到路标说要直行,但旁边有一个建筑工人说要封路的时候,此时该相信谁?什么是AI?我们时刻都在处理着模糊的、冲突的、不准确的信号,在优化问题,这就是整个智能经济所要解决的重要问题。我们怎么把经济发展决策中的不确定性,看不见到看不透的问题给解决了。所以模糊AI也是我们做的一件事情。 计算力成为核心生产力 我们发现,数据不是石油。石油是不可再生的资源,数据此时此刻每一分每一秒都在爆炸性的增长。石油与数据这两者是不对等的,对数据而言,谁能算得快速,谁能算得准,谁才能享受数据瞬时即逝的价值。这也解释了一个核心关键点,如何才能把瞬时即逝的价值抓住、实现。我们有数据融合的平台,在城市大脑、工业大脑当中已经用到了,这里面的核心还是以实时计算为基础。 当数据丰富度持续提高、计算成本进一步降低之后,究竟能达到什么效果?前几天发布的阿里巴巴达摩院2019十大趋势,其中之一就是城市的实时仿真。阿里云ET城市大脑,实现智能决策实时下发,让城市学会思考。交通态势,以往是每个月评估一次,但今天是每两分钟算一次。把城市的数据网络打通,把模糊性降低的时候就会产生新情景。我们创造了一路绿灯的信号给到救护车,把平均时间压缩了239秒钟,压缩了48.9%的时间。在急救的道路上,每一秒都很重要,要争分夺秒。239秒,在每个人的生命旅途中有一天走到需要急救这条路的时候,这种价值就感知到了。当我们今天把智能用到具体场景的时候,就真正创造了价值。 怎么让生产线学会思考?面对一个在燃烧的锅炉,当我们有了数字化之后,能解决什么问题?很简单,能耗降低。怎么控制燃烧,这个看起来非常传统的问题,大家会说,老师傅有经验,操作手册也都有阐述。而且,很多人会有这样的反应,互联网人不一定懂这个机理。但是今天给大家报告我们的实践结果,把燃烧效率提升了2.6%。我们开始一窍不通,唯一有的是计算力和数据原材料,但是当算力加算法和原材料一起的时候,烧出来就是价值。 最后我们做到的是什么?让工人师傅手上也有一个智能指挥官,而不是单纯靠二三十年手册上写下来的指数,生产线在老化,原材料在变化,工艺在改进的时候,二三十年前的手册今年可能要重新审视了。 农业,同样的道理,一个非常传统的产业中,当用数字化的手段和计算重新审视它的时候,会发现原来每一个环节都充满了智能的机会。我们创造了一个数字化的档案给每一个物品,当所有的数字化的生长足迹都可以用数字呈现的时候,就可以发现在哪些地方最有可能通过智能提升它的生产效率,最后得到的是降低3%的死亡淘汰率。 这几个案例,有非常惊人的共同特点,都是把来自互联网的技术垂直渗透到传统产业当中,这里面没有互联网的模式,有的是来自互联网的技术,所以实现的是从“互联网+”到“互联网×”,是把技术的基因注入到这里面每一个环节。当这些发生之后,就会发现价值公式是成立的,有智能、有价值,后面的价值获取就变成一个很自然的过程。大家讨论的问题是,我们怎么把智能的科技转化为智能经济,让所有人都能够看到这个产业需要拥抱智能。其实这背后是从原来看不见的问题到看不透的问题,今天我们已经解决了看不透的问题,以后就看是怎么放量了。过去我们的实践做得很辛苦,大家的经验总结是如何把经验让更多的传统产业第一时间接纳、吸收、集成,再发展、迭代。 云计算的出现,使我们在新智能经济时代“包产到户”成为一种可能。为什么?工业时代,当做蒸汽机、轮船电力的时候,要有大财团,因为没有财力物力就没有机会。但在今天,我在一些平台上很便宜地拿到一个非常强大的计算力,生产力被释放,包产到户每一个有IQ、有智能的人的头脑上的时候,会产生无法想象的价值。包产到户成为可能,而且会成就个人英雄,所以这是一个非常好的年代,对每一个个体,对每一个有数据梦想、智能梦想的人来说,都有了计算力,有了云的时候,就有可能打造另外一个智能经济时代的一个标杆。 共享智能价值 协同会降低整体的成本,因为今天我们所做的事情都是基于现有的硬件基础设施稍微添加了一个添加剂,这个添加剂就是计算和AI的算法,这两者结合就会产生巨大的价值,所以我们会发现整体的系统边际成本是非常低的。更重要的是,因为有了“包产到户”的可能性,所以靠近行业、掌握某一个垂直行业当中重要问题解法的人,也会成为重要的经济体,经济体颗粒度会越来越小。所以传统行业和IT互联网经济体当中的高科技的队伍有平等的机会,因为谁靠近行业,谁就有可能得到价值当中最大的那一环。 大家可能会说,新经济的时代是不是一个共产主义?其实也不尽然,价值获取的模式有三种,有人做原材料,有人做生产线加工工具,还有人是交付价值的结晶,这里没有一个绝对的垄断,每个人可能都有他存在的空间和价值利益点。但关键是什么?是一个产业的协同,需要有一个明确的价值杠杆撬动整个链条中的协同。大家会发现,在新经济的时代,每一个人,无论是大公司的、小公司的,斯坦福的博士还是211、985高校的本科生,有了计算力就有可能成为一个新英雄。这是一个最好的年代——智能的时代,智能经济从某种程度上来讲,跟互联网经济、分享经济完全不同,它充分地释放了让每个人成为这个经济的参与者。 在资本寒冬的时候,当我们有了这种勇气审视它的未来的时候,会发现寒冬的时候是最好的时候,为什么?因为寒冬的时候最容易找到蓝海的市场,为我们下一次的红海启航,我们的方向标很简单,就是“智能”两个字。智能背后是计算力,这是阿里云变成阿里云智能的梦想。只有把最先进的技术拿到最传统的行业当中,才能产生最新的价值空间。我们要用渐进式发展的方式把源自我们自主可控的智能复制到传统产业当中,带动整体产业结构的转型升级。 (以上内容来源于1月6日举行的2019新经济智库大会上,阿里云智能事业群机器智能首席科学家闵万里现场分享的智能科技话题。) 原文章作者:阿里研究院,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2020-1-9
    最后回复 陶平乐 2020-1-9 08:50
    3421 2
  • 阿里智能防骚扰电话技术问世:代号“二哈”
    在央视315晚会上,“机器人拨打骚扰电话”的黑色产业链被曝光。据报道,智能机器人可以通过语音合成,模仿人类的声音,一天能打1000个电话,有公司一年拨打了40多亿个骚扰电话。 对于这种高科技骚扰,难道除了挂电话就没有更好的办法了吗? 视频地址:点此。 今日,阿里巴巴人工智能实验室发布了一项内部代号名为“二哈”的智能防骚扰电话技术。当用户在手机上开通了这项服务,在接到骚扰来电时,用户可以直接转接给机器人接听。目前已经基本成熟,年内就将正式面世。 这是一个已经通过了很多人的“图灵测试”的机器人,现在你可以打开天猫精灵App,或支付宝搜索天猫精灵,试试看“调戏”它。 阿里AI labs北京研发中心负责人聂再清介绍,“二哈”采用“智能聊天”概念,机器需要理解用户请求,用强大的知识图谱生成知识点,在对话中将知识点“输出”给用户,同时用基于深度强化学习的对话策略引导对方的问题,才能将聊天进行下去。
    发表于2020-1-9
    最后回复 倡膳昀 2020-1-9 08:09
    1610 12
  • 帮情绪失控者迈过那道坎,阿里安全用人工智能守护生命
    自杀和拐卖、诈骗一样同属社会问题,无论线下线上,再正常不过的物品都可能成为工具。如何为情绪失控者构筑生命安全的防护墙?如何避免悲剧发生? 记者从阿里巴巴获悉,阿里安全推出的“守护生命”项目,利用人工智能技术并联动商家、公安、第三方机构建立自杀干预机制,对有自杀倾向的人予以安抚干预、避免悲剧。项目运行半年来,已经联合社会各方力量劝阻上千人。 作为社会共治的参与者,履行社会责任、为社会创造价值,一直是推动阿里巴巴不断完善治理体系的动力。在数字经济已经贯通线上线下的当下,社会问题的解决,要靠线上线下一体的力量来解决,“技术+共治”的数字经济治理模式不但能解决线上商品治理,在解决社会问题方面也在发挥更大的作用,哪怕是对生命的守护。 多方联手营救12岁轻生女孩 尽管安眠药早已在电商平台禁售,网上药店的经营者仍常会遇到各种询问。2019年12月的一天,一名12岁的小女孩在一家网上药店询问购买药品,客服按照惯例主动询问其用药目的时,竟发现女孩有轻生的倾向。药店客服紧急联系了阿里安全的工程师武纲。 (图说:武纲是淘宝“自杀干预师”中的一员。) 武纲是阿里安全“守护生命”项目中的一名“自杀干预师”,他日常的任务是及时发现和劝阻那些有自杀倾向、准备购买商品用于轻生的人。接到药店客服的通知后,武纲立即启动紧急干预程序,一边和商家安抚这个女孩,一边通过快速通道报警找人。 民警连夜找到了女孩家。敲开门时,她的父母还不知道一墙之隔的卧室里发生了什么。 这样的场景,武纲每天都能遇到。综合上千起自杀干预的案例特征,武纲发现这一人群都比较年轻,以女性为主,甚至还有高中、初中学生。他们生活经验不丰富,再加上心理承受能力比较欠缺,在生活、学习或工作中遭遇感情破裂、家庭不和、债务危机、怀疑自己得了绝症等挫折时,一时想不开产生了轻生念头。 技术联动多方共建干预机制 “大部分人是冲动型的,和他们多聊聊,交谈过程多倾听,身边的朋友再给一些帮助和温暖,大多数都能迈过那个坎。”武纲说,结合这一特点,“自杀干预师”的工作重点是对这一群体及时给予安抚,必要时联动家属和警方支持等。 除了不断完善利用人工智能技术联动商家、公安、第三方机构的干预机制,阿里安全还对平台的商家做了宣导培训。当消费者购买商品后,商家客服会咨询其购买用途并指导使用,在交流中若发现异常,商家客服会及时安抚、劝阻、不发货,并通知阿里“自杀干预师”,再视情况决定是否联动警方快速干预劝阻。 武纲透露,阿里拟引入更多的第三方专业机构、公益机构等合力预防干预,比如专业机构对商家培训,提升他们识别风险、安抚引导和风险干预的能力。“我们希望并呼吁更多机构加入进来,为有自杀倾向特征的人,建立有爱的服务,为生命安全筑起一道防护墙。”武纲说。 数字治理创造更大社会价值 在数字经济背景下,如何让治理创造更大的社会价值,一直是阿里安全不断探索的命题。以“技术+共治”为内核的精细化治理,已经为解决一些社会问题提供了更多想象空间。 截至2019年11月15日,由公安部主持开发,阿里安全提供技术支持的打拐神器“团圆”系统,已帮助4204名儿童回家。 由阿里安全提供技术支撑的 “钱盾反诈机器人”,通过来电显示“公安反诈专号”,向潜在的电信网络诈骗受害人拨打电话,发送短信、闪信提醒信息,提升反诈劝阻成功率,减少电信网络诈骗案件发生,平均每天劝阻3000多人,劝阻成功率超96%。 在武纲看来,自杀毫无疑问是社会问题,当互联网和数字经济已经贯通线上线下,社会问题的解决,也要靠线上线下一体的力量来解决。“我们在尝试,用技术和发起社会共治这样的带有数字经济治理特征的方式,去解决更多社会问题。” 原作者:江苏商报 原文地址:https://www.toutiao.com/a6778670538542809614/
    发表于2020-1-9
    最后回复 攸爸 2020-1-9 08:08
    1785 0
  • 揭秘阿里人工智能这五年:天才的野心与自证
    采访 | 四月 撰文 | 四月 过去五年,阿里在全球人工智能的激烈赛道上悄然跑进了第一梯队,背后一群以达摩院称号对外示人的科学家群体愈发神秘撩人。 这是一群野心勃勃的科学家,亲手打破旁人艳羡的舒适区,踏入充满禁忌的未知地,只为寻觅更广阔的舞台。他们一生都致力「求证」,或于学术理论,或于技术价值,并愿意承担随之而来的冒险和境遇窘迫。 这五年,阿里经历了人工智能技术长征的发端与突围,而他们,也经历了一场巨大的冒险与自证。 初见之时,你或许会讶异他们滔滔不绝地谈起「买单」、「落地」、「规模化」等商业味浓厚的字眼,全然没了学究气,仿若一位身居一线的创业者心心念念…… 直到你听说过那段既艰难又幸运的岁月,一切便了然于心——唯有越了解真相,才会变得越务实。 人生的绝妙之处也在于此,改变他们的不是早年风光的求学路,也并非当下所拥有的物质地位,而是源于一次又一次被质疑和误解后的绝地「自证」——不同于象牙塔里、试验台前的公示推理和仿真验证,商业场上的「自证」需要拿出实实在在的业务指标和实际效果,正如阿里办公区里那句随处可见的标语——「NO DATA,NO BB」。 强压之下的「自证」氛围造就了科学家们近乎苛刻现实的技术价值观。 待繁务卸下,他们重拾赤子之心,沉浸于算法公式和理论推理的乐趣。但人生并不总有自由浪漫的时刻,更漫长的是披荆斩棘的孤独与煎熬。 通过和近十位阿里巴巴人工智能科学家的对话与交流,本文试图还原阿里打造人工智能技术体系的荆棘路,以及路途中科学家们的内心征途。 1 . 既艰难又幸运 多年以后,遇上北京的雾霾天,漆远没准依然会想起那个加班的春节——西大望路的阿里妈妈会议室里,一桌人戴着口罩开着会,工位上的空气净化器呼呼作响,窗外是望不到对面楼的雾霾天。 回国前,漆远已经在脑海中罗列过一连串的适应清单,以备回国后的各种挑战,而「迷雾危机」大概是被遗漏的最重要的一条,它不仅来自于北京的天气,还包括那个大胆的决定。 漆远曾走过一条无数理工男梦想的坦途:31 岁麻省理工大学博士毕业,39 岁成为一流大学终身教授,定居美国,拥有宽敞明亮的实验室和独栋别墅,一位美丽的太太以及两个可爱的孩子,一年两次固定的长假足以让他兼顾工作和生活的完美平衡。 直到一次大胆的决定,漆远亲手打破了这种平衡。在拒绝谷歌、Facebook、百度等公司的邀约后,漆远决定归国到杭州工作,选择了当时看起来「最没有技术范儿」的阿里。 2014 年 9 月 19 日,时任阿里巴巴合伙人的王坚带着漆远来到纽交所,共同见证了阿里巴巴的上市,7 位敲钟人全是阿里电商的买家和卖家,却没有一位是科学家。 面向华尔街,这家彼时市值 2400 亿美金的公司并不满足被定义为一家「电商公司」。他正在谋划一个崭新而宏伟的「想象力故事」,以便让公司在未来获得更强劲的增长动力。 他明白,前沿技术会是这个故事的主角,紧接着 iDST(数据科学与技术研究院 Institute of Data Science & Technologies)宣布成立,漆远和金榕成为早期创始人。 但彼时彼地,故事听起来不免有些冒险主义——中国互联网市场仍处在模式创新的初级阶段,一家以商业利益为本的企业凭什么打造技术驱动的研究院?国内几乎没有任何成功的营运模式可以参考。 未知的挑战首先降临到了早期创始人和研究机制身上。 漆远,现达摩院金融智能实验室 负责人 加入阿里后,漆远接到的首个任务是打造一套大规模机器学习平台,落地到淘宝的广告平台阿里妈妈。他清楚地记得,当时手里攥着两千万特征,14 天的数据。由于数据量太少,他计划积累到半年数据后再启动。 同时,他还提交了一份申请数千台服务器的计划。这并不是一笔小数目,直到现在一块英伟达的计算卡依旧要价 2000 美金,计划讨论后就被否决了。 等了半年,服务器仍没有拨下来,巧妇也难为无米之炊。「当时没有 CPU 集群,整个集团都没有」,漆远说道,「同事们认为,『你们这帮教授老师过来,基本不懂业务,也不懂技术』」。 秀才遇到兵,有理说不清。漆远的团队陷入了不能「自证」的悖论里:没有 CPU 集群,如何证明自己的算法和技术高效?不能证明自己的算法和技术高效,如何争取到 CPU 集群? 漆远曾试图据理力争,僵持状态几近半年,「团队一度走在解散的边缘」。 金榕是 iDST 的另一位创始人,美国密歇根州立大学终身教授,曾获得过美国国家科学基金会奖(漆远也获得过该奖)——有超过 200 位诺贝尔奖得主都获得过这个奖金的资助。 金榕,现达摩院机器智能研究领域 负责人 金榕带领团队为「聚划算」提供流量分发的技术优化,团队很自然地把低价商品排列在搜索和推荐结果的前列以提升成交量,却忽视了对业务本质的理解——低价虽可刺激购买,却让目标用户群从二三城市转移到三四线城市。 「虽然 GMV 上去了,但产品的价值都变了」,金榕说道。 业务为技术开路,科学家们却在无意中篡改了产品的内核,「短板暴露得非常明显」,金榕谈道。当时团队多为研究背景,精通基础理论,却缺少业务理解和工程实践经验,所以看不到技术到产品中间的巨大鸿沟。 「你们要想在阿里发挥出真正的价值,就必须克服这些困难」,当时的阿里 COO 张勇找到金榕和几个骨干说道。 既然不够熟悉业务,那就去到第一现场吧! 于是,iDST 的早期科学家们兵分多路,以电商和金融两大核心业务为首,深入到产品和工程里。金榕带着团队进入到淘宝和天猫的搜索事业部,漆远和几位同事去了蚂蚁金服,做语音的团队则留在了阿里云。后来这被称为阿里科学家们的「上山下乡」运动。 技术的觉醒并不止于高层,更早些,一股从下至上的创新力量就窜上了头,内部创新的文化开始流行——「只要你的老大不反对,就是对你最大的支持」。 2013 年的十一国庆,李昊印象尤其深刻。他没有旅游计划,也不用回老家走街串巷,而是一人闷头在办公室里捣鼓。一连七天,他都在工位上敲打着键盘,像是着了魔。 终于,赶在假期结束前,他长舒一口气——Demo 跑通了,由一块 GPU 搭上一台主机,纯手写的用于图像搜索的深度学习算法。再简陋不过的装置,但结果令人欣慰——比传统算法的准确度有了明显提升。 正值第三次人工智能浪潮起势,ImageNet 大赛进入到第三届,深度学习教父 Geoff Hinton 和他学生设计的 AlexNet 在赛事中大放异彩,基于深度神经网络的思路一举解决了图像分类的棘手难题,至此开启神经网络百家争鸣的盛况,更深、更宽的网络层出不穷。 李昊从外文网站上读到这些消息时备受鼓舞,他博士毕业于中科院光电技术研究所,来阿里不到一年,满腔学以致用的迫切。 李昊,阿里巴巴资深算法专家 早在 2010 年,谷歌豪掷 1 亿美金收购图像购物搜索网站 Like.COM,掀起全球图像搜索的风口。文字搜索场景有限,图片描述更为加精确,微软、亚马逊、百度纷纷出手,阿里也顺势投资了一家图搜购物网站(现名为「淘淘搜」),通过识别图片上的实体物品来索引网络上对应的店铺链接。 遗憾的是,随着移动互联网时代的到来,图搜风口很快熄火,手机实拍图的普及,让搜索结果越来越不可控,图搜应用体验大幅受挫,不少创业公司濒临倒闭。 「实拍图的比对相比 PC 的原图难得不是一星半点,已经不是传统图搜技术能应付过来的」,李昊说道。 既然传统图搜技术已经无以为继,那在视觉领域技惊四座的深度神经网络能否奏效?为此,李昊花了整个国庆假期来验证这个想法。 「他很兴奋,一直给这个看,给那个看,非常大力地推广」,李昊回忆起将Demo交给主管时的场景。就这样,团队争取到一次向时任淘宝 CEO 展示的机会,这次是直接在手机端演示——手机拍照,实拍图和库里已有图片做比对检索,找到和相似的照片显示——相比传统算法提升了一倍。 很快,「图像搜索」项目在 2014 年正式启动,目标是落地到手淘(手机淘宝应用)平台。 刚来阿里三个月的潘攀被任命为负责人,兼顾算法、工程、产品的统筹,团队力量充沛。潘攀毕业于美国伊利诺伊大学芝加哥分校博士,此前在美国三菱波士顿研究院、北京富士通研发中心从事视觉领域的研发工作。 潘攀,现达摩院视觉智能研究领域 资深算法专家 延续此前团队推动的技术路径,「图搜」采用深度学习技术,随之成为阿里历史上最早采用深度学习技术并上线的 C 端应用产品。 和大多数互联网公司战略先行的思路不同,阿里在技术探索的早期并没有大刀阔斧地批项目,而是从现有的核心业务盘子上找切口,克制而谨慎地实验性验证,然后才推动落地。 「当组织里的算法和研发比较少,更多是由业务和产品构成时,就决定了大家对于技术不确定性的理解会非常有限」,潘攀说道,「对于一家互联网公司,做项目就一定要做出来,看得到结果」。 这是一个又艰难又幸运的过程,当行动早于认知,缺少资源、无人信任、无法施展等困境便接踵而来,这既是商业公司的盈利性质所决定的,也是新生事物萌芽期所必经的考验。 但幸运的是,无论是自上而下的理想主义,还是自下而上的创新力量都得以保留,幸免于昙花一现的口号和想法。 火种尚存便可以燎原。 2. 坐在金山上啃馒头 「坐在金山上啃馒头」,这是漆远加入 iDST 时听马云说过的话。金山就是阿里巴巴拥有的丰富数据。但是即便坐拥金山啃馒头,也难以一口吃成个大胖子,「如果数据的价值不能被挖掘出来,那不过就是普通的土壤」。 随着深度学习算法与模型的普及应用,「调参」工作成为大部分算法工程师的日常,淘宝和天猫的搜索团队一开始也不例外。 因为深度学习算法的不可解释性,很多基于该技术的方案就像是一个「黑盒」,模型中的参数选择和调整成了一件难捉摸的事,往往意味着繁琐而毫无头绪,没有技术含量。 在漆远看来,光是调参远不能建立起技术体系,「虽然属于工程层面的工作,但仍需要科学的思想指导——最好的工程指导就是科学,否则你就只能是一名调参工程师」。 与漆远秉持同一观点的还有金榕。「原来我们都是做些调参工作,直到金榕老师来了之后才把我们带上正轨」,李昊谈道,「他常反问我们,深度学习为什么能奏效?你能从理论上解释吗?」 「图搜」项目之后,李昊便来到了搜索技术部——阿里最为核心的算法部门之一。在这里,李昊遇到了前来深入业务第一线的金榕。 李昊当时的主要工作是为深度学习模型进行压缩与加速优化,一般做法是套用现有模型,但金榕通常会提供新的思路,「他给了我们一堆的公式,让我们去试」,但这一试就是三个月,也没出结果。 当李昊和同事怀着忐忑的心情找到金榕,他并没有因此责备,反而给予鼓励,「如果三个月就能做出来,那就是太简单了,继续去做吧!」直到第四个月算法总算跑通。这套算法将Embedding 技术结合深度学习引入到搜索业务中,明显提升了淘宝主搜索的 GMV。 李昊回忆,当时金榕还做了一套非常长的理论证明,证明算法是可收敛的,并在内部分享,「他当时给予我们的理论指导,正是我们所稀缺的」,李昊对此十分感激。 来到蚂蚁金服的漆远则接到了智能客服的项目,通过智能交互机器人来解决支付宝的客服问题。这一次,他顺利很多,获得当时集团客户服务部负责人戴珊的支持后(戴珊是阿里巴巴早期创始的十八罗汉之一),很快争取到了资金和资源进行技术的验证。 在阿里科技发展早期,以阿里合伙人为代表,形成了一股来自理想主义的推动力量。 2015 年的双十一,首次采用深度学习技术的支付宝客服实现了 94% 语音自助,这意味着有 94% 打来的电话不再需要转接到人工服务,次年,这个数字提升到 97%。去除掉人工智能团队的人员工资和计算资源成本,智能客服项目为公司节省了一个多亿。 所谓「知人善用,人尽其才」,技术工具同样如此,唯有了解 AI,才能用好 AI。 要在一家互联网公司里树立起对于新技术的认知和信仰并非易事,这为科学家们设置了一道又一道的障碍栏,甚至不可避免地造成了人员流失。 但回过头来看,或许正是有了「上山下山」的共事经历,才算是真正打通了「研发」和「业务」的对话体系,让阳春白雪和下里巴人从此互融。 技术之后,便是产品工程化的进阶挑战。 哪怕有高层支持,也不意味着就此被保驾护航,伴随而来的反而是更大的压力。图搜立项的第一年就设定了明确目标——日活过百万,「打从立项之初就不再是实验性的了」。 与初期的深度学习算法探索不同,后期的挑战就像无底洞一样填不满。 「问题的关键在于,我们不是在做一个独立的 APP,而是让它落在手淘上」,潘攀说道,「而且还是阿里最为核心的业务平台」。落地手淘,意味着图搜需要调用手淘的底层接口,需要针对淘宝内部的链路架构做额外定制和调配,而淌通这些链路就是最大挑战。 在视觉领域,大规模图片的压缩极其消耗算力,这为大规模的图搜访问埋下了隐患,一次意外报警让潘攀记忆犹新。 一天,图搜的服务器突然被拖垮,后台出现报警。 经过紧急排查,团队才发现,原来是淘系后台针对图像上传的默认压缩功能拖垮了服务器。默认压缩主要针对低频、小访问量的媒体上传需求,但并没有考虑到图搜的特殊情况——数据规模大,且需要实时识别,所以已经在前端预设压缩功能。换句话说,淘系的图片默认压缩对于图搜反而是一种负担。 在发生警报之前,大家都忽略了这么细微的接口。潘攀谈道,「很多时候就是这样,即使我们自己考虑到位了,但如果要连接到更大的系统上,还是会出问题」。 上线并不意味着挑战结束,比如,还有深不可测的入口。潘攀清楚地记得,图搜第一次上线的位置是手淘的一个四级菜单里。「四级」,则意味着你首先要在首页里找到「发现」,然后点开「特色服务」,点击「更多」,再…… 作为阿里最为核心的业务战场,手淘的态度显而易见——「愿意给技术机会,但也要求风险可控」。 机会需要争取,更需要「自证」其价值。 从最初上线的数千日活,过百万,过千万,一直到突破 2000 万,图搜应用一路跃升为淘宝首页导购类目的第一。但与此同时,外界的质疑声不断,「我印象特别深,每一年大家都在问,数据还能增长吗?……你还在做呀?做啥呢?」潘攀说道。 不被理解似乎成为开拓者的宿命,漆远回忆早期的探索时期,「当时对我最大的锻炼就是,不被理解是正常的」。 这或许可以称之为某种乐观主义,但毋庸置疑,对于技术的信仰正是面对困境和误解时不可或缺的坚实力量。 经历过焦灼而艰难的资源「抗争」后,漆远手中的分布式机器学习平台终于启动,为了尽早让平台上线,团队放弃年底休假,春节期间留守奋战,骨干密集开会头脑风暴。「当时切身地感受到了团队的战斗力,大家真的是非常相信,只要上线效果一定能好」,漆远回忆。 双十一期间,平台首次实现淘宝、天猫个性化推荐的大规模应用。那一年的阿里巴巴集团算法大奖上,漆远带领 80 人的团队包揽了 16 项奖中的 6 项。现在,漆远作为达摩院金融智能方向的负责人,带领团队构建面向金融经济场景的智能分析与决策技术。 另一边,在经历了搜索类目扩增、数据优化、算法迭代等多方面的升级后,「图搜」项目完成三次入口跃迁,终于在 2015 年双十一期间进入首页。让潘攀颇为自豪的是,图搜的数据一直依靠自然增长,几乎没有调用过手淘的商业推广资源。 入口升级的本质是一个不断「自证」的过程,由技术和技术背后的推动者们在一次又一次的挑战中完成,继而固化下来成为阿里技术产品的迭代传统。 不同于象牙塔里、试验台前的公示推理和仿真验证,商业场上的「自证」需要实实在在的业务指标和实际效果,正如阿里办公区里那句随处可见的标语——「NO DATA,NO BB」。 高速增长的背后是两年一次的系统大改,「阿里其实非常讲究创新,我们一般都不炒冷饭」,潘攀说道,他将图搜系统的发展分为三个时期,「每一次升级不仅是算法进步,而是整体思路的提升」。 「数据、系统、算法三个互为一体。对数据认知和处理方法的不同视角,催生了与之匹配的算法和工程系统,所以升级是整个系统层面的」。 项目早期,数据量少,还需要人工标注,所以研究为之匹配的小模型的系统和算法;随后训练数据解放,团队尝试通过用户行为的三类数据(查询数据、点击数据、未点击数据)分析出数据与排序间的逻辑关系,三元组的 Deep Ranking 框架生成,与之对应的训练框架、系统升级迭代;去年,图搜开始接入超大规模并行处理平台,释放数十亿级数据的训练能力。 与百度识图、微信扫一扫、京东拍照购等市面上的其他图搜应用不同,阿里更强调「通用化」能力,比如不仅能支持手淘所有的实体商品检索,还包括二维码、植物、垃圾等非商品的识别与分类。这些功能统统集成在图搜一个窗口里,不用再二次跳转,平均日活达到 2000 万以上。 在研究员的长大道路上,经历一次完整的技术工程化落地的意义重大,它不仅锤炼了实战能力,更为其提供了深入了解业务所想、业务所需的窗口。 「这段经历让我们明白了应该创造和推动什么样的技术,知道哪些技术更有可能落地成为产品,以及如何让一个产品能够有效地支撑业务」,金榕谈道。 可以说,从研发到业务的实战积累正是阿里打造AI 技术落地体系的基石。 如今,这套思想贯彻到阿里大大小小的技术思路中。比如,在语音技术团队今年推出的语音合成技术 KAN-TTS(Knowledge-Aware Neural TTS)中,团队就事先考虑到了不同环境下的模型部署环境,并进行框架设计和效率优化,综合各项需求的关键算法改进多达20余项,最终实现了无论是在云端还是终端,甚至是 CPU 存储有限情况下的最快速度部署。 一项技术能否在设计之初就考虑到项目部署阶段遇到的各种实际问题,正是技术落地体系成熟的重要标志。 3. 中国研究院没有Benchmark 「它是阿里巴巴国际化业务的技术生命线,如果没有这些能力,阿里巴巴很难称之为一家国际化公司」,这段底气十足的话出自司罗。 他是阿里达摩院语言技术实验室负责人,带领百余人的队伍进行自然语言理解、机器翻译、认知智能等底层技术的开发,这些技术被誉为人工智能皇冠上的明珠。 司罗,现达摩院语言技术实验室 负责人 司罗专注于机器学习、NLP 等领域的研究,2012 年成为普渡大学计算机系终身教授后,一举奠定了其在学术圈的地位。同金榕、漆远一批,司罗在 2014 年加入 iDST,是阿里建立人工智能技术体系的早期成员。 相较于视觉、语音更贴近前端用户的技术,语言则更偏向底层,以原子化能力的形式起作用,扮演着赋能和支撑的角色。正因为这个特点,它对于大型互联网技术公司而言往往不可或缺,但技术团队却又是极其分散的。 既然如此,为何不集中力量打通? 于是,语言技术恰好成为了技术平台化的最佳试验场。 2016 年 10 月,对于司罗和 NLP 团队而言是一个重要的时间节点。此前,他们忙于承接一个个「项目」,先后参与过「聚划算」、「AIios」「淘宝头条」等项目。 在这之后,司罗领到任务——将 NLP 的「大中台」建立起来,换句话说,阿里各业务线的 NLP 不再各自为营。 为了让其他业务线接入平台,司罗采取了「品牌效应」的打法。 是的,在公司内部,同样需要建立品牌,尤其在打造规模化平台的过程中。 「首先要有非常贴身的服务,然后让重点的头部用户用起来,逐步地让他们认识到 NLP 平台和解决方案的好处,再通过种子用户将我们的技术价值传播出去」,司罗知无不言地分享了品牌效应的打造「套路」。 而正是因为技术平台化的出现,让这只百余人的队伍能够支持阿里系 600余个业务方,每天调用量达到了两万亿次。 这是 NLP 技术影响力从量变到质变的飞跃。 沿用同样的思路,司罗带领的另一条技术分支——机器翻译技术也实现了规模化的业务支撑能力,为阿里全球化电商平台上的买卖双方提供 20 多种语言,48 种语言方向的机器翻译服务,覆盖欧洲、亚洲、美洲与中东地区的绝大多数国家。 阿里的图搜应用在技术平台化升级后,从最早的支持手淘平台到目前落地到淘系的六个主流 APP,一举成为全球最大的图搜应用系统。「这是淘系业务的市场份额决定的」,潘攀说道。 从单个功能应用,到十个、百个、数百个的业务方支持,每天被亿级用户使用,技术平台化的战略得到了有效验证与认可。尤其对于技术人员而言,通过平台化的过程,单点技术的影响力不断被泛化,技术的品牌效应不断地被放大。 但对于当下的阿里而言,平台化尚非终点,「上云」更是一片广阔的天地。 阿里内部的海量业务和长期实战的检验,为技术与方案移植到阿里云平台提供了硬核实力。司罗表示,NLP 平台和机器翻译平台已经先后在阿里云上的人工智能板块上线,供第三方的云计算客户使用。 从单纯的技术算法,到集成为业务和应用中的产品,再到平台化和大规模可复制化的云计算商品,这是一条阿里人自己走出来的 AI 落地路。 是时候将这条路子固化下来了! 2017 年 10 月 11 日,是阿里人工智能技术体系开宗明义的日子。 阿里巴巴 CTO 张建锋宣布成立达摩院 杭州云栖大会现场,阿里巴巴 CTO 张建锋宣布达摩院正式成立,计划未来 3 年里投入超过 1000 亿元,用于涵盖基础科学和颠覆式技术创新的研究。iDST 作为达摩院旗下最大的机器智能实验室分支,由金榕任带队。 时至今日,再谈大公司建立研究院已不是新鲜事,但适应于中国本土市场环境的成功模板依旧寥寥可数。 培养出中国最早一批 AI 研究员的微软亚洲研究院被冠以「黄埔军校」之名频频提起,投入巨大过于前沿的谷歌 X 实验室、DeepMind,IBM Waston 研究院形象「高大上」却不够接地气。 中国互联网公司已经开始重点布局,但难以与公司业务平起平坐,百度几大研究体系已被收编进技术平台,腾讯四大实验室依附于各大业务呈分散状。 至于阿里,在达摩院之前的三年探索和走过的弯路为其积累了不少宝贵经验,但如何乘胜追击更进一步成为领导者的新命题。 在金榕看来,达摩院的设立主要有两个目标:一是把达摩院的 AI 基础能力(原子能力)放到平台上支撑所有业务。比如阿里内部跟语音识别有关的业务都会使用达摩院的底层语音平台,但会根据具体业务做定制化的改变。 二是上云,通过内部核心业务验证后,用户的接受度和满意度达到一定指标,产品上云商业化,进一步放大价值,服务整个社会。 说到这,四年前王坚为金榕描绘 iDST 蓝图,三句不离「Benchmark」的画面在我眼前浮现。 「我记得从第一天起,王坚就一直跟我们说 iDST 的 Benchmark 的是什么?」金榕说道。(Benchmark,基准,常用于性能测试中的表达。) 王坚认为是斯坦福研究院(简称 SRI,1970 年脱离斯坦福大学后,更名为「斯坦福国际咨询研究院」)。「那里的基础研究和其他地方都不一样,不仅创造出了最好的理论知识,还能把技术变成产品,产品收益再反哺到学术」,金榕回忆道,那时常举的一个例子就是鼠标的发明。 不止于鼠标,从手术机器人到航天静电放电棒,从个人助理 Siri 再到癌症治疗,二战后的斯坦福研究所几乎成了硅谷高科技公司科技创新的「智慧之源」,不仅创造了新的行业、数十亿美元的市场价值,还有持久的社会价值。 「一旦看到收益,人们很容易就聚焦在收割单个业务的成果上,而缺少更深入挑战的动力」,金榕认为这也是达摩院——阿里 AI 技术中台设立的意义——跳出单个业务成果,让技术更深入,再往前跨一步,用更少的人力实现价值最大化。 经过两年的建设,达摩院人才济济,超过半数科学家具有名校博士学位,部分是美国、欧洲学成回国,办公室分布在四个国家、八个主要城市,其中机器智能团队拥有 20 多位知名大学教授,近 10 位 IEEE FELLOW。 而在达摩院之外,阿里还有一些更为分散化、业务化的人工智能能力,并非走中台化的路子,但仍是不可或缺的一环。比如天猫精灵、搜索和广告部的人工智能技术应用、蚂蚁金服的客服机器人等,它们与核心业务方贴合地更为紧密,以便技术更快地产生效益。 要为这样一支庞大而高规格的研究团队设置课题并不是件容易事。 此前,我在与某公司 AI 实验室负责人交流时,对方就曾透露过选题上的两难局面——一方面既要兼顾业务需求和 KPI 导向,另一方面还不能忘记前瞻性研究和技术布局。 整日埋头对接业务需求容易退化为业务部门的附属团队?但面对前沿课题的不确定性,究竟该冒多大的险,才能保证既有结果又具备开创性? 当我将同样的问题抛给阿里的人工智能科学家时,得到了相似的回答,「这看起来是个问题,但在阿里就不是个问题」。 延续技术到产品、产品再到商业化的研究和落地机制,技术研发与商业利益的问题将得以平衡,而且必须平衡。 「在阿里如果只是发发论文、做做研究则意味着工作只做到了一半,无法获得真正的认可,或者是比较低的认可」,潘攀说道。 与此同时,在技术平台化与产品规模化的过程中,还伴随着水到渠成的技术成果转化。 在被誉为人工智能世界杯的 CVPR 2019 WebVision 竞赛中图像分类竞赛中,阿里以 82.54% 的识别准确率获得冠军,而这背后的技术能力正是阿里「图搜」应用开出的果实。 谈到更为宏观的议题布局,金榕认为投资者思维或许是一个思路。 作为一名投资人,标的无非两种,一是比较切实可靠的项目,但是收益比较少;另一种则是高风险,但回报高,即所谓的「High Risk High Take Off」。几乎所有投资公司的投资组合都是这两种的混合。 作为研发部门,金榕会将技术资源进行分层。一部分投资在相对较容易见到结果的领域上,具备确定性;还有一部分投入在可长周期回报的项目。「在这样一个投资组合中,肯定有项目要失败,但能保证团队整体的长大和健康」,金榕谈道。 正好,他刚带队打完了一场「High Risk」的战役。 那是阿里正在研发的自主云上人工智能加速芯片 NPU,达摩院承担了部分算法工作,让 NPU 在阿里的技术架构上跑出最高性能。 为了能拿到 CTO 的「战投」,金榕预先设置了一个非常高的指标,即假设所有条件都处于非常理想的条件下,相比 GPU 的性能有了不小的提升。 硬着头皮上,一年多下来,终于收获了理想结果。在金榕看来,设定高目标虽然可能会引发焦虑和不适,但高目标的每一次落地都将为团队实力带来显著提升,「这对于打造荣誉感,提振团队士气非常奏效」。 在阿里内部有一句话,「最好的团建就是打一场胜仗」,融入阿里文化后的科学家们也开始明白这个道理了。 金榕身上所展现的冒险精神,一部分来自他的个人性格,一部分还受到阿里早期技术氛围的感染。早年间,王坚力排众议主导开发阿里云计算平台时,就常以一个「疯子」的形象活跃在公司内部。 「如果你当真要解决难题,就需要调动你所有的胆量和勇气去接受挑战」,金榕谈道。 在计算机研究领域,通常将非常棘手的问题称之为「NP-Hard」,大多数研究员一旦碰到这样的问题都会给出否定的结论。但金榕的团队所推崇的恰是「Solve The Ban Problem」。 「在商业社会,用户和商家才不会在乎这个,你不能因为 NP-hard 就止步」,金榕谈道,「这对我来讲是非常重要的原则,但凡这个研究是能够产生巨大价值,就应该全身心投入」。 不畏「禁忌」、冒险而大胆——这是我从他人口中未曾听说过的达摩院。 一脉相承的风格不可避免地将渗透进团队,一旦拔得头筹就将能让每个成员体会到以一当十的惊险,拥有胜者的姿态,继而发展成为阿里 AI 精神内核的一部分。 当上层建筑搭建完整,更为底层的技术正亟待突破,最为核心的指标在于算力。 早年间漆远接手的首个项目大规模分布式机器学习平台,随后由达摩院智能计算实验室负责人周靖人带队不断迭代和完善,已经进入到第三代版本 PAI 3.0。今年三月加盟阿里的 AI 知名青年科学家贾扬清还将为 PAI 注入更多力量。 贾扬清毕业于美国加州大学伯克利分校计算机科学博士,加入阿里前在 Facebook 担任工程总监,负责大规模人工智能平台的架构。他是 AI 深度学习框架 Caffe、Caffe2、Pytorch 的重要贡献者之一,并曾参与谷歌人工智能平台 TensorFlow 的工作,GoogleNet 作者的之一。 因为深度学习框架领域的诸多贡献,贾扬清在人工智能开发者群体中具有颇高人气,在今年 7 月的阿里云峰会上,贾扬清首次以阿里人身份亮相,不断有年轻人过来和他谈话与合影。 贾扬清,现阿里巴巴计算平台事业部 总裁 正值浙江一带的酷暑,采访室十分闷热。「我是绍兴人,没法抱怨这天气」,贾扬清笑着说道。清华硕士毕业后,贾扬清就长居海外,因为转战阿里而经常回国。绍兴距离杭州不到 80 公里,来到阿里,不仅是回国,更是回乡,贾扬清脸上有些止不住的喜悦。 和贾扬清前后脚来到阿里的还有黄非,在金榕和司罗两位老师的力荐下加入。黄非毕业于卡内基梅隆大学博士,曾任 ACL、NLPCC 等领域主席、IJCAI 资深程序委员,在 Facebook 时负责机器翻译和知识平台。加入阿里后负责组建和领导国际化机器翻译创新团队。 一如当年的漆远、金榕一样,这些年轻科学家们带着由衷的使命感和期待来到「金山」,期待着实现自我价值的同时,也为阿里经济体和中国互联网做出应有的贡献。 4. 阿里的底牌 当一件事物愈发完美或者强大,外界在其身上所寄托的期望值也将越来越高。 「最开始,公司只是希望技术能用在业务上得到一个好效果。今天,是真正希望我们能够用技术创造未来,一个新的由技术驱动的阿里巴巴」,金榕停了一会继续说道,「这个期望远高于技术难题,是一个非常大的命题」。 一个技术驱动的阿里巴巴?可能吗? 在绝大部分人的眼中,对于阿里的定义依旧是一家依靠电商业务驱动的互联网公司。在 2019 财年的财报里,阿里的核心业务包括电商业务、阿里云、大文娱和创新业务四大板块,其重要性依次排开。其中,电商业务创造了 3234 亿收入,总营收占比高达 86%。 「这正是外界看不太懂的地方,我们可不可能创造未来?」 在金榕眼里,这个未来似乎已经依稀可见,「我给你举个例子,至少我自己是非常受激励的,5G 技术就是突破口之一。随着 5G 和高清视频技术的发展,整个视频内容产业链都会带来全新的变化,是对每一个环节的重塑……」 AI 之后,5G 之前,前瞻性的技术布局和技术融合或将为阿里踩准下一个时代节点。 让我们把时间线拉近一些,现在或者近期的几年内,在阿里的主营业务之下,还有什么能称之为源动力或者底牌的东西? 欧文武,阿里巴巴资深算法专家 眼前这位入职阿里 12 年的算法专家或许知道答案。 他叫欧文武,娃娃脸上时常挂着微笑,憨态可掬。他被视为「最懂中国女人的男人」,因为他好像总能猜到你想买点什么,然后在恰当的时候送到你眼皮底下。 欧文武是阿里巴巴搜索事业部总监,资深算法专家,负责淘宝推荐算法团队,利用搜索和推荐技术让电商产品推荐流,也就是人们常说的「千人千面」。 谈到推荐业务,贾扬清曾在他的内部分享《关于人工智能的一点浅见》中这样描述:在阿里和很多互联网企业中有一个「沉默的大多数」的应用,就是推荐系统:它常常占据了超过 80% 甚至 90% 的机器学习算力,如何将深度学习和传统推荐系统进一步整合,如何寻找新的模型,如何对搜索和推荐的效果建模,这些可能没有像语音和图像那么为人所知,却是公司不可缺少的技能。 在阿里就有两支重要团队负责这个「沉默的大多数」的应用——搜索事业部与阿里妈妈。 虽然都做推荐系统,技术与平台相通,但和阿里妈妈强调变现的属性不同,搜索事业部的推荐业务更看重用户体验,强调探索和发现的乐趣以增加平台粘性,商业味道更淡薄。 而这看似的放手实则意味深长。 在 2018 年 Q3 财报会议前夕,阿里巴巴董事会临时做出了一个反常决定——短期内不对推荐推送等广告库存增量进行货币化。简言之就是停止对淘系平台上的个性化推荐的规模商业化。 随后的财报会议上,高盛银行、汇丰银行、花旗银行的分析师们对该决定穷追不舍地发问,商业化时间点、利润率、广告创收等被反复提及,可见其分量和位置。但高管们仍守口如瓶。 「千人千面」正是这块「暂时未被商业化」业务背后的核心技术力量,它被视为「阿里的底牌」,是阿里基于技术驱动业务的核心体现,有望成为驱动阿里未来营收增长的新引擎。 在电商业务的转型期,推荐流业务蕴藏着极大的价值潜力。随着平台上的商品越来越多,对所有用户采用同一套搜索算法,已经不能再满足用户的多样化需求。垂直电商领域新型竞争对手的出现也倒逼着阿里对推荐业务进行更深入的探索。 「它不仅仅展示了流量的增长,更体现出转化率的增长」,阿里巴巴集团 CFO 武卫说道,「推荐流为商家创造的价值,与淘宝在 10 年或 15 年所带来的流量和交易价值并不是一回事,这背后还有消费者参与的价值。该模式为商家提供了操盘工具,能够亲手来运营和管理他们的用户群体」。 极大的价值潜力,同时也意味着极大的业务挑战。 光是在工程层面要应付大规模数据就是一个难题。一般地,T 级(1 Tera Byte(TB)= 1024 GB)已经是相当大体量的数据存储单位,但在欧文武部门,每天面对的是上升了三个数量级以后的 P 级(1 Peta Byte(PB) = 1024 TB)数据。 「这么大量的数据,数据处理的方法,计算数据的准确性和一致性都是挑战」,他说道。 目前淘宝和天猫平台有 7 亿多用户,每个用户在平台上留下的行为特点、诉求方向都极其分散,即重叠的数据很少,体现在技术层面就是数据的稀疏性,这对算法模型的体量和复杂程度提出了更高要求。 阿里内部有个说法,推荐部门的算法是阿里最难进的算法岗位。在招人方面,欧文武表示,他更倾向于应届生,团队目前 50 人左右,博士生 40%,清华北大毕业的将近一半。 团队维持在每年两到三次大规模升级的节奏,「大升级就是以前那套全推翻,重建一套」,欧文武说道,小规模的升级,比如加些新特征,改改模型等,则频率高很多。 阿里每个财年都会依据各部门制定相关 KPI,欧文武并没有透露具体的 KPI。但他会在公司的KPI基础上给团队开个小灶,制定一套「内部 KPI」——比公司的要高出不少。 他通常会逐一拆分成许多个小目标,有人做用户数据,有人做匹配,有人做个性化排序……大概 20 多个小目标同时推进。 欧文武将其比喻成造车,车体需要拆分成很多零部件,大问题也要拆分成子问题,这样每个子问题就能更准确地评价,依据每个小问题再设定成不同的目标,然后拼凑在一起以求大目标可控。 目标要可控,但算法讲究灵活。 和一般算法追求极致的精准性不同,推荐的算法还需要投其所好,新颖性和多样性都是欧文武团队要考虑的维度。 以前,传统推荐算法主要是通过历史日志训练模型,缺少对用户未知需求的探索,十分有限;技术迭代后,现在多采用演化算法、强化学习算法、非传统的 AI 算法等多种算法融合,以求解决一个多目标平衡的问题。 当算法推荐不再局限于财务指标,欧文武希望建立一个与用户共同长大的 Life-Long 式模式。在欧文武看来,当下的推荐,停留在用户单次访问时长和浏览深度的指标优化;而更长远来看,用户能否留存才是关键。 「满意度不止在短期,而是长期的满足和收获。比如在购买之后,商品的安装、使用、保养……全链路的购物体验都可以做」,欧文武说道。 参照线下的传统购买场景,推荐的角色将不再局限于一名「导购员」,因为用户触达商品的每一个阶段都在发生改变,推荐的内涵也正在从商品推荐扩宽消费推荐,这也正是「李佳琦卖口红」效应兴起的逻辑。 据阿里员工透露,推荐算法目前在关键指标数据上有超过搜索的趋势,未来潜力可观。正如腾讯在微信广场实验广告位的价值,在推荐机制下,广告除了带来交易的价值,还有品牌展示和市场推广等更多元的价值。 「我们在这个方面依旧很克制,希望保持可持续性的增长」,欧文武说道,「不能用今天透支未来」。 在电商业务之后,云计算业务已经上升到集团的主要营收的第二位,阿里云智能总裁张建锋在今年提出了「ALL in Cloud」的战略。依托于云计算平台,阿里搭建了 AI 技术向 B 端产业赋能的各级大脑模块,比如已经长大为国家级人工智能开放创新平台的城市大脑。 城市大脑是阿里第一个「原生于云场景」的重点业务,它完全构建在云上,打破了摄像头与红绿灯的割裂,让摄像头看到的数据,告诉红绿灯应该如何优化,从而实现大规模实时交通事故检测。 3 年多以来,阿里的城市大脑走出杭州,在北京(西城、通州)、上海、苏州、澳门、吉隆坡等境内外十几个城市落地。据城市大脑的技术负责人——达摩院高级研究员华先胜透露,平均一个星期的时间,城市大脑就可完成一个城市的技术部署。 华先胜,达摩院城市大脑实验室 负责人 而在计算层,「新一代计算引擎」已经成为支撑起阿里千亿成交额、每秒数万笔交易的核心底层技术,MaxCompute(离线计算)、Flink(实时计算)、PAI(人工智能)被视为这项技术背后的「三驾马车」。 贾扬清领导的阿里云智能计算平台事业部,主要负责大数据计算和人工智能平台。对于将大数据和人工智能两大平台打通这件事,贾扬清深有感触,「这样的融合很具有前瞻性,阿里是全球少数的几个把大数据和人工智能放在一起的部门。未来大数据和人工智能未来的结合将越来越紧密。」 在谈到与达摩院的合作时,他将其比喻成「我们都是『躺平了』来支持」。 所谓计算平台,要义之一,则是解决算力瓶颈。 这也是阿里的新一代神经网络芯片 NPU 的设计初衷,在贾扬清看来,通过更底层的技术探索更大的计算潜力,切口在于「解耦」。 虽然谷歌用 TPU & TensorFlow 证明了硬件与框架融合模式的算力无穷,但别忘了还有英伟达——没有框架,依旧成为了王者——背后的心法就在于「解耦」——解开硬件与框架绑定的枷锁。 「解耦」的关键在于定义模型并让其标准化,这需要下溯到编译器层面。 「编译器的优化不仅能够挖掘出现有硬件平台的更强算力,还将在新硬件平台上基于机器学习自动迭代,大大缩短人力优化软件的时间」,而这也正是贾扬清加入阿里后的目标所指。 当更深、更强、更底层的算力挖掘成为全球人工智能市场的主旋律,阿里 AI 迎来了「算法+芯片」的AI2.0时代:先后投资寒武纪、耐能等 AI 芯片团队,收购中天微、先声互联等芯片标的,成立「平头哥」芯片公司。 目前,阿里已经发布基于 RSIC-V 架构的智能 IoT 芯片玄铁,AI 语音 FPGA 芯片 Ouroboros设计,基于云端的神经网络芯片「Ali-NPU」也已经在路上。它们标志着阿里 AI 技术「从软到硬」的深化,也预示着 AI 将更为长久地驱动着阿里经济体长大。 「因为业务需要发展,原来很多技术精力都聚焦在业务上,直到有一天,我们会非常迫切地希望,从技术出发,用科技来驱动业务,然后培育出一些全新的业务」,蒋国飞聊起蚂蚁金服的技术发展路线时说道。 他是达摩院金融科技研究领域负责人,同时也是蚂蚁金服副总裁。对照阿里巴巴,他认为,「阿里体量更大,所以已经走到了前头」。 当技术晋升为一家互联网公司的必需品时,打造行之有效的研发体系则是不可回避的议题。 研究院或者实验室等机构的设定本取自于学院体系,外壳借用倒是无妨,但如果连内核和运营模式也一同照搬到商业场,很大的概率就是水土不服止于襁褓。 在外壳之下,研究的机制、团队的建设、不同对话体系的打通、技术与业务的平衡,前瞻性与KPI的融合…才是商业公司研发体系的灵魂,一切尚需从长计议。 从2014年设立阿里最神秘部门iDST到如今人才济济的达摩院,阿里人工智能走过了既艰难又幸运的五年,梳理出这套技术体系的机制和脉络得以看清阿里人工智能的底色,推而广之,或将成为互联网公司打造人工智能技术体系的方法。
    发表于2020-1-9
    最后回复 舍焖 2020-1-9 06:45
    3045 1

快速发帖

还可输入 80 个字符
您需要登录后才可以发帖 登录 | 立即注册

本版积分规则

在本IOT圈子中寻找帖子
IOT圈子地址
[复制]
Weiot(威腾网)是一家以原创内容、高端活动与全产业渠道为核心的垂直类物联网产业媒体。我们关注新兴创新的物联网领域,提供有价值的报道和服务,连接物联网创业者和各种渠道资源,助力物联网产业化升级。
15201069869
关注我们
  • 访问移动手机版
  • 官方微信公众号

© 2014-2020 Weiot.NET 威腾网 北京微物联信息技术有限公司 ( 京ICP备20000381号 )|网站地图