请选择 进入手机版 | 继续访问电脑版
专注物联网产业服务
微信二维码
威腾网服务号
游客您好
第三方账号登陆
  • 点击联系客服

    在线时间:8:00-16:00

    客服电话

    17600611919

    电子邮件

    online@weiot.net
  • 威腾网服务号

    随时掌握企业动态

  • 扫描二维码

    关注威腾小程序

图像识别
图像识别
图像识别,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术,是应用深度学习算法的一种实践应用。 现阶段图像识别技术一般分为人脸识别与商品识别,人脸识别主要运用在安全检查、身份核验与移动支付中;商品识别主要运用在商品流通过程中,特别是无人货架、智能零售柜等无人零售领域。
  • 图像识别技术
    图像识别技术是人工智能的一个重要领域。它是指对图像进行对象识别,以识别各种不同模式的目标和对像的技术。 图像识别的发展经历了三个阶段:文字识别、数字图像处理与识别、物体识别。图像识别,顾名思义,就是对图像做出各种处理、分析,最终识别我们所要研究的目标。今天所指的图像识别并不仅仅是用人类的肉眼,而是借助计算机技术进行识别。 图像识别技术原理 计算机的图像识别技术和人类的图像识别在原理上并没有本质的区别,人类的图像识别都是依靠图像所具有的本身特征分类,然后通过各个类别所具有的特征将图像识别出来的,当看到一张图片时,我们的大脑会迅速感应到是否见过此图片或与其相似的图片。 在这个过程中,我们的大脑会根据存储记忆中已经分好的类别进行识别,查看是否有与该图像具有相同或类似特征的存储记忆,从而识别出是否见过该图像。 图像识别技术可能是以图像的主要特征为基础的。每个图像都有它的特征,如字母A有个尖,P有个圈、而Y的中心有个锐角等。对图像识别时眼动的研究表明,视线总是集中在图像的主要特征上,也就是集中在图像轮廓曲度最大或轮廓方向突然改变的地方,这些地方的信息量最大。而且眼睛的扫描路线也总是依次从一个特征转到另一个特征上。由此可见,在图像识别过程中,知觉机制必须排除输入的多余信息,抽出关键的信息。同时,在大脑里必定有一个负责整合信息的机制,它能把分阶段获得的信息整理成一个完整的知觉映象。 模式识别是人工智能和信息科学的重要组成部分。模式识别是指对表示事物或现象的不同形式的信息做分析和处理从而得到一个对事物或现象做出描述、辨认和分类等的过程。 图像识别技术是以图像的主要特征为基础的。每个图像都有它的特征,对图像识别时眼动的研究表明,视线总是集中在图像的主要特征上,也就是集中在图像轮廓曲度最大或轮廓方向突然改变的地方,这些地方的信息量最大。而且眼睛的扫描路线也总是依次从一个特征转到另一个特征上。由此可见,在图像识别过程中,知觉机制必须排除输入的多余信息,抽出关键的信息。同时,在大脑里必定有一个负责整合信息的机制,它能把分阶段获得的信息整理成一个完整的知觉映象。 图像识别技术的过程 既然计算机的图像识别技术与人类的图像识别原理相同,那它们的过程也是大同小异的。图像识别技术的过程分以下几步:信息的获取、预处理、特征抽取和选择、分类器设计和分类决策。 信息的获取是指通过传感器,将光或声音等信息转化为电信息。也就是获取研究对象的基本信息并通过某种方法将其转变为机器能够认识的信息。 预处理主要是指图像处理中的去噪、平滑、变换等的操作,从而加强图像的重要特征。 特征抽取和选择是指在模式识别中,需要进行特征的抽取和选择。简单的理解就是我们所研究的图像是各式各样的,如果要利用某种方法将它们区分开,就要通过这些图像所具有的本身特征来识别,而获取这些特征的过程就是特征抽取。 在特征抽取中所得到的特征也许对此次识别并不都是有用的,这个时候就要提取有用的特征,这就是特征的选择。特征抽取和选择在图像识别过程中是非常关键的技术之一,所以对这一步的理解是图像识别的重点。 图像识别技术应用都有哪些? 图像识别分为生物识别、物体与场景识别和视频识别。其中生物识别包括指纹、掌形、眼睛(视网膜和虹膜)、脸型等;物体与场景识别包括:签名、语音、行走的步态、击打键盘的力度等。 图像识别是一个综合性的问题,涵盖图像匹配、图像分类、图像检索、人脸检测、行人检测等技术,并在互联网搜索引擎、自动驾驶、医学分析、遥感分析等领域具有广泛的应用价值。 深圳维龙物联科技有限公司 原文章作者:维龙物联,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于5 小时前
    最后回复 牌揍 5 小时前
    1154 0
  • 大兴区科学嘉年华-AI+“国芯”应用场景科普活动掠影
    漫谈PS与图像识别 北京科学嘉年华是全国科普日北京主场活动的重要组成部分,是打造“首都科普”新名片、促进“两翼齐飞”新发展的牵引性、群众性、社会化、品牌化的大型公益科普活动。大兴区科学嘉年华作为其中的重要组成部分,在八、九月开展了相应的科普惠民活动。 2021年8月25日第二场活动的主题是:《进入图像识别的神奇领域》,在讲座中,提到了大名鼎鼎的Photoshop,今天我们就聊聊其中的一些趣事。 美国工业光魔公司(Industrial Light and Magic,简称ILM),是全球数字特效(CGI)行业的龙头老大,唯一获得美国国家科技奖章的特效公司,由著名美国导演乔治·卢卡斯(George Lucas)创建于1975年,当时为拍摄第一部《星球大战》而专门建立的特效工作室,之后工业光魔公司掀起了电影界的一场革命。 1985年9月,个性独特的乔布斯被董事会赶出了苹果公司。同一年,乔治卢卡斯因为要与前妻Marcia Griffin解决财产问题,打算卖掉工业光魔旗下的电脑动画部。没事的乔布斯闲不下来,他要找个事儿做,在1986年初,他以500万美元的价格买下了这个电脑动画部,并改为皮克斯动画Pixar。2006年1月,皮克斯动画被迪士尼以74亿美元的价格收购。乔布斯赚了74亿美元,因为500万美元的成本几乎可以忽略。不过,这些钱是算成迪士尼股份的,乔布斯成为了迪士尼的最大个人股东。现在这些财富属于乔布斯的妻子,Laurene Powell Jobs。 负责视觉特效的约翰诺尔John Knoll和弟弟托马斯诺尔Thomas Knoll为了解决影片中的一些镜头光晕特效而制作了一个后期软件,并随着需求的不断增多而新功能也被引入其中。于是这个世界上诞生了一款神奇的软件----Photoshop。 《人工智能+“国芯”应用场景科普项目》立足于国产信创硬件产品之上的人工智能应用技术普及,结合日常生活场景,通过简单的人工智能应用实践,让大家了解人工智能的实现过程。活动采用线上讲座的方式,以大兴区高米店街道为核心,面向整个大兴区召集对人工智能感兴趣的人员,得到了居民的广泛关注和响应,参与人员对活动给予了高度评价。 原文章作者:四维科技教育,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于6 小时前
    最后回复 摒晴 6 小时前
    1266 0
  • 神经网络算法、图像识别……江苏人这样种草莓?
    转自:扬子晚报 今年6月,昆明滇池古莲村的草莓种植户老张,计划利用夏天的农闲时分,为自家的草莓大棚装上一套自动化施肥和种植决策系统。老张打听了许久,对比了不少供应商,最终选择了当地“小有名气”的智多莓公司来合作。之所以小有名气,是因为智多莓公司负责人程飚在去年首届“多多农研科技大赛”中获得了二等奖。 程飚参加的多多农研比赛,是在联合国粮食及农业组织的指导下,由拼多多和中国农业大学联合举办的一个开放性农业科技竞赛,旨在探索让更多前沿的农业科技,从实验室走向田间地头。 第一届比赛的规则也很简单——在120余天的时间中,控制温室环境与水肥,种出品质佳、收益好的草莓。 智多莓由一群来自中科院自动化研究所、昆明市农科院、昆明市公安局的专家,以及云南的企业家组成,这也是唯一一支进入决赛的云南本土队伍。他们研究的是,将神经网络算法、图像识别等多种技术,与农科院专家的经验结合,输出一套数字化的草莓种植方案。 就在比赛快进入尾声的时候,程飚和团队成员一起注册了现在这家智多莓公司,并设计了自己的Logo,将比赛探索出的算法模型、水肥控制方案和自研硬件设备等进行商业化开发,提供给全国的草莓种植户。 去年11月起,程飚和团队在古莲村启动了第一个商业化项目“社区种植者支持计划”,由智多莓投资建设数字化农业服务工作站,在田间地头的一个20多平方米的小型集装箱内,装进了自动化施肥和种植决策系统,预计可以服务周边100亩左右的草莓园。 作为首批用户,老张抱着试试看的心态,将自家的2亩草莓接入了这个工作站,每株草莓一年付0.3元的服务费。他算了笔账,从去年10月到今年五一种植季结束,自家的2亩草莓地比去年多赚了三四万元,而且还节省了将近4000元的肥料成本。这样来看,每年花2000元不到的服务费,实在是一笔划算生意。 “去年挣到钱的现实,和今年继续挣到钱的愿望,这才是种植者持续投入的动力。”程飚认为,技术的关键在于,要让农户认可并从中受益,这是第一届农研大赛的初心,也是农业科技从业者最应该做的事情。 用算法为土地创造增值 云南昆明,8个100平米左右的温室中,来自云南农业科学院的阮继伟研究员扎进去就是大半年。作为云南闻名的“草莓博士”,阮继伟和团队负责第一届比赛的农事管理、数据测定等工作。 ▲去年夏天,云南省农业科学院研究员阮继伟和团队,为比赛队伍提供了全方位的农事管理服务,并对各队伍的草莓进行甜度、硬度等数值测定。图|穆功 4个玻璃温室中,集成了大量的传感器和荷兰骑士集团的环控系统,来自全球各高校和研究机构的参赛队伍,可调用Webservice的API服务接口,通过一行行代码来控制作物生长所需要的温湿度、水肥等。旁边的4个塑料温室中,则布设了普通的滴灌系统和施肥设施,来自全国各地的顶尖农人,利用传统园艺技巧精心培育草莓。在4个月的种植季节结束后,他们要在草莓产量、甜度、投入产出比等多个数据纬度进行比拼。 为了在100平米的温室中种出更多、更好的草莓,选手们各辟蹊径: 7 位瓦赫宁根大学、屯特大学、阿姆斯特丹大学的青年学者组成的 AiCU 队,从荷兰寄来了一套额外传感器,并利用双层算法单元建立更加精准的作物模型; 由中国农业大学、国家农业智能装备工程研究中心的博士们组成的CyberFarmer&HortiGraph队,通过多组摄像头的图谱识别,更及时捕捉草莓生长情况; 全国劳动模范、江苏镇江的草莓种植高手纪荣喜,一下飞机就直奔比赛基地,从家乡带来的“秘方”油渣,为种植的基质增添点肥力。 “传统种植的挑战难度,其实远高于AI种植。”阮继伟认为,相比于AI组完善的环境控制条件,农人队伍的现场管理难度要更高。他和团队每周都会为参赛队伍提供一次植株、果实等生长数据,在两个种植季结束的时候,尽管AI队伍的草莓产量平均值高出农人队伍平均值196.32%,但在甜度这一指标上,农人队伍要超出5.24%以上。 AiCU队成员,荷兰瓦赫宁根大学的博士闵钱希曦是云南人,此次她与团队成员一起在家乡的土地上“云种植”。这支“车库小队”由一群在荷兰的中国留学生组成,成员来自园艺、电气、植物、数学等多个专业,在此次竞赛中获得第三名。 “现在来看,比赛中我们遇到的最大挑战,不是远程或者数字化,而是没种过草莓。”闵钱希曦说,团队将积累的黄瓜、番茄模型,结合植物生理状态传感器返回的实时数据,迁移到草莓种植上。她们此前曾参加过“国际智慧温室种植挑战赛”,探索AI种番茄并取得亚军,这次“算法移植”,验证了队伍技术模型的可复制性。 因为疫情的影响,AiCU无法回到国内,队员们委托现场支持专家将自己种出的AI草莓,寄给了家人分享。同时,他们还在筹划将比赛成果商业化,成为一家农业算法服务商。 ▲在第一届比赛中,AiCU队伍使用了双层算法单元过滤和处理数据,从而得出更精准的决策,成功将番茄和黄瓜模型迁移到了草莓上。图|AiCU 简单来说,种植者可以使用AiCU的决策系统,在不同种植场景、不同作物中进行部署,何时施肥、施肥多少、是否需要降温/加湿,都可以交给AI,计算出最优解。同时,硬件和培训也在他们的商业服务范围内,比如帮助种植者开发更低成本的气候传感器设备,以及提供水肥配方、能源分配等策略培训。 闵钱希曦说,团队成员大部分已在荷兰的学校科研、公司R&D部门任职,从事模型、数学、传感器和温室园艺相关工作。目前,他们已经为江苏两家种植企业提供了商业化的种植算法服务。 “用更简单、更可持续的方法为每一个人稳定地提供优质、美味的蔬果。”这是AiCU成立的初衷,程飚也非常认同这个理念,他和AiCU团队的成员有多次深入交流,并希望在研发和服务层面展开更多协作。 在比赛过程中,程飚和团队成员完成了数字农业服务的软硬件开发,以及数据与算法产品架构。目前,他们采取了“社区种植者计划”的服务模式,在农业地区由智多莓投建数字农业服务站,并按照服务面积收取服务费。目前,这套系统已经在云南的怒江州、曲靖市等区域落地。 “预计再有3年,团队可以做到千万元级别营收。”程飚说。 微软Azure全球原首席科学家RanveerChandra,和多支AI参赛队伍有过深度交流。他认为,将人工智能技术用于草莓种植,并将大量不同的先进技术带到田间地头,是非常有趣,非常令人兴奋的事。“基于这些创新的改变,我们可以种植更加多元化的营养食物。”Ranveer Chandra说,希望选手们将人工智能等新技术应用到项目的过程中,能够为人类技术进步产生更深远影响。 让农户接受并负担得起 将实验室的前沿技术迁移到田间地头,只是第一步。 对所有试图商业化的参赛队伍来说,如何将这些技术变成真实的产品,并让农户接受,则是更现实的问题。 纪荣喜是参与第一届多多农研科技大赛的农人组选手。这位出生于1965年的镇江人,参与、见证了江苏草莓三十多年的发展历程,他带领莓农们种草莓、学技术,从零到亩产3000斤,一步步脱贫致富,并在2015年当选为全国劳模。 在镇江句容,纪荣喜是最擅长利用科技的种植高手,他很早便去日本学习草莓种植技术,并在大棚里装上了LED补光、水肥一体化灌溉系统等设备。但参加比赛的过程中, 纪荣喜和团队近距离接触了AI队伍的自动化决策系统后,深受触动。 气候计算机基于实时采集的数据,精准控制大棚开窗通风降温、施肥补湿,无人值守且做到了高产,“我们虽然有水肥一体化设备,但主要还是靠经验来调肥,氮肥、磷肥、钾肥一起拌进去,不科学也不精准。”纪荣喜说,他更想要一套精准的施肥核心技术。 ▲在云南,智多莓的数字农业工作站已投入使用,并为草莓种植户提供水肥控制等服务。图|智多莓 今年,纪荣喜邀请智多莓团队来到镇江句容,计划给大棚装上控肥系统。他希望这套设备能更精准施肥,提升产量并在合作社内推广,“现在我们里合作社有100多位农户,种300多亩草莓,如果推广开来,对效益是非常大的提升。” 来自中国草莓第一大产区辽宁东港的马廷东,则看到了另一面:不管是算法还是新设备,怎样可以解决劳动力短缺的问题? 马廷东去年也参加了多多农研大赛,他的另一个身份是丹东市圣野浆果专业合作社理事长。这个合作社有157户草莓种植户,种植面积超过6000亩。他们遇到的难题是,劳动力短缺带来的人工成本过高问题。 每年八至九月份,是东港草莓定植的高峰季,人工费用飙升至30元/小时。同时,后续还有草莓分选、分级的成本。一斤草莓从田间地头采出后,按照大小、品质分级,每斤分选费用在0.5元,“一年最少600万斤草莓上市,这样光分拣费用就要投入300万元以上。”马廷东说。 他也仔细研究了AI队伍在比赛中的产量、投入产出比等数据,得出一个结论——东港草莓发展仍在上升阶段,随着效益越来越高,在产业装备设施的投入会越来越高,完全支持得起智能化分级分选设备的引入。 “如果将糖度、大小、果型、单果重都能分拣出来,对草莓生产的标准化、品牌化有巨大意义。”马廷东说,他们现在也在寻求智能化分选和自动采摘机器人的合作机会。 老一代的农人,在寻求用新技术突破土地价值。新一代的农人,则有着不同的理解。 中国另一个草莓种植强县,安徽长丰县的90后孙郁晴,完整参加了4个月的种植竞赛,她对人工智能技术在农业的应用提出了自己的观点:“IBM提出AI应该是Augmented Intelligence,因为AI是提高人的效率、扩大人的能力,而不是取代人。而且AI在农业的应用一定要接地气,切实的解决主体的要求。因为对大多数中小农户来说,他们更加迫切需要低投入、高效益。” 孙郁晴说,她觉得AI和农业数据化和经验层面,有巨大的结合价值。如果将草莓种植规模、产量等信息与市场信息进行关联建模,并分析成本、利润和预算投入,这对于国内农业生产的专业化运营来说,是最值得投入的。 比赛结束后,她去了美国深造经济学。孙郁晴说,在接触到这个比赛后,她意识到农业领域女性力量会越来越多,参与度也会更加深,所以她选择了农业经济学和性别经济学两个专业,准备从更加宏观的视野研究中国农业现代化的发展。 “农业+科技”的想象力与边界 青年科学家和下一代农人的探索,带来了更多的想象空间。但土地上的问题要更加现实。 农业农村部农业物联网重点实验室主任、西北农林科技大学教授何东健观察发现,依旧在农村种地的人,都是生于50、60年代的人,“70后都是少数,更不用说00后。” 去年疫情期间,大赛的评委专家,农业部农业农村信息化专家咨询委员会副主任委员、中国农业大学教授李道亮写了本《无人农场》的著作,他认为,最多再过25年,上一代的农民就会退出工作场景。“真正的一线劳动力年龄大约平均是55岁,45岁就算年轻的。反过来说,60后和70后是我们国家的主力军,但这些人再过25年差不多就全部退出了,补上来的会越来越少,这就是一个基本的现实。” 纪荣喜也在为将来几年的草莓园苦恼,如今他的儿女都进城工作,家中的20亩草莓,主要是他和爱人在耕作,农忙时节会在村中请两位零工帮忙,但难免捉襟见肘。“我今年已经55岁了,再过5年可能就不种草莓了,到时谁来种?怎么种?” 上一代农业生产种植者的逐渐退出,是必然的过程。更加迫切的问题是,这片土地未来要如何承载起食物供给的需求。 ▲在发达国家,农业从业人口占社会人口比重在持续下降,农业科技的进步让更少的农民养活了更多的人口。图片|OWID 事实上,世界上任何一个国家的农业从业人员占社会人员的比例,永远持下降趋势。公开数据显示,目前美国、法国、日本等发达国家中,农业从业人员/社会人员的比例普遍在3%~5%左右,最少的国家是以色列,大约0.9%。可见,农业装备和技术的巨大进步,可以让更少的农民种植管理更多土地,为更多人提供食物。 中国著名经济学家、北京大学国家发展研究院教授周其仁呼吁,不能认为农业是个传统行业,农业是可以应用高科技的行业。“现在很多人没信心,觉得农业收入就是低,谁搞农业谁穷。要从大城市周围开始突破这个概念,把科技加进去,农业是有希望的。比如,发达国家丹麦,人均收入5万多美元,养猪业还很发达。这就是依靠科技,让好的种猪供应全世界。” 事实上,农业的迭代升级,已经成为中国最为关注的重要问题。今年中央一号文件提出,要全面推进乡村产业、人才、文化、生态、组织振兴,尤其是要推动“农业农村现代化取得重要进展,农业基础设施现代化迈上新台阶。” 李道亮判断,未来30年内,中国的农业会发生巨大变革,也将从传统农业实现到现代农业的跨越。“多多农研科技大赛探索了人工智能解决人的劳动力问题,接下来要鼓励更多的社会力量、科研机构加入,来一起研究、攻关,真正推动产业不断前进。” ▲在第一届比赛的初赛环节,“我说的都队”队长石奡坤(中国农业科学院蔬菜花卉研究所硕士在自家地头,向评委们陈述技术方案。图|穆功 第一届比赛的参赛队伍已为未来农业科技应用和服务,探索出更多的解决方案,开始走向商业化应用。多多农研科技大赛组委会负责人兰克表示,“这是令人振奋的一个开端”,即将开始的第二届比赛,将升级为一个更加开放的平台,它向全球的青年农业科学家提出一个问题:如何用设施园艺、生物技术等多样手段,让番茄的营养成分实现大幅度的提升和突破? “我们希望能够邀约全球的好手参与,一起来研究这项开放性命题。对我们这样一个起家于农业的新平台来说,持续不断探寻农业更上游的答案,是必须要追寻的方向,是自身的责任所在。”兰克说。 首届大赛的另一位评审专家,中国农业大学园艺学院教授王红清认为,未来农业是一个庞大的系统性工程,需要作物栽培、农业机械、物联网、生物工程、农业经济等多学科的交叉融合。“只有打破人才圈层,让搞信息技术的专家、搞人工智能的专家、搞机电工程的专家、搞农业种植的专家、搞流通上行的专家们一起,共同参与农业数据的积累,通过这种产学研的互相融合,才能探索突破的可能性。”王红清说。 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-11
    最后回复 孟杰秀 2021-9-11 20:25
    1001 0
  • 通过视频图像识别技术监控工控电脑触摸屏幕画面(仪表数据提取)
    1 监测方案 屏幕视频分析图像视频监控报警方案 屏幕视频分析图像视频监控报警方案通过上位机图像分析软件,监控屏幕图标变化状态,分析出图标变化,根据图标类型/仪表示数进行报警。并远程推送给手机,进行报警。 1.1 系统软硬件组成 1.1.1 WiFi定时拍照相机 SC-GP-CAMWiFi一款基于4G或wifi的无线定时拍照/抓拍录像FTP上传照片的相机摄像头。可广泛应用于仪器仪表的示数抓拍识别,文物、岩土、水文水利领域的照片抓拍和视频监控。 本产品支持wifi/4G以太网方式接入网络,定时拍照并将照片上传到指定的FTP服务器或存储于SD卡中。配合4G无线网卡,可用于户外没有wifi网络的场景。 1.1.1 相机支架 根据现场情况进行定做。 定做支架参考照片 1.1.2 服务器端上位机图像分析软件 屏幕图像监控分析软件 图像分析软件监控界面 1.1.3 系统工作流程 1、 操作员确认被监控设备正常运行; 2、 WiFi 摄像头开机,操作员把摄像头对准设备屏幕指定位置,通过手机 app 确认拍摄画面清晰,需要能看到警示标志区域,通过支架固定,完成后操作员可以离开; 3、 工控机定时拍摄被监控设备的屏幕画面(例如 10 秒间隔),通过 WiFi 网络传输给监控室服务器 4、 监控室服务器 a) 如果接收到屏幕画面,判断画面是否正常。这里分 4 种情况: i. 开机正常工作 ii. 工作中,发现已知的错误(比如断线图标),发出相对应的准确警报信息,发送短信给指定手机。 iii. 黑屏关机,发出关机警报信息,发送短信给指定手机 iv. 发现未知的屏幕变化(比如蓝屏死机), 发出异常警报信息,发送短信给指定手机。 b) 如果一段时间没有接收到屏幕画面(例如 5 分钟),发出断电/断网警报信息,发送短信给指定手机。 监控室服务器对设备运行状况进行日志记录 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-11
    2902 0
  • 南京智能计算中心1小时可完成100亿张图像识别、300万小时语音翻译
    (全球TMT2021年9月1日讯)人工智能正在重塑产业和经济格局,算力成为智慧时代的核心生产力。以人工智能计算中心为代表的新型基础设施已经成为数字经济转型升级的核心推动力,率先布局智算新基建已经成为发展数字经济的产业共识。一线城市、重点区域、产业集群纷纷加大新型算力基础设施投入,抢占新一轮科技竞赛的制高点。南京,作为长三角地区科技和经济发展的前沿高地,率先布局智算新基建,赋能智能生态建设与产业创新集聚,续写着AI时代的“金陵繁华”。 智算先行,古都续写AI时代“金陵繁华” 早在2019年,南京市就明确描绘人工智能的产业蓝图 -- 到2025年,南京人工智能核心产业规模将达到500亿元,带动相关产业规模5000亿元,推动南京成为全国人工智能产业创新发展的引领区和具有全球影响力的人工智能创新应用示范城市。当下,南京人工智能产业布局已初具规模,在人工智能产业规模、企业培育、空间布局、平台支撑等方面正在实现跨越式发展。 在AI算力基础设施建设方面,南京市一直处于国内领先位置,位列中国AI算力城市排行TOP 10。7月,南京市落地计算能力达每秒80亿亿次 (800P OpS) 的南京智能计算中心,是长三角地区当前投运的最高算力智能计算中心。 南京智能计算中心由南京市麒麟科技创新园携手浪潮、寒武纪打造,目前投入运营的AI算力规模达每秒80亿亿次 (800P OpS) ,1小时可完成100亿张图像识别、300万小时语音翻译或1万公里的自动驾驶AI数据处理任务。 智能生态汇聚 应用创新加速 南京智能计算中心集算力生产供应、数据开放共享、智慧生态建设和产业创新聚集四大功能于一体,成为南京市人工智能发展的新引擎。南京人工智能计算中心的建设既是南京以全方位的产业发展生态优势拥抱人工智能的必然结果,又将加速南京市人工智能产业新生态体系崛起。 目前,南京智能计算中心通过算力生产、聚合、调度与释放,与AI技术生态链全面加速对接。以清华大学、中科院计算所、南京信大气象科学技术研究院、唯仁科技、南栖仙策、南京图泰、行文智教、江苏拓邮等为代表的智能创新产学研力量,已经依托南京智能计算中心在智慧医疗、智能车联网、智能制造、自动驾驶等领域开展AI模型的训练推理任务研究,实现多场景、多领域的广泛应用服务,生态聚集效应日益凸显。 中科院计算所依托南京智能计算中心开发了智慧医疗平台,能够为蛋白质结构预测提供稳定的推断服务。蛋白质结构预测可以用在治疗某些疾病,但其过程非常繁琐,稍有不慎就无法获得较好的蛋白质空间结构。目前,基于智能计算中心的强大AI算力和先进开发环境,中科院计算所能够实现蛋白质空间结构的精准预测。 专注于通用智能决策的南栖仙策,借助南京智能计算中心的算力服务,通过强化学习优化企业决策、缩短产品研发周期,还能有效提高营销活动的利润。电影《复仇者联盟3》奇异博士通过预测未来与灭霸大战可能的14000605种结果,选出了唯一获胜的方式。在南京,南栖仙策正依托于强大的智算力,学习推演亿万种结果,找到通向未来的最优决策,进而提供现实世界自主决策系统,让“奇异博士”的超能力成为企业的真实决策力。 同时,针对不同AI技术及应用场景,南京智能计算中心正逐步打造专业化的解决方案中心与一体化服务中心,在智慧工业、智慧园区、智慧交通、智能决策、蛋白质结构预测、宇宙学、医学影像分析、光学层析影像分析等领域,与专业团队共建智能处理中心,以智算生态聚合带动形成多层级产业生态体系,赋能多个产业、惠及多类主体,加速孵化新业态。 南京智能计算中心的“智能处理中心”将为各行业领域提供专业数据收集、数据清洗、数据标注、模型训练、模型移植优化、边缘智能设备适配、领域知识汇聚、专业领域SDK研发优化与部署等服务,充分释放AI算力到千行百业。目前,基于南京智能计算中心的存储、云边一体等领先技术而成立的“工业视觉检测智能处理中心”已经成功解决数据碎片化,算法碎片化,设备碎片化等一系列问题,并基于规模化的算法开发团队与标准化的开发流程,推出“千元算法计划”以解决算法成本高、周期长的问题,为人工智能技术在工业视觉检测领域的普惠应用奠定了基础。 依托南京智能计算中心所提供的源源不断的智能算力,以“芯片+框架+算法”为底层基础、以AI模型生成和多场景应用的AI技术生态链逐渐形成,人工智能上下游产业所需要的“人才、研发、基建、资金”等核心要素不断集聚,一座“立足南京市、面向长三角、辐射全中国”,具有首位度、标识度高的人工智能产业地标正在崛起,也将带动长三角地区人工智能产业百亿级规模增长。 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-11
    最后回复 贾雅爱 2021-9-11 13:37
    2744 0
  • 基站图像识别抄表设备技术规范
    基站图像识别抄表设备技术规范 一 总则 本规范书为中国铁塔股份有限公司基站图像识别抄表设备技术规范书。 供应商必须对本文件的每一条款逐条作出明确的答复、说明和解释,首先对实现或满足程度明确作出“满足且优于”、“满足”、“不满足”、“部分满足”等应答,然后作出具体、详细的说明。不得使用“明白”、“理解”等词语。凡采用“详见”、“参见”等方式说明的,应指明参见文档的章节及页码。凡采用“部分满足”应答的,应详细说明哪部分满足或不满足;详细写出应答设备的技术数据、指标或功能等,否则视为该条回答无效。点对点应答中的漏项,视为供应商“不满足”技术规范书要求。如系统满足本文件的条款,但在合同及清单中未配置相应设备,需在答复中明确说明,否则视为免费提供相应的软硬件设备。 制造商应具有国家或国际上公认的相关的、必要的质量管理体系认证证书,表明其生产的产品先进性、可靠性。 供应商提供的设备具备本技术要求中没有提到的其它功能和其它附件,或者供应商有新的更合理的建议,供应商应作为附件提供。 供应商提供的设备应是技术先进、成熟、具有高可靠性的产品,并应以国家标准或国际标准进行设计、制造、校准和检验,指标参数以标准高的为准。 本技术规范的解释权属于中国铁塔股份有限公司。 二 技术要求 二.1 环境要求 工作温度范围:-10℃~55℃; 储运温度:-25~70℃; 工作湿度范围:≤98%(40℃±2℃); 工作海拔:≤5000米。 二.2 ★供电要求 抄表设备应采用外接电源的供电方式,并内置电池。外接电源供电电压为交流220V(187V~242V),电池应方便更换,宜使用18650标准电池,电源断电后电池应保证在每天拍一张照片的情况下至少使用三年。 二.3 功耗要求 抄表设备应保持低功耗运行,正常运行状态时平均电流应小于120mA,待机时电流应小于20μA。 二.4 ★摄像要求 抄表设备采用的摄像头像素应不低于30万,应有辅助灯光,保证在亮度接近0流明和直接光线照射的情况拍照清晰,拍摄照片满足识别要求,图像识别率应不低于99%。 图片格式应为.jpg,图片大小应不大于50KB。 二.5 外观与结构 抄表设备应表面平整、美观,无结瘤、起泡、针孔、夹杂脏物等缺陷;所有标志、标牌、文字符号应清晰、正确、整齐,产品信息完整。 抄表设备应有足够的机械强度,不能因正常的搬运、安装工作而受损,安装点应牢固、可靠。 抄表设备外壳应具有阻燃、防尘、防水性能,并有足够的强度,由抗变形、腐蚀、老化的阻燃、环保材料制成,严禁使用回收塑料制品。 抄表设备需要预留可视窗口,具备良好的透光性,方便安装后巡检人员直接查看电表读数,可视窗口尺寸应不小于70×40mm。 二.6 安装方式 抄表设备须以“后装”模式安装在电表表身上,根据用电量采集需要定期对电表读数进行拍照。 二.7 ★适配电表类型 抄表设备应至少支持对以下电表类型的用电读数采集能力: a) 机械数字单值电表; b) 液晶电子数字单值电表; c) LED数字单值电表。 默认图像采集周期为24h,采集周期应可设,设置范围为1h~1000h,支持平台设置。 默认图像采集时间为每日0点,采集时间点应能够设置为任意时间,支持平台设置。 二.8 防跌落 抄表设备必须稳定附着于电表上,防止长期附着引起的材料疲劳或日常维护产生的触碰导致设备跌落。 二.9 ★通信功能 抄表设备应内置4G通信模块,具备通过4G网络进行无线通信的功能。电表读数照片通过内置通信模块上传至云端服务器,由服务器完成照片中电表读数的识别,识别结果作为电表在采集时间的用电读数,并按要求上传至中国铁塔抄表平台,历次电表读数的差值作为该电表所接负载在当前时间周期的耗电量。 表1 制式要求 网络1 4G制式(同时支持移动、联通、电信三家或三款) 表2 技术指标 指标名称 具体指标 TD-LTE 频段要求 应至少支持以下频段: 1880-1900MHz、2300-2655 MHz TD-LTE吞吐率要求 设备峰值速率应至少达到下述值的90%:上行:27.3Mbps 下行:7.6Mbps 最低工作电平值: -85dBm 通信天线指标 阻抗:50Ω驻波比:≤2 工作频段增益(不含馈线损耗) ≥3dBi SIM 卡接口 具备1个SIM 卡接口,卡槽设计应方便安装更换。或支持ESIM。 防雷要求 天线端口共模3kA,差模 2kA。 二.10 ★平台要求 抄表设备应支持中国铁塔抄表平台的统一管理,满足附件1《铁塔远程抄表平台 智能图像识别抄表终端接口技术规范》要求,并满足以下要求: a) 设备能正常完成注册,通过web端完成与电表的绑定,绑定信息包括电表编号、站址编码等。 b) 设备可正常上传数据。 c) 设备可正确响应平台下发指令。 d) 设备可进行远程升级。 二.11 数据存储功能 抄表设备应具备缓存和重传机制,存储数量应不小于10条。 抄表平台应具有历史电能数据(图片和数据)和单日电量数据的存贮功能。数据默认每日上午10时保存1次,存储数量不少于1000条,数据存贮应稳定、可靠。 二.12 告警功能 抄表设备应能对低电量、设备离线、人为拆除等异常情况发送告警信息。 二.13 重启功能 抄表设备应设计操作键用于本地重启,用于首次安装校验及定期维护。 二.14 材料阻燃性能 抄表设备外壳应具有合适的安全性以防止火焰蔓延,不应因与之接触的带电部件的热过载而着火。试验温度为:650℃±15℃,作用时间30s±1s。 二.15 电磁耐受(EMC)能力 二.15.1 射频电磁场辐射抗干扰度要求 应满足GB/T 17626.3-2006中3级保护(设备)抵抗数字无线电话射频辐射的要求。 二.15.2 射频场感应的传导骚扰抗扰度要求 应满足GB/T 17626.6-2008中3级射频场感应的传导骚扰抗干扰度的要求。 二.16 使用寿命 抄表设备的电子器件使用寿命应不少于10年。 三 试验方法 三.1 ★图像识别准确率 分别在0流明和直接光线照射条件下让抄表设备对电表拍照,每种模式下分别拍照200张,图片应清晰,且平台能准确的解析数据,准确率不低于99%。 适配电表的类型应至少包括机械数字单值电表、液晶电子数字单值电表、LED数字单值电表。 三.2 ★材料阻燃性能 使灼热丝的顶部施加到试验样品在正常使用时可能会遭受热应力的表面部分,灼热丝应尽可能地保持水平。在没有详细规定设备在正常使用期间遭受热应力的区域时,灼热丝的顶部应施加在试验样品最薄之处,而且离试验样品上边缘最好不小于15mm,试验温度:650℃±10℃;作用时间:30s±1s。试验期间,将试验样品固定在试验装置上,但不应将额外的机械应力传给试验样品。 可在任意随机位置与灼热丝接触,设备应具有合适的安全性以防止火焰蔓延,不应因与之接触的带电部件的热过载而着火。 三.3 ★抄表平台接入能力 将抄表接入中国铁塔抄表平台,设备应能正常完成注册,并准确的上传数据。 四 ★交货日期 卖方接收采购订单后14天内,一次性提供全部订单要求的设备。 五 ★保修及售后服务 供应商所提供本采购设备的保修期为36个月,从终验证书签发之日起开始计算。 在保修期内,卖方应为买方提供免费保修升级服务;如因非买方原因,在保修期结束前不能排除故障或未达到技术规范书的技术指标要求,则保修期被延迟至设备达到标准为止。 卖方应提供24小时热线服务。 卖方应保障所提供的设备的材料、设计和工艺无任何故障缺陷。返修设备及部件的保修期为返修后3个月或原保修期,以两者中较长者计;卖方保证设备技术及质量满足信息产业部相关产业标准以及技术规范书标准。 若卖方提供的设备不能满足技术规范书要求及承诺,卖方应免费为买方更换、增加为满足设备要求所需的设备和材料。 在保修期内,当设备及其部件发生质量问题时,卖方应免费予以维修或更换,如经两次修理仍不能正常使用,卖方应予以免费更换。 在保修期内,设备故障部件的维修、返修及更换费用(包括运保费、税款等),应由卖方承担。 供应商必须积极配合方所进行的产品质量抽测、设备安装现场质量检查和技术指导。 六 资产编码 设备资产编码应符合附件2《中国铁塔电能计量器具条码规范》的要求。 七 培训 数采物联设备到货7个工作日内,供应商应安排技术人员到地市公司面向安装及维护人员组织一次现场培训,包括安装施工培训、调测培训、维护培训,后续持续跟踪负责解决安装、调测过程出现的问题。 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-11
    最后回复 值蓊 2021-9-11 10:18
    5062 0
  • 百度图像识别接口应用到场景有哪些?
    图像识别顾名思义就是设备通过图像扫描出来图像里面的内容,包括文案、物品信息资料等等;百度的图像识别接口可以精准识别超过十万种物体和场景,包含10余项高精度的识图能力并提供相应的API服务,充分满足各类开发者和企业用户的应用需求。 图像识别接口API应用场合: 通用物体和场景识别 可识别超过10万类常见物体和场景,接口返回大类及细分类的名称,并支持获取识别结果对应的百科信息;还可使用EasyDL定制训练平台,定制识别分类标签。广泛适用于图像或视频内容分析、拍照识图等业务场景。 图像主体检测 检测图片中的主体,支持单主体检测、多主体检测。可识别出图片中主体的位置和标签,方便裁剪出对应主体的区域,用于后续图像处理、海量图片分类打标等场景。 动物识别 识别近八千种动物,接口返回动物名称,并可获取识别结果对应的百科信息;还可使用EasyDL定制训练平台,定制识别分类标签。适用于拍照识图、幼教科普、图像内容分析等场景。 植物识别 可识别超过2万种常见植物和近8千种花卉,接口返回植物的名称,并支持获取识别结果对应的百科信息;还可使用EasyDL定制训练平台,定制识别植物种类。适用于拍照识图、幼教科普、图像内容分析等场景。 品牌logo识别 识别超过2万类商品logo,支持创建自定义品牌logo图库,可准确识别图片中品牌logo的名称,适用于需要快速获取品牌信息的业务场景。 百度图像识别接口应用到场景有哪些?以上介绍是图像识别接口应用的一部分场景,还有更多的图像识别SDK应用场景,还有私有化部署实现功能,腾佑科技作为百度云服务中心,支持百度所有产品的出售而且优惠折扣全网最低价,详细咨询请点击我们的在线商桥或者拨打400电话:400-996-8756。 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-11
    最后回复 乙骑看 2021-9-11 05:46
    1844 0
  • 联手中国人工智能巨头!商船三井测试新型船舶图像识别记录系统
    船舶识别记录系统示例显示图像 日本航运巨头商船三井(MOL)近日宣布同商汤科技(SenseTime)日本公司(SenseTime Japan)联手开发一款新的船舶图像识别与记录系统(vessel image recognition and recording system),该系统将安装到商船三井客运专线公司经营的“Nippon Maru”号邮轮上进行示范试验。“ 该系统的图形识别引擎的开发采用了商船三井的知识并应用了人工智能(AI)深度学习技术,以便其识别周围的船舶。 该系统将利用配备的图形处理器(GPU)和超高分别率摄像机的终端实现高精度识别和自动记录船舶。该图像识别引擎可以在夜间或其他能见度差的情况下使用,监测船舶自动识别系统(AIS)不能识别的小型船舶。 自动监测对商船三井“自主驾驶船”的目标必不可少的,此次开发的船舶图像识别记录系统是自动监测的重要一环。由于该系统能够自动记录图形数据,商船三井计划仔细评审积累的数据并利用这些数据进一步增强图形识别引擎的分析精度。 商船三井将定位具有图像识别功能的导航支持系统,如AR技术的航行信息显示系统(Voyage Information Display System),作为“FOCUS EYE”系列其挑战性项目,该系统已经在实际使用中。 商船三井将继续研制和修改该系统。该系统将支持船员值守,增强安全运营和加速值守自动化,其长期目标是实现自主智能船舶。商船三井已经在先进的安全运营和减少其对环境的影响支持下取得了进展。 北京市商汤科技开发有限公司简称“商汤科技(SenseTime)”,成立于2014年,创始人为香港中文大学信息工程系教授汤晓鸥,是人工智能领域的一家独角兽公司,专注于计算机视觉和深度学习的原创技术研发。商汤科技由香港中文大学工程学院团队创立,战略合作伙伴包括高通、华为、小米科技、本田汽车和麻省理工学院等。公司在香港、北京、深圳、上海、成都、日本京都和东京都有产业和科研布局。 作为全球领先的人工智能平台公司,商汤科技(SenseTime)是中国科技部授予的“智能视觉”国家新一代人工智能开放创新平台。同时,商汤科技也是全球知名AI创新企业。商汤科技以“坚持原创,让AI引领人类进步”为使命。公司自主研发并建立了全球领先的深度学习平台和超算中心,推出了一系列先进的人工智能技术,包括人脸识别、图像识别、文本识别、医疗影像识别、视频分析、无人驾驶和遥感等。商汤科技已成为中国头部AI算法提供商。2014年,商汤在人脸识别技术中战胜FaceBook,成为可实现准确率超过人眼的第一团队。商汤目前也是ImageNet中谷歌的强有力的竞争对手。2017年7月,商汤科技宣布完成4.1亿美元B轮融资,创下全球人工智能领域单轮融资最高纪录,同时也成为全球融资额最高的人工智能独角兽企业。 Sensetime致力于应用深度学习技术服务的规划、开发和运营。该公司成立于2014年,以香港中文大学多媒体实验室为基础,于2016年成立。自日本子公司成立以来,它一直为汽车工业和制造业提供自动驾驶、车辆识别和人脸识别等人工智能技术。此次研发的船舶图像识别与记录系统将Sensetime拥有的车辆识别及障碍物检知等汽车自动驾驶技术在船舶上使用,该系统装载超高灵敏度、超高精度照相机,可以识别和自动记录船舶,还可以识别没有搭载船舶自动识别装置义务的总吨数未满300吨的外航船以及总吨数未满500吨的内航船等现今船舶自动识别装置(AIS)不能识别的船舶,另外在夜间视界不良时也可以使用。 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-10
    最后回复 贲乐怡 2021-9-10 22:13
    4400 0
  • 浙大与阿里ai细粒度图像识别技术被国际权威顶会收录
    今年5月,国家林业和草原局下发《关于妥善解决人工繁育鹦鹉有关问题的函》,要求河南省林业局对包括费氏牡丹鹦鹉在内的多种人工养殖鹦鹉进行标识管理试点,对符合条件的养殖户尽快核发管理证件,同时,对合法人工繁育来源、依法允许出售的鹦鹉,停止执行禁止交易措施,在政府规定的场所进行销售活动。原来,1月初,河南商丘近1000家养殖户因不了解费氏牡丹鹦鹉属于国家保护动物,直到外地公安部门多次来商丘调查,他们才后知后觉。现在,“鹦鹉案”困境终于有了解法。 可是,难以辨别的野生动植物依然有很多。怎么才能避免因“不懂法”“不认识”而触碰野生动植物保护的红线?在淘宝等商品平台上,阿里安全的做法是,依靠通过人工智能对商家挂出商品进行初筛,再交给人工审核精细判断处理,并对禁限售商品的搜索弹出科普宣导页面。 最近,浙江大学和阿里安全AI细粒度图像识别技术取得了新进展,在公开数据集CUB(鸟类识别)、Standford Dogs(狗类识别)、iNaturalist(动植物识别)的识别准确率上达到91.3%、68.5%、92.4%的行业最优效果,研究成果被多媒体国际权威顶会ACM MM 2021 收录,有望利用AI技术在商品和内容治理的实际应用中达到更好的效果。 如下图所示,左图是桃面牡丹鹦鹉,右图是国家保护动物费氏牡丹鹦鹉,二者区别仅在于喙的颜色以及白色眼圈,面对如此微小的区别,需要AI实现精细化识别。 阿里安全图灵实验室算法专家炫谦介绍,新研发的AI细粒度识别技术可以自适应调整具备聚焦视角,例如在不同种类的鸟类识别中,聚焦区域可能集中在“喙、眼、羽毛、尾巴、爪”等部位。 细粒度图像识别是计算机视觉领域的一个经典问题,属于图像分类任务的细分支任务,细粒度图像识别任务的关键因素在于局部注意力,往往存在于图像的局部区域,如鸟的尾部、喙和蛙类的头部等。浙江大学和阿里安全的研究者通过“过滤”不需要关注的部位,增强对局部判别性区域的识别能力。在不同种类动植物的细粒度判别时,该技术可聚焦到类别的独特特征区域,从而帮助图片分类。 阿里安全图灵实验室负责人薛晖介绍,作为从源头构建安全的新一代安全架构核心AI技术,该技术未来有望用于平台治理工作中,比如山寨商标的识别,未成人年不良图片治理和恶心图治理等,帮助构建清朗、健康网络环境。 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-10
    最后回复 司书仪 2021-9-10 15:02
    3098 0
  • microchip–机器人演示系统实现基于神经网络的图像识别
    富昌电子和Microchip为机器人、电机控制和图像识别的人工智能 (AI) 应用开发了多板演示系统。 这款新的北极光演示系统包括图像处理和神经网络元件。其视频板使用图像传感器查看单个数字,在边缘执行人工智能,以识别数字,并向电机控制板发送指令。然后该板指示机械臂将物体移动到标有相同数字的位置。其显示模块显示来自相机的图像,并在系统识别出数字时显示一个信号。 该北极光系统采用 Microchip 产品,这些产品发挥着关键作用,包括实现神经网络推理引擎、图像处理和显示控制、电机控制和驱动,以及功率调节。 视频板的核心是一个低功耗、安全的 Microchip IGLOO2 FPGA,即 M2GL025-VF256,它具有 28,000 个逻辑元件(可扩展到 150,000 个)。该 FPGA 具有在软件中实现的 RISC-V CPU、用于显示输出的缩放器和 UART 接口,实现了用于图像识别的卷积神经网络 (CNN) 模型。 视频板还包括一个安森美半导体的MT9M114 CMOS 图像传感器、一个Microchip的基于 Arm Cortex-M4 内核的SAM E51 微控制器,以及一个 Microchip的 MIC33M350 电源模块。 显示模块包含160px x 128px的OLED 显示屏 WiseChip UG-6028GDEBF02。它还有一个可翻转的标准视频连接器,以提高观看灵活性。 电机控制板基于 Microchip dsPIC33EP128GM604 数字信号控制器(DSC)。它通过 Microchip MCP2561 CAN 收发器与视频板通信。该板也由 MIC33M350 模块供电。dsPIC33 器件提供 PWM 输出信号来控制机械臂的运动。 关于富昌电子: 富昌电子(Future Electronics)是全球领先的电子元器件分销商,向客户提供全球供应链解决方案、定制化工程设计服务以及丰富的电子元器件产品种类,在业界享有盛名。富昌电子由Robert Miller先生于1968年创立,在全球44个国家/地区拥有170个办事处,并视其5500名员工为公司重要的资产。作为一家全球整合的公司,富昌电子依托全球一体化信息平台,使客户能够实时查询库存情况和供需动态。凭借高水平的服务、先进的工程设计能力以及丰富的可销售库存,富昌电子始终秉承着成就客户的理念。 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-10
    最后回复 则断 2021-9-10 13:04
    4090 0
  • ebay测试图像识别功能可缩短一半交易卡上架时间
    在线拍卖行 eBay 上已拥有一个相当庞大的交易卡社区,如果你想要出售的交易卡数量众多,那么为每张卡创建条目无疑是非常耗时的事情。幸运的是,eBay 上个月宣布将会在本月晚些时候在 Android 和 iOS 端应用中推出一项全新的图像识别功能,该功能有望自动完成交易卡上线的大部分流程。 卖家只需将手机摄像头对准卡片,eBay 应用就会生成一个已经填充了大部分字段的列表。该公司声称,与手动输入所有内容相比,该功能可将上线时间缩短一半。不过,它并不是完全自动的。 首先,卖家必须搜索卡片所属的相关游戏或类别。然后,应用会呈现一个提示,用摄像头搜索该卡。然后,卖家从一个可能的列表中选择合适的匹配。应用会填写卡片的各种基本信息,但用户仍需输入卡片的状况、价格、运费和照片等细节。 eBay 交易卡和收藏品主管 Nicole Colombo 表示:“我们正在积极听取我们不断增长的社区的意见,投资新的增强功能,包括利用计算机视觉技术和建立一个强大的交易卡目录。我们的新列表功能不仅将为我们的卖家创造更快、更便捷的体验,还将为购物者提供更强大的交易卡库存--同时确保卡列表中的信息更加准确”。 训练机器学习模型需要时间,因此该功能从4月底的《魔法:集结》卡牌开始缓慢推出。5月,eBay将增加《口袋妖怪》和《优衣库》。 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-10
    最后回复 醮制 2021-9-10 10:13
    2875 0
  • 证件识别、图像识别api接口广泛应用
    证件识别、图像识别API接口应用广泛 关键词: 护照识别api、身份证拍照识别API、证件图像识别API,身份证图像识别API接口,身份证识别软件SDK,移动端车牌识别API接口,android身份证图像识别软件,手机端的证件图像OCR识别 一、证件图像识别API接口应用背景 总体来说当今的ocr识别技术主要细分为以下功能:ocr综合文字识别、ocr视频文字识别、人脸识别、证件识别、票据识别、车牌Vin码识别、银行卡识别、云识别。那么今天就和大家聊聊应用广泛的证件识别。 随着移动互联网的的发展,越来越多的公司都推出了自己的移动APP,这些APP多数都涉及到个人身份证信息的输入认证(即实名认证),如果手动去输入身份证号码和姓名,速度非常慢,且用户体验非常差。为了提高在移动终端上输入身份证信息的速度和准确性,我们开发出证件图像识别软件SDK,以满足各行业应用需求,给用户带来更好的体验。只需将身份证图像识别软件SDK集成到APP中,即可通过手机摄像头扫描识别身份信息。 二、证件图像识别API接口简介 证件图像识别软件SDK可支持Android、iOS主流移动操作系统,android平台提供jar包,ios提供静态库.a文件。APP集成身份证图像识别软件SDK后,用户采用手机、平板电脑对身份证进行拍摄识别即可自动识别身份证信息(如图-1所示); 证件图像识别 证件图像识别API接口技术还可以部署在识别服务器上,可支持Linux 32/64位操作系统、Windows 32位/64位操作系统。用户可部署到自有服务器上,APP可直接调用身份证图像识别软件服务识别身份证信息。 使用证件图像识别API接口技术后,大大地提升了APP的用户体验。 三、 证件图像识别API接口技术功能特点 1.识别身份证种类多:可识别二代身份证(包含汉族身份证和少数民族身份证)、香港身份证、澳门身份证、台湾身份证及部分国外身份证; 2.识别速度快:单张身份证图像识别软件速度小于2 秒; 3.通过调用识别功能Activity,实现APP应用程序接口调用,支持JAVA、Object-C等多种语言开发调用。 四、 证件图像识别API接口技术主要应用领域 警务通:移动警务、移动执法、交警执法(身份证、驾照、行驶证、车牌号识别) 城市管理综合行政执法:识别身份证、驾照 出租屋式旅业(小旅馆)管理:入住旅客登记 流动人口管理:入户普查 社区网格化管理:采集证件信息 保险:车险移动查勘,采集车辆信息及驾驶人身份信息 寿险移动展业,采集身份证、名片、银行卡号 电信实名制:代理网点采集身份证信息 信用卡申请:采集身份证、名片信息 证券非现场开户:采集身份证、银行卡号 网络实名制认证:采集身份证信息 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-10
    4918 0
  • 44课时ai课程发布!涵盖结构搭建、逻辑编程、图像识别、机器学习
    近年来,从中央到地方,陆续出台了系列推动人工智能教育的政策和措施。2017 年 7 月,国务院下发《关于新一代人工智能发布规划》的通知,文件明确提出,要在中小学阶段设置人工智能相关课程。2020 年 11 月 6 日,教育部在最新答复函官宣:编程教育将纳入中小学相关课程。 这意味着,人工智能课程将进入全国各大中小学校,成为中小学生的必修课。而人工智能成果展示活动,则是最有效的人工智能课程落地形式。 自「 2021 少年硅谷-月球资源采集挑战赛」启动报名以来,凭着高水平的赛事设置、高质量的赛事课程、丰富全面的赛事培训及趣味无穷的赛事道具,吸引了来自全国各地的老师和孩子。老师和孩子们在比赛过程中,「学」中「玩」,「玩」中「学」,轻松学习人工智能。 | 多场教师培训活动 近日,作为「 2021 少年硅谷-月球资源采集挑战赛」唯一技术支持方的英荔教育,重磅发布「月球资源采集挑战赛」赛项课程,共计 44 课时。内容涵盖结构搭建、逻辑编程、图像识别、机器学习、物联网控制等人工智能相关知识点。 | 课程目录 现在,请你和你的伙伴一同跟随赛事课程计划,创造属于你们的 AI 月球车,完成月球资源采集的一系列挑战吧! 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-9
    最后回复 兑笞 2021-9-9 19:29
    964 0
  • 图像识别在零售行业如何应用?今晚7点海深科技ceo戴剑彬直播讲解
    人工智能推动我国各行各业正在经历新一轮升级。在这轮技术变革浪潮中,与我们生活息息相关的零售行业表现的尤为突出。无人货架、无人货柜、AI 收银机等的出现,正在潜移默化地改变着人们的消费方式,使传统零售逐渐向智慧零售过渡,推动消费升级的同时,也节约了大量人力和物力。 智慧零售带来的消费升级主要体现在场景升级、服务升级和体验升级。而智慧零售的实现离不开计算机视觉的一项关键技术——图像识别。 图像识别,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术,是应用深度学习算法的一种实践应用。商品识别是图像识别的一种,主要应用在无人零售领域。(来源百度百科) 商品图像识别即利用计算机视觉技术,通过图像识别不同商品。但这项技术在应用时,会面临物体倒下、混合摆放、密集摆放、产品总量多、相似度高、商品变形、遮挡、非标产品识别等挑战。 海深科技聚焦新零售人工智能解决方案的研究。目前在商品图像识别方面,海深科技可以做到细粒度图像识别、极限图像识别、非标品图像识别、物体的重识别等,识别准确率高速度快,目前已为多家知名企业提供解决方案。 海深科技推出的基于计算机视觉的AI零售柜G-BOX,支持水果、生鲜、软包装零食、牛奶面包、日用品等日常商品售卖,并且支持商品密集、跨层摆放的识别,再加上开门自由取货的消费方式,更接近于微型超市的形态,可广泛应用于写字楼、医院、社区、学校、便利店等场景。 今晚7点,智东西公开课策划推出的计算机视觉应用系列课继续开讲。海深科技创始人兼CEO戴剑彬将主讲第二讲,主题为《图像识别在零售行业的应用》。戴博士将从图像识别对零售行业的变革出发,对商品图像识别技术难点及解决办法、解决方案工程化落地关键以及应用案例进行系统性讲解。 课程信息 时间:9月3日19点 地点:智东西公开课小程序 讲师介绍 戴剑彬,海深科技创始人兼CEO,毕业于清华大学,佐治亚理工学院,深度学习资深专家,曾在Oracle,Yahoo!等硅谷著名互联网公司长期从事机器学习算法的研发,在超大规模深度模型的架构和优化领域有世界前沿性成果。2016年6月,戴剑彬博士回国创建海深科技,公司专注于计算机视觉领域内的技术和产品研发,以基于深度学习的商品识别和视频用户行为分析为核心技术,为零售行业提供人工智能解决方案。 课程内容 主题: 图像识别在零售行业的应用 提纲: 1.图像识别对零售行业的变革 2.商品图像识别难点及解决办法 3.基于图像识别的智能零售解决方案工程化落地关键 4.图像识别在零售行业的应用案例 开课提醒 扫描下方二维码可直接进入直播间,在公屏顶部戳“开启开课提醒”提前预约,避免错过直播哦。 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-9
    最后回复 鲷泾 2021-9-9 15:52
    3179 0
  • 基于数据采集和图像识别的输电线路覆冰在线监测装置
    基于地形气候的多样性,冬季长时间的高强度、大范围的低温严寒气候,电力线路经常会出现不同程度上的覆冰问题,当线路覆冰量达到一定的程度时,电缆线重量培增,线路弧垂扩大,电缆线对地距离减小,从而引起电缆线触碰放电造成跳闸。另外覆冰情况严重时,空气中的杂质会随着雨雪粘附在绝缘子串上,导致绝缘子耐受电压水平降低,易产生形成冰闪事故。在状况进一步恶化时,若超出线路金具设计的机械强度,会造成 部分金具破裂,甚至进一步影响到杆塔的稳定性。严重影响人们的正常的生产和生活。 输电线路覆冰在线监测装置可以实现对线路覆冰状况的实时监测,主要是对线路覆冰的厚度的测量、气象环境的(包括温度、湿度、风速、风向等)数据采集、绝缘子导线拉力分析、拉力实时监控预警、并可根据相关覆冰模型算法得出相应的警戒值及预警信息,对线路覆冰状况进行检查,以及融冰处理情况实时审核管理。 在大规模推展覆冰监测装置的应用后,在防冰抗冰工作中发挥了极大的保障的作用。利用系统大数据的支持,可以为线路融冰起到指导、决策的作用。在大面积覆冰的情况下,融冰的先后次序、轻重缓急就可借助覆冰监测系统监测的数据,合理安排防冰特巡及导地线融冰工作任务。同时在运行人员的手机上可同步覆冰监测系统相关数据,极大提高了现场数据的真实有效性及准确性。 -END- 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-9
    最后回复 娠驼诫 2021-9-9 14:01
    5038 0
  • 智能一体机助力婚姻登记,让科技为爱情保驾护航
    人脸比对, 身份证扫描, 指纹识别。 如今一台智能机器的出现, 便可实现3分钟自助领证。 没错,是结婚证的“证”! 婚姻业务智能一体机, 为爱情保驾护航。 产品涵盖婚姻登记、离婚申请、补领结婚证、补领离婚证、档案查询五大核心功能。依托活体检测、图像识别、身份证读取、指纹识别等技术,解决婚姻业务办理高峰期办件量大、证件审查风险高、单次办理时间长等问题,提高办理效率、降低安全风险、提升群众满意度。 1高效率 人工智能甄别,为繁杂工作减负。 自主研发的AI+大数据“智能审核”算法,实时、高效、准确地实现对业务的审核判断,过滤不符合受理要求的业务,减轻工作人员负担。 2高精度 OCR图像识别,为信息采集定位。 通过OCR图像识别结合计算机深度学习,实时提取当事人证件关键信息,实现证件之间智能比对,对信息采集精准定位。 3高实力 资深研发团队,为产品质量负责。 研发团队由涉足婚姻领域十余载的业务专家、技术大牛汇聚而成,功能评审50余次,基层调研30余次,11次推翻重构,强悍实力铸就一流品质。 4高安全 生物识别认证,为业务安全把关。 结合人脸识别、指纹识别等多模态生物识别技术,利用人工智能算法,核验当事人身份,有效防范身份盗用。 5高标准 全面运维保障,为售后服务护航。 专业化运维团队将提供7*24小时的高标准运维保障,第一时间通过远程调试或现场维修的方式解决产品问题。 该婚姻业务智能一体机已在贵阳市云岩区婚姻登记处正式投入使用。准新人通过人脸识别,3分钟便可完成结婚登记的所有信息录入。该信息将直接同步至登记窗口,无需手工填写表单。近年来,民政部全力打造“数字婚姻”理念,在登记工作中推进数字化、网络化、智能化运用,极大提高登记服务效率,让办事群众切实体验到“互联网+婚姻服务”带来的精准便捷服务。 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-9
    最后回复 仑舜牵 2021-9-9 08:50
    3716 0
  • 2021年世界人工智能大会 交通银行:“数字化新交行更有‘AI’”
    7月8日,2021年世界人工智能在沪召开,以“数字化新交行更有‘AI’”为主题,大会荣耀合作商交通银行极富科技感的展台也正式亮相。近年来,作为唯一一家总部设在上海的国有大行,交行重点聚焦“长三角龙头银行”建设,服务上海主场。本次展会,交行展厅开辟了裸眼3D虚拟主播互动区、沉浸式金融服务体验区,“交银e办事”品牌展示区和数字人民币场景服务区四大展区,集中展出交行为赋能城市数字化转型打造的一系列金融产品。 金融科技惠民生 “交银e办事”是交行对接上海“两张网”推出的标杆品牌,旗下产品和服务紧紧围绕民生需求,通过数字化手段,结合银行金融服务属性,有效协助政府提升服务小微企业、服务市民的能力。在这个展区,观众既能看到“惠民就医”、“智能投顾”、“电子亮证”、“手机银行老人关爱版”、“智能客服”等惠民产品,也能看到“便捷开户”、“普惠e贷”、“e关通”、“跨境e金融”等服务于实体经济的金融产品,充分体现了交行“让数据多走路,让客户少跑路”的理念,展现了大数据、人工智能等新技术的应用成果。 其中,“惠民就医”是交行配合上海市医疗付费“一件事”推广和“便捷就医”数字化转型,为上海市医保参保市民量身定制的一款数字信用产品,且普惠就医额度不低于5000元,市民可通过“随申办”APP实现在线极简申领。与此同时,该产品通过重塑医疗付费流程,将患者排队缴费环节由此前至少三个减少到零,实现了看病缴费零排队,极大程度提高了医疗效率,减少患者排队等候时间平均30分钟以上。据了解,该产品现已覆盖上海全市400余家公立医疗机构,申请批核率高达95%以上。 数字人民币消费新体验 来到交行展台,自助咖啡吧、自助果汁机、自助洗衣机、食品小超市等有趣的小商铺跃入眼帘,这些都是交行为观众们“尝鲜”数字人民币悉心安排的场景。观众们可现场体验便利消费、校园生活、电子竞技、外币兑换等服务,真真切切地感受到数字人民币带来的安全及便利。 数字人民币是由人民银行发行的数字形式的法定货币,交行作为数字人民币的试点运营机构之一,积极推进数字人民币在试点城市的场景建设,已涵盖连锁餐饮、零售百货、交通出行、健康医疗、教育培训和文化健身等百姓主要消费场景,支持线上线下数字人民币综合支付服务;形成了智慧校园、数字人民币保单、港口领域结算、国家电网缴费、集团企业资金归集清分等面向政府及企业的数字人民币金融服务方案。在上海正如火如荼举行的“五五购物节”活动中,交行不断拓展服务场景,支持数字人民币在百货商超、餐饮酒店、旅游景点、自动售货、生活服务、居家出行、影院剧场等民生消费领域的应用,助力数字人民币快速发展。 雅典娜智能机器人平台 雅典娜机器人平台也是交行展厅的一大亮点,在沉浸式体验空间里,她将与观众亲密互动。早在2018年,交行就开始研究人工智能在信用卡业务上的应用,确定了以“理解语言、拥有智能、赋能金融”为研究的出发点,以信用卡所积累的大量业务数据为基础,研发了自主可控的雅典娜智能机器人平台。通过将自研技术、开源算法、商业产品形成统一技术体系,形成了以雅典娜机器人平台为核心的人工智能体系,涵盖数据、算法、算力(GPU),感知智能,认知智能,决策智能,数字员工等多维度,建设了生物识别、知识图谱、图像识别、ASR、TTS、流程自动化等AI能力。 目前雅典娜人工智能体系已广泛应用于信用卡智能客服、智能营销、智能催收、智能风控等业务。其中在智能客服领域的应用,每日分流话务4.4万通,分流率51.0%,分流人工话务占比达到32.3%。平台关键技术已申请4篇国家发明专利,平台也获得了2019上海银行业年度创新奖,2020人民银行科技发展二等奖,在银行同业有一定的影响力和示范效应。 虚拟主持、XR技术助阵 交行展台矗立着一块高达7.5米的电子大屏幕,屏幕上一名惹人喜爱的裸眼3D二次元虚拟主持人“申雅”非常吸睛。作为虚拟主持人、二次元偶像IP,“申雅”以可“萌”可“飒”、小吃货、偶尔会犯迷糊的实习主播为人设。本次展会,交行请来“申雅”作为特邀嘉宾,通过结合实时光学式动作捕捉技术和增强现实跟踪系统等最尖端技术,与观众开展场景互动,展现交行数字人民币、惠民就医、电子亮证等金融科技产品。 XR技术是AR的升级,可以实现虚拟世界与现实世界之间无缝转换的“沉浸感”体验。在此次世界人工智能大会的交行展台上,观众能够观赏到采用此技术呈现的交行百年历史、信用卡业务及沃德嘉年华活动等内容,体验焕然一新的金融服务体验。 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-8
    最后回复 值蓊 2021-9-8 21:23
    1336 0
  • 视觉检测在自动化的应用
    机器视觉检测技术是一种基于计算机视觉研究的新兴检测技术。在当今不断发展进步的工业自动化中,机器视觉技术已在工业中得到越来越广泛的应用,并越来越受到用户的认可和青睐。因此,人们开始考虑使用CCD摄像机捕获图像并将其发送到计算机或专用图像处理模块。通过数字处理,可以根据像素分布,亮度和颜色等信息确定大小,形状和颜色。这种方法将计算机处理的快速性和可重复性与人类视觉的高度智能化和抽象的能力相结合,从而产生了机器视觉检测技术的概念。 我们不难发现其应用规模越加的普遍,依据这些范畴,我们可以归纳综合出在工业自动化下的五大应用。 1、视觉引导和定位应用 视觉定位要求机器视觉系统能够快速准确地找到被测零件并确认其位置,上下料使用机器视觉来定位,引导机械手臂准确抓取。在半导体封装领域,设备需要根据机器视觉取得的芯片位置信息调整拾取头,准确拾取芯片并进行绑定,这就是视觉定位在机器视觉工业领域最基本的应用。此外,在半导体制造领域,芯片位置信息调整拾取头非常不好处理,机器视觉则能够解决这个问题,因为需要准确拾取芯片以及绑定,这也是视觉定位成为机器视觉工业领域最基本应用的原因。 2、外观缺陷检测应用 检测生产线上产品有无质量问题,该环节也是取代人工最多的环节。例如机器视觉涉及到的医药领域,其主要检测包括尺寸检测、瓶身外观缺陷检测、瓶肩部缺陷检测、瓶口检测等。伴随着现代工业自动化的发展,机器视觉检测被广泛应用到各种各样的检查、测量和零件识别,例如新能源动力电池表面缺陷检测、电子元器件识别、磁性材料外观缺陷检测、产品包装上的条码和字符识别等,这类应用的共同特点是连续大批量生产、对外观质量的要求非常高。随着经济水平的提高,机器视觉检测越来越受到重视。它可以提高合格产品的生产能力,在生产过程的早期就报废劣质产品,从而减少了浪费节约成本。 3、高精度检测应用 有些产品的精密度较高,达到0.01~0.02m甚至到u级,人眼无法检测必须使用机器完成。最典型的案例就是动力电池毛刺检测、pcb电路板检测等。以及药用玻璃瓶检测,医药领域也是机器视觉的主要应用领域之一。 4、图像识别应用 图像识别就是利用机器视觉对图像进行处理、分析和理解,以识别各种不同模式的目标和对象。可以达到数据的追溯和采集,在新能源电池、电路板、电子元器件、五金配件、食品、药品等领域应用较多。最典型的案例就是识别二维码。二维码和条形码是我们生活中极为常见的条码。在商品的生产中,厂家把很多的数据储存在小小的二维码中,通过这种方式对产品进行管理和追溯,随着机器视觉图像识别应用变得越来越广泛,各种材质表面的条码变得非常容易被识别读取、检测,从而提高现代化的水平、生产效率大大的提高、生产成本却逐渐降低。 5、物体分拣应用 在机器视觉应用环节中,物体分拣应用是建立在识别、检测之后的一个环节,通过机器视觉系统将图像进行处理,结合机械臂的使用实现产品分拣。在过去的生产线上,是用人工的方法将物料安放到指定地点,再进行下一步工序。而现在则是使用自动化设备分料,其中使用机器视觉系统进行产品图像抓取、图像分析,输出结果,再通过机器人,把对应的物料、放到固定的位置上,从而实现工业生产的智能化、现代化、自动化。常用于食物分拣、快递主动分拣、棉花纤维分拣等,节约人工、提升速率、进步产物质量成为了当下经济情况下企业生计的必经之路,应用机器视觉检测技巧将能帮助企业在剧烈的竞争中立于不败之地。 深圳市昊天宸科技有限公司是一家集研发、专属定制及销售为一体的高新科技企业,生产线设备升级改造方案提供商。自成立以来,公司就一直专注于机器视觉检测领域,自主研发生产机器视觉检测设备、视觉检测自动化设备、机器视觉外观检测设备、光学自动化检测设备、CCD视觉检测设备、光学筛选机、机器视觉检测系统,同时提供定制化机器视觉检测解决方案,为各大企业厂家提供非标自动化检测设备,针对新能源电池、PCB线路板、精密部件、电子元器件等领域产品的尺寸测量、外观缺陷、字符识别等方面进行自动化检测,帮助客户提高生产效率,提高产品质量,降低人工成本,增强市场竞争力。 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-8
    最后回复 经清韵 2021-9-8 17:10
    4039 0
  • 推荐|10本不容错过的深度学习和神经网络书籍
    深度学习是如今最火热的技术之一,但是对于有心入门却不得其法的同学来说,选择适合自己的书籍至关重要。 本着乐于助人、无私奉献的精神,小编特意为大家精选了 10本深度学习相关的书籍。这些书籍中,有些非常注重理论知识,主要关注神经网络和深度学习背后的数学和相关假设;有些则注重实战,通过代码而不是理论来讲解深度学习。而那种既有理论讲解,同时又有相应的实战训练的书籍。 本次电子书籍为CSDN回馈粉丝福利免费赠送,所有书籍均可在CSDN上在线学习(文末获取学习地址)。 现在,让我们一览这些书籍,比较优劣,看看哪些对于学习AI,或者说进一步理解这门艺术有最大的帮助: 第一本:《深度学习之图像识别:核心技术与案例实战》 本书全面介绍了深度学习在图像处理领域中的核心技术与应用,且提供了不同难度的案例供读者实践,可以在已有代码的基础上进行修改和改进,从而加深对所学知识的理解。 第二本:《keras深度学习实战》 通过阅读本书,读者不仅能学会使用Keras快捷构建各个类型的深度网络,还可以按需自定义网络层和后端功能,从而提升自己的AI编程能力。 第三本:《实战深度学习算法》 本书系统地介绍了如何用 Python 和 NumPy 一步步地实现深度学习的基础模型,可直接动手调试和观察整个训练过程,进一步理解模型及其算法原理。 第四本:《深度学习入门之PyTorch》 本书将从机器学习和深度学习的基础理论入手,从零开始学习PyTorch,了解PyTorch基础,以及如何用PyTorch框架搭建模型。 第五本:《深度学习之PyTorch物体检测实战》 本书从概念、发展、经典实现方法等几个方面系统地介绍了物体检测的相关知识,重点介绍了Faster RCNN、SDD和YOLO这三个经典的检测器,并利用PyTorch框架从代码角度进行了细致讲解。另外,《深度学习之PyTorch物体检测实战》进一步介绍了物体检测的轻量化网络、细节处理、难点问题及未来的发展趋势,从实战角度给出了多种优秀的解决方法,便于读者更深入地掌握物体检测技术,从而做到在实际项目中灵活应用。 第六本:《深度学习与计算机视觉——算法原理、框架应用与代码实现》 本书第1篇基础知识,介绍了人工智能发展历程、计算机视觉概要、深度学习和计算机视觉中的基础数学知识、神经网络及其相关的机器学习基础、卷积神经网络及其一些常见结构,最后对前沿的趋势进行了简单探讨。第2篇实例精讲,介绍了Python基础、OpneCV基础、简单的分类神经网络、图像识别、利用Caffe做回归、迁移学习和模型微调、目标检测、度量学习和图像风格迁移等常见的计算机视觉应用场景。 第七本:《TensorFlow深度学习实战》 本书将介绍如何有效地使用Google的开源框架TensorFlow进行深度学习。 第八本:《零基础学机器学习》 本书通过AI“小白”小冰拜师程序员咖哥学习机器学习的对话展开,内容轻松,实战性强,主要包括机器学习快速上手路径、数学和Python 基础知识、机器学习基础算法(线性回归和逻辑回归)、深度神经网络、卷积神经网络、循环神经网络、经典算法、集成学习、无监督和半监督等非监督学习类型、强化学习实战等内容,以及相关实战案例。 第九本:《百面机器学习 算法工程师带你去面试》 书中收录了超过100道机器学习算法工程师的面试题目和解答,其中大部分源于Hulu算法研究岗位的真实场景。 第十本:《图像处理、分析与机器视觉(基于LabVIEW)》 主要介绍基于LabVIEW的图像处理、分析与机器视觉系统的开发技术。 以上书籍免费获取方法: 人工智能从基础到实战 计算机视觉 深度学习 获取方法: 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-8
    最后回复 蝴邸隋 2021-9-8 14:43
    4135 0
  • 用python进行ocr图像识别
    数据采集就怕遇到图片,只能看不能复制怎么办。手动将文字提取出来,要耗费很大的工作量。 例如下图,某楼盘的一房一价表,怎么样发现单价低位的房子?光凭肉眼很难发现吧,能否让计算机进行文字的识别,然后再对这些数值型信息进行数据分析? 首先把图片中的单价提取出来, 进而生成图像: 用python就可以实现,采用现在流行的OCR图像识别。主要思路是使用机器学习模式,通过已有图片手动训练出一个图像识别模型,具体步骤如下: 一、将图片预处理,更方便计算机识别 (一)把图像灰化 使用open-cv库对图片进行处理。 使用灰化后的图片,如下图,排除干扰信息,能让识别更加稳定。 (二)把图片分割 将图片分割成小方块,一是提高识别精度,二是方便将数据储存为表格形式。可以设定好参数,根据坐标系把图片裁剪成一个个小方块,如下图,储存为jpg格式。 二、建立图像识别模型 (一)将分割好的小方块图片合并成tiff文件 jTessBoxEditor,打开jTessBoxEditor.jar,使用tools下的merge tiff工具,将图片合并成tiff文件。(二)使用已有模型对tiff文件进行初识别 下载并安装tesseract,并配置好环境变量,将Tesseract-OCR和tessdata的路径加入到环境变量下的path下面。 Tesseract自带图像识别的模型,例如中文简体汉字识别模型chi_sim.traineddata,英文识别模型eng.traineddata,这些模型可以网上下载,放到tessdata里面即可使用。 然后进入tiff所在文件夹。在命令窗口,输入:tesseract ***.tif *** -l +++ -psm 7 batch.nochop makebox,按回车生成box文件。其中***为tif的文件名,+++为要生成的traindata的文件名。(三)使用对tiff和box文件进行调整打开,在box editor中的open按钮,打开要编辑的tif文件。编辑之后保存,生成box文件。保存在同一个文件夹里。 (四)使用tiff和box文件生成模型 在tiff和box的文件中,在命令窗口输入以下代码,最终生成模型(traindata文件) 上述脚本也可以写在bat文件中,运行脚本来生成traindata,最终仅需要将traindata复制到tessdata里面,即可使用该模型。 三、应用图像识别模型 安装完,训练完模型之后,就要在python中使用模型了。安装pytesseract,找到pytesseract.py文件,打开编辑,将其中的“tesseract_cmd = 'tesseract'”,改成tesseract的安装路径(如C:\Program Files\Tesseract-OCR\\tesseract)。 因为模型是采用灰化后的图片训练的,所以在识别时也要使用灰化。 四、优化图像识别模型 在使用中,如果有错误,可以存下来,加入训练库,优化图像识别模型。在一般是识别错误的图片,积攒一阵子后。累积做成tif文件。注意:同类错误选择几个记号了,训练库尽量小而精。 Python猫技术交流群开放啦!群里既有国内一二线大厂在职员工,也有国内外高校在读学生,既有十多年码龄的编程老鸟,也有中小学刚刚入门的新人,学习氛围良好!想入群的同学,请在公号内回复『交流群』,,非诚勿扰!)~ 还不过瘾?试试它们 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-8
    最后回复 牝筒 2021-9-8 13:47
    2651 0
  • 图片二维码识别sdkc#,百度图像识别api接口
    图片二维码识别SDK C#,百度图像识别api接口?图像识别精准识别超过十万种物体和场景,包含10余项高精度的识图能力并提供相应的API服务,充分满足各类开发者和企业用户的应用需求。 图像识别接口配置功能有哪些? 1、 功能丰富 10余项垂类业务场景的细粒度图像识别,精准识别超过十万种物体和场景,并持续丰富接口返回的内容信息 2、 支持定制化识图 可根据不同的业务场景定制专属的AI识图能力,如自定义菜品识别,满足非通用场景下的业务需求 3、 组合接口API调用 可通过入参自由选择需要的垂类识别服务,一次传图,多垂类同时识别 4、 同步返回百科信息 识别结果中可返回百度百科的词条内容,让业务功能更完善、内容更丰富 图片二维码识别SDK C#,百度图像识别api接口?腾佑科技作为百度云服务中心,支持百度所有产品的出售而且优惠折扣全网最低价,详细咨询请点击我们的在线商桥或者拨打400电话:400-996-8756。 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-8
    最后回复 缑希月 2021-9-8 10:54
    3770 0
  • 新华日报:1小时可完成100亿张图像识别南京智能计算中心落成投运
    1小时可完成100亿张图像识别 南京智能计算中心落成投运 新华日报 2021年7月18日 第2版 本报讯 (王梦然) 7月16日,南京智能计算中心在麒麟科技创新园落成并投运,中心由麒麟科技创新园、浪潮、寒武纪共同打造。 南京智能计算中心采用业界领先的人工智能芯片和算力机组构建,已运营系统的AI计算性能相当于50万台个人电脑的计算能力,1小时可完成100亿张图像识别、300万小时语音翻译或1万公里的自动驾驶AI数据处理任务……这将成为长三角当前投运的最高算力的智能计算中心。 目前,清华大学、中科院计算所、南信大气象科学技术研究院等一批智能创新产学研机构已依托南京智能计算中心开展人工智能研发应用创新。其中,中科院计算所利用算力平台开展蛋白质结构预测的AI推断服务,唯仁科技等企业则在智慧医疗、智能车联网、智能制造、自动驾驶等领域开展训练推理任务研究,力争实现多场景、多领域的算力应用服务。 中心的落地,将再次擦亮南京“人工智能”产业名片。目前,南京人工智能产业围绕基础层、技术层、应用层三大层级,集聚企业近300家,核心产业规模超过60亿元,带动相关产业规模近800亿元。 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-8
    最后回复 越柔绚 2021-9-8 08:04
    5569 0
  • 浙大与阿里ai图像识别取得新进展鸟类识别准确率达91.3%
    今年5月,国家林业和草原局下发《关于妥善解决人工繁育鹦鹉有关问题的函》,要求河南省林业局对包括费氏牡丹鹦鹉在内的多种人工养殖鹦鹉进行标识管理试点,对符合条件的养殖户尽快核发管理证件,同时,对合法人工繁育来源、依法允许出售的鹦鹉,停止执行禁止交易措施,在政府规定的场所进行销售活动。原来,1月初,河南商丘近1000家养殖户因不了解费氏牡丹鹦鹉属于国家保护动物,直到外地公安部门多次来商丘调查,他们才后知后觉。现在,“鹦鹉案”困境终于有了解法。 可是,难以辨别的野生动植物依然有很多。怎么才能避免因“不懂法”“不认识”而触碰野生动植物保护的红线?在淘宝等商品平台上,阿里安全的做法是,依靠通过人工智能对商家挂出商品进行初筛,再交给人工审核精细判断处理,并对禁限售商品的搜索弹出科普宣导页面。 最近,浙江大学和阿里安全AI细粒度图像识别技术取得了新进展,在公开数据集CUB(鸟类识别)、Standford Dogs(狗类识别)、iNaturalist(动植物识别)的识别准确率上达到91.3%、68.5%、92.4%的行业最优效果,研究成果被多媒体国际权威顶会ACM MM 2021 收录,有望利用AI技术在商品和内容治理的实际应用中达到更好的效果。 图说:浙江大学和阿里安全研发的AI技术在公开数据集CUB(鸟类识别)、Standford Dogs(狗类识别)、iNaturalist(动植物识别)的识别准确率达到目前行业最优效果 如下图所示,左图是桃面牡丹鹦鹉,右图是国家保护动物费氏牡丹鹦鹉,二者区别仅在于喙的颜色以及白色眼圈,面对如此微小的区别,需要AI实现精细化识别。 阿里安全图灵实验室算法专家炫谦介绍,新研发的AI细粒度识别技术可以自适应调整具备聚焦视角,例如在不同种类的鸟类识别中,聚焦区域可能集中在“喙、眼、羽毛、尾巴、爪”等部位。 图说:左图为吉娃娃,右图为玩具曼彻斯特犬,因为两者皮毛纹理相近,左图易被误识别为玩具曼彻斯特犬。 细粒度图像识别是计算机视觉领域的一个经典问题,属于图像分类任务的细分支任务,细粒度图像识别任务的关键因素在于局部注意力,往往存在于图像的局部区域,如鸟的尾部、喙和蛙类的头部等。浙江大学和阿里安全的研究者通过“过滤”不需要关注的部位,增强对局部判别性区域的识别能力。在不同种类动植物的细粒度判别时,该技术可聚焦到类别的独特特征区域,从而帮助图片分类。 阿里安全图灵实验室负责人薛晖介绍,作为从源头构建安全的新一代安全架构核心AI技术,该技术未来有望用于平台治理工作中,比如山寨商标的识别,未成人年不良图片治理和恶心图治理等,帮助构建清朗、健康网络环境。 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-8
    最后回复 犹自棠 2021-9-8 01:20
    3326 0
  • 通过AI电子秤窥探视觉识别原理,干货满满
    视觉识别技术在各个领域的价值都有在一点点的探索和挖掘,零售业也并非罕见。现在、自动结账、自动补货、刷脸支付到如今的视觉识别秤,这只是AI技术在零售业应用的开始。为了让大家更好地d了解这一趋势,今天就i识别技术原理,为大家做一个揭秘大放送。帮助大家更好地理解 AI识别的相关问题。 电子秤识别的过程 (1)信息的获取 获取信息的过程可以类比成人类“看”这个动作。在i识别设备中,我们需要首先通过摄像头拍摄到秤盘的商品,将光感信息转化为机器可以识别的电信息。比如,在图像描述中,我们可以通过不同的色彩模式下的参数来描述每个像素点,从而描述一张照片,比如HSB色彩模式就可以通过色相,饱和度,亮度三个维度来描述像素,此外,还有大家常见的RGB、LAB、灰度等多种方式。 HSB光谱 (2) 信息的预处理 预处理就是将照片进行图像识别前的处理过程,包括对信息的挑选和加工。首先是挑选,在摄像头拍下照片的时候,我们需要快速在拍摄的多张照片中,挑选最清晰的一张拿来使用。接下来是照片降噪处理。这里面对图像的处理包括:图像修复填充、图像去雾处理、图像对比增强、图像无损放大、拉伸图像恢复、图像清晰度增强、图像色彩增强等等。最终,只为排除干扰因素,获得一张最适合算法去识别的照片。 拉伸图像恢复 (3)特征抽取和选择 简单地理解就是我们所研究的图像是各式各样的,有的图像里包含苹果,有的图像包含香蕉,如果要将这些图片进行分类,就要通过这些图像所具有的本身特征来识别,而获取香蕉、苹果这些特征的过程就是【特征抽取】。在特征抽取中所得到的特征也许对此次识别并不都是有用的,比如苹果上贴有一个标签,我们没有通过标签来识别的计划,这个时候就要提取苹果相关的特征,摒弃标签的特征,这就是【特征的选择】。特征抽取和选择在图像识别过程中是非常关键的技术之一,所以对这一步的理解是图像识别的重点。 (4) 分类器设计和分类决策 【分类器设计】是指通过训练而得到一种识别规则,通过此识别规则可以得到一种特征分类,使图像识别技术能够得到高识别率。【分类决策】是指在特征空间中对被识别对象进行分类,从而更好地识别所研究的对象具体属于哪一类。比如我们在无码商品的识别中,我们发现有大面积叶子的特征的,都属于蔬菜,因为我们可以在特征分类中加上蔬菜这个分类,这样,算法发现有大面积叶子的特征时就会在叶子蔬菜这个分类中去匹配,而不会跑到水果或者干货的品类中去。 拍摄图片 识别到特征主体 怎么提高图像识别的准确率? (1)样本增强 数据增强是指在训练的过程中,为了获得更多的样本和模拟实际情况中的多变的情况,对图像进行不同的处理以获得多样的样本。比如,一只正常小猫的照片,我们可以通过将照片进行去色,增加曝光,模糊、锐化,旋转,翻转,加上有色滤镜等处理。增加验证准确性的最简单方法之一是添加更多数据。在没有很多训练实例,这将特别有用。 样本增强技术 (2) 正确操作,避免脏数据 在图像识别的过程中,送入训练图像越干净,模型识别的准确率就会越高。这里的干净,就是指有效样本,比如,正常的送入i识别的样本,都应该是包含水果蔬菜之类的无码商品的,而操作员在使用过程中用摄像头拍下一些手机、钱包、或是主体不清晰的照片等,不在训练样本范围内的照片,这样子的我们称之为脏数据,脏数据在越多,准确率就会越低。 脏数据 有效数据 (3) 使用清晰度合适的照片 和人眼识别一样,如果输入的图像太小,会不利于模型对图像识别图像特征。但是,也不是图像越大越好,如果图像太大,则会增加计算机所需的计算资源,并且模型如果不够复杂,也无法处理它们。所以,怎么选出最适合该商业场景的图像大小也是一门技术活。 (4)同时使用多套算法,然后将多套算法进行PK 在i识别的算法中,我们就创新地部署了多套算法,让不同的算法分别进行识别计算,然后将多套算法的识别结果进行PK,显示最有可能的那一张。比如,我们得放上一根黄瓜,在A算法中,得出的黄瓜的概率最高,是80%;在B算中得出的苦瓜的概率最高,是30%。这两个结果pk后,80%明显大于30%。所以我们会推荐黄瓜,并且将黄瓜放在第一位展示出来,将苦瓜放在第二位。 多个算法PK AI技术发展至今,面临的新挑战是什么? 随着技术的成熟与发展,就像人的大脑无法记忆浏览器所承载的内容一样,机器对于图像的处理在效率和准确度上可以超越人类,也毋庸置疑。 技术成熟后,科学技术人员所面对的是一些新的问题。如何让这些技术为我们所用,走出高昂的费用,走出实验室的苛刻条件,走入复杂的现实世界,走入各行各业和寻常百姓家。 通过i识别在生产过程中所解决的问题,大概可以了解对从技术到应用之间的距离。 (1) 最普通的摄像头 首先,i识别所需要的摄像头,是最普通的720P的摄像头,且不说不是什么工业的专业镜头,就连最普通的手机摄像头都比它拍出的照片清晰多倍,稍微放大一些就能看到清晰的像素码。 (2)极小的算力 其次,i识别所需算力极小。在正常的称重设备上,都有一个芯片供设备本身的系统(windows/安卓)运行,而i识别和这个系统共同用一个芯片的算力,同时要求运算速度在毫秒级别。此外,为了准确率和离线处理,我们还需要同时部署多套神经网络算法和本地自学习算法。 (3)复杂的现实环境 在实际的场景中,i识别需要面对的环境也非常地复杂。不仅要面对生鲜商品随着季节的颜色形态变化,也需要面对不同门店的光环境,不同包装袋透光率等等。 虽然,算法基本的底层框架都差不多,但是对于实际场景的使用,还是会有千差万别的处理方式,要想做好某个领域的AI产品,还是得技术和行业两手抓。 原文章作者:元芒数字,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-7
    最后回复 跚淄仿 2021-9-7 21:40
    2120 0
  • easydl,easydl定制化图像识别
    EasyDL,EasyDL定制化图像识别,百度云EasyDL图像定制化。腾佑科技作为百度云服务中心,支持百度所有产品的出售而且优惠折扣全网最低价,详细咨询请点击我们的在线商桥或者拨打400电话:400-996-8756。 EasyDL图像:定制基于图像进行多样化分析的AI模型,实现图像内容理解分类,图中物体检测定位等,适用于图片内容检索、安防监控、工业质检等场景。 EasyDL文本:基于百度大脑文心领先的语义理解技术,提供一整套NLP定制与应用能力,广泛应用于各种自然语言处理的场景。 EasyDL语音:定制语音识别模型,精准识别业务专有名词,适用于数据采集录入、语音指令、呼叫中心等场景,以及定制声音分类模型,用于区分不同声音类型。 EasyDL OCR:定制化训练文字识别模型,结构化输出关键字段内容,满足个性化卡证票据识别需求,适用于证照电子化审批、财税报销电子化等场景。 EasyDL视频:定制化分析视频片段内容,跟踪视频中特定的目标对象,适用于视频内容审核,人流/车流统计,养殖场牲畜移动轨迹分析等场景 EasyDL结构化数据:挖掘数据中隐藏的模式,解决二分类、多分类、回归等问题,适用于客户流失预测、欺诈检测、价格预测等场景。 EasyDL零售行业版:定制化商品检测模型,基于百度大规模零售数据预训练模型及数据增强合成技术,提供多种可选服务功能和成熟AI能力,全面满足零售快消行业商品识别相关业务需求。 EasyD使用方式有哪些? 1、在线使用 在云端使用 EasyDL完成一站式模型训练及部署,即刻上手体验,无需依赖本地算力环境。云端产出的模型可灵活支持在线、离线多种部署方案 2、本地使用 在本地安装飞桨客户端-EasyDL,可实现本地离线完成一站式模型训练及部署流程,数据与产出的模型可在本地高效管理 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-7
    最后回复 脉肄 2021-9-7 21:10
    4440 0
  • 搭载智能物体识别技术京瓷开发图像识别型“智能无人收银系统”
    京瓷株式会社(社长:谷本秀夫)宣布推出自主开发的图像识别型“智能无人收银系统”。 该系统利用京瓷自主开发的人工智能物体识别技术,使用1台相机就可以迅速识别重叠在一起的多个商品。另外,与传统方式相比,使用此技术可以大幅缩减录入新商品时系统的学习时间。 系统识别商品 “智能无人收银系统”使用画面 ■系统开发的背景 近年来,随着日本国内劳动人口的减少,零售店和便利店面临着进一步提高店铺运营效率和节省人力的课题。此外,为防止新冠病毒的传播,店铺内也需减少人与人接触的机会。 应对这种情况,目前一些店铺内引进了自助收银机和无人人工智能结算系统。但随之而来的问题是自助收银机需扫描条形码,会耗费使用者的时间和精力,无人人工智能结算系统需在店铺内放置多个摄像头,需要大规模的设备投资。 京瓷智能无人收银系统可以迅速识别重叠在一起的多个商品,在减轻使用者负担的同时,有助于提高店铺运营效率、减少人与人接触的机会。另外,在收银台设置1台相机、电脑和显示器即可使用本系统,成本低,操作简单。 ■系统的特点 京瓷智能无人收银系统利用京瓷研究开发本部先进技术研究所的自主开发技术,具有以下3个特点。 (1)低成本、导入简单 在收银台设置1台相机、电脑和显示器即可使用本系统,即使是小规模店铺也能低成本导入。 (2)在商品重叠摆放或手持商品状态下也可识别物体 利用京瓷自主开发的物体识别人工智能训练数据生成技术,即使是商品重叠摆放或者手持商品时,系统也可以实现高精度的图像识别。 (3)可以对大量商品进行识别,大幅缩减录入新商品时系统的学习时间 利用京瓷自主开发的物体识别人工智能架构, 1台系统就可以录入并识别约6,000种以上的商品。 此外,在录入新商品时,以往的系统需要再次识别全部商品,包括已录入的商品,而本系统只需要识别追加的新商品,从而大幅缩短系统的学习时间。 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-7
    最后回复 cw2vj9uj17 2021-9-7 14:11
    5002 0
  • 人工智能下的数据标注岗位是如何进行图像识别的
    伴随着图像处理技术的飞速发展,推动了图像识别技术的产生和发展,并逐渐成为人工智能领域中重要的组成部分,并广泛地运用于零售、医疗、教育等各个领域,渗透到人们生活的方方面面,远到智能物品识别,近到手里一份热腾腾的红薯。 那么你是否好奇,人工智能真的能如人眼一样进行图像识别吗? 图像识别的含义 图像识别是人工智能的一个重要领域,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。一般工业使用中,采用工业相机拍摄图片,然后再利用软件根据图片灰阶差做进一步识别处理。 AI图像识别,连接着机器和这个一无所知的世界,帮助它越发了解这个世界,并最终代替我们完成更多的任务。 《人工智能:一种现代方法》中提到,在人工智能中,感知是通过解释传感器的响应而为机器提供它们所处的世界的信息,其中它们与人类共有的感知形态包括视觉、听觉和触觉,而视觉最为重要,因为视觉是一切行动的基础。 图像识别的主要应用领域 在人类图像识别系统中,对复杂图像的识别往往要通过不同层次的信息加工才能实现。图像识别技术是立体视觉、运动分析、数据融合等实用技术的基础,在导航、地图与地形配准、自然资源分析、天气预报、环境监测、生理病变研究等许多领域可广泛应用。 1)遥感图像识别:航空遥感和卫星遥感图像通常用图像识别技术进行加工以便提取有用的信息。该技术主要用于地形地质探查,森林、水利、海洋、农业等资源调查,灾害预测,环境污染监测,气象卫星云图处理以及地面军事目标识别等。 2)军事、公安刑侦等领域的应用:图像识别技术在军事、公安刑侦方面的应用很广泛,例如军事目标的侦察、制导和警戒系统;自动灭火器的控制及防伪装;公安部门的现场照片、指纹、手迹、印章、人像等的处理和辨识;历史文字和图片档案的修复和管理等等。 3)生物医学图像识别:图像识别在现代医学中的应用非常广泛,它具有直观、无创伤、安全方便等特点。在临床诊断和病理研究中广泛借助图像识别技术,例如CT(Computed Tomography)技术等。 4)通讯领域的应用:包括图像传输、电视电话、电视会议等。 5)机器视觉领域的应用:作为智能机器人的重要感觉器官,机器视觉主要进行3D图像的理解和识别,该技术也是研究的热门课题之一。机器视觉的应用领域也十分广泛,例如用于军事侦察、危险环境的自主机器人,邮政、医院和家庭服务的智能机器人。此外机器视觉还可用于工业生产中的工件识别和定位,太空机器人的自动操作等。 图像识别的演变 图像识别的发展经历了三个阶段:文字识别、数字图像处理与识别、物体识别。文字识别的研究是从 1950年开始的,一般是识别字母、数字和符号,从印刷文字识别到手写文字识别, 应用非常广泛。 数字图像处理和识别的研究很早,至今也有近50年历史。数字图像与模拟图像相比具有存储,传输方便可压缩、传输过程中不易失真、处理方便等巨大优势,这些都为图像识别技术的发展提供了强大的动力。 物体的识别主要指的是对三维世界的客体及环境的感知和认识,属于高级的计算机视觉范畴。它是以数字图像处理与识别为基础的结合人工智能、系统学等学科的研究方向,其研究成果被广泛应用在各种工业及探测机器人上。 AI如何识别图像? 在识别图像时,各个方面都考虑了帮助AI识别感兴趣的对象。让我们找出在图像识别中如何识别事物类型以及什么类型。 (1)面部识别 面部识别大家都不陌生了,手机的面部解锁,上班打卡等等都会用到面部识别。人脸识别系统会映射人脸的各种属性。并且在收集了此类信息之后,进行同样的处理以从数据库中发现匹配项。 (2)物体识别 进行图像识别以识别该图像中的关注对象。视觉搜索技术的工作原理是识别图像中的对象,然后在网络上寻找它们。 (3)文字检测 文本检测对于OCR转录很有用,在OCR转录中,从图像中提取文本并提供给其他用户(如文本分类或文本注释)使用,以创建用于基于NLP的机器学习模型开发的数据集。 (4)模式识别 模式识别是人工智能和信息科学的重要组成部分。模式识别是指对表示事物或现象的不同形式的信息做分析和处理从而得到一个对事物或现象做出描述、辨认和分类等的过程。 类似地,为了识别图片中的特定图案,使用图像识别。像在各种情况下执行的面部表情,纹理或身体动作。 随着深度学习的发展和技术的不断完善,除了已经出现的智能化的应用外,未来还会发生什么不可思议的事情呢?小编曾经看到过一个未来生活的宣传片中的一幕,小朋友拿出手中电脑对着原始森林中的动物脚印扫描,就可以显示出它对应的动物。即使这种动物灭绝了,它依然可以活灵活现的显示出来,这样的未来生活是不是很酷! 未来的图像识别究竟还可以逆天到什么程度,想象中的就如同科幻小说里描述的未来生活都可以实现么,真的是让人拭目以待呢! 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-7
    最后回复 巫马炎 2021-9-7 13:07
    4758 0
  • 江苏“女神级”学霸:专业成绩始终第一,累计获5万元奖学金,保研985!
    在校担任学业辅导员、副班主任,专业成绩始终第一;曾前往英国伦敦进行学术交流,并发表论文;多次投身公益事业,奉献爱心,为社会贡献自己的力量;带领同学参加多项比赛,并获得优异成绩......她是江南大学2017级学生郭文欣。在日复一日的刻苦学习中,郭文欣用自己的勤奋和专注实现着梦想,最终被保送至华东师范大学。 郭文欣,女,人文学院2017级本科生。在校担任学业辅导员、教技1904班副班主任、党支部组织委员兼纪检委员。专业成绩始终第一,荣获国家奖学金,连续三年校一等奖学金等10项奖学金,荣获江苏省三好学生、学生年度人物等多项个人荣誉。勇于钻研探索,累计获得一项国家级奖项,三项省级奖项,三项校级奖项,四项担任队长。潜精研思,前往英国伦敦大学国王学院学术交流30天,发表论文一篇。曾前往北京师范大学,华东师范大学等著名国内一流学府学术交流。投身于公益事业,在多项大型赛事和志愿服务活动中担任组织者和志愿者。校外积累丰富的教育实践经验,在校服务同学,为留学生和中国学生搭建沟通桥梁。 遇到问题刨根问底,不轻言放弃,这是郭文欣面对问题的态度。大学期间,她带动周围同学,积极参加“领航杯”江苏省大学生信息技术应用能力大赛、“ITeach”全国大学生数字化教育应用创新大赛等多项竞赛,并获得优异的成绩。在她看来,竞赛的过程是一个不断探索,不断创新,不断解决困难的过程,她很投入并且非常享受这样的过程。 为深入探求教育技术领域的前沿及研究问题,郭文欣作为核心成员参与了《基于图像识别的智能批卷系统》的省级大创项目并顺利结题。在学年设计阶段,她和其他人协作设计并开发了一个小组协作学习投入可视化表征系统,高质量完成学年设计论文。还在第24届全球华人计算机教育应用大会上以第二作者的身份发表论文《面向多维关联的协作学习交互过程分析——基于认知网络分析方法应用》。 严于律己,宽以待人,这是郭文欣的生活准则。在校期间她专业成绩优异,始终保持专业第一,还荣获国家奖学金、连续三年校级一等学业奖学金、国家励志奖学金等多项奖学金,累计金额5万余元。前往北京师范大学、华东师范大学、南京师范大学等国家一流学府交流学习,还获得江苏省三好学生,无锡市三好学生,校三好学生等个人荣誉称号。 除此之外,郭文欣还尽心尽力服务老师和同学。大学四年,郭文欣共担任六门专业核心课程课代表,在学习上为同学们提供帮助;还担任教育1904班副班主任和18级学业辅导员期间,耐心解决学弟学妹生活、学业上的问题,为他们树立了很好的榜样。为了促进学校留学生和中国学生之间的友谊,她亲自策划并组织假面舞会,来增进各国学生之间的交流。 “投身社会,奉献社会,做一个对社会有用的人”是她一直以来秉承的信念并且言出必行。郭文欣积极参加志愿活动,哪里有需要就去哪里,为老人小孩带去关爱。她曾在人文青协组织的金匮苑社区敬老活动、“无锡农商银行杯”环太湖徒步大会、乐跑马山等多项大型赛事中担任志愿者,还志愿宣传国家资助政策,荣获“优秀学生资助宣传大使”称号。 为解决社会问题,她深入调研。在调研无锡惠山泥人文化和锡剧文化时,郭文欣和团队在老师的指导下,一起前往调查当地文化现状和市民的态度;为调研新中国建国70周年来的乡村发展与变迁,她深入乡村,与当地村民面对面交流,从他们口中的描述重现70年来最真实的乡村变迁;还教会当地村民作答线上问卷,深入调研伴随着迅速发展在交通设施方面的缺陷与问题,并将调研成果展现在公众号上,获得了良好的反响。 “笃学尚行,止于至善”,这是江南大学的校训,也是郭文欣的人生导向标。大学四年,她始终以拼搏向上的姿态砥砺前行,恪守“研”、“严”、“言”,在不断地奋进中点亮自己的人生梦想,让梦想开花。在未来的道路上,她也会不断超越自我,潜精研思,奉献社会,做一个有理想有情怀的江南学子! 本文素材来源:江南大学新闻中心 原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-7
    最后回复 签妍 2021-9-7 01:17
    1701 0
  • 几行 Java 代码搞定图片提取文字功能
    近日浏览网上一些图片提取文字的网站,觉得甚是有趣,花费半日也做了个在线图片识别程序,完成了两个技术方案的选择,一是 tesseract + Python flask的方案实现,二是 tesseract + Spring web 的技术解决方案,并简作论述,与君共勉。 一、tesseract-ocr介绍 ocr 含义是Optical Character Recognition,含义即视觉字符识别。而tesseract是该领域特别优秀开源的作品。 官方的tesseract定义: OCR engine - libtesseract and a command line program - tesseract. 即tesseract包括一个视觉字符识别引擎libtesseract和命令行程序tesseract。 当前最新稳定版本是4.x.x基于LSTM,源码可从找到tesseract的GitHub: tesseract.找到。 关于tesseract的工作模式如上图所示。假设现在有一个图片输入,整个执行流程为: [*]输入(一张图片) [*]有用信息提取(比如一个图片上只有一个字,那其他留白的是无用,这个字上每个色素是有效的并且相关) [*]找出文字/线条 [*]字符分类集 [*]输入与分类集对比找出最接近的 [*]输出识别结果 二、安装tesseract 第一步下载 下载合适的exe安装文件: 网址:https://digi.bib.uni-mannheim.de/tesseract/,下载完成后后装即可 第二步环境变量配置 在path变量中加入tesseract-ocr的安装路径 第三步安装成功检测 使用tesseract指令,显示如下: Linux环境下载安装与上述类似 下载leptonica 和 tesseract两个包,解压安装,配置环境变量即可。网上很容易找到该安装包。 三、使用命令行 1.tesseract + 图片路径 + 保存结果名 + -l 语言集 示列: tesseract 1606150081.png 1606150081 -l chi_sim 2.tesseract + 图片路径 +stdout -l +语言集 示列: tesseract D:\company\ruigushop\spring-2s\test.png stdout -l chi_sim 有了上述之后就可以完成web图片识别程序的开发啦,废话不多说,直接上代码。 四、程序实现(Python) 程序设计思路: 上传图片 -> 保存 ->对上传的图片执行tesseract指令->获取识别结果 只有二十多行代码就实现了,so easy,以后网上看到图片识别程序再也不会感觉神奇了吧! # coding=utf-8 from flask import Flask, request import os import datetime import time app = Flask(__name__) def get_time_stamp(): times = datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S') array = time.strptime(times, "%Y-%m-%d %H:%M:%S") time_stamp = int(time.mktime(array)) return time_stamp @app.route('/image/extract', methods=['POST']) def pure_rec(): file = request.files.get('file') ts = str(get_time_stamp()) up_path = os.path.join(ts + file.filename) file.save(up_path) cmd = "tesseract "+up_path+" " + ts + " -l chi_sim" print(cmd) os.system(cmd) with open(ts+".txt", 'r+', encoding="utf-8") asf: result = f.read() return result if __name__ == '__main__': app.run(debug=True)五、程序实现(Java) 不需要任何引入第三方jar包,搭建一个简单的 Springboot Web 项目就可以了,没有其他额外的依赖。 Controller: @RestController publicclass LiteralExtractController { @PostMapping("/image/extract") publicString reg(@RequestParam("file")MultipartFile file) throws IOException { String result = ""; String filename = file.getOriginalFilename(); File save = new File(System.getProperty("user.dir")+"\\"+filename); if (!save.exists()){ save.createNewFile(); } file.transferTo(save); String cmd = String.format("tesseract %s stdout -l %s",System.getProperty("user.dir")+"\\"+filename,"chi_sim"); result = cmd(cmd); return result; } publicstaticString cmd(String cmd) { BufferedReader br = ; try { Process p = Runtime.getRuntime().exec(cmd); br = new BufferedReader(new InputStreamReader(p.getInputStream())); String line = ; StringBuilder sb = new StringBuilder(); while ((line = br.readLine()) != ) { sb.append(line + "\n"); } return sb.toString(); } catch (Exception e) { e.printStackTrace(); } finally { if (br != ) { try { br.close(); } catch (Exception e) { e.printStackTrace(); } } } return; } }六、实验测试 很简单二十多行代码就完成了,看看效果怎么样吧。 测试一图片: 测试一结果: 测试二图片: 测试二结果: perfect,识别的很准确,第二个测试全部是英文字符的时候我们采用了中文训练的数据集,虽然也很好的识别了,但是速度会慢很多。 七、总结 图片识别在当今网络技术领域是非常热门的一块,而这次完成的这个程序完全是依赖别人开源框架来完成了这个技术实现,在应用层面这是成功的,但是本质上并没有实际算法,技术核心上的东西,如果只关心应用层开发上述解决了我们计算机在规则字符识别上的问题。 上述代码中基本没有难点,直接复制即可使用。此外,tesseract作为一款优秀的开源字符识别软件,但它也不是万能的,tesseract只能识别规则的字符,对于一些艺术字,抽象字它是无能为力的。 来源:blog.csdn.net/weixin_44671737/article/details/110000864 #投 稿 通 道# 让你的博客被更多人看到 如果你在 CSDN、博客园、掘金等平台有写技术博客的习惯,想让自己的原创博客被更多人看到,可以来 Java后端 投稿。 Java后端 鼓励读者投稿个人技术博客、面试经验、教程。不管是入门的图文教程、还是热门技术讲解,只要你喜欢写东西,我们欢迎你来投稿。? 稿件基本要求: ? 文章确系个人原创作品,如果在其他非公众号渠道有过发表也可以,只要是个人原创即可。 ? 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰、语句通顺。 ? 如果被采纳的原创稿件,我们将提供稿费以及个人影响力曝光,具体依据文章阅读量和质量结算稿费。 ? 投稿通道: ? 投稿请联系下方微信,备注:原创投稿 △长按添加 Java后端 小编 原文章作者:程序猿久一,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-7
    最后回复 柞枫 2021-9-7 00:04
    1696 0
  • <每次只学三分钟>python图像处理入门-提取轮廓
    提取图像中物体的轮廓,通常用在图像识别中,比如图像像素级分割,应用面比较广。 import cv2import numpy as npfrom skimage.measure import find_contoursimg_path = "D://001.jpg"img_bgr = cv2.imread(img_path) #读取图像rows = img_bgr.shape[0] #图像的宽度cols = img_bgr.shape[1] #图像的长度img_gray = cv2.cvtColor(img_bgr, cv2.COLOR_BGR2GRAY) #转为灰度图_, thres = cv2.threshold(img_gray, 80, 255, cv2.THRESH_BINARY) #阈值二值化cv2.imwrite("D://001_thres.jpg", thres) #保存阈值化后的图mask = np.zeros((rows, cols), dtype=np.uint8)mask[:, :] = np.where(thres[:, :] == 0, 0, 1) #构建二值图掩码contours = find_contours(mask, 0.5) #寻找二值图的轮廓verts = np.fliplr(contours[0]) - 1 #物体的外轮廓通常是最长的一个,这里只找物体的外轮廓for k in range(len(verts) - 1): spos = (int(verts[0]), int(verts[1])) epos = (int(verts[0]), int(verts[1])) cv2.line(img_bgr, spos, epos, (0, 0, 255), 2) #将外轮廓用红色的线绘制到原图上 cv2.imwrite("D://001_contour.jpg", img_bgr) #保存绘制了红色外轮廓的图每步的效果图如下: 原图 二值化图 绘制红色轮廓后的图 涉及的函数介绍: 原文章作者:人淡如菊龙猫君,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-6
    最后回复 皎痕认 2021-9-6 23:15
    3379 1
  • 数字图像识别技术,输电线路缺陷检测方法
    由于我国输电线路分布点多面广,所处地形复杂,自然环境恶劣,电力线及杆塔附 件长期暴露在野外,受到持续的机械张力、雷击闪络、材料老化、人为的影响而产生倒塔、断股、磨损、腐蚀、受力等损伤。绝缘子还存在被雷击损伤,树木生长引起输电线放电,杆塔存在被偷窃等意外事件,因此为了安全和可靠地供电,输电线路缺陷检测智能化已日益显出其迫切性。通过基于深度学习算法的图像识别方法,能及时判别输电线路巡检图像中的各种缺陷隐患,可以避免人工慌检、漏检、误检情况,从而可以提高缺陷上报及处理效率。 在输电线路缺陷检测方法中,大部分现有技术只能识别一种缺陷,如只是对输电线路中的鸟巢进行识别,或只是对输电线路中绝缘子的缺失进行检测,或只是对输电线路中防震锤的缺失进行检测,或只是对输电线路中螺栓的缺失进行检测。而虽然可以对输电线路中的多个部件进行识别和定位的技术,但也没有对输电线路中的各种部件缺陷进行检测,其识别步骤也繁琐复杂,而且不能通过训练出的单一深度网络模型自适应地处理各种分辨率图像和对各种缺陷进行检测。 问题拆分 利用无人机巡检输电线路时拍摄的图像,或利用人工巡检时手机拍摄的图像,或利用输电杆塔上固定摄像头拍摄的视频截取图像,图像分辨率可以任意,通过从这些图像源中裁剪出检测目标,生成一个固定分辨率的图像作为训练样本,将这些包含各种输电线路缺陷的正负训练样本子图像输入到目标检测深度神经网络中进行学习,生成统一的包含所有输电线路缺陷的检测模型,再利用此统一的深度神经网络模型,对输入任意分辨率的输电线路图像进行自适应的全部缺陷检测,输出这幅图像中包含的全部缺陷类别并且标注出缺陷位置。 问题解决 1.一种基于深度学习的输电线路缺陷检测方法,其特征在于,所述的方法包括以下步 骤: (1)对输电线路源图像进行处理而获取到训练样本,通过训练样本对深度神经网络进行训练,获取可用于输电线路缺陷检测的深度神经网络模型; ⑵向所述的深度神经网络模型中输入待检测的输电线路原始图像进行自适应缺陷检测; (3)输出输电线路原始图像中可能存在的所有缺陷类别和在原始图像中的位置。 2. 根据权利要求1所述的基于深度学习的输电线路缺陷检测方法,其特征在于,所述的步骤(1)中对输电线路源图像进行处理而获取到训练样本包括以下步骤: (1 ? 1)对输电线路源图像进行裁剪,使其被裁剪为包含目标物缺陷的子图像; (1 _2)对包含目标物缺陷的子图像进行缩放,并生成具有第一固定分辨率的正负训练 样本子图像,其中,正训练样本子图像为不包含目标物缺陷的子图像,负训练样本子图像为 包含目标物缺陷的子图像; (1.3)在正负训练样本子图像中标注目标物缺陷的类别和位置; (1 ? 4)将标注好目标物缺陷的类别和位置的正负训练样本子图像输入到深度神经网络 中进行端到端的学习训练; (I.5)当对深度神经网络的训练达到设定的精度要求或者迭代达到设定的次数后,生成能检测包含可用于输电线路缺陷检测的深度神经网络模型。 3. 根据权利要求2所述的基于深度学习的输电线路缺陷检测方法,其特征在于,所述的步骤(2)具体包括以下步骤: (2.1)力口载步骤(1)中获取的深度神经网络模型; (2_2)将待检测的输电线路原始图像输入到该深度神经网络模型中,由该深度神经网络模型对输入其中的输电线路原始图像进行自适应缺陷检测。 4. 根据权利要求3所述的基于深度学习的输电线路缺陷检测方法,其特征在于,所述的步骤(2_2)中深度神经网络模型对输入其中的输电线路原始图像进行自适应缺陷检测包 括: 对输电线路原始图像中的大目标物缺陷进行识别,以及对输电线路原始图像中的小目 标物缺陷进行识别。 5. 根据权利要求4所述的基于深度学习的输电线路缺陷检测方法,其特征在于,所述的对输电线路原始图像中的大目标物缺陷进行识别为: 将输电线g各原始图像缩放至第二固定分辨率后,将缩放后的子图像输入到深度神经网络模型中进行正向传播运算,获取输电线路原始图像中的大目标物缺陷。 6.根据权利要求5所述的基于深度学习的输电线路缺陷检测方法,其特征在于,所述的对输电线路原始图像中的小目标物缺陷进行识别为: 判断输电线路原始图像的分辨率,判断其是否大于预设阈值,若是,则将所述的输电线 路图像切割为多个固定分辨率的子图像,并将各个固定分辨率的子图像都输入到所述的深度神经网络模型中进行正向传播运算,获取输电线路原始图像中的小目标物缺陷。 7.根据权利要求5所述的基于深度学习的输电线路缺陷检测方法,其特征在于,所述的步骤(2 ? 2)后还包括以下步骤: (2.3)将目标物缺陷在子图像中的坐标位置转换为在输电线路原始图像中的坐标位置,并在输电线路原始图像中标注目标物缺陷的类别和位置。 8.根据权利要求1所述的基于深度学习的输电线路缺陷检测方法,其特征在于,所述的深度祌经网络包括Faster-RCNN网络或YOLO网络或SSD网络。 原文章作者:电网数字化,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-6
    最后回复 盯袈 2021-9-6 21:44
    998 0
  • 证件识别——图文智能处理OCR技术
    服务器多种证件识别: 说移动端多种证件识别图文智能处理技术之前,先说说服务器端的多种证件识别图文智能处理服务程序。 系统功能参数: 支持180度、90度自动旋转功能; 支持复杂背景(如手持身份证)自动裁剪边缘; 支持自动倾斜校正功能,识别率大大提高; 身份证OCR识别系统功能介绍: 通过拍照界面,指导用户拍出合格身份证图像。 采用文字识别(OCR)技术,自动提取身份证信息(如姓名、证件号码、地址等)以及头像信息。 支持Linux、Windows两大主流业务系统。 支持多语言集成开发的要求,支持开发的语言包括但不限于:C、C++、C#、JAVA。 一、移动端多种证件识别图文智能处理的应用背景 可以预见未来几年60%以上的业务将会逐渐转移到智能终端系统上来。在这种背景下,北京易泊推出基于Android平台的身份证识别软件。 二、移动端多种证件识别图文智能技术的解决方案 移动端多种证件识别图文智能处理,是利用OCR识别技术,通过手机拍摄身份证图像或者从手机相册中加载证件图像,过滤身份证的背景底纹干扰,自动分析证件各文字进行字符切分、识别,最后将识别结果按姓名、地址、民族、身份证号等项目分别导入到软件的数据库对应的字段当中。 三、移动端多种证件识别图文智能处理的优势 在移动端多种证件识别图文智能处理行业中,快证通的字符分割算法源于清华,尤为出色。快证通支持支持Android系统,准确率基本在98%以上 2、进行自动拍照,视频流模式拍照,占用内存小,识别速度快 文通技术支持:郑明辉:壹叁叁柒壹陆贰壹壹贰玖 原文章作者:OCR识别Wintone,转载或内容合作请点击 转载说明 ,违规转载法律必究。寻求报道,请 点击这里 。
    发表于2021-9-6
    最后回复 销晃尸 2021-9-6 20:45
    2788 0

快速发帖

还可输入 80 个字符
您需要登录后才可以发帖 登录 | 立即注册

本版积分规则

在本IOT圈子中寻找帖子
IOT圈子地址
[复制]
Weiot(威腾网)是一家以原创内容、高端活动与全产业渠道为核心的垂直类物联网产业媒体。我们关注新兴创新的物联网领域,提供有价值的报道和服务,连接物联网创业者和各种渠道资源,助力物联网产业化升级。
15201069869
关注我们
  • 访问移动手机版
  • 官方微信公众号

© 2014-2020 Weiot.NET 威腾网 北京微物联信息技术有限公司 ( 京ICP备20000381号-1 )