36氪:全球顶级赛事折桂 码隆科技在视觉识别领域独占鳌头

  AI已经渗透进我们生活的各个方面, 36氪认为,人工智能已经成为下一个风口。在埃森哲近期发布的《人工智能如何驱动中国的经济增长》报告中,分析指出AI将被视为生产的新要素,促进中国生产力的大幅增长。预计到2035年,AI或将为中国的经济增长率贡献1.6个百分点。

  之所以人工智能得以快速发展,在于促进人工智能蓬勃发展的深度学习技术正成指数级增长,是目前人工智能领域研究的核心。无论是谷歌、微软、英特尔等世界500强巨头,还是中小、初创的人工智能领域公司,都致力于深度学习算法的研究与提升。

  WebVision接替ImageNet,弱人工智能逐渐转向强人工智能

  36氪获悉,就在7月26日,CVPR(IEEE Conference on Computer Vision and Pattern Recognition的缩写,即IEEE国际计算机视觉与模式识别会议——编者注)组织、Google协办的计算机视觉识别领域的顶级赛事WebVision竞赛宣布来自中国的创新公司团队码隆科技获得世界冠军。

36氪:全球顶级赛事折桂 码隆科技在视觉识别领域独占鳌头

  随着CVPR宣布ImageNet的结束,WebVision竞赛或将接棒,成为新的图像识别奥林匹克,更加专注于目前尚未解决的问题。

  两者的区别在于,ImageNet竞赛的数据是人工标注过的干净数据。例如想训练计算机识别“沙发”这一概念,就需先对原始图片标注哪些是沙发,哪些不是沙发,再反复训练计算机认识、记忆,从而达到准确识别沙发的目的。

  而WebVision用于计算机的训练数据都是从互联网通过以词搜图的搜索引擎爬取,并未经过人工标注或筛选,数据包含大量噪声——图片与其标签或类别不符的“脏”数据,且不同类别之间的数据量差异之大可达三十倍。这极大增加了使用深度学习算法训练模型的难度,但同时却更加贴近于实际应用。而能否使用这样的未经人工标注的“原始”数据,对于人工智能技术在很多领域的实际落地尤其关键,因为对于大多领域,如商业、金融、医疗等,面临的问题不是缺少数据,恰恰相反,他们拥有海量但缺乏专业人士标注或标注不统一的数据。

  这种“非人工标注”数据的获取成本要低很多,可是对深度学习算法的要求却非常高,传统的“有监督”学习已经不适用,而半监督学习(Semi-Supervised Learning)则应运而生。

  ImageNet的既定数据库已经很难使深度学习算法获得突破性进展,而WebVision主要是挑战未经人工标注的数据,对深度学习算法的提升有更大的帮助,也更符合现实应用场景。”码隆科技的算法科学家告诉36氪,这次比赛中他们采用半监督学习和课程学习的方式,利用非人工标注的数据来训练一个可以媲美人眼的图像识别深度学习模型。

  据WebVision 竞赛的公开资料显示,此次有超过100个团队注册参赛。其中不乏SnapChat、清华大学、上海科技大学、UCF 等来自世界各国的顶尖学术和研发机构。根据官方公布的结果数据显示,码隆科技此次提交的五次识别结果准确率占据了全部识别结果准确率排名的前五名,其最佳结果准确率94.8%远远高出第二名2.5个百分点。这在计算机视觉的竞赛领域中是极大的优势。2016年ImageNet图像识别比赛第一名仅比第二名高出0.04%准确率。

  讲了这么多技术的先进性,实际商业应用如何才是图像识别技术商业化落地的关键。码隆科技起步时先从纺织服装领域切入,目前已将产品范围扩大至各个有商品识别需求的垂直行业,主要为客户提供商品识别(ToB)、定制化图像搜索引擎(ToB+ToC)的人工智能平台和API接口。

  什么是商品识别?

  人们常说的人脸识别主要是通过人工智能分类技术识别年龄、性别、种族等特征。而商品识别,是针对用户常接触的各种商品,如服装、面料、家具、药品、红酒、日用品等各种商品进行识别。通过图像搜索和自动标注,为这些商品提供精准搜索和属性鉴别,进行商品智能化处理,可以满足消费者的个性化需求并提升服务质量和购物体验。

  对于图像识别技术而言,相比书本等有固定特征的商品,柔性、易变形的的商品,如纺织、服饰、日用品等更难识别,需要有海量的数据支持并投入更大的精力去研究。除了提升基础人工智能技术外,码隆科技还推出了ProductAI——人工智能商品识别平台,为企业客户提供自助式的视觉应用服务。

36氪:全球顶级赛事折桂 码隆科技在视觉识别领域独占鳌头

  客户通过上传自己的图片和数据,建立属于自己的“图搜商品”引擎。码隆的算法技术可以帮助企业实现商品图像标记、分类、检测、定位等功能。目前该平台已于去年底上线试用,每月有上百家客户申请使用,包括中国纺织信息中心、微软在线、蒙牛乳业、暴风影音、视觉中国、瑞丽杂志、POP时尚、找家纺、家图网、卷皮网等各个行业的代表客户。这种平台式的操作既整合了商品识别服务,同时也为码隆建立了庞大的商品数据库,以不断提升识别准确率和识别维度的丰富性。

  “新零售”背景下图像识别还有哪些应用前景?

  对于人工智能行业来说,应用场景是其商业化的关键。36氪前不久发布的《人工智能行业研究报告》表明,目前图像识别已经是人工智能中发展最迅速、应用最广泛、商业化成熟度最高的技术。在终端产品上已被广泛用于金融、安防、自动驾驶、医疗、教育等领域。

  起始于对服装面料等商品的识别,ProductAI也逐渐应用于更广泛的零售场景。ProductAI能够对商品进行360°立体精准识别,可识别物体超过20,000种,大部分功能的识别精准度高于专业人员。即使出现商品折叠、变形、被遮挡等情况,依旧能够被精准识别。

  这对于当下无人结算的无人便利店来说,将大大提高运营效率并降低运营成本。

  在商超场景中,ProductAI可从任意角度识别商品,并可与AR相结合实现新零售营销,有无限拓展可能。

  每个客户可以根据自己的商品库,搭建一个专属的客制化拍照搜商品的搜索引擎,用于导购,比价,商品管理,信息统计,以及提升客户体验等等

  码隆科技相关负责人向36氪表示,客户在增加了商品图像搜索引擎和商品识别后台管理的功能后,用户活跃度和交易量会有显著提升,收益会远超实际的调用费用。