AI物体识别
行业应用
1)电商行业
(1)市场规模
随着电子商务的蓬勃发展,基于物体图像识别技术的以图搜图正发挥重大作用,以移动端为例,其中适合图像搜索的图片为20 %,假设 0.5%人次成功转移,1% 平均购买转化率,平均购物单价为20 0元,如,按平均10%的佣金计算,那么一年产业规模也超过220亿元。加上其他收入,比如:广告、手机搜索等,总体市场规模不低于600亿元。随着移动电子商务日益兴起,图形图像搜索已能为客户带来全新的用户体验。在购物领域,非常典型的就是服装服饰等非标类产品,占到整个电子商务的55%市场份额。
(2)图片检索原理
1、目录式图像检索
目录式检索是将图片进行分类,用户按照分类结构逐渐细化查询范围。目录式检索方式经常需要人工来进行大部分的分类工作,因此效率较低。现在仍有大部分的图像搜索引擎结合关键字搜索保留了这一检索途径,但类目也通常限于大众用途的图片,这些类目下的图片主要源自专题网站,如壁纸就多来源于专门的壁纸网站。
2、关键词图像检索
关键词图像检索原理是基于图像外部信息的检索,这种方式是根据图像的文件名、路径名、链路、ALT 标签及与图像在同一页面的文本信息等外部信息进行检索,实质上是将图像检索转化为文本检索,这是目前搜索引擎普遍采用的方法。这种检索方式最显著的优点是检索速度快,很好地利用了成熟的基于文本的检索技术。不足在于过于依赖网页标题与文件名的准确性。以上两种检索方式可归结为基于文本的图像检索,它们往往只分析图像的外部信息即文本信息,而没有考虑图像本身的视觉信息。随着图像数量的大量增长,语言表达的限制性及语种的复杂性,这种只是基于文本的图像检索技术已经不能满足用户的需求,于是有了基于图像内容检索技术的发展。
3、视觉图像检索
基于内容的图像检索技术主要就是图像视觉检索,将图像自身的视觉内容特征作为其索引,如颜色、纹理、形状以及空间关系等底层视觉特征,通过对这些图像特征的比较来实现检索。这是一种基于图像本身特征层次的自动匹配,融合了图像理解、模式识别和计算机视觉等理论,特别适用于检索目标明确的查询。
视觉图像检索原理在实际应用中有两种检索方式 :层次性和实例式。层次性图像搜索是将关键字检索与简单的视觉图像检索相结合,不再是“关键词 + 关键词 + ”的过程,而是将关键词与某些主要的视觉特征由用户自由组合。实例式图像检索在较新的专业图像搜索引擎中应用较多,该方法是提供一张图片实例或者由用户绘制一个大概的形状,系统自主综合可视特征寻找相似图片。不过,有时候需要用户提供图片实例会使系统变得很不友好,因此通常有实例式图像检索功能的搜索引擎也包含层次性图像搜索功能。
(3)商品识别中的图像搜索系统结构
(4)具体应用
1、商品分类:
在电商平台中,商品的种类繁多,有衣服、鞋、帽子、围巾等。其中衣服的分类品种复杂多样按性别分有男装、女装;按季节分有春、夏、秋、冬季的服装;按年龄来分有童装、青少年装、中年装、老年装;按群体来分有学生装、白领装、孕妇装等;一件衣服可能同时有好几个标签,可能是男装、春装、中年装、白领装,因此单凭人眼来分十分吃力。因此基于图像识别技术可以将衣服的款式进行分类,对同类衣服进行标签的标注。
2、价格比对
以淘宝为例,消费者在通过关键字“风衣”进行检索,得到几万个不同的结果,如图一所示的商品就有上百个,细心的消费者可能会一页一页的翻找比对这些商品,但是效率非常低,也不容易察觉到价格间的差异。消费者越来越迫切地希望能基于描述商品的图像进行检索,通过商品可视特征的提取和匹配,对数以百万计的商品图片实现图片到图片的智能化检索。
3、款式识别
帮助商家和用户将每件衣服打上不同的款式标签,如吊带衫、打底裤、直筒裤、Polo衫、短袖等。
4、时尚穿搭
当用户看到街上的某个时尚穿搭时,可拍照上传搜索同款的衣服,系统提供不同的穿搭建议,给予用户随时随地的穿搭体验。
5、真伪识别
可通过对商品的材质、标签识别,帮助用户来识别正品和高仿,防止用户受骗,以至于电商平台的信誉受损。
2)新零售行业
(1)商品的分类监测
通过识别商品的包装,判断商品的属性。比如消费者进店后拿了又放到其他位置打乱商品原来的的顺序与管理。可在后台链接语音系统,当商品发生错乱时,基于用户语音提醒,方便商品的管理,减少了商超的分拣员;当商品的货架缺货时,可自动提醒后台增补货源以对货仓进行清查;以及对该类商品的统计分析,每周每月的消费量等。
(2)食品安全的监控与管理
通过对零售食品包装袋的识别,判断食品的生产日期、保质期是否满足食用要求等。
(3)用户的精准画像
结合人脸识别,通过追踪用户的购买行为和商品的购买量来为用户画像,比如发现用户在购买牙膏的之后会去顺手在买一个牙刷,再买了洗面奶之后会在买一瓶乳液等。帮助商家更好的了解用户的需求,以及对商品摆放位置对用户行为的影响等。
(4)完美连接线上线下:
识别系统获得的用户偏好还能反哺线上,将所得数据通过线上反馈给厂商,助力于厂商更全面地了解消费者需求,进而精准地研发产品,设计营销策略。这些都是完美实现新零售“打通线上线下”内在要求的极佳方式。
3)汽车行业
(1)车型识别
1、车型识别研究的主要方向:
1)基于神经网络的方向
2)基于小波变换的车型识别方向
3)利用地震动信号进行分析处理判断车型
2、车辆的检测方法:
1)基于背景差分的方法
2)基于帧间差分的方法
3)基于光流法的方法
3、车型特征提取:图像目标识别特征的提取可采用多种方法,主要方法有傅立叶描述子、矩特征、变换域特征、边缘轮廓特征、角点特征等。
4、车型识别技术:
1)基于模板匹配的识别方法
2)基于统计模式的识别方法
3)基于神经网络的识别方法
4)基于仿生模式(拓扑模式)的识别方法
5)基于支持向量机的识别方法
(2)车牌识别(摘自百度,可自查原版)
1、简介:
车牌识别技术要求能够将运动中的汽车牌照从复杂背景中提取并识别出来,通过车牌提取、图像预处理、特征提取、车牌字符识别等技术,识别车辆牌号、颜色等信息。
2、技术原理:
1)基本步骤:
A. 牌照定位,定位图片中的牌照位置;
B. 牌照字符分割,把牌照中的字符分割出来;
C. 牌照字符识别,把分割好的字符进行识别,最终组成牌照号码。
2)识别流程:利用车辆的动态视频或静态图像进行牌照号码、牌照颜色自动识别。
3、应用方式:
1)监测报警:
对于纳入“黑名单”的车辆,例如:被通缉或挂失的车辆、欠交费车辆、未年检车辆、肇事逃逸及违章车辆等,只需将其车牌号码输入到应用系统中,车牌识别设备安装于指定的路口、卡口或由执法人员随时携带按需要放置,系统将识读所有通过车辆的牌照号码并与系统中的“黑名单”比对,一旦发现指定车辆立刻发出报警信息。
2)超速违章处罚:
车牌识别技术结合测速设备可以用于车辆超速违章处罚,一般用于高速公路。具体应用是:在路上设置测速监测点,抓拍超速的车辆并识别车牌号码,将违章车辆的牌照号码及图片发往各出口;在各出口设置处罚点,用车牌识别设备识别通过车辆并将号码与已经收到的超速车辆的号码比对,一旦号码相同即启动警示设备通知执法人员处理。与传统的超速监测方式相比,这种应用可以节省警力,降低执法人员的工作强度,而且安全、高效、隐蔽,司机需时刻提醒自己不能超速,极大地减少了因超速引发的事故。
3)车辆出入管理:
将车牌识别设备安装于出入口,记录车辆的牌照号码、出入时间,并与自动门、栏杆机的控制设备结合,实现车辆的自动管理。应用于停车场可以实现自动计时收费,也可以自动计算可用车位数量并给出提示,实现停车收费自动管理节省人力、提高效率。应用于智能小区可以自动判别驶入车辆是否属于本小区,对非内部车辆实现自动计时收费。在一些单位这种应用还可以同车辆调度系统相结合,自动地、客观地记录本单位车辆的出车情况,车牌识别管理系统采用了车牌识别技术,达到不停车、免取卡,有效提高车辆出入通行效率。
4)自动放行:
将指定的牌照信息输入系统,系统自动地识读经过车辆的牌照并查询内部数据库。对于需要自动放行的车辆系统驱动电子门或栏杆机让其通过,对于其它车辆系统会给出警示,由值勤人员处理。可用于特殊单位(如军事管理区、保密单位、重点保护单位等)、路桥收费卡口、高级住宅区等。
5)高速公路收费管理:
在高速路的各个出入口安装车牌识别设备,车辆驶入时识别车辆牌照将入口资料存入收费系统,车辆到达出口时再次识别其牌照并根据牌照信息调用入口资料,结合出入口资料实现收费管理。这种应用可以实现自动计费并可防止作弊,避免了应收款的流失。
6)计算车辆旅行时间:
在交通管理系统中可以将车辆在某条道路的平均旅行时间作为判断该道路拥堵状况的一个参数。安装车牌识别设备于道路的起止点,识读所有通过车辆并将牌照号码传回交通指挥中心,指挥中心的管理系统根据这些结果就可计算出车辆平均旅行时间。
7)牌照号码自动登记:
交通监管部门每天都要处理大量的违章车辆图片,一般由人工辨识车牌号码再输入管理系统,这种方式工作量大、容易疲劳误判。采用自动识别可以减少工作强度能够大幅度提高处理速度和效率。这种功能可用于电子警察系统、道路监控系统等。
(3)车辆识别的难点
1、受人自身对对象识别过程的只是限制,对自然界的认识不足,缺乏先进的科学知识;
2、车辆繁多但差别不大,没有明显的区别特征;
3、受具体应用环境的影响太大,各类检测算法要求的条件太苛刻,摄像机的位置和角度要求高;
4、受视觉变化的影响大,从不同角度所摄的汽车特征差别大;
5、受自然环境影响太大特别是光照影响,严重的光照反射使得车辆轮廓线不分明,颜色偏离、变化太大,难以辨认;
6、汽车的外形更新太快,特征变化太快,使得算法适应性较差;
7、汽车的管理规则变化太快,使得智能交通中的应用系统算法修改频繁。
8、复杂背景多车辆的特征的同时提取。复杂背景多车辆的检测,较容易实现,但是多车辆的特征同时提取比较困难,实现多车辆特征的同时提取,对以后的分类识别、跟踪等都有很大的帮助;
9、汽车遮挡情况的研究。在交通口,因车速行驶速度相对较慢,汽车遮挡情况虽然出现的比较少,但为乐万山系统,增加系统的鲁棒性,这种情况下的汽车识别有待于进一步的研究;
10、运动车辆的三维建模。运动车辆是一个三维物体,因而获取运动车辆的三维信息并利用它进行识别将是车型识别发展的最终目标和解决途径。随着信息获取技术手段的不断改进,这一途径必将得到应有的发展;
11、非正常天气条件下车型的识别。车型识别的相关资料显示,天气、光线等对车型识别准确性的影响不大,如何降低天气条件的影响,增加系统的自适应性,也是汽车分类识别有待解决的关键问题;
12、支持向量机还处在继续发展阶段,很多方面还不完善,现有的算法都是采用多个支持向量机分类器进行组合,从而实现多值分类目的。但目前多分类算法不是特别理想。
4)医药行业
(1)药品标签处理
1、图像采集与预处理:
1)药瓶图像采集:
图像采集的原理是通过光学感光元器件将目标物的光线转换成电信号,然后对电信号做采样和量化即得到数字图像。
2)图像预处理:
图像传感器采集到的数字图像难免会夹杂各类噪声和畸变信号,无法直接应用于视觉识别。主要包括图像灰度化、图像平滑和图像增强。
2、药瓶图像提取:
1)药瓶边缘检测:
边缘检测的实质是利用相关算法提取图像中目标物与背景间灰度变化明显的分界线,而药瓶边缘检测是实现药瓶图像分割的先决条件。
2)药瓶图像分割:
经过Canny算法边缘检测后的图像是二值图像,为提取出药瓶的有效分割边界,考虑到药瓶两侧具有竖直边缘特性,因此常用竖直边界分割检测的方法,根据检测出的药瓶上下左右边界,完成药瓶图像分割
3、药瓶图像矫正:
西林瓶表面贴附的药品标签呈现圆柱表面特征,成像后标签两侧区域会出现非线性挤压变形,因此为了能正确识别药品国药准字编号,有必要对这部分畸形图像做平面化矫正,恢复字符的正确形态,并拉开字符间距。
1)图像矫正算法:
药瓶图像矫正的根本目的是把圆柱面药瓶图像矫正为柱面图案平面展开时的成像效果。
2)矫正实验:验证矫正算法后的有效性。
(2)药品标签字符识别
1、药品标签识别原理(原理图如下):
2、药品标签识别流程:
1)字符预处理:字符切分、字符大小归一化、字符笔画宽度归一化
2)候选字符提取:选取统计特征、创建字符模板、分类器设计
3)药品标签字符识别:基于 BP 神经网络的字符识别、基于图像异或增强算法的字符识别
3、应用:
1)医院和药店药品分类与管理:
目前医院和药店的药品种类繁多,利用药品识别技术可以快速的帮助医疗人员对药品的分类管理。
2)药品生产商的流程管理:
通过对药品生产线上药品的标签识别,帮助厂商快速发现药品的标签捡漏、质量检测等。
3)违禁药物的管理:
对实验室的一些危险化学品的监测与管理。
4)帮助用户快速了解药品:
大多用户都是医生开药后,并无阅读说明书的习惯或者说明书不够详细,随着智能终端的普及,用户可 以使用移动终端拍照搜索药品的详细资料快速帮助用户了解一款药品的用途以及注意事项