文本描述
22017.12 iResearchInc 来源:艾瑞咨询研究院自主研究绘制。 。 摘要 算法迭代将不断提升限定场景识别准确率,加速渗透为各行业应用赋能。 前沿算法之外,计算机视觉公司的商业壁垒有赖于产品、服务、市场等综合建设。 深度学习主要提升的是计算机视觉领域分类任务的准确率;开源环境仅降低计算机 视觉领域的入门技术门槛,前沿算法的技术壁垒依然存在;计算机视觉比赛成绩、 论文成果不直接代表技术团队解决实际业务问题的能力。 前端嵌入式智能系统的渗透率将逐步提升,与后端协同智能计算,加速产业智能升 级。 2017年中国计算机视觉规模预期为40亿,凭借安防领域的爆发性增长,预期2020 年将增长至725亿。 SMS3计算机视觉技术概述1 计算机视觉行业概况2 计算机视觉的应用场景3 计算机视觉典型公司案例4 计算机视觉行业发展趋势542017.12 iResearchInc 计算机视觉的概念与行业主要应用 计算机视觉横跨感知与认知智能,现阶段应用以感知为主 视觉使人类得以感知和理解周边的世界,人的大脑皮层大约有70%的活动在处理视觉相关信息。计算机视觉即通过电子化的方式来感知和理解影像, 以达到甚至超越人类视觉智能的效果。从1966年学科建立(MIT:The Summer Vision Project)至今,尽管计算机视觉在感知与认知智能方向 仍有大量难以解决、尚待探索的问题,但得益于深度学习算法的成熟应用(2012年,采用深度学习架构的AlexNet模型,以超越第二名10个百分 点的成绩在ImageNet竞赛中夺冠),侧重于感知智能的图像分类技术在工业界逐步实现商用价值,助力金融、安防、互联网、手机、医疗、工业 等领域智能升级。2017年下半年,数家计算机视觉公司单笔融资上亿美元,再次将计算机视觉推向人工智能领域最受关注的方向之一。本报告聚 焦于计算机视觉技术现阶段在工业界的应用与研发,将在对相关技术热点及产业整体做概述性介绍的基础上,对典型应用的具体使用场景分领域论 述,希望理清现状,写明征途,供产业界、投资界、政策制定者及关注人工智能领域的社会各界以参考。因报告研究对象以技术层创业公司为主, 偏颇遗漏之处,敬请指正。 来源:艾瑞根据专家访谈、公开资料等研究绘制。涉及常识推理、语义理解、规划决策等 问题难以定义或用函数逼近 通常为对声、光、电等物理信号做简单分类 大致可用函数来逼近 感知智能 认知智能金融及互联网领域 刷脸认证 安防领域 疑犯追踪视频结构化 手机及娱乐领域 影像分类影像处理AR特效 零售领域 商品识别 工业领域 产品质检3D分拣医疗领域 医疗影像分析 自动驾驶领域 环境感知高精地图定位 无人机/机器人领域 环境感知定位自动避障 计算机视觉的典型应用视觉感知小有所成,视觉认知道阻且长 通 过 电 子 化 的 方 式 感 知 和 理 解 影 像 计 算 机 视 觉广告营销领域 自动化挖掘影像内容广告位52017.12 iResearchInc 计算机视觉的学术研究任务 现阶段有较好商业化进展的主要为语义感知中的分类任务 来源:参考资料Stuart Russell.人工智能:一种现代的方法[M]等。 语义感(认)知 对象关系识别:空间关系、动作关系、介词方位关系等 行为识别及预测、追踪 看图写话:场景理解,语句、段落等生成 3D目标分类及对象关系、姿势行为分析、相关场景理解 3D重建:从影像信息中重建这个世界的几何模型,一般从二维影像出发得到场景的三维表示, 可利用运动视差、双目立体视觉、多视图、纹理、明暗、轮廓、物体及场景几何结构等线索 定位与控制 定位基于影像信息(往往也结合惯性运动单元IMU等其他传感器获取多维度信息)机器人(包括自动驾驶汽车)在环境中对自身进行定位,进而导航 控制指导机器人操纵物体,拾起、抓住、转动等,自动驾驶领域则涉及横向、纵向及障碍物避让等控制是一个需要不停观察、规划的连续决策问题 建立影像信息与语言描述的映射 3D目标感(认)知与重建猫猫 鸭子 狗猫 鸭子 狗 图像分类物体检测语义分割 计算机视觉的学术研究任务(部分) 与人类实时选择性处理视觉信息不同(如人在驾驶时不需在意公路边草地的纹理或形状,也不用知道每辆车的确切形状), 计算机仍难以从实际需求出发自主选择性输入并计算影像信息,通常需要人类对具体任务进行分解并使用与之匹配的计算 方法,建立完整理想的智能视觉系统仍有很大挑战。另外,与可结合常识做猜想和推理进而辅助识别的人类智能系统相比, 现阶段的视觉技术往往仅能利用影像表层信息,缺乏常识以及对事物功能、因果、动机等深层信息的认知把握。 分类:图像分类、物体检测、语义分割等,分别为图像整体、局部以及像素级的分类任务 去模糊、超分辨率等技术 可有效增强影像信息 。。。。。。