文本描述
目录Contents
一、计算机视觉行业概述
二、计算机视觉技术与应用场景
三、计算机视觉行业与创业公司梳理
1.1 定义与研究意义
1.2 行业驱动—数据量、运算力、算法技术
1.3 政策法规
1.4 投资热度
全球投资热度
国内投资热度
1.5 市场规模
2.1 通用视觉识别技术流程
2.2 识别技术与应用场景简介
生物特征识别
光学字符识别
物体与场景识别
视频对象提取与分析
3.1 产业链
3.2 全景图
3.3 商业模式
3.4 行业竞争
市场格局
创业公司分析
3.5 行业思考
商业模式
技术趋势
计算机视觉行业概述
Chapter 1
定义与研究意义
行业驱动—数据量、运算力、算法技术
政策法规
投资热度
全球投资热度
国内投资热度
市场规模“To know what is where by looking.”
(通过看去了解所在之处。)
----亚里士多德
计算机视觉是指用计算机来模拟人的视觉系统,实现人的视觉功能,
以适应、理解外界环境和控制自身的运动
概括的说,视觉系统主要解决的是物体识别、物体形状和方位确认
以及物体运动判断这三个问题。而计算机视觉的研究,则是专注于让
机器代替人眼,解决这些问题
(1)物体的识别:即理解物体是什么,对物体的识别主要体现在两
方面,第一是是将不同物体归类,第二是对同类型物体的区分与鉴别,
如不同人脸的鉴别。物体识别要求既能抽象出物体的共同属性,又能
分别出相似物体间的细微差别
(2)物体形状和方位的确定:判断物体的形状和方位是为了让物体
在视觉的三维空间里得到记忆的重建,进而进行场景分析与判断
(3)物体运动的判断:和物体形状方位的确定一样,对物体的运动
的判断也是一种对于场景的重建和理解,用于进行视觉主体(人或机
器)对场景的分析,乃至做出自身行动的决策,实现视觉主体和场景
的交互
定义
让机器之眼代替人眼,看懂所在世界
人体识别文字识别物体识别
1.1 定义与研究意义
1.2 行业驱动---
数据量
运算力
算法技术
1.3 政策法规
1.4 投资热度
全球投资热度
国内投资热度
1.5 市场规模
36Kr-计算机视觉行业研究报告
2016年9月计算机视觉作为计算机的眼睛,是机器认识世界、看懂世界的一种
方式。而认识世界、看懂世界是人工智能产品或方案不可或缺的重
要部分。唯有看见,才能够做出分析判断,进而代替人类完成更多
的任务。它与语音识别、语言识别一并构成了人工智能的感知智能,
让机器完成对外部世界的探测,进而做出判断,采取行动,让更复
杂层面的智慧决策、自主行动成为可能
基于深度学习算法模型和CPU、GPU等关键硬件的支撑,计算机视
觉技术应用得以实现,并最终集成于多类产品和应用场景之中(如
机器人、无人驾驶等等)
计算机视觉能够增强、改善人们的生活,代替人类完成更多的任务
一方面,它为人类自身视觉提供强有力的辅助和增强,极大的改善
人与世界交互的方式。比如,我们可以通过图片搜索引擎找到与之
相关信息;另一方面,机器可以准确、客观而稳定的看见,突破人
类视觉的局限,代替人类完成更多的任务。比如,机器可以24小时
不间断、不疲倦的进行场景监控
研究意义
计算机视觉赋予机器“看”和“认知”的功能,是人工智
能的一类基础应用技术
人工智能基础架构
自然语言处理
计算机视觉
语音识别
智慧家电智慧工业
关键硬件算法模型
路径规划GPUNPU
传感器深度学习(CNN、RNN等)
CPU
基础应用技术
回归分析最速梯度下降法分布式存储
产品
知识架构层
基础支撑层
技术应用层
方案集成层
空间搜索
来源:36氪研究院
预测计划和安排
智慧交通
36Kr-计算机视觉行业研究报告
2016年9月
1.1 定义与研究意义
1.2 行业驱动---
数据量
运算力
算法技术
1.3 政策法规
1.4 投资热度
全球投资热度
国内投资热度
1.5 市场规模。