2020-01-02 14:46:09

百香果智能(智能.100xg.cn):欢迎提交人工智能(AI)、自然语言处理(NLP)、大数据(big data)、机器学习(ML)、数据挖掘(DM)、知识图谱、智能硬件、工业互联网、工业机器人、云计算、5G网络、物联网、边缘计算(MEC)、机器人流程自动化(RPA)、前沿科技相关的公司、术语、API接口、项目、生成器、解决方案、开放平台产品、ai算法、ai模型、源码、sdk\模块、软件系统、在线/离线工具等领域词条。快速提交,并将在这里展现。

计算机视觉(英文:Computer Vision,简称CV)是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。这里所 指的信息指Shannon定义的,可以用来帮助做一个“决定”的信息。因为感知可以看作是从感官信号中提 取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。

介绍

计算机视觉=图像处理+机器学习 

图像处理技术用于将图像处理为适合进入机器学习模型中的输入,机器学习则负责 从图像中识别出相关的模式。

计算机视觉相关的应用非常的多。比如百度识图、手写字符识别、车牌识别等等应用。这个领域是应用前景非常火热的。同一时候也是研究 的热门方向。随着机器学习的新领域深度学习的发展,大大促进了计算机图像识别的效果。因此未来计算机视觉界的发展前景不可估量。

计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等。计算机视觉是AI领域最重要的研究方向之一,它本身又包含了诸多的研究子领域,包括物体分类与识别、目标检测与追踪、语义分割、3D重建等一些基础方向,也有超分辨率、图片视频描述、图片着色、风格迁移等偏应用的方向。目前计算机视觉处理的主流技术中,深度学习已经占据了绝对优势地位。

计算机视觉是用电脑去识别物体的一种新技术。作为视觉来讲,必须要有眼睛与大脑两部分。计算机视觉的主要组成部分不是“眼睛”,而是“大脑”。

2011年,计算机视觉迎来了最伟大的突破。当年,谷歌人工智能实验室的杰夫·迪恩与斯坦福大学计算机系教授吴恩达合作,他们动用上万台电脑的计算资源,让计算机用深度学习算法在YouTube上观看了一千万段关于猫的视频,最后计算机终于完成了“猫脸识别”。这个项目是谷歌大脑在计算机视觉领域取得的巨大成功。

到了2014年,计算机视觉领域的ImageNet比赛第一次超越了人类肉眼识别图片的准确率——这标志着计算机视觉已经比人眼更加精准,因此具有极大地应用价值。

ImageNet国际挑战赛是计算机视觉领域最著名的比赛,被誉为国际计算机视觉领域的“奥林匹克”。它是2010年由美国斯坦福大学人工智能实验室的李飞飞教授主导推出的。早在2009年,ImageNet对1500万张图片进行了标注,涉及22000个类别的物体,李飞飞她们建立了一个规模空前的数据库。而且,她们公开了整个数据库,免费提供给全世界的人工智能研究团队。有了这个培育计算机大脑的数据库,科研工作者教会了计算机识别物体。

任务

计算机视觉的主要任务是赋予智能机器人视觉,利用测距、物体标定与识别等功能实现对于外界位置信息、图像信息等的识别与判断。在硬件需求上,工业视觉相对较高,需要对工业相机的帧频、分辨率等指标依据自身的需求进行筛选;而计算机视觉则除少部分特殊情况外,大部分对于相机或摄像头的要求并不高。

在算法侧重上,工业视觉的算法往往侧重于精确度的提高;而计算机视觉的算法难度相对较高,侧重于或采用数学逻辑或采用深度学习方法进行物体的标定与识别。在产业成熟度上,工业视觉已经相对较为成熟,在半导体、包装等行业的测量检测已有较为广泛的应用;而计算机视觉整体来讲还是一个刚起步的状态,初创企业层出不穷。

项目

计算机视觉(CV)是一个人工智能比较关键的领域,它涉及提供分析和高级图像和视频数据理解的工具。CV中最常见的问题包括:

1、图像分类:

图像分类是教模型以识别给定图像上的内容的CV任务。例如,可以训练模型来区分公共空间中的各种物体(可用于自驾车)。

2、对象检测:

对象检测是一种CV任务,通过在给定类的每个实例周围提供边界框来教导模型从一组预定义类别中检测对象的实例。例如,可以使用对象检测来构建人脸识别系统。然后该模型能够在图片上检测到的每个脸部周围绘制边界框。(顺便说一下,图像分类系统只能识别图像上是否存在人脸,而不能检测到物体在哪里,就像物体检测系统所能做的那样)。

3、图像分割:

图像分割是一个CV任务,其中某个人训练一个模型,用一个给定像素最可能属于的预定义集合中的类对每个像素进行注释。

4、显着性检测:

显着性检测是训练模型以提供最有可能引起观看者注意的区域的CV任务(即检测人类最感兴趣的区域)。这可以用来确定视频中的广告展示位置。

基本原理

想要实现计算机视觉,首先需要有一个摄像头,然后把拍摄的照片成像在CCD上形成电子照片。这些电子照片是以像素为单位存储在计算机上的。每一个像素都可以看成是三个矩阵元,这些矩阵元给出了像素的RGB数值(每个数值都是整数,取值在0到255之间)。其中,R表示红色,是red的首字母; G表示绿色,是green的首字母;B表示蓝色,是blue的首字母。有了这三种基本颜色,就可以按照不同的权重叠加出千变万化的色彩。

计算机视觉所处理的主要对象就是这个RGB数值,因为每一张照片的像素很多,因此整张照片可以被看成是三个大的矩阵。

计算机视觉的本质,其实就是处理这三个矩阵,然后从这三个矩阵中提取出“特征信息”,比如对于动物的图片,可以提取的特征是“有没有尾巴?”以及“有没有毛?”等。通过对特征信息的提取与判断,可以实现“猫脸识别”或者“人脸识别”。人工智能是通过机器学习的方法,提取不同物体的特征,然后用分类器对各种事物进行分类识别。

计算机视觉的头部公司之一商汤科技与华东师范大学合作,编写了中国第一本人工智能教材《人工智能基础(高中版)》,在书中详细介绍了计算机视觉的算法实现及其基本原理。

核心竞争力

深度学习算法已经打破了图片分类的瓶颈,而且也突破了物体识别的技术瓶颈。物体识别的技术难度比图像分类要高。图片分类问题只需要判断图片中包含哪个物体,而物体识别则需要在同一张图片包含多个物体时,给出所包含物体的具体位置。

目前,基于深度学习算法的计算机视觉已经实用化,张学友演唱会上警方抓逃犯的成功案例说明人工智能在计算机视觉方面已经真正落地了。

当然,人才依然是人工智能计算机视觉的核心竞争力。以商汤科技为例,商汤科技的创始人之一是香港中文大学的汤晓鸥教授,其CEO徐立也拥有人工智能的博士学位。在商汤科技,有120个博士,这无疑是其核心竞争力的体现。

计算机视觉的核心并不在于摄像头,也不在GPU,因为这些都可以在公开市场上买到。对于企业来说,买不到的核心技术是人工智能的算法——这些算法需要相应的人才去编写去改进,只有不断研究新的算法,改进现有的算法,才可能让人工智能工作地越来越好。

落地应用

计算机视觉领域的应用非常广泛,其主要的落地应用有以下几个大类。

在安防摄像头领域,主要有无人值守的场地看管、刷脸门禁、以及发现异常自动报警装置等。在这里主要的代表性公司有海康威视、大华股份等传统大公司与商汤科技、云从科技、依图科技以及旷视科技等独角兽企业,这四家公司被称为人工智能计算机视觉的“四小龙”,它们的产品在本文一开头提到的张学友演唱会上抓逃犯的过程中发挥了重要作用。

在交通摄像头领域,主要是识别车辆车牌,进而进行车辆套牌分析、交通违章分析等智慧城市解决方案。在这个领域的人工智能计算机视觉的头部公司有格灵深瞳等。

在金融领域,计算机视觉主要用于快速信贷审核、刷脸支付与刷脸开户等应用。在这个行业的代表性企业有商汤科技、旷视科技Face++等。

在医疗领域,计算机视觉主要用于智能诊断与疾病研究和精准医疗方面。在这个垂直领域的代表性企业有阿里云ET医疗大脑等。

在汽车领域,计算机视觉主要用于无人驾驶,代表性的企业是百度。百度最近与金龙汽车合作发布了阿波龙无人驾驶汽车。

在无人机领域,计算机视觉主要应用于物流运输以及路径规划、地质灾害监控等。在这个领域的代表性企业是大疆科技。

除了以上的垂直领域,人工智能计算机视觉还有非常多的应用领域,比如在手机领域,计算机视觉主要用在美图拍照与直播特效等领域;在虚拟现实领域,计算机视觉主要用于虚拟现实游戏以及3维电影等领域。


计算机语言:Java、JavaScript、PHP、Python、C#、Android、Objective-C、Go语言、c/C++、NodeJS、Swift、R语言。

       企业微信
       星云互联
       万集科技
       金溢科技
       高新兴
       迪纳科技
       飞驰镁物
       斯润天朗
       东软集团
       天泽信息
       锐明技术
       鸿泉物联
       车载信息服务
       AliOS斑马智行系统
       车机操作系统