深度学习简介

人工智能-4计算机视觉和图像处理01-LMLPHP
机器学习是实现人工智能的一种途径,深度学习是机器学习的一个子集
深度学习相比于机器学习,少了‘手动特征提取’部分,交给网络来处理
深度学习流程:数据输入–训练模型(在数据中学习)–输出预测

  • 机器学习:输入-特征工程-训练分类/回归器–输出
  • 深度学习:输入 - 算法(分类器)–输出

图像处理、语音识别、机器翻译、拍照翻译、自动驾驶
内容:深度学习框架TensorFlow应用,深度神经网络

深度学习发展关键点

1989:反向传播(计算机硬件资源不够给力)
2012:李飞飞imageNet数据集,举行竞赛 ,首次使用深度学习
2019:transformer

计算机视觉(CV)

1,定义

计算机视觉是指用摄像机和电脑及其他相关设备,对生物视觉的一种模拟。主要任务是让计算机理解图片或者视频中的内容,就像人类和许多其他生物每天所做的那样。

2,任务

任务拆分:让计算机理解图片中的

  • 场景(办公室,客厅等)
  • 物体(动物,人等)
  • 定位物体在图像中的位置(物体的大小,边界等)
  • 物体间的关系或行为(对话,比赛,吵架等),以及图像表达的意义(悲伤的,喜庆的等)

OpenCv主要是前期工作,对图片处理
计算机视觉三大经典任务:图像分类、目标检测、图像分割

  • 图像分类:区分是猫是狗
  • 目标检测:关注特点的物体目标,获取这一目标的类别信息和位置信息
  • 图像分割:如无人驾驶中对道路和非道路的分割

人工智能-4计算机视觉和图像处理01-LMLPHP

3,历史

2012年前 – 基于传统方法
2012年后 – DL在CV遍地开花

11-24 09:28