学习北邮鲁鹏老师的计算机视觉计算机视觉课程的笔记小结

计算机视觉

在计算机视觉中,主要的任务有

  • 图像处理(像素级别)。噪声处理,形态学处理,轮廓处理。
  • 特征工程。像素级别的几何特征:haar角点。统计特征:HOG,sift。
  • 图像分割。算法:mean-shift,最小割。
  • 图像分类。场景分类。算法:svm/决策树/xgboost
  • 图像检测。人脸检测(HAAR)、行人检测(HOG)。
  • 图像识别。人脸识别,车牌识别。

一边来说,对于一个工程任务,比如车牌检测,要分层pipeline处理。

  1. 找到ROI感兴趣的区域。分析ROI的几何、形态、色彩特征,进行图像处理。
  2. 特征提取。
  3. 有监督训练分类器,降低错误率。根据向量特征及其label 训练图像分类器svm。
  4. OCR识别。

SLAM

SLAM方面的话,pipline 是

  • 收集两个视角的图像。
  • 图像特征提取。sift特征或orb特征。
  • 点匹配。暴力或flann算法匹配。
  • 计算相机位姿计算和特征点3D坐标。算法:归一化八点法(数值稳定)。
  • 收集第三个视角的图像。
  • PnP计算相机位姿。PnP是已知3D坐标,不同于八点法。

机器学习

姚青林python机器学习

kaggle中大部分使用的最优分类算法还是 xgboost,gbdt集成决策树的一种。

11-21 11:37