提示:本文内容面向【飞燕AI训练营】学员,其属于第3学习节点,需要结合第1节点(AI数学基础)和第2节点(PyTorch基础)进行学习。
计算机视觉领域已经发展的很成熟了,而且入门很简单,建议所有立志于搞AI的人,都应该从计算机视觉出发。
计算机视觉说白了就是学习图片和标签两者之间的关系,我们喂给模型一堆图片以及它们对应的标签,经过反复的纠错,模型就能学习到图片和标签之前的隐藏关系。当我们再拿来新的图片让模型去识别的时候,它会根据之前学习到的特征,给新图片进行分类或者定位等操作。
学习计算机视觉,我们可以体会到深度学习的基本工作内容:数据收集,数据标注,构建模型,训练模型,指标监控,部署模型等。
根据我的个人经验,对于计算机视觉领域来说,我总结了几个核心的知识点:
(1)什么是通道?虽然“通道”是很常见的一个字眼,但是理解起来还是有一定的难度的。
(2)什么是特征图?要想深刻的理解“特征图”这个概念,建议大家可以看看《特征工程》相关的图书。其实,“特征图”就是特征工程中的一个特例而已。
(3)卷积操作和池化操作。
(4)上采样和下采样,金字塔模式等。
(5)1x1卷积的作用是什么?
(6)卷积网络和全连接网络的优缺点是什么,各自用在什么场景?
虽然知识点看似不多,但是每个核心知识点背后都蕴含了深刻的思想以及其他更多的知识点,所以建议大家不要掉以轻心,否则抱着漫不经心的学习态度,最后只能竹篮打水一场空。切记,初学者往往是“知了”心态,一看就知道了,一学就知道了,但实际上仅仅是表面效果而已,转身就会忘掉的。