使用rgb和只是有灰度进行深度学习有多大差距

2024-12-02 20:18:45

推荐回答（3个）

回答1：

计算机视觉，通过RGB或者RGBD信息，让计算机能对其中包含的信息，如图片中主要有什么，感兴趣的物体（人）在图中什么位置。最近有一项研究关于NBA篮球赛，可从视频中分析出要进行大动作的"焦点人物"。计算机视觉中，会用到一些传统的图像处理方法，不过越来越多的计算机视觉研究基于机器学习和深度学习。之前视觉总需要提取特征，sift，stip等，而特征的好坏直接影响到视觉识别结果，通过无监督特征学习，如稀疏自编码，能从数据中得到一个比较靠谱的特征，后续直接通过分类器等进行处理即可。机器学习是数据驱动，在获得大量数据后，通过数据构建模型从而完成预测，分类等任务。机器学习包含较多方面，只说神经网络。通过人工神经元构建的神经网络，只要两三层便能较好的拟合任意函数，对于简单的任务只要把数据扔进去训练即可。后来有人发现如果多几层，神经网络的准确率会更好，不过层数过多时，提升不明显，训练时间极具提高。此外对于很多复杂的任务，简单的神经网络不足以应付。比如对于20*20的数字灰度图片，只要把这400个像素值输入网络即可。但是对于640*480的彩色图片，要识别图中是什么动物，那简单的神经网络结果就不怎么样了，而且通常需要预先从图中提取特征向量，而不能直接把图片当成特征向量。深度学习对神经网络进行了多种改进，比如卷及神经网络，循环神经网络等，无一例外就是网络层数提高，而且直接输入原始数据，学习特征，再学习分类模型。

回答2：

差距应该比较大，我做的项目是用灰度图的，很多外形相似的物体容易误识别，如果用彩色图像，数据维度更大，准确度肯定要好很多

回答3：

灰度图，只有黑白，RGB有彩色