使用rgb和只是有灰度进行深度学习有多大差距

2024-12-02 20:18:45
推荐回答(3个)
回答1:

计算机视觉,通过RGB或者RGBD信息,让计算机能对其中包含的信息,如图片中主要有什么,感兴趣的物体(人)在图中什么位置。最近有一项研究关于NBA篮球赛,可从视频中分析出要进行大动作的"焦点人物"。计算机视觉中,会用到一些传统的图像处理方法,不过越来越多的计算机视觉研究基于机器学习和深度学习。之前视觉总需要提取特征,sift,stip等,而特征的好坏直接影响到视觉识别结果,通过无监督特征学习,如稀疏自编码,能从数据中得到一个比较靠谱的特征,后续直接通过分类器等进行处理即可。机器学习是数据驱动,在获得大量数据后,通过数据构建模型从而完成预测,分类等任务。机器学习包含较多方面,只说神经网络。通过人工神经元构建的神经网络,只要两三层便能较好的拟合任意函数,对于简单的任务只要把数据扔进去训练即可。后来有人发现如果多几层,神经网络的准确率会更好,不过层数过多时,提升不明显,训练时间极具提高。此外对于很多复杂的任务,简单的神经网络不足以应付。比如对于20*20的数字灰度图片,只要把这400个像素值输入网络即可。但是对于640*480的彩色图片,要识别图中是什么动物,那简单的神经网络结果就不怎么样了,而且通常需要预先从图中提取特征向量,而不能直接把图片当成特征向量。深度学习对神经网络进行了多种改进,比如卷及神经网络,循环神经网络等,无一例外就是网络层数提高,而且直接输入原始数据,学习特征,再学习分类模型。

回答2:

差距应该比较大,我做的项目是用灰度图的,很多外形相似的物体容易误识别,如果用彩色图像,数据维度更大,准确度肯定要好很多

回答3:

灰度图,只有黑白,RGB有彩色