直方图肯定办不到,它说白了就是告诉你图像亮度或颜色等级分布情况,比如图像是否曝光过度,三原色中的一种是否较多等等。你说要求识别视频中的人摘下帽子,我想你的意思是不是追踪一个动态目标。如果是这样,那需要先对目标进行特征提取,再在视频中对目标进行特征匹配,说起来比较容易,但实际很麻烦,建议你看一下计算机图像处理方面的书。
仅靠直方图希望不大