因此,关于如何提取HoG功能有很多选择。
使用不同的方向,每个单元使用不同数量的像素以及使用不同的块大小。
但是,是否有标准或最佳配置?
我有尺寸为50x100的训练图像,并且正在选择8个方向的图像。我正在从训练数据中提取特征以进行车辆分类。但是我真的不知道什么是“最佳”。
例如,我这里有2种配置,是否有任何理由选择一种?我个人觉得第二个是更好的选择,但是为什么呢?
最佳答案
我使用HOG进行产品识别。根据我当时的理解,您指出的是标准HOG的实际问题。根本没有最佳配置,它取决于数据集。如果您有适合数据集的最佳值,然后重新调整数据集所有图片的大小,则也应重新调整值的大小。因此,HOG没有最佳的“一刀切”。
但是,一切并没有丢失。相反,您应该做的是一种“始终有效”的方法。这个想法是做Spatial Pyramid Matching。这只是在进行各种规模的HOG并将它们组合在一起。一幅值(value)一千个字的图片:
您可以在此处看到,级别2只是具有精细单元的标准HOG。但这可能不是最佳比例(因为像元太小,您只观察到噪声)(另一方面,像0级这样的像元太大,可能太大,到处都有统一的直方图)。在对数据集进行训练时,您可以为每个级别计算最佳权重,并且您将知道什么是最佳值,即:最相关的像元大小是什么
关于image-processing - 理想的HoG功能数量,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/24332963/