在下面的示例中,一个std::map结构填充了26个来自A-Z的值(用于键)和0-26的值。 (在我的系统上)查找最后一个条目(10000000次)所花费的时间对于 vector 来说大约是250毫秒,对于 map 来说大约是125毫秒。 (我使用 Release模式进行了编译,并为g++ 4.4启用了O3选项)

但是,如果出于某种奇怪的原因,我想要比std::map更好的性能,我需要考虑使用哪些数据结构和函数?

如果答案对您来说似乎很明显,我深表歉意,但是我对C++编程的性能至关重要的方面没有太多经验。

#include <ctime>
#include <map>
#include <vector>
#include <iostream>

struct mystruct
{
    char key;
    int value;

    mystruct(char k = 0, int v = 0) : key(k), value(v) { }
};

int find(const std::vector<mystruct>& ref, char key)
{
    for (std::vector<mystruct>::const_iterator i = ref.begin(); i != ref.end(); ++i)
        if (i->key == key) return i->value;

    return -1;
}

int main()
{
    std::map<char, int> mymap;
    std::vector<mystruct> myvec;

    for (int i = 'a'; i < 'a' + 26; ++i)
    {
        mymap[i] = i - 'a';
        myvec.push_back(mystruct(i, i - 'a'));
    }

    int pre = clock();

    for (int i = 0; i < 10000000; ++i)
    {
        find(myvec, 'z');
    }

    std::cout << "linear scan: milli " << clock() - pre << "\n";

    pre = clock();

    for (int i = 0; i < 10000000; ++i)
    {
        mymap['z'];
    }

    std::cout << "map scan: milli " << clock() - pre << "\n";

    return 0;
}

最佳答案

对于您的示例,使用int value(char x) { return x - 'a'; }
更笼统地说,由于“键”是连续且密集的,因此请使用数组(或 vector )来保证Θ(1)的访问时间。

如果您不需要对键进行排序,请使用use unordered_map ,它应该为大多数操作提供摊余对数改进(即O(log n)-> O(1))。

(有时,尤其是对于小型数据集,线性搜索比哈希表(unordered_map)/平衡二叉树(map)更快,因为前者的算法要简单得多,因此可以减少big-O中的隐藏常数。轮廓。)

10-08 04:16