c++ - 哪种容器类型提供比std::map更好的(平均)性能？

在下面的示例中，一个std::map结构填充了26个来自A-Z的值(用于键)和0-26的值。 (在我的系统上)查找最后一个条目(10000000次)所花费的时间对于 vector 来说大约是250毫秒，对于 map 来说大约是125毫秒。 (我使用 Release模式进行了编译，并为g++ 4.4启用了O3选项)

但是，如果出于某种奇怪的原因，我想要比std::map更好的性能，我需要考虑使用哪些数据结构和函数？

如果答案对您来说似乎很明显，我深表歉意，但是我对C++编程的性能至关重要的方面没有太多经验。

#include <ctime>
#include <map>
#include <vector>
#include <iostream>

struct mystruct
{
    char key;
    int value;

    mystruct(char k = 0, int v = 0) : key(k), value(v) { }
};

int find(const std::vector<mystruct>& ref, char key)
{
    for (std::vector<mystruct>::const_iterator i = ref.begin(); i != ref.end(); ++i)
        if (i->key == key) return i->value;

    return -1;
}

int main()
{
    std::map<char, int> mymap;
    std::vector<mystruct> myvec;

    for (int i = 'a'; i < 'a' + 26; ++i)
    {
        mymap[i] = i - 'a';
        myvec.push_back(mystruct(i, i - 'a'));
    }

    int pre = clock();

    for (int i = 0; i < 10000000; ++i)
    {
        find(myvec, 'z');
    }

    std::cout << "linear scan: milli " << clock() - pre << "\n";

    pre = clock();

    for (int i = 0; i < 10000000; ++i)
    {
        mymap['z'];
    }

    std::cout << "map scan: milli " << clock() - pre << "\n";

    return 0;
}

最佳答案

对于您的示例，使用int value(char x) { return x - 'a'; }
更笼统地说，由于“键”是连续且密集的，因此请使用数组(或 vector )来保证Θ(1)的访问时间。

如果您不需要对键进行排序，请使用use unordered_map ，它应该为大多数操作提供摊余对数改进(即O(log n)-> O(1))。

(有时，尤其是对于小型数据集，线性搜索比哈希表(unordered_map)/平衡二叉树(map)更快，因为前者的算法要简单得多，因此可以减少big-O中的隐藏常数。轮廓。)