在下面的示例中,一个std::map结构填充了26个来自A-Z的值(用于键)和0-26的值。 (在我的系统上)查找最后一个条目(10000000次)所花费的时间对于 vector 来说大约是250毫秒,对于 map 来说大约是125毫秒。 (我使用 Release模式进行了编译,并为g++ 4.4启用了O3选项)
但是,如果出于某种奇怪的原因,我想要比std::map更好的性能,我需要考虑使用哪些数据结构和函数?
如果答案对您来说似乎很明显,我深表歉意,但是我对C++编程的性能至关重要的方面没有太多经验。
#include <ctime>
#include <map>
#include <vector>
#include <iostream>
struct mystruct
{
char key;
int value;
mystruct(char k = 0, int v = 0) : key(k), value(v) { }
};
int find(const std::vector<mystruct>& ref, char key)
{
for (std::vector<mystruct>::const_iterator i = ref.begin(); i != ref.end(); ++i)
if (i->key == key) return i->value;
return -1;
}
int main()
{
std::map<char, int> mymap;
std::vector<mystruct> myvec;
for (int i = 'a'; i < 'a' + 26; ++i)
{
mymap[i] = i - 'a';
myvec.push_back(mystruct(i, i - 'a'));
}
int pre = clock();
for (int i = 0; i < 10000000; ++i)
{
find(myvec, 'z');
}
std::cout << "linear scan: milli " << clock() - pre << "\n";
pre = clock();
for (int i = 0; i < 10000000; ++i)
{
mymap['z'];
}
std::cout << "map scan: milli " << clock() - pre << "\n";
return 0;
}
最佳答案
对于您的示例,使用int value(char x) { return x - 'a'; }
更笼统地说,由于“键”是连续且密集的,因此请使用数组(或 vector )来保证Θ(1)的访问时间。
如果您不需要对键进行排序,请使用use unordered_map
,它应该为大多数操作提供摊余对数改进(即O(log n)-> O(1))。
(有时,尤其是对于小型数据集,线性搜索比哈希表(unordered_map)/平衡二叉树(map)更快,因为前者的算法要简单得多,因此可以减少big-O中的隐藏常数。轮廓。)