我对分布式计算还不太熟悉,但我想知道页面排序算法是如何在多台机器上工作的。就像
他们何时决定复制数据(如果需要的话),
如果数据没有被复制,他们会要求其他地方的服务人员给出结果吗?
或者他们把“模块”发送到不同的服务器(比如一个巨大的链接图的一部分)到一个服务器,把另一个模块发送到另一个服务器,然后把他们收到的结果组合起来?
我搜索一些东西——它如何从我的国家获取页面(你知道,搜索页面只从<insert country>中获取)
这不是家庭作业。只是个问题我欢迎所有想法,即使它们非常笼统或非常详细,或不回答我的所有问题。
现在,我几乎什么都不知道,我希望在看完答案后能有所了解。

最佳答案

有三头鲸鱼:MapReduceGoogle File SystemBigTable

10-07 18:58