我正在尝试将数据从一个HDFS复制到另一个HDFS。有什么建议为什么第一个有效但是第二个无效吗?

(作品)

hadoop distcp hdfs://abc.net:8020/foo/bar webhdfs://def.net:14000/bar/foo

(不起作用)
hadoop distcp webhdfs://abc.net:50070/foo/bar webhdfs://def:14000/bar/foo

谢谢!

最佳答案

如果两个群集运行的HDFS版本不兼容,则
您可以使用webhdfs协议(protocol)在它们之间进行distcp

hadoop distcp webhdfs://namenode1:50070/source/dir webhdfs://namenode2:50070/destination/dir

如果使用HTTP,则应在source和destination命令中提供NameNode URI和NameNode的webhdfs端口。

关于hadoop - Hadoop distcp无法正常工作,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/30808734/

10-16 23:45