我已经在具有1个主节点和3个从节点的集群上安装了hadoop 1.0.4,现在我想通过Web应用程序访问HDFS文件系统,以存储和访问现有Web应用程序的数据。

由于我的Web应用程序当前使用MySQL作为数据库,因此我希望将其替换为HDFS。

那么可以使用什么,以便能够通过现有Web应用程序访问HDFS?

为了实现后端数据迁移,我正在使用sqoop和flume,但我希望与HDFS进行实时应用程序同步。因为我从网页保存的内容应直接转到HDFS,而我要搜索的内容应直接来自HDFS。

请提出建议。

提前致谢。

最佳答案

这就像用橘子代替苹果。

您不能用HDFS替换MySQL。 MySQL是数据库,而HDFS是ext3 / ext4之类的文件系统。 HDFS以分布式方式运行,而ext3 / ext4则不会。

HDFS提供高延迟和高吞吐量,而MySQL数据库提供低延迟和低吞吐量。考虑用NoSQL DB(Cassandra,HBase等)替换RDBMS(MySQL,Oracle等)。

有大量的NoSQL数据库,基于需求分析,必须选择适当的数据库。

关于java - 如何从现有的Web应用程序访问HDFS(Hadoop文件系统),我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/15583792/

10-16 21:28