据我所知,在CREATE TABLE-statement末尾的Impala中,您可以设置复制因子:

CREATE [EXTERNAL] TABLE [IF NOT EXISTS] [db_name.]table_name
    ...
    [CACHED IN 'pool_name' [WITH REPLICATION = integer] | UNCACHED]

无论如何,我对pool_name所指的感到有些困惑。这是HDFS中存储数据的路径吗?

最佳答案

不完全是,它实际上是指使用hdfs cacheadmin -addPool...命令定义的HDFS池,请参阅hdfs command guide。反过来,池确实包含一堆引用要缓存的hdfs路径的缓存指令。从Apache文档:



可以在Impala Guide中找到有关如何在Impala中使用此HDFS功能的详细信息。

关于sql - 'pool_name'在CREATE TABLE语句中是什么意思?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/56595320/

10-16 21:28