创建表

首先,代码中定义了两个表格:dim_prod_hierarchy_info 和 app_abtest_product_info,都位于 test 数据库中。

  • dim_prod_hierarchy_info 表用于存储产品层级信息,有三列:hier_node_level_1_name, hier_node_level_2_name, hier_node_level_3_name。这些列分别存储产品的不同层级名称。
  • app_abtest_product_info 表用于存储产品信息,也有三列:prod_level_1, prod_level_2, prod_level_3,与第一个表的列功能类似。

sql:

CREATE TABLE test.dim_prod_hierarchy_info (
    hier_node_level_1_name VARCHAR(255),
    hier_node_level_2_name VARCHAR(255),
    hier_node_level_3_name VARCHAR(255)
);

CREATE TABLE test.app_abtest_product_info (
    prod_level_1 VARCHAR(255),
    prod_level_2 VARCHAR(255),
    prod_level_3 VARCHAR(255)
);

插入数据

接着,代码通过 INSERT INTO 语句向 dim_prod_hierarchy_info 表中插入了几行数据。这些数据代表不同类别的产品及其层级。

代码如下:

INSERT INTO test.dim_prod_hierarchy_info (hier_node_level_1_name, hier_node_level_2_name, hier_node_level_3_name) VALUES
('SmartPhone', 'Galaxy S21', 'S21 Ultra'),
('Tablet', 'Galaxy Tab', 'Tab S7'),
('SmartWatch', 'Galaxy Watch', 'Watch 3'),
('Earbuds', 'Galaxy Buds', 'Buds Live');

清空数据表

在向 app_abtest_product_info 表插入数据之前,代码使用 DELETE FROM 语句删除了该表中的所有现有数据。这确保了表中没有旧数据。

DELETE FROM test.app_abtest_product_info WHERE 1=1;

数据迁移和筛选

最后,使用 INSERT INTO … SELECT 语句,从 dim_prod_hierarchy_info 表中选取特定的数据行,并将这些数据插入到 app_abtest_product_info 表中。这个查询只选择那些符合特定条件的行:hier_node_level_1_name 字段必须是预定义的产品类别之一,且 hier_node_level_3_name 不能为空。

INSERT INTO test.app_abtest_product_info(prod_level_1, prod_level_2, prod_level_3)
SELECT hier_node_level_1_name, hier_node_level_2_name, hier_node_level_3_name
FROM test.dim_prod_hierarchy_info
WHERE hier_node_level_1_name IN ('SmartPhone', 'Tablet', 'SmartWatch', 'Earbuds')
   AND hier_node_level_3_name IS NOT NULL
GROUP BY hier_node_level_1_name, hier_node_level_2_name, hier_node_level_3_name;

查询数据

最后,使用一个简单的 SELECT * FROM 查询来查看 dim_prod_hierarchy_info 表中的数据。

代码如下:

SELECT * FROM test.dim_prod_hierarchy_info;

结论

通过这个示例,用户可以学习如何创建和操作SQL表,包括如何插入、删除和迁移数据。这是数据库管理和数据分析中的一个重要技能,可以应用于各种实际场景。

11-21 16:38