kettle的连接组件

Posted on Posted in kettle基础概念

4、连接是转换里面的第八个分类。连接是结果集通过关键字进行连接。

4.1、合并记录是用于将两个不同来源的数据合并,这两个来源的数据分别为旧数据和新数据,该步骤将旧数据和新数据按照指定的关键字匹配、比较、合并。主要用于新旧数据的对比,非常好使的哦!

1)、需要设置的参数:
1.1)、旧数据来源:旧数据来源的步骤。
1.2)、新数据来源:新数据来源的步骤。
2)、标志字段:设置标志字段的名称,标志字段用于保存比较的结果,比较结果有下列几种。
2.1)、 "identical",旧数据和新数据一样。
2.2.)、"changed" ,数据发生了变化。
2.3.)、"new", 新数据中有而旧数据中没有的记录。
2.4)、 "deleted",旧数据中有而新数据中没有的记录。
3)、关键字段:用于定位两个数据源中的同一条记录。
3.1)、比较字段:对于两个数据源中的同一条记录中,指定需要比较的字段。
3.2)、合并后的数据将包括旧数据来源和新数据来源里的所有数据,对于变化的数据,使用新数据代替旧数据,同时在结果里用一个标示字段,来指定新旧数据的比较结果。
4)、注意:
4.1)、旧数据和新数据需要事先按照关键字段排序。
4.2)、旧数据和新数据要有相同的字段名称。


4.2、记录关联,就是对两个数据流进行笛卡尔积操作。

4.3、记录集连接就像数据库的左连接、右连接、内连接、外连接。注意:在进行记录集连接之前,应该要对记录集进行排序。

 作者:别先生

   
博客园:https://www.cnblogs.com/biehongli/

   
如果您想及时得到个人撰写文章以及著作的消息推送,可以扫描上方二维码,关注个人公众号哦。