kettle
最近公司在做数据总线的工作,需要用kettle这个ETL工具,所以花了一些时间来研究研究,喜欢的话点个赞
kettle抽取一个数据库中数据,同步到另一数据库
1.新建一个“转换”,新建两个数据库连接如下:
目标数据库MySQL
源数据库SQL Server
2.拖入“输入表”和“输出表”
输入表:选择相应的数据库,可以直接获取sql语句
输出表:选择相应的数据库,填写目标表(同步数据用的表),可以直接获取sql语句
没有连接导致字段不可读
按住shift之后便可以连线
目标数据库中没有相应的表,需要新建
执行
3.运行转化文件即可
以上说的是完全同步一张表的情况,而且前提是——在目标数据库中没有同名的表
如果我只需要这张表中的某些字段应该怎么办
4.根据自己的需要删除或者修改字段,再同步数据
源数据表
添加“字段选择”
编辑“字段选择”,获取字段
移除自己不需要的字段:先获取,然后右击——删除
修改字段(这里偷懒没有写,自行脑补哈)
“输出表”运行SQL语句,建立新表如下:
最后结果
以上的同步数据是在目标数据库中没有这张表的情况下,如果目标数据库中已经存在这张表了呢?
5.同步目标数据库已存在的表
源数据库表数据如下:
目标数据库表数据如下:
修改字段选择,删除字段create_time(同步的数据没有这一列的数据)
修改输出表对应已存在的表
最后结果
赞 (0)