背景

目前有两个数据库AB, 想把A库指定的表数据迁移到B库中，因为涉及到数据量比较大，所以考虑使用kettle。闲话少说，真货搞起来

Kettle 说明

Kettle 本身是做数据抽取、清洗、转换和装载的工具。能支持在多个平台上进行操作，比如window、linux、unix 上运行。
支持多种数据源配置。
可视化图形界面操作
kettle流程图本质上都是配置文件，比如.ktr/.kjb文件。

这样的一个好处就是，流程图一旦画好之后，就可放到其他平台使用。

下载

下载就不说了，自己找官网下载就行，文件挺大，下载也挺慢，如果下载不下来的话，可以在下边评论处@我

安装和启动

在window上，双击Spoon.bat，打开即可，如图

在启动之前，最好是修改下启动脚本，添加字符集utf-8, 比如

set OPT=%OPT% %PENTAHO_DI_JAVA_OPTIONS% "-Dfile.encoding=UTF-8" "-Djava.library.path=%LIBSPATH%;%HADOOP_HOME%/bin" %JAVA_ENDORSED_DIRS% %JAVA_LOCALE_COMPAT% "-DKETTLE_HOME=%KETTLE_HOME%" "-DKETTLE_REPOSITORY=%KETTLE_REPOSITORY%" "-DKETTLE_USER=%KETTLE_USER%" "-DKETTLE_PASSWORD=%KETTLE_PASSWORD%" "-DKETTLE_PLUGIN_PACKAGES=%KETTLE_PLUGIN_PACKAGES%" "-DKETTLE_LOG_SIZE_LIMIT=%KETTLE_LOG_SIZE_LIMIT%" "-DKETTLE_JNDI_ROOT=%KETTLE_JNDI_ROOT%"

主要在spoon.bat 脚本中，添加-Dfile.encoding=UTF-8 ，指定字符集，否则导入的数据中文都是乱码。

安装mysql或oracle驱动包

mysql驱动包自行下载，放到安装目录下的/lib 目录下重启即可。我是下载的 5.1.49版本

创建数据源

点击 “转换”-》“主对象树”-》“DB链接”-》“新建”-》Test

然后输入数据库的链接信息，并点击测试，是否连接成功。

我这个是Myql DB ,你可以选择你那边支持的数据库。

需要创建两个，一个源数据库和一个目标数据库。

配置源数据源

点击“核心对象”-》“输入”-》选择“表输入”，如下图

双击 “表输入”，然后选择源数据库，并输入要迁移的表的sql, 并点击确定即可

目标库入库数据配置

点击“核心对象”-》“输出”-》“插入/更新”，如下图

双击“插入/更新2”，配置源表字段和目标表字段的之前的映射关系。

点击保存或者 ctrl+s ，会把这个流程，保存成 ktr格式的文件。

此文件的用处，下边会说。

现在这个映射关系，已经配置完成，可以点击数据迁移了。

最后一步，是如何把流程图从window迁移到linux上运行

为什么要使用kettle呢，因为他的流程图文件，能支持跨系统使用，同一个ktr即可以在window上使用，也可以放到linux上执行。

在linux上，主要是使用kettle的pan.sh 脚本去执行这个ktr文件，具体执行的命令如下

sh  $Kettle_Home/pan.sh -file=/home/test/kettle/ktr/data_transfer.ktr -norep

然后，我们可以定时执行这个脚本，从而实现增量数据的定时更新和迁移。当然目标源数据脚本得能查询出来当天的增量数据。

下边我配置的定时执行脚本任务。如下


TIME=$(date "+%Y%m%d")
sh /data/data-integration/pan.sh -file=/home/data-integration/ktr/data_transfer.ktr -norep >> /home/data-integration/ktr/log/log-"$TIME".log

这样，通过日志，可直接查看任务的执行情况。

记录一下： Kettle中文网

http://www.kettle.org.cn/

好了，通过Kettle 定时迁移大数据量的逻辑，是上边写的这部分了，欢迎大家拍砖。

望不吝小手，给点个赞，在此多谢啦！

相关推荐

AlmaLinux 9.6发布:升级工具、初步支持IBM Power虚拟化技术: IT之家5月21日消息，科技媒体linuxiac昨日（5月20日）发布博文，报道称代号为SageMargay的AlmaLinux9.6发行版已上线，距上一版本9.5发...

Java最新学习路线，系统全面，零基础适用: 首先，我个人比较推崇的学习方法是：先学java前段，也就是HTML，css，js，因为学习java以后肯定是往javaee方向发展的，学习完前端，在学习后端很多东西比计较容易理解！其中J2SE是关键...

深入理解数据库事务（数据库事务处理的理解）: Transaction作为关系型数据库的核心组成，在数据安全方面有着非常重要的作用，本文会一步步解析事务的核心特性，以获得对事务更深的理解。什么是事务数据库几乎是所有系统的核心模块，它将数据有条理地保...

IvorySQL 4.4 发布（1044mysql）: IvorySQL4.4已于2025年3月10日正式发布。新版本全面支持PostgreSQL17.4，新增多项新功能，并修复了已知问题。增强功能PostgreSQL17.3增强功...

Oracle 与 Google Cloud 携手大幅扩展多云服务: 据DCD4月10日报道，甲骨文（Oracle）与谷歌云（GoogleCloud）深化合作，全力扩展多云产品。双方计划为OracleDatabaseGoogleCloud解决方案新增11...

Izzi 利用 Oracle 云提高计费效率和客户体验: 据thefastmode网5月2日报道，墨西哥电信运营商Izzi宣布采用Oracle云基础设施（OCI），对其业务支持系统（BSS）进行现代化改造增强客户体验，已经成功完成。通过在OCI上运行...

好莱坞群星也有明星脸?硅谷科技名人本尊分身比一比: 假如有部电影齐聚了众科技名人角色，如同许多好莱坞大牌卡司所共同主演的《瞒天过海》（Ocean’sEleven）那样，演出彼此在商场上竞逐、或共同对抗外来竞争捍卫硅谷的故事，更在剧中有不少对手戏，会不...

澳大利亚Find My iPhone被黑多人被黑客锁机: FindMyiPhone本来是一个用于协助找回被盗手机的好工具，但是现在，澳洲的苹果用户发现他们的FindMyiPhone变成了黑客的帮凶。昨天，这名自称为OlegPliss的黑客使用Fin...

服务器密码错误被锁定怎么解决（服务器密码失效）: #服务器密码错误被锁定解决方案当服务器因多次密码错误导致账户被锁定时，可以按照以下步骤进行排查和解决：##一、确认锁定状态###1.检查账户锁定状态（Linux）```bash#查看账户锁定...

凌晨突发的数据库重大故障，我排查了一整天……: 春节期间过得太热闹了，上班确实没啥状态，这不刚发生的一个重大性能故障，排查了整整一天，后面的领导都站成了一排，本次把故障发生的详细分析过程分享给大家！本次故障发生在凌晨，核心应用卡顿非常严重，Orac...

Oracle锁表紧急处理!3招快速解锁方案: 开篇：突发故障现场凌晨1点，某电商系统突然卡顿，数千笔支付订单无法完成——数据库出现死锁，技术团队紧急响应...（遇到类似情况的，欢迎在评论区分享经历）一、问题重现：死锁是如何产生的？典型场景：问题根...

JetBrains DataGrip Mac中文破解版V2025.1下载安装教程: DataGripforMac是由JetBrains开发的数据库集成开发环境（IDE），专为数据库管理员和开发人员设计。它支持多种数据库（如MySQL、PostgreSQL、Oracle、SQ...

电脑装安卓系统，安卓X86版5.1 RC1下载: 日前，谷歌放出了Android-x865.1的第一个候选版本Android-x865.1RC1，该版本基于Android5.1.1r24Lollipop开发，更新包括大量x86（32位）代...

来来来!一文告诉你Eclipse的正确安装使用姿势，你都清楚吗?: 前言本学习笔记是有关如何设置Eclipse的详细说明。即使你天天在使用它，但是，相信我，或许你并不足够了解它。安装Java运行时环境Eclipse是Java应用程序，因此设置Eclipse的第一步是安...

分享收藏的 oracle 11.2.0.4各平台的下载地址: 概述oracle11.2.0.4是目前生产环境用的比较多的版本，同时也是很稳定的一个版本。目前官网上已经找不到下载链接了，有粉丝在头条里要求分享一下下载地址。一、各平台下载地址1.1Linuxx...

kettle数据迁移实战

背景

Kettle 说明

下载

安装和启动

安装mysql或oracle驱动包

创建数据源

配置源数据源

目标库入库数据配置

最后一步，是如何把流程图从window迁移到linux上运行

相关推荐

取消回复欢迎你发表评论:

生产系统数据库操作规范(2):（数据库生产库是什么意思）

Redis客户端 Jedis 与 Lettuce

高并发架构系列:Redis并发竞争key的解决方案详解

redis如何防止并发（redis如何防止高并发）

开源推荐:如何实现的一个高性能 Redis 服务器

redis安装与调优部署文档(WinServer)

Redis 入门 - 安装最全讲解(Windows、Linux、Docker)

一文带你了解 Redis 的发布与订阅的底层原理

Redis如何应对并发访问（redis控制并发量）

Java SE Development Kit 8u441下载地址【windows版本】

kettle数据迁移实战

背景

Kettle 说明

下载

安装和启动

安装mysql或oracle驱动包

创建数据源

配置源数据源

目标库入库数据配置

最后一步，是如何把流程图从window迁移到linux上运行

相关推荐

取消回复欢迎 你 发表评论:

生产系统数据库操作规范(2):（数据库生产库是什么意思）

Redis客户端 Jedis 与 Lettuce

高并发架构系列:Redis并发竞争key的解决方案详解

redis如何防止并发（redis如何防止高并发）

开源推荐:如何实现的一个高性能 Redis 服务器

redis安装与调优部署文档(WinServer)

Redis 入门 - 安装最全讲解(Windows、Linux、Docker)

一文带你了解 Redis 的发布与订阅的底层原理

Redis如何应对并发访问（redis控制并发量）

Java SE Development Kit 8u441下载地址【windows版本】

取消回复欢迎你发表评论: