开源的Java编写的ETL工具,可以在Window、Linux、Unix上运行

不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。

免费开源

基于java的免费开源的软件,对商业用户也没有限制

易配置

可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定

不同数据库

ETL工具集,它允许你管理来自不同数据库的数据

两种脚本文件

transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制

图形界面设计

通过图形界面设计实现做什么业务,无需写代码去实现

定时功能

在Job下的start模块,有一个定时功能,可以每日,每周等方式进行定时

Kettle家族目前包括4个产品:Spoon、Pan、CHEF、Kitchen。

SPOON

允许你通过图形界面来设计ETL转换过程(Transformation)

PAN

允许你批量运行由Spoon设计的ETL转换 (例如使用一个时间调度器)。Pan是一个后台执行的程序,没有图形界面

CHEF

允许你创建任务(Job)。 任务通过允许每个转换,任务,脚本等等,更有利于自动化更新数据仓库的复杂工作。任务通过允许每个转换,任务,脚本等等。任务将会被检查,看看是否正确地运行了

KITCHEN

允许你批量使用由Chef设计的任务 (例如使用一个时间调度器)。KITCHEN也是一个后台运行的程序

基于JAVA的ETL工具

ETL(Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程),对于企业或行业应用来说,我们经常会遇到各种数据的处理,转换,迁移,所以了解并掌握一种etl工具的使用,必不可少,这里我介绍一个我在工作中使用了3年左右的ETL工具Kettle,本着好东西不独享的想法,跟大家分享碰撞交流一下!在使用中我感觉这个工具真的很强大,支持图形化的GUI设计界面,然后可以以工作流的形式流转,在做一些简单或复杂的数据抽取、质量检测、数据清洗、数据转换、数据过滤等方面有着比较稳定的表现,其中最主要的我们通过熟练的应用它,减少了非常多的研发工作量,提高了我们的工作效率