从 晶 科 技
CONGJINGTECHNOLOGY
设为首页 | 收藏本站
新闻详情

一张图看懂kettle-从晶科技

什么是kettle?


Kettle翻译成中文是水壶的意思。


当Kettle不再是水壶时,它是一个常用的ETL(Extract-Transform-Load)工具,负责接收抽取的数据,进行转换后,加载到目的端。


Kettle应用于以下场景:


1、不同应用或数据库之间整合数据

2、将数据库中的文件导出为文本文件

3、大批量数据装载进数据库

4、数据清洗

5、集成应用相关项目使用


微信截图_20220920173305.png

为什么要用Kettle?


Kettle用纯Java编写,跨平台,绿色无需安装,数据抽取高效。Kettle具有下面几个特点:


1、使用简单,通过图形界面实现功能,无需编码,面向元数据来设计


2、支持多种输入和输出格式,包括文本文件、数据表、以及各种数据库引擎


3、转换功能强大


小编带您,一张图看懂kettle


微信截图_20220920173014.png


· Spoon: The integrated development environment. Offers a graphical user interface for creating and editing job and transformation definitions. Spoon can also be used to execute and debug jobs and transformations, and it also includes functionality for performance monitoring.


     Spoon : 集成开发环境。提供用户图形界面化创建和编辑任务和转换定义。同时也能提供执行和调试任务和转换,并且还包括性能监控功能。


· Kitchen: A command line–driven job runner, which can be used to integrate Kettle with OS-level scripts. It is typically used to schedule jobs with a scheduler such as cron, at, or the Windows Task Scheduler.


     Kitchen:一个命令行的任务执行器(注意不是转换),可被用来与操作系统层的脚本集成。通常结合使用例如 cron,at 或 windows 任务管理器定义周期性任务。


· Pan: A command line–driven program just like Kitchen, but it is used for executing transformations instead of jobs.


     Pan:通 Kitchen 一样是命令行方式执行器,不过这个仅仅能执行转换定义,而不是任务。


· Carte: A light-weight server (based on the Jetty HTTP server) that runs in the background and listens for requests to run a job. Carte is used to distribute and coordinate job execution across a collection of computers forming a Kettle cluster.


    Carte:一个运行在后头的轻量级服务(基于 Jetty 的 HTTP 服务),通过监听请求来运行任务。使用 Carte 在 Kettle 集群分发和协作任务的执行。


如果您使用kettle的过程中,遇到如下问题1、Kettle生成的文件如何进行批量导入?2、有千上万个Kettle任务需要同时处理,怎么办?


找从晶科技,开发的KettlePack管理平台,基于Kettle9(兼容Kettle8及其他版本)的web端调度监控管理平台,安装简单、使用便捷,关键是免费用。


部分文字转载于:https://blog.csdn.net/goobird/article/details/90902308

https://my.oschina.net/frankwu/blog/212194


联系客服