本 Talend 教程提供了有关安装数据集成工具、设计作业和使用组件的基本信息。这款 ETL 工具有多种软件产品,提供数据集成、云集成、数据治理、大数据等功能。本文涵盖了其中的大部分内容。
它最著名的是其开源数据集成平台,也称为 Open Studio for Data Integration。请使用本 Talend 教程页面中的超链接查看每个元素的示例及其截图。
通常,公司无法以所需格式获取列来据此做出任何决策。因此,他们需要一个工具来清理或转换数据集以制定业务决策。Talend Open Studio 是新兴的商业智能工具之一,可以轻松执行所有所需操作!本 Talend 教程涵盖了大多数用于清理或转换数据集并将其存储在数据库中的 ETL 组件。
Talend 教程简介
本 Talend 教程部分涵盖用户界面和基础知识。我们还将展示从 SQL Server 加载或读取数据所需的必要连接。
数据加载
该数据集成工具需要一些数据集来执行转换。在本 Talend 教程章节中,我们执行数据准备,即从我们实时使用的大多数源读取数据集。此外,本教程还涵盖了 Talend 从源导出数据到各种目标的方法。
Talend 转换教程
本 Talend 教程部分涵盖了大多数可用的组件。
- tSortRow
- tAggregateRow
- tAggregateSortedRow
- tBufferInput 和 tBufferOutput
- tCreateTable
- tConvertType – 数据类型转换
- 使用 tMap 进行类型转换
- tDenormalize
- tDBRow – 执行 SQL 查询
- tFileList
- tFilterColumns
- tFilterRow
- 使用 tMap 筛选行
- tFixedFlowInput
- tForeach
- tFuzzyMatch
- tLoop
- tMap 连接
- tJoin
- tMap 查找
- tJava
- tJavaRow
- tJavaFlex
- tMsgBox
- tNormalize
- 透视列
- 父子作业
- tRowGenerator
- tReplace
- tReplicate
- tRunJob
- tSampleRow
- tDBSCD – SCD 示例
- 手动实现 SCD 类型 2
- tUnite
- tUniqueRow
- 捕获被拒绝的行
- 读取多结构文件