Talend 教程

本 Talend 教程提供了有关安装数据集成工具、设计作业和使用组件的基本信息。这款 ETL 工具有多种软件产品,提供数据集成、云集成、数据治理、大数据等功能。本文涵盖了其中的大部分内容。

它最著名的是其开源数据集成平台,也称为 Open Studio for Data Integration。请使用本 Talend 教程页面中的超链接查看每个元素的示例及其截图。

通常,公司无法以所需格式获取列来据此做出任何决策。因此,他们需要一个工具来清理或转换数据集以制定业务决策。Talend Open Studio 是新兴的商业智能工具之一,可以轻松执行所有所需操作!本 Talend 教程涵盖了大多数用于清理或转换数据集并将其存储在数据库中的 ETL 组件。

Talend 教程简介

本 Talend 教程部分涵盖用户界面和基础知识。我们还将展示从 SQL Server 加载或读取数据所需的必要连接。

  1. 下载和安装集成工具
  2. 创建业务模型
  3. 如何创建作业
  4. 创建全局上下文组
  5. 连接到 SQL Server
  6. 使用上下文组连接到数据库

数据加载

该数据集成工具需要一些数据集来执行转换。在本 Talend 教程章节中,我们执行数据准备,即从我们实时使用的大多数源读取数据集。此外,本教程还涵盖了 Talend 从源导出数据到各种目标的方法。

  1. 读取 Excel 文件
  2. 读取文本文件
  3. 将 Excel 加载到数据库表中
  4. 将文本文件加载到数据库中
  5. 将数据库表导出到 Excel
  6. 如何将数据库表导出为 JSON
  7. 将数据库表导出到文本文件
  8. 将数据库表导出为 XML

Talend 转换教程

本 Talend 教程部分涵盖了大多数可用的组件。

  1. tSortRow
  2. tAggregateRow
  3. tAggregateSortedRow
  4. tBufferInput 和 tBufferOutput
  5. tCreateTable
  6. tConvertType – 数据类型转换
  7. 使用 tMap 进行类型转换
  8. tDenormalize
  9. tDBRow – 执行 SQL 查询
  10. tFileList
  11. tFilterColumns
  12. tFilterRow
  13. 使用 tMap 筛选行
  14. tFixedFlowInput
  15. tForeach
  16. tFuzzyMatch
  17. tLoop
  18. tMap 连接
  19. tJoin
  20. tMap 查找
  21. tJava
  22. tJavaRow
  23. tJavaFlex
  24. tMsgBox
  25. tNormalize
  26. 透视列
  27. 父子作业
  28. tRowGenerator
  29. tReplace
  30. tReplicate
  31. tRunJob
  32. tSampleRow
  33. tDBSCD – SCD 示例
  34. 手动实现 SCD 类型 2
  35. tUnite
  36. tUniqueRow
  37. 捕获被拒绝的行
  38. 读取多结构文件