Informatica 教程

在本 Informatica 教程中,我们将向您展示连接不同数据源的详细步骤。接下来,从数据源提取数据并使用转换来转换数据。本 Informatica 教程的最后一部分将通过截图介绍如何创建会话和工作流,以及如何将数据加载到目标位置。

Informatica 是 ETL 工具的市场领导者,超过 5800 家企业依赖这一完整的数据集成解决方案。这款 Informatica 商业智能工具主要用于构建强大的业务应用程序,以从源(Source)中提取数据、转换数据并将其加载到目标(Target)中。本页将解释关于此数据集成工具或 ETL 工具的一切。

使用本 Informatica 教程页面来学习其所有功能。PowerCenter 客户端包含不同的应用程序或工具,有助于设计映射(Mappings)和映射组件(Mapplets)。使用此 PowerCenter 客户端可以创建会话(Session)和工作流(Workflow)。

Informatica 教程简介

这款 Informatica 数据集成工具是 Oracle 提供的一个完整的数据集成解决方案,用于从数据库管理系统中提取数据、执行数据清洗以处理数据,并将其加载到数据仓库或目标数据库中。

这是本 Informatica 教程的简介,内容涵盖该数据集成工具的安装、PowerCenter 的配置、工作流等。

众所周知,Informatica 或任何 ETL 工具都涉及三个步骤。

  • 步骤 1:将数据导入到 PowerCenter Designer 中,对数据执行转换(清洗)(第 2(a) 章)。 
  • 步骤 2:使用所需的转换执行数据清洗。请查看第 3 章。
  • 步骤 3:将数据加载到目标表或文件中(第 2(b) 章)。
  • 步骤 4:为了将所有内容组合起来,我们需要工作流、会话和映射。所以,请查看第四章。

第 1 章:软件配置

Informatica PowerCenter 应用程序允许从多个源(源限定器)或数据仓库加载或提取数据。然后,根据业务需求转换数据(转换)。并将处理后的数据加载到目标表中(目标设计器)。

  1. 如何下载软件
  2. 安装软件的详细步骤
  3. 如何在 Informatica Admin Console 中配置存储库服务和集成服务
  4. PowerCenter 存储库管理器用于创建新域并执行管理任务,如部署工作流、映射等。
  5. PowerCenter Designer 简介用于设计 ETL。我们在这里从源加载数据,执行转换,然后将数据发送到目标表。

第 2 章:Informatica 数据连接教程

Informatica PowerCenter 从不同的来源访问信息或数据。它们包括平面文件、XML、关系数据库、SAP Hana、Teradata、大型机、Excel 和 Access。同样,它也支持相同的目标来加载数据。

本节 Informatica 教程涵盖了不同类型的数据连接,并教授基本的 ETL 操作,如提取、转换和加载。

第 2(a) 章:Informatica 源

源分析器页面可以帮助从各种来源导入数据,如文本文件、Excel 文件、COBOL 文件、XML 定义等。除了标准文件外,它还支持所有类型的数据库。要连接数据库,您需要创建一个 ODBC 连接,而 Microsoft Access 驱动程序则有助于连接 MS Access 数据库。

以下是我们可以用来将数据导入 PowerCenter Designer 的 Informatica 源列表,请使用超链接查看详细的教程信息。

  1. PowerCenter 源分析器
  2. ODBC 连接
  3. 从关系数据库导入
  4. 如何从平面文件导入
  5. 从 Excel 工作簿导入
  6. 将数据从一个 SQL 数据库移动到另一个数据库
  7. 从 SQL Server 导出到平面文件
  8. 从文本文件加载到 SQL Server
  9. 将多个文本文件加载到 SQL Server

第 2(b) 章:Informatica 目标教程

目标设计器选项卡有助于将数据导出或加载到各种目标,如数据库、文本文件、COBOL 文件、Excel 文件、XML 文件等。Informatica 提供了多种驱动程序来连接所有类型的数据库和文件。因此,您所要做的就是为您的目标选择正确的驱动程序。

以下是 Informatica 目标的列表,请使用超链接查看创建目标表、加载数据等教程步骤。

  1. 目标设计器
  2. 使用源定义创建目标表
  3. 创建新的目标表

第 3 章:Informatica 转换

本 Informatica 教程部分涵盖了可用的转换列表。

  1. 聚合器使用可用函数聚合源数据。支持的操作包括查找平均值、总和、最小值、最大值、记录计数、中位数、方差和标准差。
  2. 表达式有助于对源数据执行非聚合数学计算。
  3. 筛选器转换将根据指定的条件或表达式结果(布尔值 True 或 False)筛选源数据。
  4. Java 转换允许您在工作流中编写自定义 Java 代码以执行复杂功能。
  5. 连接器转换:它涵盖了所有可用的连接类型,如普通连接、主外连接、明细外连接和全外连接。
  6. Informatica 查找转换用于对表、平面文件、Excel 和视图执行查找操作。
  7. 非连接查找是一个带参数的函数。您可以在表上执行查找。
  8. 规范化器用于对非规范化的源数据执行数据规范化。
  9. 排名转换和“分组依据”选项。它有助于从上到下或从下到上对数据进行排名。
  10. 路由器转换与 IF ELSE 条件或 CASE 语句相同。Informatica 检查条件并根据结果路由数据。
  11. 序列生成器用于为主键或外键列生成序列号。
  12. 排序器转换将按升序或降序对传入的源数据进行排序。
  13. Informatica 源限定器是 Power Center Designer 生成的默认转换,本教程将对其进行介绍。
  14. SQL 转换允许编写事务查询,在工作流中间执行截断、插入、更新和删除操作。
  15. 存储过程转换允许在工作流中调用或执行存储过程以执行复杂的计算。
  16. 事务控制有助于控制事务,例如提交记录或回滚到原始位置。
  17. 联合转换合并来自多个数据源(或表)的数据,而不删除重复项。
  18. 更新策略根据源数据对目标表执行插入、更新或删除操作。它会比较并执行这三种操作中的任何一种。
  19. 前置和后置 SQL 转换.

对于所有其余的 Informatica 转换,例如 XML 生成器、XML 解析器和 XML 源限定器,请参阅转换列表文章。

第 4 章:Informatica 会话和映射

本 Informatica 教程部分解释了会话、映射和工作流的创建。这些对于运行应用程序非常有帮助。

Informatica 教程的这一部分是学习数据管理最重要的一节。因为它在所有转换中都具有可重用性。

工作流管理器简介包含任务设计器、工作组件设计器和工作流设计器。另一个关键点是,您可以创建 Informatica 会话任务、事件、电子邮件、命令等。

  1. 映射定义了从源文件到目标表的数据转换规则。
  2. 非可重用可重用会话:会话是一组关于何时以及如何将数据从源移动到目标的指令。
  3. Informatica 工作流是一组关于如何运行一个或多个通过链接连接的任务的指令。
  4. 命令任务允许您在工作流中运行 Unix 或 shell 命令。
  5. 事件等待任务允许您创建事件,此任务将等待指定事件的发生。

还有一个名为 Informatica 工作流监视器的工具,允许您监视或跟踪任务或工作流的执行过程。

评论已关闭。