Talend tNormalize 帮助规范化非规范化数据,以便我们能够使用这些清理过的数据进行进一步的操作。此 Talend tNormalize 组件像数据库规范化一样规范化源数据。
为了演示 Talend tNormalize,我们使用了下面显示的文本文件。正如你所注意到的,Sales 列有多个由分号分隔的条目。

Talend tNormalize 示例
在我们开始创建作业之前,我们为 Normalize Source 文本文件创建了 File delimited 元数据。我们将此元数据用作源。

我将使用相同的 File delimited 元数据 作为 Talend normalize 组件的源。

接下来,将 tNormalize 拖放到作业窗口中。从下面的 tNormalize 组件选项卡中可以看到,它有两个选项
- 要规范化的列: 请选择您要展平或规范化的列。
- 项目分隔符: 请键入分隔规范化列内内容的项目。

请点击 tNormalize 编辑模式按钮来检查模式或输入输出列。

在这里,我们从下拉列表中选择 Sales 列作为规范化列。接下来,我们使用分号作为项目分隔符。

为了显示规范化数据的结果,我们使用了 tLogRow。为此,请添加 tLogRow 并将其与 tNormalize 连接。在 tLogRow 组件选项卡中,请选择 Table (print values in cells of a table) 选项。让我运行 Talend tNormalize 作业并查看结果。

我们想将 tNormalize 输出存储在文本文件中,以将其用作 tDenormalize 源。在这里,我们将结果保存在一个文本文件中,包括标题,并用逗号分隔列。接下来,运行 Talend tNormalize 作业。

在文件系统中,我打开文本文件向您展示结果。
