Talend tNormalize

Talend tNormalize 帮助规范化非规范化数据,以便我们能够使用这些清理过的数据进行进一步的操作。此 Talend tNormalize 组件像数据库规范化一样规范化源数据。

为了演示 Talend tNormalize,我们使用了下面显示的文本文件。正如你所注意到的,Sales 列有多个由分号分隔的条目。

Source Text

Talend tNormalize 示例

在我们开始创建作业之前,我们为 Normalize Source 文本文件创建了 File delimited 元数据。我们将此元数据用作源。

File Delimiter Metadata for source text file

我将使用相同的 File delimited 元数据 作为 Talend normalize 组件的源。

Talend tNormalize to Denormalize the data

接下来,将 tNormalize 拖放到作业窗口中。从下面的 tNormalize 组件选项卡中可以看到,它有两个选项

  • 要规范化的列: 请选择您要展平或规范化的列。
  • 项目分隔符: 请键入分隔规范化列内内容的项目。 
Check the Talend tNormalize Component Tab to Denormalize the data

请点击 tNormalize 编辑模式按钮来检查模式或输入输出列。

Edit the Schema of the Talend tNormalize to select the Denormalize Columns

在这里,我们从下拉列表中选择 Sales 列作为规范化列。接下来,我们使用分号作为项目分隔符。

Talend tNormalize to Denormalize the data Separator

为了显示规范化数据的结果,我们使用了 tLogRow。为此,请添加 tLogRow 并将其与 tNormalize 连接。在 tLogRow 组件选项卡中,请选择 Table (print values in cells of a table) 选项。让我运行 Talend tNormalize 作业并查看结果。

Run the Talend tNormalize Job to Denormalize the data

我们想将 tNormalize 输出存储在文本文件中,以将其用作 tDenormalize 源。在这里,我们将结果保存在一个文本文件中,包括标题,并用逗号分隔列。接下来,运行 Talend tNormalize 作业。

Configure the tDBOutput

在文件系统中,我打开文本文件向您展示结果。

Denormalized Text File