Talend Unite

Talend unite 组件可帮助您整合或合并来自不同文件或不同来源的数据,并生成一个输出。Talend unite 字段在实时应用中非常有用。例如,如果我们从不同的商店获取销售数据,并且我们想将这些数据合并并存储在数据库中。

在此示例中,我们将合并三个包含客户数据的文本文件。以下屏幕截图将向您展示这些文本文件中存在的数据。

File Source

从下面的 Talend 屏幕截图中可以看到,我们已经为前面提到的所有文本文件创建了元数据。

Talend Unite 或 Merge 示例

让我将这三个客户文本文件的元数据拖放到设计窗口中,并选择“文件输入分隔符”作为组件。

Add Three File Delimiter Sources to Workflow

接下来,将 tUnite 组件拖放到设计空间。您可以从下面的屏幕截图中看到工具提示:tunite 将输入合并到同一个输出中。

让我将三个文本文件的主输出行连接到 Talend tunite 组件。您可以看到下面的合并顺序为 1、2 和 3。这完全取决于您连接到 Talend unite 字段的方式。但是,您可以通过将所需的文件输出作为第一个来更改合并顺序。

Add Talend tUnite to Unite multiple Source files

在组件表中的 tunite 字段内,除了编辑模式,没有太多可以做的。大多数情况下,Talend 会同步输入字段中的列。如果不是这种情况,请单击“同步列”按钮。

接下来,单击图像中标记的按钮。它将打开以下模式编辑器窗口,您可以在其中更改列的顺序或删除特定列。或者,您可以更改输入列的长度或精度。在窗口的左侧,您可以看到三个选项卡,分别代表三个输入文件。您可以单击每个选项卡以查看组件及其顺序等。完成更改后,请单击“确定”按钮。

Edit Schema of the Talend tUnite to Unite multiple Source files

我将使用 tLogRow 来显示 Talend Unite 字段的输出。单击“运行”按钮后,您可以看到输出或 tLogRow 输出数据。

Run the Talend tUnite Job to Unite multiple Source files

我认为我会将 tUnite 输出放入数据库表中。为此,我们使用了 Talend_Unite 表,并将“表上的操作”设置为“如果存在则删除表”,然后创建了一个选项。如果您有任何疑问或在使用现有表时,请单击“编辑模式”按钮并检查输入和输出模式。在这里,我们正在创建一个新表,因此无需查看模式。

Configure the tDBTable output table

让我们运行 Talend Unite 作业并查看结果

Run Talend tUnite Job to Unite multiple Sources and save in SQL Table

好!没有错误。让我打开 SQL Management studio 来检查 Talend Unite 表中的数据。

Result Table