Talend 读取动态文件结构

进入文本文件的中的数据是不可预测的。一天,我们可能会得到十列,第二天十二列,另一天列的顺序完全不同,等等。如果我们的源文件具有动态结构或多结构,我们可以使用 Talend 的 tFileInputMSDelimited 组件来读取或处理它。

为了演示 Talend tFileInputMSDelimited 读取动态文件结构,我们使用下面的文件。

Source Text

从上面的图片中,您可以看到,加拿大有四列,法国有三列,并且所有国家的列顺序都不同。

Talend 读取动态文件结构示例

首先,拖放 tFileInputMSDelimited 以读取多结构或动态文件结构。

Talend Read Dynamic File Structure 2

单击“多模式编辑器”按钮。

Click the Multi Schema Editor

这是我们需要根据字段分隔符获取结构的地方。大多数组件与 tFileInputDelimited 相同。

请单击“浏览”按钮,然后从文件系统中选择或读取动态源文本文件。接下来,根据需要更改“字段分隔符”,然后单击“预览”按钮以查看数据预览。

Talend Read Dynamic Multi File Structure 6

请选择或勾选“公共列”或“分组列”以获取代码。默认情况下,它会选择列;否则,您可以选择所需的列。接下来,单击“获取代码”按钮。

Fetch Cods in Talend to Read Dynamic Multi File Structure

如果文本文件中有多个分隔符来分隔列,请勾选“使用多个分隔符”选项,并将它们放在下面的文本框中。

Use Multi-Separator option in Talend to Read Dynamic Multi File Structure

现在您可以在“输出列”下看到所有连接。

Check the Output

一旦您右键单击 Talend tFileInputMSDelimited 并选择“行”选项,您就可以看到所有输出。对于 Talend 读取动态文件结构示例,我们将每个输出分配给 tLogRow 并进行表预览。

Talend Read Dynamic Multi File Structure 10

请运行 Talend 读取多结构文件以查看输出。您还可以根据要求更改列名。

Run the Talend Read Dynamic Multi File Structure Job