进入文本文件的中的数据是不可预测的。一天,我们可能会得到十列,第二天十二列,另一天列的顺序完全不同,等等。如果我们的源文件具有动态结构或多结构,我们可以使用 Talend 的 tFileInputMSDelimited 组件来读取或处理它。
为了演示 Talend tFileInputMSDelimited 读取动态文件结构,我们使用下面的文件。

从上面的图片中,您可以看到,加拿大有四列,法国有三列,并且所有国家的列顺序都不同。
Talend 读取动态文件结构示例
首先,拖放 tFileInputMSDelimited 以读取多结构或动态文件结构。

单击“多模式编辑器”按钮。

这是我们需要根据字段分隔符获取结构的地方。大多数组件与 tFileInputDelimited 相同。
请单击“浏览”按钮,然后从文件系统中选择或读取动态源文本文件。接下来,根据需要更改“字段分隔符”,然后单击“预览”按钮以查看数据预览。

请选择或勾选“公共列”或“分组列”以获取代码。默认情况下,它会选择列;否则,您可以选择所需的列。接下来,单击“获取代码”按钮。

如果文本文件中有多个分隔符来分隔列,请勾选“使用多个分隔符”选项,并将它们放在下面的文本框中。

现在您可以在“输出列”下看到所有连接。

一旦您右键单击 Talend tFileInputMSDelimited 并选择“行”选项,您就可以看到所有输出。对于 Talend 读取动态文件结构示例,我们将每个输出分配给 tLogRow 并进行表预览。

请运行 Talend 读取多结构文件以查看输出。您还可以根据要求更改列名。
