目的:使用tFileList组件,读取文件夹下的所有文件,输出每个文件内的数据
组件:tFileList,tFileInputDelimited,tLogRow
1.tFileList连接时使用迭代连接

2.设置读取文件路径,文件列表类型选择“文件”

3.设置tFileInputDelimited
3.1读取的文件名,使用全局变量的方法:((String)globalMap.get("tFileList_1_CURRENT_FILEPATH")),其中tFileList_1是组件名,CURRENT_FILEPATH是迭代时的当前文件名,属于全局变量(全局变量查询官方文档)
3.2 分隔符设定:取入csv文件,在tlogrow输出中,可以看到,是以","为分隔符的,所以,建议设置","
3.3 schema设置,取入文件的字段名需要在这里设置,否则,会提示“schema未定义”,导致tlogrow无法输出内容


本文介绍了如何使用talend组件tFileList结合tFileInputDelimited读取文件夹下所有CSV文件的内容。通过设置迭代连接、文件路径和全局变量获取当前文件名。在tFileInputDelimited中,配置分隔符为逗号,并设定schema匹配文件字段。然而,运行结果显示tFileInputDelimited并不根据文件内容自动调整,而是要求手动匹配字段和数据,否则会出现字段匹配错误的情况。
最低0.47元/天 解锁文章
663

被折叠的 条评论
为什么被折叠?



