正宗粉蒸肉Kettle实战100篇第19篇转换核⼼对象MicrosoftExcel输出组件我们在上⾯的实战系列中,多次⽤到了Excel作为输⼊或输出组件,该篇主要是针对官⽅英⽂⽂档做⼀个翻译说明,主要包括输⼊、输出、写⼊组件
Microsoft Excel 输出
Microsoft Excel输出步骤允许您将数据写⼊⼀个或多个Excel⽂件。以下部分介绍了可⽤于配置此步骤的功能。
说明:此步骤将数据导出到Microsoft Excel 2003电⼦表格⽂件(.xls)。如果要写⼊.xlsx⽂件(Excel 2007及更⾼版本),请参阅Microsoft Excel Writer步骤
在我们的8.3版本中,Excel输出有两个组件对象,分别是Excel输出和Microsoft Excel 输出,第⼀个是仅⽀持2003版本的格式(有数量限制,且步骤设置较简单),后⾯Microsoft Excel 输出则包含了很多属性、规则设置,我们在选择Excel输出时应该选择后者,由于Spoon翻译的缘故,我们在转换核⼼对象树中看见的Microsoft Excel 输出组件实际上对应的是Microsoft Excel Writer组件
⽂件选项
选项说明
步骤名称指定当前步骤的唯⼀步骤名称
⽂件名输出的Excel⽂件名称
创建⽗⽬录如果当前⽬录不存在则创建⽗⽬录,该选项适应于指定的⽂件⽬录不存在的情况
启动时不创建⽂件完成此步骤后,选择以创建输出⽂件。当数据流中没有⾏时,这可以避免创建空⽂件
网络移动经纪人
扩展名固定XLS格式(因为这是2003格式的Excel)
卢沟桥事变电影
在⽂件中包含步骤数选择在扩展名之前的输出⽂件名中添加副本号。例如:
在⽂件名中包含⽇期选择在扩展名之前输出⽇期,例如:_20190816
在⽂件名中包含时间选择在扩展名之前输出时间,例如:_235959
指定时间格式选择特定的时间格式进⾏格式化输出以上关于时间的配置
至死不渝的爱情结果中添加⽂件名选择将⽂件名添加到内部⽂件名结果集。此内部结果集稍后可⽤于处理所有已创建的⽂件选项说明
内容选项
选项说明
追加选择将⾏附加到指定⽂件的末尾。如果该⽂件不存在,将创建⼀个新⽂件。
头选择以显⽰标题(在“⾃定义”选项卡中定义)。标题将显⽰在电⼦表格⽹格数据之前。即输出表头脚选择以显⽰电⼦表格⽹格数据后⾯的页脚
编码指定⽂件的输出编码,1、指定UTF-8或者UTF-16编码,2、空选项使⽤系统默认编码⾸次使⽤时,PDI客户端会在系统中搜索可⽤的编码并相应地填充此列表。
分隔每⼀⾏指定要拆分⽂件的⾏数,并启动⼀个新的电⼦表格以继续输出数据。
⼯作表名称Excel中的Sheet名称
保护⼯作表选择密码保护⼯作表。您还必须在“密码”字段中指定密码。
⾃动调整列⼤⼩选择此选项可⾃动将⼯作表列的⼤⼩设置为最⼤值。
保留Null值选择此选项可在输出中保留空值。 如果未选择此选项,则使⽤空字符串替换空值。使⽤临
时⽂件指定临时⽂件⽬录
使⽤模板选择以使⽤指定的Excel模板来创建输出⽂件。如果选择此选项,则还必须在Excel模板字段中指定模板⽂件名。选项说明
追加Excel模板选择将输出附加到指定的Excel模板
个性化选项
malena
个性化选项主要包含针对输出Excel的个性配置,主要分为表头和表数据两⼤部分:
表头:表头字体、⼤⼩、是否加粗、斜线、斜线字体、⾼度、颜⾊等
表数据:字体、⼤⼩、颜⾊、背景等
字段选项卡
“字段”选项卡定义导出字段的属性。单击“获取字段”以⾃动从输⼊流中检索字段列表并填充列表。最⼩宽度按钮可从输出中删除任何填充。
选项描述
名称指定字段名称阿拉伯狼
类型指定字段的数据类型(string、date或者number)
格式指定字段最终输出格式
获取字段: 单击“获取字段”以从输⼊流中检索字段列表并填充列表。
最⼩宽度: 单击“最⼩宽度”以从输出中删除任何多余的填充。
说明:您可以指定Excel中可⽤的任何格式定义。这些格式不限于任何特定于Kettle的格式
元数据⽀持
此步骤的所有字段都⽀持元数据注⼊。您可以将此步骤与ETL元数据注⼊⼀起使⽤,以便在运⾏时将元数据传递给转换。
Microsoft Excel Writer
Microsoft Excel Writer步骤将传⼊的⾏从PDI写⼊MS Excel⽂件,并⽀持.xls和.xlsx⽂件格式。 .xls⽂件使⽤更适合简单内容的⼆进制格式,⽽.xlsx⽂件使⽤Open XML格式,该格式适⽤于模板,因为它可以更好地保留图表和杂项对象。
卤面怎么做
⼀般我们在做Excel导出时也是使⽤此组件居多.
常规
指定该步骤的名称
⽂件&⼯作表
选项
选项卡主要分为三个部分:⽂件、⼯作表、模板
⽂件
此⾯板包括⽤于选择结果⽂件名,扩展名和时间戳信息的字段。如果数据分成多个⾏,则会创建多个⽂件。您还可以从此⾯板预览结果字段
说明⽂件名称
⽤于指定⽂件输出名称、存储路径扩展名选择xls或者xlsx两种格式
Stream XSLX data
(check box)将⼤型XLSX⽂件写⼊输出⽂件时选择此选项
1、如果要流式传输XLSX⽂件,请选择此选项。当您选中此复选框时,系统使⽤流API来编写⼤⽂件⽽没有任何内存限制(不超过MS Excel的1,048,575⾏和16,384列的限制)。
2、如果您不想流式传输XLSX⽂件,请清除此复选框。
只有选择扩展为xlsx格式时该选项才可⽤
骆驼祥子观后感
分隔每⼀⾏数据指定正数以在每个’n’个数据⾏中创建新的输出⽂件。例如,如果要每200个数据⾏拆分⽂件,则在此字段中输⼊200。⽂件将
被编号。
⽂件名包含步骤数⽬在多个副本中运⾏步骤时,选择此选项可在⽂件名(例如_0)中包含副本号,例如同时启动步骤的多个副本
⽂件名包含⽇期⽂件名称包含⽇期,如:_20190916