字段拼接帮助文档
字段拼接步骤用于将多个字段拼接到一个目标字段中。字段可以用分隔符分隔。此步骤包含了“字段”和“高级”两个标签页。“字段”标签页配置信息如图1所示。
图1 整体配置信息(字段标签页)
下文详细解释各控件的含义:
1、转换步骤名称:步骤的名称,在单一转换中,名称必须唯一。
2、目标字段名称:指定字段拼接后新字段的名称。
3、目标字段的长度:指定目标字段(字符串)的长度。
4、分隔符:根据需要指定分割字段的分隔符。特殊字符可以设置为$[序号]格式。序号可以查询ASCII表,采用十六进制表示其序号。例如$[7C]代表'|'字符。
5、外壳:设定包裹字段的字符。一定要确保每一个切分包含偶数个外壳,否则结果很难预测。Kettle将尽量确保每一个切割包含偶数个外壳,如果当前切分不包含偶数个那么可以继续往后连接切分直到包含偶数个外壳为止。例如:要拆分的字符串为“$11$|22|3$|$4|5$$6|$7$8$9|$10”,其中分隔符为“|”。如果设置Enclosure为$,那么结果将拆分为$11$、22、3$|$4、5$$6、$7$8$9|$10;如果未设置外壳,那么结果将拆分为$11$、22、3$、$4、5$$6、$7$8$9、$10。(1)名称:指定进行拼接的字段名称。
(2)类型:指定字段类型:字符串、日期、数字、布尔值、整数、BigNumber、可序列化或二进制。
(3)格式:格式化字符串时需要。例如需要格式化日期与时间,那么可以用yyyy-MM-dd'T'HH:mm:ss.XXX,注意其中单引号限定部分。如果需要在日期格式中使用原始字母,那么必须用单引号限定,否则将当成表达式解析。注:需与类型关联使用。
(4)长度:对于数字:数字的有效长度;对于字符串:字符串的总长度;对于日期:字符串的打印输出长度(例如,输入4只会返回年份)。
(5)精度:对于数字:小数位数。
(6)货币符号:货币符号,主要用在财务场景,一般放在货币金额数字的前缀或者后缀。例如人民币一般用的¥,美元一般用$,欧元一般用€。
(7)小数点符号:在字符型转小数型(BigNumber)时,识别字符串中的小数点。如字符串“123,456.789”和“123456.789”转BigNumber型时,设置十进制为“.”,则能转变为123456.789。有意思的是这里除了能识别“.”,还能适配其他字符,如“,”、“|”、“_”、甚至字母“a”都可以。只要字符被替换成“.”之后整个字符串是符合数字格式的就行。注意不管设置多长的字符串,这里始终只取第一个字符作为小数点符号。
(8)分组符号:在字符型转小数型(BigNumber)时,识别字符串中的分隔符(常见的千位分隔符)。如字符串“6,123,456.789”转BigNumber型时,设置分组为“,”,则能转变为6123456.789。有意思的是这里除了能识别“,”,还能适配其他字符,如“.”、“|”、“_”、甚至字母“a”都可以。只要字符被转换后整个字符串是符合数字格式的就行。另外分组可以结合小数点符号做一些更有意思的事情,如有一个字符串如“123.456,789”,将小数点符号设为“,”,将分组设为“.”,可转换为“123,456.789”。
(9)去除空格类型:下拉框根据需要选择去除空格的方式。
(10)缺省:当字段值为空或者“null”时,为字段指定的默认值。
“高级”标签页配置信息如图2所示:……
更多详细内容,欢迎点击下述链接查看。
文章原创首发于:https://ckettle.ccsaii.com.cn/help/StepPluginType/ConcatFields?s=****