微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Pentaho Kettle-顺序数据查找/合并

如何解决Pentaho Kettle-顺序数据查找/合并

我有2种类型的数据通过文件传输

数据1 包含:SectorNumber,GID,Count字段和值。该数据可能包含具有不同GID的相同扇区号。因此,SectorNumber和GID组成一对。

  • data1 中:我为每对添加了序列号并对其进行了排序(扇区名称按asc排列,而Count按des顺序排列)。会按顺序列出每对。

数据2 包含:名称和UID。

问题陈述-

我必须在(数据1的)GID中搜索(数据2的)UID。如果找到匹配项,请从data2中获取相应的名称

但是,我不需要一次处理Data1的所有行。相反,我只需要一个一个地处理每一对序列。如果找到匹配项,则必须先对所有具有seq = 1的data1对进行查找/匹配,然后再进行..

  • 如果未找到匹配项,则对具有seq = 2的对重复该过程(除了之前已找到匹配的扇区编号的所有对之外)。
  • 再次用seq = 3重复,依此类推,直到对的最后一个值。

到目前为止我做了什么-

我已经尝试通过水壶中可用的步骤来完成上述操作,但是这种方法似乎不干净,因为需要一次又一次地重复这些步骤。

所以我想知道是否有干净简单的方法来实现这一目标?万一我的问题仍然不清楚。如果有帮助,我将添加到目前为止尝试的转换的XML。我正在使用7.1版本。

请在以下链接中找到转换xml,并将其保存到.ktr

https://drive.google.com/file/d/10YWggQNAlmwGaYVuWhIFIOoRZWR5-X4W/view?usp=drivesdk

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。