如何解决Power BI - 将行值与另一个表中的列进行比较会导致计算负载过大
我正在分析来自防火墙的日志,我想在 Power Query M 中添加两列以确定源 IP 地址或目标 IP 地址是 LAN 地址还是来自 Internet。
我创建了一个名为 Private_IPs.txt 的文件,其中逐行包含所有内部子网(10.、172.16.、172.17. 等)并将其加载为表格。
计算代码如下:
#"Add dst isPrivate" = Table.AddColumn(#"Add src isPrivate","dst_isPrivate",each List.Count(let tmp_dst = [dest_ip] in List.Select(Table.Column(Private_IPs,"Subnet"),each Text.StartsWith(tmp_dst,_))))
- 它通过选择表
"Subnet"
的{{1}}列来创建一个列表 - 从这个列表中,它只保留
Private_IPs
开头的元素,如果有的话。 - 然后计算过滤列表中的项目数,以便我得到的列值为 0 或 1
它有效,但问题是当我刷新数据时,它为表格的每一行加载文件“PrivateIPs.csv”两次,导致加载时间几分钟和几分钟,计数器报告类似>
“来自 Private_IPs.csv 的 10MB”
“来自 Private_IPs.csv 的 20MB”
[...]
“来自 Private_IPs.csv 的 400MB”
为什么会这样?它不应该将表保存在内存中而不是每次都从文件中读取吗?我如何做到这一点?它只是一个包含 17 行的文本文件,也许我的解决方案太复杂了?
解决方法
由于带有私有子网的表非常小而且不会改变,我在查询编辑器中手动创建了它,现在它只加载一次。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。