如何解决将 SQL 表转储到 FILE 并应用自定义函数?
我有一种情况,编写 PL/pgsql 函数解决方案既慢又麻烦,而且可能是不可能的,因为我需要很多 python 模块。这就是为什么我想选择 VAEX 或 dask。
伪代码:
def olap(ary,tbl_field):
return set(ary) & set(tbl_field)
然后对于 FILE 循环中的每一行并找到最高的重叠。
伪代码:
for row in FILE:
max_olap = select olap(row.fieldX::int[],F.fieldX::int[]) as score
from FILE as F
order by score desc limit 1
res.append(row.id,max_olap)
save2sqlTable(res) #or file first
#or better yet insert during the loop,unless it breaks parallization
即循环内循环。
我说的是大约 100 万行。
olap()
函数仅用于说明。真正的乐趣要复杂得多,但仍然接受两个数组作为参数。
哪种工具更适合这种情况?
如何将 sql 表转储到 numpy|panda|?可变数组字段适合什么格式?
我想使用并行化功能吗?
完成后,我必须将结果导入 sql 表。
流程任何部分的任何示例。
到目前为止我发现了什么:
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。