微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Apache Druid 在控制台中抛出网络错误

如何解决Apache Druid 在控制台中抛出网络错误

当我们尝试查询数据源时,查询会运行 5 分钟以上,并在控制台中抛出网络错误。我们正试图获得数百万的巨大成果。这是德鲁伊的一些限制,我们无法获取大量记录吗?其他聚合查询运行良好并产生结果。

SELECT * FROM "datasource"
WHERE "__time" >= TIMESTAMP '2021-06-21' and "__time" <= TIMESTAMP '2021-06-23' and consumerid=1234

enter image description here

Segment Granularity: DAY
Query Granularity : DAY
Segments Created: 736
Avg Segment Size: 462 MB
Total Datasource Size: 340.28 GB
Replicated Size: 680.55 GB

二级分区:single_dim (consumerid)

有什么办法可以解决这个问题吗?

我也通过 API 尝试过这个,5.30 秒后它抛出错误

curl --location --request POST 'https://druiddev-druid.int.org/druid/v2/sql' --header 'Authorization: Basic Username/p' --header 'Content-Type: application/json' --data-raw '{
    "query": "SELECT * FROM datasource WHERE consumerid=1234 and buydate='\''01/01/2021'\''","resultFormat" : "csv","batchSize":20480

}' > output.dat

  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100 17.9M    0 17.9M    0   165  58699      0 --:--:--  0:05:20 --:--:-- 86008
curl: (92) HTTP/2 stream 0 was not closed cleanly: INTERNAL_ERROR (err 2)

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。