如何解决BigQuery 交叉连接以检查 3m 记录表中记录之间的距离?
我有一个包含大约 300 万条记录的表,其中包含经纬度。我想比较每条记录之间的距离,以检查哪条记录可能是同一个地方或附近的地方。
对于小测试表,我使用交叉连接和距离函数,但对于这个 3m 表,交叉连接是问题。
您有什么建议或解决方案吗?
解决方法
但是对于这个 3m 的表,交叉连接是问题所在。 ……有什么建议……?
您可以使用 ST_CLUSTERDBSCAN 将您的记录划分为集群,而不是将所有 3M 记录相互交叉连接,而是仅将同一分区/集群内的记录交叉连接
下面是如何对地理点进行聚类的示例
ST_CLUSTERDBSCAN(ST_GEOGPOINT(longitude,latitude),5000,1) over() cluster
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。