如何解决如何使用测地线创建距离表
我正在用 Python 计算。假设我有这种 DataFrame,它由一些点的长纬度组成
import pandas as pd
dfa=pd.DataFrame(([1,2],[1,3],1],4]),columns=['y','x'])
之前,我使用了 scipy.spatial 中的距离矩阵,并使用此代码创建了另一个 DataFrame。但它似乎无法精确计算点之间的距离(长纬度)
from scipy.spatial import distance_matrix
pd.DataFrame(distance_matrix(dfa.values,dfa.values),index=dfa.index,columns=dfa.index)
您认为可以使用测地线更改计算吗?这是我尝试过的。
from geopy.distance import geodesic
pd.DataFrame(geodesic(dfa.values[0],dfa.values[0]).kilometers,columns=dfa.index)
# i don't kNow how to change [0] adjusted to column and index
有什么建议吗?
解决方法
给定一个列表或类似列表的对象 locations
,你可以做
distances = pd.DataFrame([[geodesic(a,b) for a in locations]
for b in locations])
不过,这将是多余的,因为它会计算 a,b 和 b,a 的距离,即使它们应该相同。根据 geodesic
的成本,您可能会更快地找到以下一些替代方案:
distances = pd.DataFrame([[geodesic(a,b) if a > b else 0
for a in locations]
for b in locations])
distances = distances.add(distances.T)
size = len(locations)
distances = pd.DataFrame(columns = range(size),index = range(size))
def get_distance(i,j):
if distances.loc[j,i]:
return distances.loc[j,i]
if i == j:
return 0
return geodesic(locations[i],locations[j])
for i in range(size):
for j in range(size):
distances.loc[i,j] = get_distance(i,j)
您还可以将数据存储为字典,键是从 itertools.combinations
输出的。还有关于创建对称矩阵类的 this article。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。