如何解决Pandas 中分类变量的顺序 - 使用 Networkx
前阵子问过一个与Graph问题相关的question,最近遇到了一个特例的问题。基本上,虽然 b > 3 * a
,我还需要 b < 5 * a
,我将其重写为 a > 0.2 * b
,因为我只能处理 >
代码中的 main
不等式(不是包括在这里)
import pandas as pd
import networkx as nx
df = pd.DataFrame(data=[['a','b',3],['b','a',0.2],# ['b','c',2],# ['c','d',1.5],],columns=['Cat1','Cat2','Relationship'])
print(df)
G=nx.from_pandas_edgelist(df,'Cat1',edge_attr=True,create_using=nx.DiGraph())
print(nx.dag_longest_path(G))
max_length_of_relationships = nx.dag_longest_path_length(G)
# max_length_of_relationships = len(df)
for i in range(max_length_of_relationships):
df2 = df.merge(df,left_on='Cat2',right_on='Cat1')
df2['Relationship'] = df2['Relationship_x'] * df2['Relationship_y']
df2 = df2[['Cat1_x','Cat2_y','Relationship']]
df2.columns = ['Cat1','Relationship']
df = df.append(df2).drop_duplicates()
print(df)
错误信息是:
NetworkXUnfeasible: Graph contains a cycle or graph changed during iteration
任何克服此错误消息的建议将不胜感激!
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。