微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Pandas 中分类变量的顺序 - 使用 Networkx

如何解决Pandas 中分类变量的顺序 - 使用 Networkx

前阵子问过一个与Graph问题相关的question,最近遇到了一个特例的问题。基本上,虽然 b > 3 * a,我还需要 b < 5 * a,我将其重写为 a > 0.2 * b,因为我只能处理 > 代码中的 main 不等式(不是包括在这里

这是带有错误消息的示例代码

import pandas as pd
import networkx as nx

df = pd.DataFrame(data=[['a','b',3],['b','a',0.2],# ['b','c',2],# ['c','d',1.5],],columns=['Cat1','Cat2','Relationship'])
print(df)

G=nx.from_pandas_edgelist(df,'Cat1',edge_attr=True,create_using=nx.DiGraph())
print(nx.dag_longest_path(G))
max_length_of_relationships = nx.dag_longest_path_length(G)

# max_length_of_relationships = len(df)
for i in range(max_length_of_relationships):
    df2 = df.merge(df,left_on='Cat2',right_on='Cat1')
    df2['Relationship'] = df2['Relationship_x'] * df2['Relationship_y']
    df2 = df2[['Cat1_x','Cat2_y','Relationship']]
    df2.columns = ['Cat1','Relationship']
    df = df.append(df2).drop_duplicates()

print(df)

错误信息是: NetworkXUnfeasible: Graph contains a cycle or graph changed during iteration

任何克服此错误消息的建议将不胜感激!

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。