Pandas 中分类变量的顺序 - 使用 Networkx

如何解决Pandas 中分类变量的顺序 - 使用 Networkx

前阵子问过一个与Graph问题相关的question，最近遇到了一个特例的问题。基本上，虽然 b > 3 * a，我还需要 b < 5 * a，我将其重写为 a > 0.2 * b，因为我只能处理 > 代码中的 main 不等式（不是包括在这里）

这是带有错误消息的示例代码：

import pandas as pd
import networkx as nx

df = pd.DataFrame(data=[['a','b',3],['b','a',0.2],# ['b','c',2],# ['c','d',1.5],],columns=['Cat1','Cat2','Relationship'])
print(df)

G=nx.from_pandas_edgelist(df,'Cat1',edge_attr=True,create_using=nx.DiGraph())
print(nx.dag_longest_path(G))
max_length_of_relationships = nx.dag_longest_path_length(G)

# max_length_of_relationships = len(df)
for i in range(max_length_of_relationships):
    df2 = df.merge(df,left_on='Cat2',right_on='Cat1')
    df2['Relationship'] = df2['Relationship_x'] * df2['Relationship_y']
    df2 = df2[['Cat1_x','Cat2_y','Relationship']]
    df2.columns = ['Cat1','Relationship']
    df = df.append(df2).drop_duplicates()

print(df)

错误信息是： NetworkXUnfeasible: Graph contains a cycle or graph changed during iteration

任何克服此错误消息的建议将不胜感激！