微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

pyspark中的图框bfs

如何解决pyspark中的图框bfs

我不熟悉graphframe,在这里我试图使用bfs查找Employee层次结构。 src和dst分别是empid和managerid。

`from graphframes import GraphFrame
  vertices = spark.createDataFrame([('1','Carter','Derrick',50),('2','May',26),('3','Mills','Jeff',80),('4','Hood','Robert',65),('5','Banks','Mike',93),('98','Berg','Tim',28),('99','Page','Allan',16)],['id','name','firstname','age'])
  edges = spark.createDataFrame([('2','1'),'2'),('6','3'),('7',('8','5'),('9','7')],['src','dst'])
 g1 = GraphFrame(vertices,edges)

  result5 = g1.bfs(fromExpr = "id == '5'",toExpr =  "id == '1'",maxPathLength = 10)
  result5.show()`
 **** Out put****
  +--------------------+------+--------------------+------+--------------------+
  |                from|    e0|                  v1|    e1|                  to|
  +--------------------+------+--------------------+------+--------------------+
  |[5,Banks,Mike,93]|[5,2]|[2,May,Derrick,...|[2,1]|[1,Carter,Derri...|
  +--------------------+------+--------------------+------+--------------------+

截至目前,我正在fromExpr =“ id =='5'”中传递单个id,该方法如何从edge src列中循环整个id列表,并将所有输出路径保存在结果数据帧中。请让我知道您的输入。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。