如何解决PySpark 数据框的交叉验证逻辑回归给出了一个错误:“标签不存在可用的: ...'
我对 pyspark.sql.dataframe.DataFrame 进行了逻辑回归,但是当我尝试进行交叉验证时,我收到标签不存在的错误。但标签是“sc_status”,可用。
lr = LogisticRegression(maxIter=10,featuresCol="features",labelCol="sc_status")
model = lr.fit(train)
grid = ParamGridBuilder().addGrid(lr.maxIter,[0,1,5]).build()
evaluator = MulticlassClassificationEvaluator()
cv = CrossValidator(estimator=lr,estimatorParamMaps=grid,evaluator=evaluator)
cv.fit(train)
/content/spark-3.1.1-bin-hadoop3.2/python/pyspark/sql/utils.py in deco(*a,**kw)
115 # Hide where the exception came from that shows a non-Pythonic
116 # JVM exception message.
--> 117 raise converted from None
118 else:
119 raise
IllegalArgumentException: label does not exist. Available: sc_status,cs_method,c_ip,cs_uri_stem,cs(User_Agent),features,CrossValidator_f1cb87bcd1b6_rand,rawPrediction,probability,prediction
在逻辑回归中指定了 labelCol。有没有办法对交叉配合做同样的事情?这是我第一次使用 pySpark。
数据框如下所示:
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。