如何解决在 BigQuery 中查找最高相关值
我希望返回依赖元素和一系列自变量之间的 corr 值。
理想情况下,这可以在 bigquery 中运行,并且可以通过测试的变量数量增加或减少而灵活。
目前我在工作表中使用 Corr 函数,并保存单元格 ($) 以便始终引用因变量
此处的示例文档:https://docs.google.com/spreadsheets/d/17TCfDBMg6OcfA9tUJgpmSGYQBmbG7OU_55Oc_h6nVfU/edit?usp=sharing
解决方法
BigQuery 也有 CORR 函数:
CORR(X1,X2) [OVER (...)]
,
您可以使用CORR
函数来实现变量之间的相关性。
以下是基于您的数据的示例:
select
corr(dependent_variable,v1) as v1_cor,corr(dependent_variable,v2) as v2_corr,v3) as v3_corr,v4) as v4_corr
from dataset.table
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。