如何解决SQL:计算表中所有列的缺失百分比
我有一个表格,可以说列:“A”、“B”、“C”和“D”,包含超过一百万行。 我想计算每列缺失数据的百分比。
所以结果应该是这样的:
"列名";"PctMissing"
"A";0.05
"B";0.30
"C";0.40
"D";0.11
sql 语句会是什么样子?
亲切的问候,
拉扎诺娃
解决方法
一种方法是条件聚合:
select avg(case when a is null then 1.0 else 0 end) as missing_a,avg(case when b is null then 1.0 else 0 end) as missing_b,avg(case when c is null then 1.0 else 0 end) as missing_c,avg(case when d is null then 1.0 else 0 end) as missing_d
from t;
注意事项:
- 这会产生比率而不是百分比。如果您确实更喜欢百分比,请使用
100.0
而不是1.0
。 - 这会将结果放在列中而不是行中。在大多数数据库中,这更有效(表只扫描一次)。
您可以将 union all
用于不同的行作为一般做法:
select 'a',avg(case when a is null then 1.0 else 0 end) as missing
from t
union all
select 'b',avg(case when b is null then 1.0 else 0 end) as missing
from t
union all
. . .;
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。