如何解决使用SQL计算条件概率
我有一个表,该表由11列组成,我想在其两列(例如种族和收入)上计算条件概率。
Income is a varchar(3) field and has values either "<50K" or ">50K".
Race consists of three values such as "White","Black" and "Asian".
我想计算
P[Income = ">50K" | Race = X] for each race given above.
但是,我无法提出一条SQL语句来获取此信息。我本来想按种族分组并计算收入等于“> 50K”的地方,但是这仅是计数,而且我不知道如何将其除以同一查询中的条目总数。你能帮我吗?
解决方法
您可以使用聚合:
select race,avg(case when income = '>50K' then 1.0 else 0 end)
from t
group by race;
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。