如何解决标准化数据? QQ-Plot 似乎没有显示相关的分布等
我目前正在对数据集进行规范化。我做了一些归一化测试和一些图表,一切都表明数据是正常的,除了QQ-Plot,结果对我来说很奇怪。有人可以帮我解释下面的数据吗?数据集正常吗?如果没有,是否可以采取任何措施来规范化?
夏皮罗测试:
from scipy.stats import shapiro
stat,p = shapiro(spt)
print('Statistics=%.3f,p=%.3f' % (stat,p))
# interpret
alpha = 0.05
if p > alpha:
print('Sample looks Gaussian (fail to reject H0)')
else:
print('Sample does not look Gaussian (reject H0)')
- Statistics=0.997,p=0.086 样本看起来呈高斯分布(未能拒绝 H0)
正常测试:
# D'Agostino and Pearson's Test
from scipy.stats import normaltest
# normality test
stat,p = normaltest(spt)
print('Statistics=%.3f,p))
# interpret
alpha = 0.05
if p > alpha:
print('Sample looks Gaussian (fail to reject H0)')
else:
print('Sample does not look Gaussian (reject H0)')
- Statistics=0.102,p=0.950 样本看起来呈高斯分布(未能拒绝 H0)
安德森-达林测试:
# Anderson-Darling Test
from scipy.stats import anderson
result = anderson(spt)
print('Statistic: %.3f' % result.statistic)
p = 0
for i in range(len(result.critical_values)):
sl,cv = result.significance_level[i],result.critical_values[i]
if result.statistic < result.critical_values[i]:
print('%.3f: %.3f,data looks normal (fail to reject H0)' % (sl,cv))
else:
print('%.3f: %.3f,data does not look normal (reject H0)' % (sl,cv))
统计:0.220
- 15.000:0.555,数据看起来正常(未能拒绝 H0)
- 10.000:0.632,数据看起来正常(未能拒绝 H0)
- 5.000:0.759,数据看起来正常(未能拒绝 H0)
- 2.500:0.885,数据看起来正常(未能拒绝 H0)
- 1.000:1.053,数据看起来正常(未能拒绝 H0)
情节
from statsmodels.graphics.gofplots import qqplot
qqplot(spt,line='s')
plt.show()
sns.Boxplot(spt)
sns.histplot(spt)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。