微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

标准化数据? QQ-Plot 似乎没有显示相关的分布等

如何解决标准化数据? QQ-Plot 似乎没有显示相关的分布等

我目前正在对数据集进行规范化。我做了一些归一化测试和一些图表,一切都表明数据是正常的,除了QQ-Plot,结果对我来说很奇怪。有人可以帮我解释下面的数据吗?数据集正常吗?如果没有,是否可以采取任何措施来规范化?

夏皮罗测试:

    from scipy.stats import shapiro
    
    stat,p = shapiro(spt)
    
    print('Statistics=%.3f,p=%.3f' % (stat,p))
    # interpret
    alpha = 0.05
    if p > alpha:
        print('Sample looks Gaussian (fail to reject H0)')
    else:
        print('Sample does not look Gaussian (reject H0)')

  • Statistics=0.997,p=0.086 样本看起来呈高斯分布(未能拒绝 H0)

正常测试:

    # D'Agostino and Pearson's Test
    from scipy.stats import normaltest
    # normality test
    stat,p = normaltest(spt)
    print('Statistics=%.3f,p))
    # interpret
    alpha = 0.05
    if p > alpha:
        print('Sample looks Gaussian (fail to reject H0)')
    else:
        print('Sample does not look Gaussian (reject H0)')
  • Statistics=0.102,p=0.950 样本看起来呈高斯分布(未能拒绝 H0)

安德森-达林测试:

    # Anderson-Darling Test
    from scipy.stats import anderson
    result = anderson(spt)
    print('Statistic: %.3f' % result.statistic)
    p = 0
    for i in range(len(result.critical_values)):
        sl,cv = result.significance_level[i],result.critical_values[i]
        if result.statistic < result.critical_values[i]:
            print('%.3f: %.3f,data looks normal (fail to reject H0)' % (sl,cv))
        else:
            print('%.3f: %.3f,data does not look normal (reject H0)' % (sl,cv))

统计:0.220

  • 15.000:0.555,数据看起来正常(未能拒绝 H0)
  • 10.000:0.632,数据看起来正常(未能拒绝 H0)
  • 5.000:0.759,数据看起来正常(未能拒绝 H0)
  • 2.500:0.885,数据看起来正常(未能拒绝 H0)
  • 1.000:1.053,数据看起来正常(未能拒绝 H0)

情节

    from statsmodels.graphics.gofplots import qqplot
    qqplot(spt,line='s')
    plt.show()

QQ-Plot

    sns.Boxplot(spt)

Box-Plot

    sns.histplot(spt)

Histogram

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。