如何解决如何在R中拟合多元正态分布?
我需要使R的Iris数据集中的每个物种都适合多变正态分布。我看到mvtnorm
包可能有用;但是,我想使用最大似然估计,并且不确定如何在R中使用它。有什么想法吗?
解决方法
如果您只想使每个物种适合一个分布,则可能需要mvnorm.mle
包中的Rfast
:
install.packages("Rfast")
library(Rfast)
iris.split <- split(iris[,1:4],iris$Species)
iris.mvnorm <- lapply(iris.split,function(x) mvnorm.mle(as.matrix(x)))
iris.mvnorm[["setosa"]]
# $loglik
# [1] 44.91657
#
# $mu
# [1] 5.006 3.428 1.462 0.246
#
# $sigma
# Sepal.Length Sepal.Width Petal.Length Petal.Width
# Sepal.Length 0.121764 0.097232 0.016028 0.010124
# Sepal.Width 0.097232 0.140816 0.011464 0.009112
# Petal.Length 0.016028 0.011464 0.029556 0.005948
# Petal.Width 0.010124 0.009112 0.005948 0.010884
其他物种分别存储在iris.mvnorm[["versicolor"]]
和iris.mvnorm[["virginica"]]
中。
似乎您正在寻找混合判别分析(因为已知类标签)。在这种情况下,您可以使用MclustDA
包中的mclust
。
model= MclustDA(data = iris[,class = iris$Species)
summary(model)
但是,如果您希望通过拟合多元高斯混合来对数据进行聚类,则可以使用Mclust
函数。
fit = Mclust(data = iris[,G=3)
table(fit$classification,iris$Species)
# setosa versicolor virginica
# 1 50 0 0
# 2 0 45 0
# 3 0 5 50
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。