最新公告
  • 欢迎您光临欧资源网,本站秉承服务宗旨 履行“站长”责任,销售只是起点 服务永无止境!立即加入我们
  • 潜变量和降维分析的方法合起来给你写写多幸福

    今天就给大家写一个潜变量和降维的组合分析方法,因为这两个东西有很多共同点。

    潜变量

    为什么我们需要潜在变量?考虑一个问题,比如你想衡量一个人的幸福程度,你会如何衡量?

    我猜你会看到这个人:

    等等,你是在试图通过这些可衡量的指标来反映一个人的所谓幸福。这是我们自然想要的,因为我们明白幸福是一个抽象的概念,无法直接衡量,所以称为潜变量。

    降维/压缩

    机器学习中有专门的降维算法,但因子分析和主成分分析更多地用于社会科学领域。让我们一一介绍:

    主成分分析

    主成分分析是因子分析中提取因子的一项重要技术。它的作用是从一系列变量中提取分量,我们希望每个变量都能尽可能多地解释原始数据的变化。

    记住一句话:分量是原始变量的线性组合。

    成分是原始变量的线性组合。

    在进行主成分分析时,我们会得到与变量一样多的成分,每个成分解释的方差都会比前一个成分少一点,然后所有成分都会解释原始数据中 100% 的方差。

    理论上,我们可以从分量中完全恢复我们的原始数据,但是我们的目的是降维,所以我们通常不会保留所有的分量,只保留主分量。

    上图是一个主成分分析的示意图,4个原始变量,4个分量,很可能我们只保留前两个分量。

    主成分分析示例

    使用的数据是 Harman.5,其中包含 5 个变量。我们可以使用psych包的principal函数进行主成分分析,使用这个函数你只需要给出数据集和你想要保留的主成分个数。例如我想要2:

    library(psych)
    pc = principal(Harman.5, nfactors=2,  rotate='none', covar = F)
    pc

    如果您希望所有 5 种成分都出来,只需将 nfactors 更改为 5。

    解释结果输出:

    SS 载荷,这是每个分量中变量的平方载荷之和。理论上,有 5 个分量,5 个分量的载荷平方和为 1。

    Proportion Var,这是该分量解释的方差的比例。它是通过使用SSloading与5进行比较得到的。

    Cumulative Var,这是累积方法差异解释率。可以看出,只有 2 个分量解释了源数据中 93% 的变化。伟大的。

    h2,这是分量解释变量变化的比例,因为我们只保留2个主成分,所以不是1,如果我们保留5个主成分,这个值应该是1.

    u2,这是 1-h2

    com,这就是复杂度,如果值为1,则表示该变量仅对一个组件有负载用r软件做主成分分析,如果为0,则根本没有负载。

    但是我们看的是加载的结果,很尴尬。我们看到组件 1 确实很强大,并且所有变量在组件 11 上都有很高的负载,所以我们无法命名组件。

    我们上面做的主成分分析的可视化表达如下:

    可以看出,组件1与所有变量都是强关联的,所以这种方法不是一个很好的解释方法。

    因子分析

    因子分析和主成分分析都是降维的方法。在主成分分析中,每个主成分是所有变量的线性组合。绘图应如下所示:

    但在因子分析中,上述关系发生了变化

    r做主成分分析_怎么用spss做主成分分析_用r软件做主成分分析

    在因子分析中,我们认为所有的变量都是由因子引起的。当然,这个过程允许误差存在,所以因子分析中会有误差项。通过因素无法完全恢复原始数据,但主要成分还可以。

    贴几句原话供自己体会:

    因子分析侧重于协方差。PCA 侧重于方差。

    因素是观察变量的成因,变量是成分的成因。

    因子分析不假设观测变量的完美测量。

    因子分析实践

    我们仍然使用相同的数据进行因子分析:

    fac = fa(Harman.5, nfactors=2,  rotate='none')
    fac

    同理,如果要制作5-factor模型,只需将nfactors改为5即可。从结果来看,2-factor模型已经解释了原始数据90%的方差,已经很好了。同时我们注意第一个因素解释原来的数据变异0.55,第二个解释0.35,其实差别没那么大。

    还需要强调的是,在因子分析中,默认因子是可以相关的,这与 PCA 不同。因此,一个显着变量可能对因子1没有负载,而在其他因子之间有负载,但因子之间存在相关性,因此显着变量与因子1之间的相关性无法抹去。

    但是,如果您对因子应用正交旋转,则因子分析与主成分分析相同。所以你会看到主成分分析在SPSS中被归类为因子分析。

    所以记住因子分析是非正交旋转的主成分分析。

    主成分分析是正交旋转的因子分析,因子之间不存在相关性。

    如果只有一个因子或因子正交,则 PCA 和 FA 是相同的

    谈谈两者的区别

    首先,让我们进行因子分析并给出载荷:

    fac2 = fa(Harman.5, nfactors=2)
    fac2$loadings[] %>% round(2)
    fac2$Structure[] %>% round(2)

    解释一下上面两个结果,都是载荷,都是相似的,第一个是模式系数,第二个是结构系数:

    然后做主成分分析,给出载荷:

    pc = principal(Harman.5, nfactors=2,  rotate= "none" , covar = T)
    pc

    可以看出,两种方法做的载荷基本相同。

    概括

    今天从潜变量推导出来,写了PCA和FA的异同。我希望它会激励你。感谢您耐心阅读。我的文章都写得很详细,代码在原文中。我希望每个人都能自己做。是的,请关注并私信回复“资料链接”,获取我收集的所有资料和学习资料。如果对你有用,请先收藏,再点赞转发。

    也欢迎大家提出意见和建议。想了解什么统计方法,可以在文章下方留言。也许我看到它时会为你写一个教程。

    如果您是本科生或研究生,如果您在为自己的统计作业、数据分析、论文、报告、考试等发愁,如果您在使用SPSS、R、Python、Mplus、Excel时遇到任何问题,请联系我。因为我可以为您提供良好、详细、耐心的数据分析服务。

    如果您对 Z 检验、t 检验、ANOVA、MANOVA、回归、卡方检验、相关性、多水平模型、结构方程模型、中介调整、量表信度和效度等统计技术有任何疑问,请发送私信我,详细耐心指导。

    如果您是一名学生并且您担心统计#Assignments、#Data #Analysis、#Thesis、#reports、#composing、#Quizzes、Exams.. 如果您在#SPSS、#R-Programming 中遇到问题,#Excel用r软件做主成分分析,Mplus,然后联系我。因为我可以为您的数据分析提供最好的服务。

    您是否对用于数据分析的 z 检验、t 检验、ANOVA、MANOVA、回归、Logistic 回归、卡方、相关、关联、SEM、多级模型、中介和调节等统计技术感到困惑……??

    然后联系我。我会解决你的问题…

    加油,工人们!

    站内大部分资源收集于网络,若侵犯了您的合法权益,请联系我们删除!
    欧资源网 » 潜变量和降维分析的方法合起来给你写写多幸福

    常见问题FAQ

    免费下载或者VIP会员专享资源能否直接商用?
    本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
    提示下载完但解压或打开不了?
    最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。若排除这种情况,可在对应资源底部留言,或 联络我们.。
    找不到素材资源介绍文章里的示例图片?
    对于PPT,KEY,Mockups,APP,网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。
    欧资源网
    一个高级程序员模板开发平台

    发表评论