最新公告
  • 欢迎您光临欧资源网,本站秉承服务宗旨 履行“站长”责任,销售只是起点 服务永无止境!立即加入我们
  • 【每日一题】机器学习里常用的无监督学习方法

    主成分分析(PCA)是机器学习中常用的一种无监督学习方法。该方法利用正交变换,将线性因变量表示的观测数据变换为少数线性自变量表示的数据,这些变量称为主成分。主成分的个数通常小于原始变量的个数,所以主成分分析是一种降维方法。

    主成分分析法主要用于分析数据的基本结构,即数据中变量之间的关系。它是一种强大的数据分析工具,也可用于其他机器学习方法的预处理。经典方法。

    为什么要求变量是线性独立的?

    如果数据中某些维度之间存在很强的线性相关,那么样本在这些维度中提供的信息会在一定程度上重复,所以希望数据的维度是不相关的(即正交的)。的)。

    直观的解释

    如图,考虑二维的情况,如果x_1和x_2是两个数据变量,图中每个点代表一个样本点,可以看出这些数据分布在一个以原点为中心的椭圆中,很明显这两个变量是线性相关的,因为固定一个变量后,另一个变量的值就不是随机的了。

    主成分分析对数据进行正交变换,具体来说,就是对原坐标系进行旋转变换,将数据表示在一个新的坐标系中。新变量是 y_1 和 y_2。可以看出,在新的坐标系中,椭圆的长轴和短轴分别对应了两个新的坐标轴。为什么这样做?因为主成分分析选择方差最大的方向作为第一个主成分,即长轴对应的方向;其次,选择方差第二大且与第一主成分线性无关的方向用r软件做主成分分析,即正交方向,作为第二主成分。主成分,即短轴。

    在新的坐标系中,数据中的变量是线性无关的。

    样本主成分分析

    求解主成分分析的思路是对原变量进行一系列线性变换,使得新变量y_1(第一个主成分)的方差最大,y_2(第二个主成分)的方差最大,主成分)是所有与 y_1 无关的原始变量。在线性变换中,方差最大,然后在与y_1、y_2线性无关的条件下,分别求y_3用r软件做主成分分析,y_4….。

    下面我们简单介绍一下样本的主成分分析算法。

    计算累积方差贡献。率,然后确定k的大小。求解 k 个样本的主成分。y_i = a_i^T*x; 数据分析

    得到k个主成分后,就可以对主成分进行分析了。通过计算主成分与原变量的相关系数(称为因子载荷),可以分析出哪个原变量与主成分的相关性最高。例如,在考试成绩数据中,每个科目都是原始变量。得到第一主成分后,如果物理学和第一主成分的因子载荷最高,则说明物理学对第一主成分的影响最大。如何分析,应结合具体计算结果和具体事例。

    扩张

    主成分分析可以通过核方法在高维空间中隐式进行,相关的方法是核主成分分析。

    参考文献:《统计学习方法(第二版)》,李航,清华大学出版社;

    欢迎大家在评论区讨论。如有错误,请指正,谢谢。

    喜欢的可以关注一波小编哇,一起讨论,一起学习进步!您的支持是我们创作的动力!

    站内大部分资源收集于网络,若侵犯了您的合法权益,请联系我们删除!
    欧资源网 » 【每日一题】机器学习里常用的无监督学习方法

    常见问题FAQ

    免费下载或者VIP会员专享资源能否直接商用?
    本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
    提示下载完但解压或打开不了?
    最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。若排除这种情况,可在对应资源底部留言,或 联络我们.。
    找不到素材资源介绍文章里的示例图片?
    对于PPT,KEY,Mockups,APP,网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。
    欧资源网
    一个高级程序员模板开发平台

    发表评论