最新公告
  • 欢迎您光临欧资源网,本站秉承服务宗旨 履行“站长”责任,销售只是起点 服务永无止境!立即加入我们
  • 【知识点】病区与非病区硒含量有差异吗?

    今天我以单向ANOVA为例,详细梳理一下ANOVA的全过程。

    单因素方差分析是大家熟悉的单因素方差分析(教科书上称为单因素),也俗称完全随机设计的方差分析。通过完全随机化的方法,将患者分配到多个不同的治疗组,比较多组疗效指标是否存在差异

    先看下面的案例:

    为了解大骨节病与谷物中微量元素硒含量的关系,课题组调查了大骨节病区A(威远县)、B(青州市)和C(台山区)两个地区)、D(长清区)两个非大骨节病区。

    从每个病房随机抽取20名农户采集面粉,检测面粉中的硒含量(μg/kg),并尝试分析这四个地区的面粉硒含量是否存在差异。具体数据见下表1。

    表1 四个地区面粉硒含量样本数据表

    41bc57b9a2858576d35439cdc697f9c2.png

    我们把上面的数据画成一个图(如下图,每个空心小圆圈代表一个样本值),可以直观的看出80个样本值(20*4)是不同,即它们是不同的。

    暂时忽略其他潜在的混杂因素,造成这种差异的原因可能是来自不同的地区,但因为四组内的值也不同,所以差异可能只是由于随机误差,通俗的讲,就是人家说的运气造成的。

    30c9e8457c5d0460fb392a6ffcbf807c.png

    但是,仔细观察会发现两个病房的数字似乎要低得多,这表明区域差异确实可能导致了当前的差异。

    为了验证我们的猜测,我们可以用方差分析来检验病房区和非病区区面粉硒含量的差异是否具有统计学意义。

    这里需要明确的是,我们的目标是比较这四个地区的面粉中硒含量是否存在差异。在实践中,我们比较了四个地区硒含量的总体平均值。因此,只要总体平均值存在差异,我们就说四个地区的硒含量存在差异。

    要进行ANOVA,当然要先做一个假设:这四组数据没有区别,注意了!

    在这个假设下,我们可以把这四组数据看成一个大群,也就是以上80个数据作为一个整体。对于这个整体,我们可以计算一个均值和标准差,即表1中的72.22和20.00。

    但实际上这80条数据属于四组,所以我们也可以分别计算这四组的平均值,即57.11、55.58、85.62、90.55.

    如果假设成立(即四组数据没有差异),那么四组的平均值应该在总体平均值附近(即72.22)上下波动,彼此相差应该不会很大。

    但是现在我们实际得到的数据显示,组内平均最低的是57.11、最大的是90.55,直观上和7是一样的< @2.22 的距离并不小,因此我们会怀疑它们不能被视为一个整体(更严格地说,它们不是来自同一种群),从而拒绝它们相同的假设。

    按照这个思路,我们得到下表(表2):

    类间方差和类内方差_方差分析时组间变异表现为_类间方差公式

    表2方差分析的一般结果

    你不需要看上表所涉及的具体计算过程,你只需要了解所谓的“均值偏差平方和(SS)”和“均方值”的计算方法(女士)”。

    再对比一下我们前面讲的方差的概念和计算方法,你会不会发现,未知的“均方(MS)”其实可以看作是一种特殊的“方差”!

    对比下图中方差的计算公式:左边是与均值的偏差平方和方差分析时组间变异表现为,右边是自由度。

    我们首先查看均方(MS 组内)来衡量“组内变异”。由于各组内不存在地域差异,因此MS组内的大小仅反映随机误差(即运气)的情况。

    当假设四组整体均值相同时,组间均方(MS between groups)的大小只反映随机误差的大小。

    这里所说的“随机误差”如何理解?

    同一群体中两个或多个样本的差异可以简单理解为随机误差,即虽然表面上不同,但这种差异没有任何意义,也不反映额外的信息,只是碰巧而已。

    方差分析时组间变异表现为_类间方差公式_类间方差和类内方差

    就像你和其他人掷骰子一样。虽然你得到不同的分数,但差异纯粹是运气,不能解释任何其他问题。同时,不可能一个人总是赢,另一个人总是输。情况。

    但是,如果对方悄悄地在骰子上玩花样,并且知道如何滚动以获得大点,那么此时,你的点数之间的差异不再只是因为运气,而是因为骰子。

    在统计语言中,您的差异不仅包括随机误差,还包括其他因素。所以,下次你觉得自己总是输的时候,看看骰子是不是有问题。

    回到这个例子方差分析时组间变异表现为,由于MS组和MS组都只反映随机误差的大小,所以它们携带的信息量应该没有区别(提示:方差的大小决定了信息量在数据中)。

    因此,MS组间和MS组内的值差别不大,所以MS组间除以MS组内时,得到的F值原则上应该在1左右。

    如果我们得到的数据计算出来的F值远大于1(对应的P值会很小),说明MS组远大于MS组,也就是说MS组携带因此,可以证明MS组之间的差异不仅包括随机误差,还包括其他因素(如不同地区),结合这个例子,说明面粉硒含量在四个之间是不一样的。地区!

    下表3是上述数据经过SPSS计算得到的。很明显,F值超过46,比1大很多(注意,正式情况下F值不是和1比较的,这里只是为了方便理解),对应的P值远小于0.05,从而拒绝零假设差异具有统计显着性,则可以认为这四个区域的硒含量总体均值不完全相等,也就是说至少有两个区域总体不同意思。

    表3 四个地区硒含量的方差分析结果

    ca9d4e37cfe474c58679380a0beb8ee2.png

    单向方差分析只告诉我们四个总体均值并不完全相等,但哪些不同,哪些相等?这涉及成对比较。

    站内大部分资源收集于网络,若侵犯了您的合法权益,请联系我们删除!
    欧资源网 » 【知识点】病区与非病区硒含量有差异吗?

    常见问题FAQ

    免费下载或者VIP会员专享资源能否直接商用?
    本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
    提示下载完但解压或打开不了?
    最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。若排除这种情况,可在对应资源底部留言,或 联络我们.。
    找不到素材资源介绍文章里的示例图片?
    对于PPT,KEY,Mockups,APP,网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。
    欧资源网
    一个高级程序员模板开发平台

    发表评论