最新公告
  • 欢迎您光临欧资源网,本站秉承服务宗旨 履行“站长”责任,销售只是起点 服务永无止境!立即加入我们
  • 统计学发展的概貌,距今只有三百余年的短暂历史!!

    由于人类的统计实践是由计数活动产生的,所以统计的发展历史可以追溯到远古时期的原始社会,即有5000多年的悠久历史。然而,能够使人类的统计实践上升到理论概括水平的,是一个现代事件,即统计学已经成为一门系统的学科。它只有短短的300多年的历史。统计学的发展概况大致可分为三种形式:古典记录统计、现代描述统计和现代推论统计。

    统计学作为一门学科已有300多年的历史。根据统计方法和历史演进顺序,统计的发展历史通常可以分为三个阶段,即古典统计期、现代统计期和现代统计期。古典统计学的萌芽可以追溯到 17 世纪中叶。此时的欧洲正处于封建社会解体、资本主义兴起的阶段。工业和手工业迅速发展,社会发生重大变化。政治改革者迫切需要数据证据来协助国家的经营管理,以满足经济发展的需要。此时,欧洲各国展开了一系列统计基础工作。在此期间,威廉. 佩蒂和约翰。以格兰特和赫尔曼为代表的政治算术学校。赫尔曼·康宁创办的国师学派相互渗透、相互借鉴,服务和指导国家管理和社会福利的提高。

    18世纪末至19世纪末是现代统计学的发展时期。100年来,欧洲国家相继完成工业革命,科技进入全面繁荣时期。天文、气象、社会人口等领域的数据已经达到一定的积累规模。对统计的需求已从国家层面扩展到社会科学领域。每个字段。对事物和现象的静态描述已经不能满足社会的需要。数理统计学派创始人AJ Quetelet率先将概率论引入经典统计学,并提出大数定律的思想,使统计学逐渐变得具有启发性。事物的内在规律,可用于任何科学的一般研究方法。在此期间还提出了一些重要的统计概念。误差测量、正态分布曲线、最小二乘法、大数定律等理论方法的广泛使用,为社会、经济、人口、法律等领域的研究提供了大量宝贵资源。指导。

    20世纪科学技术的发展速度比上一个时代要快得多,以描述性方法为核心的现代统计学已经不能满足需要。统计学重心转向推论统计学,进入现代统计学阶段。20世纪初,随着细胞学的发展,农业育种工作如火如荼地开展。1923年,为适应作物育种研究的需要,英国著名统计学家RA Fisher提出了一系列基于概率论和数理统计的推论统计理论和方法,以及随机试验设计技术和方差分析。

    1930年代以来,随着社会经济的发展和先进医学理念的吸收和融合,人们对医疗保险和健康管理的需求不断增加,统计思想渗透到医学领域,形成了现代医学统计方法。例如,在生命质量研究领域,通过对横向和纵向数据的分析,逐步形成了重复测量数据方差分析、质量调整生命年(QALYs)法等统计方法。现阶段,统计学已广泛应用于毒理学、分子生物学、临床试验等生物医学领域。这些领域的发展导致了统计方法的不断创新,以及诸如主成分估计、非参数估计和 MME 算法应运而生。. 随着现代生物医学的发展和计算机技术的进步,人类健康管理和疾病治疗进入基因领域,对基因数据分析的需求量很大。高维海量遗传数据具有全新的数据特征,一系列高维数据统计分析方法相继产生。

    自上个世纪以来,计算机经历了突飞猛进的发展,计算机技术催生了大数据并支持其处理和分析。计算机技术可以说是大数据发展的基础。大数据时代对统计学发展的探讨,自然离不开对计算机科学的关注。大数据的价值来自于分析过程。作为大数据分析的主要工具和方法,统计学和计算机技术已成为服务大数据的核心科学。两者息息相关,合作与竞争并存。

    计算机极大地促进了统计学的发展。计算机将人类拥有的数据水平提升到了一个全新的水平,无论是在数量、类型还是粒度方面。新的数据或数据特征催生了新的数据处理方法。例如,社交网络的发展直接需要生成基于网络的统计方法;大数据流环境需要数据流算法等。计算机技术也被融入到统计方法中,推动了新的统计方法的诞生。

    自20世纪计算机兴起以来,发展了一系列基于计算机的统计方法:MCMC模拟计算、Jackknife、Bootstrap等。这些方法不仅拓展了统计领域,也为解决问题创造了新思路. 进入大数据时代,以互联网为核心的云计算技术为大数据的存储和访问提供了场所和渠道。随着分布式和并行计算(云计算的核心技术)的快速发展,Bag of LittleBootstraps 算法(2012),Memory-Efficient Tucker Decomposition(2008),MapReduce-based K-means 算法) (2009),基于MapReduce的并行Apriori算法(2012)以及一系列面向大数据的采样、分类、聚类、

    随着数据统计分析方法的蓬勃发展,以数据库技术为关键支撑的计算机信息处理技术在诸多领域也得到了长足的发展。例如,在数据获取方面,可以利用DEEP WEB技术感知数据,以及进行高质量的数据继承与整合;在数据存储方面,谷歌、IBM、百度等公司已广泛使用GFS技术实现高效分发。在数据索引方面,目前主流的索引技术之一是BigTable,它是一种分布式、可扩展、高效的非关系型数据库。; 在可视化方面,Clustergram 技术可以进行聚类,优化大数据分析结果的形式。在大数据时代,

    另一方面,由于统计学的发展是由实际需求驱动的,如果要解决的问题能够随着计算机的发展而得到很好的解决,相应的统计方法可能会被埋没在浩瀚的历史长河中。例如,在大数据时代,超高维数据已经出现方差分析时组间变异表现为,而LASSO、SCAD等方法在处理超高维数据时计算效率还远远不够。对于超高维数据,Fan 和 Lv 提出的 SIS(Sure Independence Screening)方法可以快速有效地将维数从超高维降到相对较小的尺度。这是一种基于相关准则的降维方法,

    这种统计方法可以有效地降低计算成本,但是当计算机的速度和性能得到很大提高时,它的价值就下降了。Hadoop是一种基于分布式系统的大型数据软件平台,可以通过并行处理成倍提高计算机性能。图形处理器 GPU 是图形卡的核心,它拥有一个小型高效系统,由数千台小型高效计算机组成,旨在同时处理多个任务。核心组成的大规模并行计算架构,经过并行计算优化后,GPU上的计算速度理论上比CPU快50-100倍,可直接处理超高没有“GPU+Hadoop”帮助的维度 SIS 方法。数据。一些统计方法可能会淹没在计算机技术发展的洪流中。从学科发展的角度来看,统计学与计算机技术也具有一定的竞争关系。

    与计算机竞争揭示了统计学面临的替代危机,而应对这场危机的最好态度就是积极拥抱计算机技术,将计算机技术融入统计学。在大数据时代,统计应该更紧密地与计算机技术结合。

    高维海量大数据同时具有多样性和高速度的特点。实际应用和数据推动了统计学的发展。在大数据时代,计算机与统计学的结合成为分析和研究大数据的基础。在大数据时代,统计学家应该积极拥抱计算机技术,需要对计算机相关知识有更全面的了解。尽管对大数据的数据分析理念和思维转变进行了大量的研究和探讨,但大数据时代的帷幕才刚刚拉开,人们对新事物的认识总是需要一个过程。对某些问题的误解可能会给统计的发展造成重大损失。例如,

    作为统计学家,不能随从别人的意见,对当前存在的一些误解要及时指出和纠正。此外,在大数据时代,还有很多问题需要反复讨论和长期检验,比如大数据时代的经典统计方法如何发展?如何整合分析多源异构大数据?大数据真的越大越好吗?以上所讨论的问题是关系到统计发展方向的一些比较重要的问题,值得统计学家进一步研究。

    一、经典记录统计

    古典记录统计形成的时期大致是从十七世纪中叶到十九世纪中叶。在这个新兴阶段,统计学仍然是一个意义和范围不明确的学科。在用文字或数字如实记录和分析一个国家的社会经济状况的过程中,初步确立了统计研究的方法和规则。概率论引入后,逐渐成为一种较为成熟的方法。法国天文学家、数学家和统计学家拉普拉斯是第一个有效地将经典概率论引入统计学的人。因此,后来的比利时统计学家、数学家和天文学家凯特勒指出,统计学应该从拉普拉斯开始。

    凯特莱特:Lambert Adolphe Jacques Quetelet,1796~1874年,被统计界称为“现代统计学之父”和“国际统计会议之父”。他一生写过很多,其中统计数据多达65种。1851年,积极筹备组织国际统计学会,担任第一届国际统计学会主席。之后,他被选为欧洲各科学院院士。他最大的贡献是将统计方法(他作为物理科学家和数学家擅长)应用于人类研究。

    最大类间方差法matlab_方差分析时组间变异表现为_常嬉为墓间之事的为

    他记录了苏格兰士兵的胸围、法国应征者的身高和其他类似项目,并发现这些数字与平均值的变化方式与掷骰子或子弹散布在靶心周围的方式相同。他在 1835 年首次注意到这一点。后来他使用 1846 年比利时人口普查中的数据进行统计分析。在这样做的过程中,他制定的许多法律仍然是现代人口工作的基础。他将结果绘制成图表,绘制出各种测量发生的频率,从而形成钟形曲线。(它通常被称为高斯曲线,因为高斯经常使用这种曲线。)因此,随机性进入了人类领域。这再次表明,一些支配无生命宇宙的规律也为生命(尤其包括人类)所遵守。来自凯特勒 s作品中“普通人”的概念由此而来。“人口统计”的想法也受到他的工作的影响,这决定了保险范围的大小。)

    (一)拉普拉斯的主要贡献

    另一位对概率论与统计学相结合研究的贡献者是伟大的德国数学家卡尔·弗里德里希·高斯(Carl Friedrich Gauss,1777~1855))。

    (二)高斯的主要贡献

    二、现代描述统计

    现代描述性统计的形成时期大致是从十九世纪中叶到二十世纪上半叶。因为这个“描述性”的特征是由一群最初研究生物进化的学者提炼出来的,所以历史上被称为生物统计学。生物统计学学院的创始人是英国高尔顿(F. Galton,1822~1911),主要带头人是高尔顿的学生K. Pearson(卡尔·皮尔森,1857~1936))。

    (一) 高尔顿的主要贡献

    (二)皮尔逊的主要贡献

    是皮尔逊致力于生物统计学并将其提升到一般方法论的高度。皮尔逊的一生是统计研究。他对统计学的主要贡献是:

    常嬉为墓间之事的为_最大类间方差法matlab_方差分析时组间变异表现为

    三、现代推理统计

    现代推论统计的形成时期大致是从二十世纪初到二十世纪中叶。人类历史进入20世纪后,无论是社会领域还是自然领域,都对统计学提出了更多的要求。由于各种事物和现象之间复杂的数量关系以及一系列未知的数量变化,单纯依靠记录或描述的统计方法已不再有效。于是,“推理”的方法相继诞生,以把握事物整体的真实联系,预测未来的发展。从描述统计到推论统计,这是统计发展的一大飞跃。统计学发展的这种深刻变化是在农业田间试验领域完成的。因此,它被称为历史上的农业实验学校。英国统计学家戈塞特(WS Gosset, 1876-1937) and Fisher, 1876-1937) and Fisher)对现代推论统计学的建立做出了最大的贡献。

    (一)Gossett的t检验和小样本的思想

    戈塞特(WS 1876-1937)是英国一家啤酒厂的化学技术员方差分析时组间变异表现为,在长期的实验和数据分析工作中发现了t分布,但当时戈塞特的公司害怕商业机密。因此,戈塞特在1908年以笔名“学生”发表了这个结果,所以后人称其为“学生分布”。在当时正态分布一统天下的情况下,戈塞特于1908年以笔名“学生”发表了该结果。赛斯的t分布不为外界所理解和接受,直到1923年英国统计学家费舍尔对分布进行了严格推导,并于1925年在分布表上汇编时才可以在他的酒厂中使用。发行版得到了学术界的认可,并得到了迅速的传播、发展和应用。

    方差分析时组间变异表现为_最大类间方差法matlab_常嬉为墓间之事的为

    1908 年,Gosset 首次以笔名“Student”(Gosset,WS(化名“Student”)在 Biometrics 杂志上发表了“Probabilistic Error in Mean”。1908.The probabilistic Error in Mean.Biometrika 6:1–25.)。由于这篇文章为“学生 t 检验”提供了依据,许多统计学家将 1908 年视为统计推断理论发展的里程碑。后来,Gossett 先后发表了《Probability Errors of Correlation Coefficients》(1909)、《Sample Mean Distributions for Non-Random Sampling》(1909)、《Random Sample Means from Infinite Populations》)Probability Estimation Tables of Probability Estimation (1917), etc.) 在这些论文中,他首先比较了计算均值和标准误的两种方法;其次,研究样本在Poasson分布误差问题中的应用;第三,建立相关系数的抽样分布;第四,导入“学生”分布,即t分布。这些论文的完成奠定了“小样本理论”的基础;同时,也为以后的样本数据统计分析和解释开辟了一条新途径。由于戈塞特的理论使统计学开始从大样本到小样本,从描述到推论,有人称赞戈塞特是推论统计学(尤其是小样本理论研究的先驱)。建立相关系数的抽样分布;第四,导入“学生”分布,即t分布。这些论文的完成奠定了“小样本理论”的基础;同时,也为以后的样本数据统计分析和解释开辟了一条新途径。由于戈塞特的理论使统计学开始从大样本到小样本,从描述到推论,有人称赞戈塞特是推论统计学(尤其是小样本理论研究的先驱)。建立相关系数的抽样分布;第四,导入“学生”分布,即t分布。这些论文的完成奠定了“小样本理论”的基础;同时,也为以后的样本数据统计分析和解释开辟了一条新途径。由于戈塞特的理论使统计学开始从大样本到小样本,从描述到推论,有人称赞戈塞特是推论统计学(尤其是小样本理论研究的先驱)。

    (二) R. Fisher 的统计理论和方法

    R. Fisher 一生共撰写了 395 篇论文。世界上流传最广的统计著作有:1925 年出版的《研究工作者的统计方法》、1930 年出版的《自然选择的遗传理论》、《实验设计》、1935 年、生物学、农艺学和医学研究,1938年,与耶茨合着,农业和医学研究(1938年,合着:弗兰克·耶茨),1938年发表《统计估计理论》,1950年发表于《数理统计贡献》,纽约威利,发表于1956 统计方法和科学推理。奥利弗和博伊德、爱丁堡等。当时,他是统计学的世界领袖,他的贡献是多方面的。

    方差分析时组间变异表现为_常嬉为墓间之事的为_最大类间方差法matlab

    今天的文章到此结束,欢迎进群交流!

    站内大部分资源收集于网络,若侵犯了您的合法权益,请联系我们删除!
    欧资源网 » 统计学发展的概貌,距今只有三百余年的短暂历史!!

    常见问题FAQ

    免费下载或者VIP会员专享资源能否直接商用?
    本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
    提示下载完但解压或打开不了?
    最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。若排除这种情况,可在对应资源底部留言,或 联络我们.。
    找不到素材资源介绍文章里的示例图片?
    对于PPT,KEY,Mockups,APP,网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。
    欧资源网
    一个高级程序员模板开发平台

    发表评论