最新公告
  • 欢迎您光临欧资源网,本站秉承服务宗旨 履行“站长”责任,销售只是起点 服务永无止境!立即加入我们
  • 作者简介马少平副监事长清华大学清华大学“天工”智能计算(组图)

    近年来,人工智能发展迅速并逐渐渗透到各行各业和各个领域,越来越多的人在学习人工智能相关技术。为了帮助人工智能初学者快速掌握人工智能的基本原理,CAAI副导师马绍平教授撰写了入门读物《计算机如何实现智能》。通过新的科普栏目“跟我学AI”,我们会为大家分享书中的章节,并讲解一些视频,让大家了解对应的AI知识点。

    关于作者

    马少平

    CAAI副监事长

    清华大学“天宫”智能计算研究院常务副院长、教授

    CAAI会士

    个人简介:

    CAAI前副主席。博士生导师,清华大学人工智能研究院智能信息获取研究中心主任 CSRankings在过去十年的国际排名中位居Web与信息检索领域第一。先后承担了多项“973计划”、“863计划”和国家自然科学基金项目。

    前言

    近年来,人工智能发展迅速,再次掀起高潮。逐渐渗透到各行各业和各个领域。越来越多的人在学习人工智能相关技术。市场上也有很多优秀的相关书籍。. 但是我经常听到一些朋友抱怨这些书太专业,读起来比较难。为此,我利用各种机会写了一些科普文章,介绍了人工智能相关的内容,做了一些科普报告。不过也有朋友反映,虽然了解了这些科普内容,但还是不知道怎么去执行。能不能有一本既通俗易懂又能帮助我们理解具体技术的书,让我们更容易理解什么是人工智能?它是如何实现的。

    为此,我想了很久,想写一本能满足这些朋友要求的书。但有几次我开始写,但我半途而废,写不下去了。这里的关键是如何定位问题。经过很多业内人士,包括我们组的同学,在这个过程中给了我很多鼓励和很好的建议,最后我想尝试写一篇关于人工智能入门的入门书。目标受众是一定有理工科背景的朋友,用通俗易懂的语言,由浅入深,讲授人工智能的基本原理。在写作的过程中,我想到了“一个老师一辈子”的某种互动写作方法。这本书设计了一位博学的老师,比如“博士。

    “计算机如何实现智能”项目由六篇文章组成,每篇文章都是一个单独的章节。除文字内容外,每个内容还配有数个讲解视频,每个视频时长20分钟左右,方便小伙伴们学习。

    作为人工智能的入门通俗读物,本书将带你走进人工智能的世界。

    这里介绍的是本书的第一部分:如何实现神经网络。

    这是我们最初的尝试,效果如何,请朋友们多多指教。欢迎朋友们留下您宝贵的意见和建议,书中如有不妥或未说明的地方,我将不胜感激。

    艾博士的指南

    近年来,人工智能蓬勃发展,在语音识别、图像识别、自然语言处理等诸多领域得到了很好的应用。推动这股人工智能浪潮,无疑是深度学习。所谓深度学习,其实就是一个多层的神经网络,至少目前为止,深度学习基本上都是用神经网络来实现的。神经网络并不是一个新概念。早在1940年代,以感知机为代表的神经网络的研究就已经开展,但仅限于当时的客观条件。提出的模型相对简单,只有两层输入和输出。功能有限,连最简单的异或问题(XOR问题)都无法解决,神经网络的研究处于低潮。

    1980年代中期,随着BP算法的提出,神经网络再次引起了研究热潮。当时广泛使用的神经网络在输入层和输出层之间引入了一个隐藏层,不仅可以轻松解决异或问题,而且证明可以逼近任何连续函数。然而,由于计算能力和数据资源的匮乏,神经网络的研究再次陷入低谷。

    一直对神经网络情有独钟的多伦多大学 Hinton 教授于 2006 年在 Science 上发表了一篇论文,提出了深度学习的概念。到目前为止,神经网络已经以深度学习的形式在研究人员中重新出现。在…前面。但是,深度学习并不是简单地重复以往的神经网络,而是针对以往神经网络研究中存在的问题提出一些解决方案,可以实现更深层次的神经网络,这也是深度学习一词的来源。

    随着深度学习方法相继应用于语音识别和图像识别,并取得了传统方法无法比拟的性能,深度学习引发了人工智能研究的又一次高潮。

    那么神经网络是如何实现的呢?本文将一一解开这个谜团。

    本文内容根据难易程度分为三个层次,读者可以根据自己的需要选择部分或全部阅读。

    级别 1:1.1 到 1.2 部分,介绍神经元和神经网络的基本概念。通过一个简单的数字识别问题,介绍了神经元的概念以及神经元与模式的对应关系。然后系统地介绍了神经元和全连接的神经网络。

    Level 2:1.3到1.4节,介绍神经网络的基本训练方法,介绍BP算法和BP算法的基本工作原理。从模式提取的角度,介绍了卷积神经网络的概念,进一步解释了卷积神经网络的实现方法。最后介绍了神经网络的几个应用实例,并详细描述了其组成和结构。在阅读这些内容之前,要求读者对向量、导数、偏导数等基本概念有一个大致的了解,但不需要太深的知识。

    第三关:1.5到1.11,介绍什么是梯度消失问题和常见的解决方案。介绍什么是过拟合问题和常见的解决方法。为了利用神经网络处理自然语言问题,介绍了引导词的表达方法和求解方法。针对句子等序列数据处理对象,本文介绍了递归神经网络是什么以及如何解决,并给出了一些应用实例。接下来介绍一种特殊的循环神经网络LSTM,并说明其结构和基本求解原理。与第二级一样,要求读者对向量、导数、偏导数等基本概念有一个大致的了解,但不需要太深的知识。

    小明是个聪明好学的孩子,对一切都充满好奇。人工智能最近很火。无论是在电视上还是网络媒体上,经常听到的一个词就是神经网络。小明在生物课上学过人类神经网络。我们的思维过程依赖于大脑的神经网络。那么计算机上的神经网络是如何实现的呢?带着这个疑问,小明找到了全能的艾博士,向艾博士询问了神经网络的实现原理,以及计算机是如何利用神经网络来实现一些智能功能的。

    第 1 节:从数字识别开始

    今天是周末。艾博士正在家里整理他的阅读笔记,准备周一的讲座。得知小明的来意后,他对小明说:小明,你来的正是时候。我正在准备这个材料。让我们一起讨论这个问题。

    小明,你看,图1.1(a)是数字3的图像,其中1代表有笔划的部分,0代表没有笔划的部分。假设我们要识别从0到9的十个数字图像,也就是说,如果我们给一个数字图像,我们希望计算机识别图像的编号,我们应该怎么做呢?

    图1.1 数字3的图像和图案

    一种简单的方法是为每个数字构造一个模式。例如对于数字3,我们构造这样的模式:有笔划的部分用1表示,没有笔划的部分用-1表示,如图1.1(b)所示。当有要识别的图像时,我们使用要识别的图像来匹配模式。匹配方法是将图像和图案对应的位置数相乘,然后将相乘结果累加。累加的结果称为匹配值。. 为了表示方便,我们将图案逐行展开来表示图案的每个点。待识别的图像也以相同的方式进行处理,记为 。这里假设图案与要识别的图像大小相同,由点组成。

    艾博士问晓明:你觉得这样一场比赛的结果会是什么?

    小明想了想,回答说:如果图案和要识别的图像中的笔划相同,就会得到比较大的匹配结果。如果有不一致的地方,比如花样中某个位置没有笔画,则这部分在花样中。为-1,而待识别图像中对应位置有笔划,这部分在待识别图像中为1,所以对应位置相乘为-1,相当于惩罚结果,将使匹配结果更小。所以我猜测匹配结果越大,要识别的图像与图案越一致,否则差异会更大。

    听完小明的回答,艾医生很开心:小明,你说得对。我们以 3 和 8 为例。如图1.2所示,是8的图像。这两个数字的区别只是最左边是否有笔划。当使用8和3的模式进行匹配时,当8的左边部分与3的模式的左边部分相乘时,会得到一个负值,所以匹配结果被惩罚,减少了匹配值。相反,如果3和8的图案匹配,由于3的左边没有笔画值,所以乘以8左边的对应位置得到的结果为0,同样被扣分,匹配值为减少。只有待识别的图像与图案笔划一致时,才能获得最大匹配值。

    bp神经网络原理及其在字符 1 识别中的应用_bp网络神经算法概述_bp神经网络模型都有什么应用

    图1.2 数字8的图片

    接下来,艾博士让小明分别计算数字3、8和3的模式匹配值。萧铭连忙给出了计算结果。3和3的模式匹配值为143,8和3的模式匹配值为115,可见前者远大于后者。图1.3为数字8匹配模式3的示意图,为方便起见使用了小图。

    图1.3 数字8乘以模式3对应的位置再累加

    看到计算结果,小明很兴奋,马上问艾博士:如果要鉴别一个数字是3还是8,是不是应该分别匹配这两个数字的模式,看哪个模式的匹配度更大值,哪个数字是?

    艾医生肯定的回答:非常真实。如果你认识从 0 到 9 的 10 个数字,你只需要分别构建这 10 个数字的模式。对于要识别的图像,分别匹配10个模式,选择匹配值最大的一个作为识别结果。但是由于笔画数量不同,比如1笔少,8笔多,所以识别结果的匹配值也会有大有小。出于这个原因,我们可以使用一个叫做 sigmoid 的函数来匹配值。变换在0到1之间变换匹配值。sigmoid函数如下式所示,通常用σ表示。

    其图形如下:

    图1.4 sigmoid函数示意图

    从图中可以看出bp神经网络原理及其在字符 1 识别中的应用,当x比较大时,sigmoid输出接近1,当x比较小时(负数),sigmoid输出接近0。通过sigmoid函数变换的结果可以是视为待识别图像属于该数的概率。

    听艾博士讲到这里,聪明的小明用计算器计算后立刻想到了一个问题:艾博士,上例中3和8的匹配结果分别为143、115。将两个结果带入sigmoid函数,接近1,没有明显区别?

    艾博士称赞小明的细心:小明说的很对,sigmoid函数不能这样直接使用,而是必须“翻译”并加上一个合适的offset b,这样加上offset之后,两个结果分别是在sigmoid函数中心线两侧解决这个问题:

    比如这里我们让b=-129,小明,这样处理之后的sigmoid值是多少呢?

    小明用计算器再次计算后,结果如下:

    小明对这个结果很满意:这个sigmoid函数真的很神奇,所以区分很明显,接近1的就是识别结果,接近0的不是。但是艾博士,对于不同的数字模式,这个偏差是固定值吗?

    艾医生回答:当然不能修。不同的数字图案具有不同的b值,以解决前述不同数字之间有多少笔画的问题。

    经过艾博士的详细讲解,小明明白了这么简单的数字识别的基本原理。但这与神经网络有什么关系?

    针对小明的问题,艾博士在纸上画了一个示意图,如图1.5。艾博士指着图片说:我们上面介绍的其实是一个简单的神经网络。这是一个可以识别3和8的神经网络。如前所述,它表示要识别的图像,3和8的模式分别可以看成图中每条边的权重。如果识别的概率分别为 3 或 8,这个示意图的实际表示与前面介绍的数字识别方法完全一样,只是用网络的形式表示。

    图1.5 以神经网络形式表示的数字识别

    艾博士指着图进一步解释:图的下半部分代表输入层,每个圆圈对应输入图像的位置值,上层代表输出层,每个圆圈代表一个神经元,并且所有神经元都采取相同的运算:输入的加权和,加上偏置,然后通过sigmoid函数得到输出值。这样的神经网络实际上代表了如下的计算过程:

    小明,你看,这就是我们之前说的数字识别方式吗?

    听完艾博士的解释,小明恍然大悟,问道:那么每个神经元对应的权重是不是代表一种模式呢?例如,在这个图中,一个神经元代表数字 3 的模式,另一个神经元代表数字 8 的模式。进一步,如果在输出层添加 10 个数字,我们可以实现数字识别吗?

    图 1.6 具有一个隐藏层的神经网络

    得到艾博士肯定的回答后,小明又问:你刚才说这是一个简单的神经网络,那还有更复杂的神经网络吗?复杂的神经网络是如何构建的?

    艾博士回答:这个网络太简单了。有两种方法可以构建更复杂的网络。例如,一个数字可以用不同的方式书写。在这种情况下,同一个数字可以构造多个不同的模式。只要匹配上一个模式,就可以认为是这个数字。这是横向扩展。另一种方法是构建局部模式。例如,一个数字可以分为上下左右四个部分,每个部分是一个图案,多个图案组合起来形成一个数字。不同的号码也可以共享相同的本地模式。例如,3和8在右上和右下部分可以相同,区别在于左上和左下模式。要实现这样的功能,需要在神经网络的输入层和输出层之间添加一层表示局部模式的神经元。这层神经元被称为隐藏层,因为它位于神经网络的中间部分。如图1.6所示,输入层和隐藏层的神经元之间存在加权连接,​​隐藏层和输出层之间也存在加权连接。隐藏层中的每个神经元代表一些局部模式。这是一个纵向扩展。隐藏层和输出层之间也存在加权连接。隐藏层中的每个神经元代表一些局部模式。这是一个纵向扩展。隐藏层和输出层之间也存在加权连接。隐藏层中的每个神经元代表一些局部模式。这是一个纵向扩展。

    小明看着艾博士画的图bp神经网络原理及其在字符 1 识别中的应用,想了想,说:如果要描述更详细的局部模式,可以多加一些隐藏层吗?

    艾博士回答:小明是对的,通过增加隐藏层的数量,可以描述更详细的模式。每次添加隐藏层时,都会对模式进行更详细的描述。这样,一个深度神经网络就建立起来了。越靠近输入层的神经元,模式越详细,反映的信息特征越细微;越靠近输出层的神经元,所描绘的模式就越能反映整体。信息的特征。这样,不同粒度的特征就体现在不同层次的神经元上。每个隐藏层也可以水平缩放,同一层中每个额外的神经元添加一个与同一层中的神经元具有相同特征粒度的模式。

    小明又问:这样一来,神经网络越深,越能描述不同粒度特征的模式,而横向神经元越多,能表示的不同模式就越多。但是,当神经网络变得复杂时,会有很多模式需要表达。如何构建不同粒度的各种模式?

    艾博士很欣赏小明周到的作风:小明,你的问题问得很好。上面只是一个例子来说明这是可以做到的。构建模式非常困难,实际上我们很难手动构建这些模式。后面我们可以看到,这些模式,也就是神经网络的权重,可以通过样本训练得到,也就是根据标注的样本,神经网络会自动学习这些权重,也就是模式,所以以实现数字识别。

    最后,艾博士总结道:通过上面的解释,我们了解到神经元可以代表一定的模式,不同层次的神经元可以代表不同粒度的特征。从输入层开始,层级越高,特征的粒度越大。从中间层的细粒度特征,到中间层的中粒度特征,再到顶层的全局特征,利用这些特征就可以实现对数字的识别。如果网络足够复杂,神经网络不仅可以实现数字识别,还可以实现更智能的系统,如人脸识别、图像识别、语音识别、机器翻译等。

    小明读书笔记

    神经元实际上是模式的表达,不同的权重反映不同的模式。权重与输入的加权和,即权重与对应的输入相乘再求和,实现了输入与模式的匹配。匹配结果可以通过sigmoid函数转化为匹配概率。概率值越大,匹配度越高。

    一个神经网络可以由多层神经元组成。每个神经元表达一种模式。靠近输入层的神经元表达更细粒度的特征,靠近输出层的神经元表达更细粒度的特征。粗粒度特征。同一层的神经元越多,表示相同粒度的模式越多,神经网络层数越多,可以描述的不同粒度的特征就越多。

    站内大部分资源收集于网络,若侵犯了您的合法权益,请联系我们删除!
    欧资源网 » 作者简介马少平副监事长清华大学清华大学“天工”智能计算(组图)

    常见问题FAQ

    免费下载或者VIP会员专享资源能否直接商用?
    本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
    提示下载完但解压或打开不了?
    最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。若排除这种情况,可在对应资源底部留言,或 联络我们.。
    找不到素材资源介绍文章里的示例图片?
    对于PPT,KEY,Mockups,APP,网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。
    欧资源网
    一个高级程序员模板开发平台

    发表评论