最新公告
  • 欢迎您光临欧资源网,本站秉承服务宗旨 履行“站长”责任,销售只是起点 服务永无止境!立即加入我们
  • DileepGeorgeVicariousAI发表在Science上的一篇论文引发了业内热议

    上周,Vicarious AI 发表在 Science 上的一篇论文在业界引起了热议,褒贬不一,甚至有媒体挖出了 Yann LeCun 在 2013 年对 Vicarious AI 的批评。论文发表后,Heart of Machines 进行了独家Vicarious AI 的首席技术官 Dileep George 就概率生成模型、Yann LeCun 的批评和其他主题进行了采访。

    迪利普·乔治

    Vicarious AI 是一家位于硅谷的人工智能 (AI) 初创公司,旨在从人脑中汲取灵感,实现具有高级智能的机器人。在 Vicarious AI 的办公室里,随处可见它的口号——Our Frontier,Human-like AI。

    上周,Vicarious AI 的论文《一种以高数据效率进行训练并打破基于文本的验证码的生成视觉模型》在 AI 社区引发了热议。在论文中,作者提出了一种不同于深度学习的模型——递归皮层网络(Recursive Cortical Network),它突破了基于文本的全自动区分计算机和人类图灵测试CAPTCHA。与主流深度学习算法相比,Vicarious AI 的循环皮层网络在场景文本识别中体现了 300 倍的训练数据使用效率。

    文本验证码,又称验证码,是用于防止机器人恶意登录网站的网络安全软件。人类很容易识别 CAPTCHA 中形状奇特的文字,但对于机器来说,CAPTCHA 就变成了无法理解的幽灵,所以这也算是一种图灵测试。

    早在 2013 年,Vicarious AI 就声称已经征服了 CAPTCHA,但该公司直到上周才发表论文。主要原因之一是当时CAPTCHA仍然被广泛使用,Vicarious AI担心发表论文会引发很多网络安全问题。现在,仍然使用 CAPTCHA 作为验证方法的公司已经不多了,现在是发表论文的好时机。

    对于 Vicarious AI 来说,征服 CAPTCHA 只是向类人 AI 的中继站。“我们的目标是解决人类擅长的所有问题,特别是在自然视觉线索方面,”乔治说。

    “如果我一生只需要解决一个问题,我肯定会选择人脑。”

    George 毕业于印度理工学院,获得本科学位,随后来到斯坦福大学学习电气工程和机器学习。第二年,迪利普开始对神经科学产生兴趣。“初中的时候看过很多心理学的书,读本科的时候就全部放弃了。这种兴趣在我研究生二年级突然又回来了,这让我开始专注于神经科学研究。”

    在他的博士期间。在斯坦福大学,乔治结识了《人工智能的未来》作者、硅谷掌上电脑公司 Palm 的创始人杰夫·霍金斯(Palm 于 2011 年被惠普收购)。神经科学界的知名人士霍金斯和志同道合的乔治于 2005 年共同创立了 Numenta,这是一家致力于机器智能的软件公司。

    Numenta 不满足于 George 对神经科学和机器学习的探索,因此在 2010 年,他着手创办一家新公司。恰好在那个时候,Vicarious AI 的现任 CEO D. Scott Phoenix 找到了他。在创立 Vicarious AI 之前,Phoenix 有过创业经历,公司被硅谷知名孵化器 Y Combinator 收录。之后,他作为合伙人加入了风投Founders Fund。

    Phoenix 看到了 George 在神经科学和工程方面的专长,决定与他共同创立 Vicarious AI。从公司成立之初,他们的目标就很明确——受到人脑的启发,实现具有高级智能的人工智能。

    “人脑是通用学习的基本框架,学习这个世界上的各种问题,”菲尼克斯在接受高盛采访时说。

    D.斯科特·菲尼克斯

    当时,很少有公司提出这个想法,但硅谷总是充满了眼光独到的投资者,比如 Facebook 的天使投资人和 Paypal 创始人彼得泰尔。泰尔在 2010 年底为 Vicarious AI 筹集了种子轮。到 2014 年,Vicarious AI 已经完成了 4000 万美元的 B 轮融资,其中包括 Facebook 创始人马克扎克伯格、Y Combinator 首席执行官山姆奥特曼和特斯拉创始人埃隆马斯克。迄今为止,Vicarious AI 已经筹集了超过 1. 3 亿美元的总资金。

    与融资金额形成鲜明对比的是,公司只有50人,扩张速度缓慢。George 透露,直到 2013 年,Vicarious AI 团队只有六人。

    “并不是我们不想招人,我们花了很长时间才确定一个我们认为正确的研究方向,”乔治说。这个方向是让机器获得感知。

    机器了解世界,需要画面感

    AI界有一个笑话——“一个普通的人工智能不懂自然语言就是流氓”。然而,Vicarious AI 在成立之初就决定避开自然语言的研究,从计算机视觉领域入手。根据乔治的说法,如果一台机器无法感知世界,它就无法理解它在做什么。

    “墙上一根钉子,地上一根钉子,哪个钉子是水平的?” 乔治举了一个简单的例子。显然,墙上的钉子就是答案。“通常,人们不只是从字面上得到这个答案,他们会想象脑海中的画面。在你得到这张照片之前,你必须对墙壁以及墙壁如何与指甲相互作用有一定的了解ai遇到未知的图像结构,这就是为什么替代人工智能必须从视觉开始。”

    在计算机视觉领域,当今的主流算法是以卷积神经网络为代表的深度学习算法。然而,深度学习算法只对固定问题有效,一旦问题发生变化,算法就不起作用。

    “强化学习现在已经准备好玩打砖块了,但如果下接受器上升三个像素,那么模型就会崩溃,”乔治补充道,强调“只有三个像素。)”。

    大量的数据和计算能力也是制约深度学习的条件。至少人类在下一场围棋比赛中只需要一双手和一杯咖啡就可以提神醒脑,而基于深度学习的AlphaGo则需要3000美元;重叠问题是卷积的问题 长期以来神经网络的“致命弱点”,一旦两张图片重叠,而且重叠部分的颜色完全一样,那么卷积神经网络就很难区分了.

    ai遇到未知的图像结构_dnftcls遇到未知错误_lol tcls遇到未知错误

    因此,Vicarious AI选择了不同于深度学习的生成概率模型,可以模拟生成图像中物体的轮廓和形状,从而理解物体。生成模型有两个明显的好处:更好的泛化和处理对抗样本的能力。在 Vicarious AI 最近的一篇论文中,循环皮层网络是一种生成模型,可在各种计算机视觉任务中实现强大的性能和高数据效率。

    研究生成模型的挑战在于研究问题的边界是未知的,这反过来又成为深度学习算法的强项——只要让机器做一件事,它就能做好。Vicarious AI 团队花了很长时间筛选出不仅解决计算机视觉中物体的检测和识别,而且体现泛化能力的研究课题。最后,Vicarious AI 选择了 CAPTCHA。

    著名哲学家 Douglas Hofstadter 曾说过:“AI 理解的中心问题是字母“A”(AI 理解的中心问题是字母“A”)”,乔治坚信这句话。

    代表字母A的四层循环皮层网络结构

    “我认为 CAPTCHA 是一个‘完整的 AI 问题’。如果你完全解决了这类问题,那么你就有了通用人工智能。” George 告诉记者,为了完全识别 CAPTCHA,模型必须能够识别任何文本。不仅仅是验证码,即使有人在纸上写了任何类型的字体(比如 PPT 中的艺术字),模型也需要识别它。

    乔治和他的团队并不是唯一想研究 CAPTCHA 的科学家。许多科学家意识到识别 CAPTCHA 的重要性。麻省理工学院认知科学教授 Josh Tenenbaum 也在使用生成概率模型来解决 CAPTCHA 问题。

    Vicarious AI 的解决方案与其他研究的最大区别在于,它将脑科学的研究成果应用于生成模型。

    人脑已经为机器构建了框架

    在实现通用人工智能的方法上,今天的AI领域存在着巨大的差异:更喜欢学习人脑先天机制的“自然派”和相信发展的“机器派”机器本身的。10 月,AI 界的两位旗手,纽约大学心理学和神经科学教授 Gary Marcus 和 Facebook AI 研究所所长 Yann LeCun 就这个问题进行了两个多小时的辩论。Marcus 支持前者,而 LeCun 是机器派。

    Vicarious AI 选择站在“自然派”的立场上:对人脑的研究是实现通用人工智能的关键。“所有的学习算法到头来都是搜索,如果忽略人脑,搜索量太大了,所以我们认为需要从人脑的特点中学习。” 目前,Vicarious AI 的研究人员中有 20% 的成员是神经科学专家,这些关于人类大脑皮层的研究成果也在最新论文中有所体现。

    在本文中,最典型的例子是在视觉皮层中使用横向连接。在人类视觉系统中,横向连接可以保证人类对物体轮廓理解的连续性;当将人类视觉的特征应用于循环皮层网络时,横向连接允许循环皮层网络汇集而不会失去特异性,从而增加不变性。

    另一个例子是“自上而下的注意力机制”。由于注意力机制,即使是高度重叠和部分透明的字母 A 和 B,也可以很容易地被人类分别识别。当应用于循环皮层网络时,此属性允许网络具有组合性,允许多个对象表示场景。

    “我们的研究需要一种叫做‘脚手架’的东西,”乔治进一步解释道。脚手架原本是编程中的一个特殊名词,程序员会搭建一个框架(scaffolding),让他们可以方便地访问函数。同样,循环皮层网络也没有采取 CNN 或其他深度学习网络的方法,从一张白纸开始,从头开始分析图像;相反,基于人类识别图像的框架,机器具有与人类视觉系统相同的特征。

    从结果来看,循环皮层网络在场景文本识别基准上的数据效率是深度学习算法的 300 倍以上。循环皮层网络在 reCAPTCHA 上达到 66.6% 的准确率ai遇到未知的图像结构,BotDetect 64.4%,Yahoo 57.4%,PayPal 57.1%。只要准确率高于1%,就被认为是破解了CAPTCHA。

    当 Vicarious AI 在 2013 年发布结果时,业界的评价褒贬不一。Vicarious AI 没有提出有效的研究方法,这也是包括 LeCun 在内的许多 AI 科学家的主要原因。他在 2013 年猛烈抨击了 Vicarious AI,用“这是最糟糕的 AI 炒作的文本示例”来谴责 Vicarious AI。

    在过去的四年里,乔治一直被许多人询问他对 LeCun 言论的评价,他拒绝发表评论。直到上周的论文发表之前,乔治告诉机器之心,“这篇论文是最好的答案。”

    循环皮层网络不仅用于破解验证码,还将用于控制、推理和机器人技术。近两年来,Vicarious AI 一直在研究如何将该技术应用于实验室的工业机器人。

    Vicarious AI 商业化总监楼兴华博士表示,Vicarious AI 将为仓库机器人和工厂机器人,尤其是柔性制造所需的视觉和控制提供智能模块。传统的刚性生产线是非标准自动化,每条生产线针对特定产品具有不同的配置和模具。柔性制造的概念是自动适应不同的产品。最明显的优势是该系统可以满足不同产品的生产需求,当场景和需求发生变化时,机器人的生产效率也可以得到保证。

    Vicarious AI 的投资方包括 ABB 集团和亚马逊,公司还与国内外多家顶级机器人公司和制造商建立了合作伙伴关系。

    工业机器人是目前 Vicarious AI 技术的实现方式,但这并不意味着 Vicarious AI 会止步于此。Vicarious AI 希望在 2040 年左右实现高级别的智能 AI。

    “我认为其他公司不会在我们之前解决这个问题,”乔治自信地说。“用先进的智能实现人工智能就像把人类送上月球一样伟大。这是我们做这件事的动力。”

    硅谷顶级人工智能会议 AI Frontiers 将于本周五(美国时间)举行。点击“阅读原文”参与报名。

    站内大部分资源收集于网络,若侵犯了您的合法权益,请联系我们删除!
    欧资源网 » DileepGeorgeVicariousAI发表在Science上的一篇论文引发了业内热议

    常见问题FAQ

    免费下载或者VIP会员专享资源能否直接商用?
    本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
    提示下载完但解压或打开不了?
    最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。若排除这种情况,可在对应资源底部留言,或 联络我们.。
    找不到素材资源介绍文章里的示例图片?
    对于PPT,KEY,Mockups,APP,网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。
    欧资源网
    一个高级程序员模板开发平台

    发表评论