最新公告
  • 欢迎您光临欧资源网,本站秉承服务宗旨 履行“站长”责任,销售只是起点 服务永无止境!立即加入我们
  • 什么是翻译技术的原理?+翻译记忆+术语+机器翻译

    前言

    这几年我一直在思考很多与语言服务行业发展相关的问题,其中两个是:翻译技术的原理是什么?推动翻译技术发展的动力是什么?

    今天一时兴起,我想尝试回答这两个问题。

    首先,我想谈谈演绎和归纳,这是逻辑中的两个基本概念。虽然传统逻辑和现代逻辑中人们对演绎和归纳有不同的解释,但总的来说,我们认为归纳是从个体到一般,演绎是从一般到个体。

    就职:

    一款名为 Trados 的计算机辅助翻译工具的核心功能是:编辑器 + 翻译记忆库 + 术语 + 机器翻译。

    一款名为 memoQ 的计算机辅助翻译工具的核心功能是:编辑器 + 翻译记忆库 + 术语 + 机器翻译。

    一款名为 YiCAT 的计算机辅助翻译工具的核心功能是:编辑器 + 翻译记忆库 + 术语 + 机器翻译。

    因此翻译记忆理论及几款计算机辅助翻译软件评介,计算机辅助翻译工具的核心功能是:编辑器+翻译记忆库+术语+机器翻译。

    以上过程就是从个体到一般的归纳过程。

    扣除:

    翻译一篇文章时,译者需要参考双语词典、过去翻译的句子、机器翻译的翻译,需要在Word这样的文字处理界面中完成翻译。

    因此,我们可以在 Word 中嵌入双语词典、翻译记忆库和机器翻译。

    我们也可以自己开发一个Word,并在其中嵌入双语词典、翻译记忆库和机器翻译。

    我们还可以开发嵌入双语词典、翻译记忆库和机器翻译的网页。

    我们还可以开发嵌入双语词典、翻译记忆库和机器翻译的移动应用程序。

    我们甚至可以戴上VR眼镜,构建一个虚拟的翻译界面,左边是原文,右边是翻译,然后嵌入双语词典、翻译记忆库、机器翻译。

    上述过程是从一般到个体的演绎过程。

    文本

    一、翻译技术的原理是什么?

    我们以计算机辅助翻译工具为例来分析演绎和归纳的区别。基于以上例子,我们来思考一下这个困扰我很久的问题:编辑器+翻译记忆库+术语+机器翻译是翻译技术的基本原理吗?如果我们想帮助翻译人员做好翻译工作,我们至少应该了解编辑人员的基本操作,如何创建翻译记忆库,如何创建术语,如何引入机器翻译等,然后帮助我们改进翻译基于这些工具和资源的效率和质量?

    正是因为这样的想法,我才会追溯计算机辅助翻译工具的发展历史,想知道是谁最先开发了计算机辅助翻译工具。

    通过我对一些网上资料的收集整理,大致想出了一个翻译技术的抽象发展过程,但是这个过程目前经不起推敲,所以被认为是谎言,大家听了会很开心给它。:

    翻译是一项非常古老的工作。从事翻译工作的人没有想过使用任何现代技术来帮助他们提高效率和质量。

    然而,当政府产生大量的翻译需求,而计算机恰好是政府的高效工具时,如何将计算机应用于翻译成为人们自然会想到的问题,因此人们认为:既然翻译需要一个纸质词典,为什么不把词典放到电脑里,翻译的时候可以查电子词典呢?于是,计算机中的电子词典成为最早应用于翻译生产的翻译技术:翻译生产中查词典的行为变成了查电子词典的行为。人们之所以只想到字典,是因为当时计算机的存储空间极为有限。

    但是,当翻译的对象变成情报时,翻译行为就变成了军队的一部分。指挥官们不认同人工翻译的效率,所以希望用机器来完成自动翻译,所以机器翻译就成为翻译制作中第二个很重要的应用翻译技术。

    但是由于当时计算机软硬件技术的限制,不仅没有支持高速计算的硬件,也没有支持自动翻译的数字资源,也没有支持高质量自动翻译的算法。翻译,所以机器翻译没能真正发展起来。寂寞。人们对自动翻译的追求已经失败。经过对机器翻译技术的一些探索,人们认为使用电子词典比使用机器翻译要好。

    当战争放弃机器翻译时,机器翻译研发的副产品——双语翻译文本成为关注的对象,于是人们发现除了电子词典,电子双语文本也可以用于翻译生产。

    然而,当使用电子双语文本训练机器翻译引擎时,机器翻译要么完全翻译之前翻译的句子,要么根本不翻译,因此人们开始思考如何在翻译过程中充分找到电子双语。文本中有效的双语片段,于是翻译记忆技术开始出现:翻译生产中查找电子词典的行为逐渐变成了查找双语文本的行为。

    需要注意的是,此时人们并没有放弃机器翻译,而是从完全或完全不使用机器翻译转变为对机器翻译进行后期编辑。

    (对这段历史感兴趣的朋友可以看看这篇文章:译者工作站的由来)

    如何从翻译记忆库中找到有效的双语片段已经从翻译问题变成了数学问题。在数学家设计的最短编辑距离算法出现后,翻译记忆技术趋于成熟。

    然而,翻译记忆技术的出现并没有立即改变译者的工作行为,因为翻译工作本质上是文本工作。文字工作如果没有好的展示工具和输入工具,肯定做不出来,所以:电子词典+机器翻译+翻译记忆的翻译技术组合,也受到人机交互技术的约束。商用计算机和个人计算机的发展逐渐打破了这种束缚。个人电脑已经逐渐变得相对便宜和可用,但是操作系统已经跟不上个人电脑的发展。复杂的操作系统仍然限制着翻译技术的普及。限制了计算机辅助翻译工具的设计。

    但在图形界面操作系统出现后,也出现了更加直观友好的用户界面。当这种页面开始出现在廉价的个人电脑上时,计算机辅助翻译工具才真正在翻译行业流行起来,友好编辑最初是基于文字处理软件(如Word)开发的,逐渐成为可能在优秀操作系统的加持下自主设计开发。因此,各种基于Windows操作系统的计算机辅助翻译工具在世界范围内得到广泛应用。它在互联网上广泛传播,掀起了计算机辅助翻译工具的热潮。

    但是,中国改革开放没有及时开放,中国的计算机技术发展也没有与世界取得突破,所以中国的计算机辅助翻译工具市场一直被国外工具所占据。由于计算机辅助翻译工具的核心是文字处理,而文字处理必须以文件格式为基础,而文件格式标准受制于国外公司,所以中文计算机辅助翻译工具一直受文件格式标准的约束。

    网络技术的发展给计算机辅助翻译工具带来了新的希望:在一台计算机上完成的翻译工作可以多人同时完成,编辑器可以多人操作,电子词典可以由多人构建和协调。多人同时检索,翻译记忆库可以多人共同构建和检索,机器翻译可以通过互联网公开调用,不受本地计算资源的限制,因此计算机辅助翻译工具从独立使用变为基于服务器利用。

    互联网技术和移动通信技术的发展,使得访问一个网站比在本地安装一个软件更容易,因此本地计算机辅助翻译工具逐渐成为网页端计算机辅助翻译。

    随着大数据技术的发展,越来越多的待翻译数据不需要以特定的文件格式存储,而是可以直接存储在数据库中。因此,原本受文件格式标准限制而无法广泛使用的计算机辅助翻译工具也受到欢迎。春天来了,你可以摆脱传统文件格式的束缚,新的计算机辅助翻译工具出现。

    随着现代语言服务流程越来越规范,人们意识到不仅翻译过程可以借助工具,语言服务的各个过程也可以借助工具,因此翻译项目管理等不同类型的翻译技术工具应运而生。系统纷纷涌现,原本嵌入在计算机辅助翻译工具中的技术也相继成为独立的工具。专业术语工具、语料库、机器翻译引擎等工具不断出现在市场上。所有工具都以界面的形式相互链接,从而大大提高了计算机辅助工具的功能。

    今天我们需要重新定义:在翻译过程中,我们可以使用哪些计算机硬件和软件,我们有哪些数字资源,我们可以嵌入哪些算法?

    为什么我们需要重新定义这些问题?因为现代逻辑认为演绎推理是必然性推理。如果演绎推理的前提是正确的,那么结论一定是正确的,如果演绎推理的前提是错误的,那么结论也是错误的。特斯拉创始人马斯克倡导亚里士多德的第一原理,即:在对每个系统的探索中,都有一个第一原理,它是一个最基本的命题或假设,不能省略或删除,也不能违背。 .

    如本文开头的那句话——“译者在翻译一篇文章时需要参考双语词典、过去翻译的句子、机器翻译的翻译,需要在类似Word的文字处理界面中进行翻译。 ” – 本身就是错误的,那么我们怎样才能开发出真正可以帮助翻译人员的计算机辅助翻译工具呢?所以我们在思考翻译技术原理的时候,需要思考的是,我们定义的“编辑器+翻译记忆库+术语+机器翻译”是否是不可破译的翻译技术基本原理的组合。如果不是,那是什么?

    二、什么在推动翻译技术?

    此时,还有一个问题需要我们思考:是什么推动了翻译技术的发展?

    今天谈翻译技术,大家都在谈机器翻译,那为什么机器翻译发展了这么多年,人们还在谈计算机辅助翻译呢?为什么机器翻译最早出现在美国,而计算机辅助翻译工具却很少由美国公司开发?

    在这里,我想提一下我的另一个假设:机器翻译的发展源于战争,而计算机辅助翻译的发展源于国际交流。

    后面我会重点讲解:经过我的一番研究,发现电子词典工具的应用起源于欧盟,翻译记忆技术的应用起源于杨百翰大学,翻译技术的普及起源于科技公司。三者的共同点是,欧盟希望将一种语言的文本以多种语言的形式传递给其他欧洲国家。机器翻译效率高,但不准确,必须借助工具辅助人工翻译;杨百翰大学及相关人员希望摩门教的教义能够以多语种的形式传递到美国乃至世界其他地区,因此有必要研究如何准确高效地翻译摩门教信息;科技公司希望将他们的产品卖给世界各国越来越多的人,因此需要计算机辅助翻译工具来准确翻译产品手册和其他产品信息。

    观察史实会发现,最早提出电子词典可用于翻译过程的人来自欧盟前身欧洲煤钢共同体。类似于欧盟和联合国的组织都是计算机辅助翻译技术的拥护者。最早提出翻译记忆技术的Alan Melby教授是杨百翰大学的教授,同时也是一名摩门教徒(他的成长背景请看这篇文章:),因为摩门教徒需要学习多种语言,这也促使他们思考如何利用技术提高语言学习的有效性和翻译工作的效率。享誉全球的 BYU 语料库同样来自杨百翰大学。Trados的前身INK,当今世界上使用最广泛的计算机辅助翻译工具,是基于杨百翰大学摩门教文本机器翻译项目ALPS的产品开发的。他们开发了世界上第一台商用计算机。辅助翻译工具。(参见论文:机器翻译调查:其历史、当前状态和未来前景)。Trados 及其前身 INK 都是为翻译 IBM 的项目而开发的。包括 IBM、Apple 和 Microsoft 在内的互联网公司都是计算机辅助翻译工具的拥护者。微软后来成为 Trados 的股东。. 如今,这些互联网公司仍在开发新的翻译技术,尤其是机器翻译技术。是基于杨百翰大学摩门教文本机器翻译项目ALPS的产品开发的。他们开发了世界上第一台商用计算机。辅助翻译工具。(参见论文:机器翻译调查:其历史、当前状态和未来前景)。Trados 及其前身 INK 都是为翻译 IBM 的项目而开发的。包括 IBM、Apple 和 Microsoft 在内的互联网公司都是计算机辅助翻译工具的拥护者。微软后来成为 Trados 的股东。. 如今,这些互联网公司仍在开发新的翻译技术,尤其是机器翻译技术。是基于杨百翰大学摩门教文本机器翻译项目ALPS的产品开发的。他们开发了世界上第一台商用计算机。辅助翻译工具。(参见论文:机器翻译调查:其历史、当前状态和未来前景)。Trados 及其前身 INK 都是为翻译 IBM 的项目而开发的。包括 IBM、Apple 和 Microsoft 在内的互联网公司都是计算机辅助翻译工具的拥护者。微软后来成为 Trados 的股东。. 如今,这些互联网公司仍在开发新的翻译技术,尤其是机器翻译技术。(参见论文:机器翻译调查:其历史、当前状态和未来前景)。Trados 及其前身 INK 都是为翻译 IBM 的项目而开发的。包括 IBM、Apple 和 Microsoft 在内的互联网公司都是计算机辅助翻译工具的拥护者。微软后来成为 Trados 的股东。. 如今,这些互联网公司仍在开发新的翻译技术,尤其是机器翻译技术。(参见论文:机器翻译调查:其历史、当前状态和未来前景)。Trados 及其前身 INK 都是为翻译 IBM 的项目而开发的。包括 IBM、Apple 和 Microsoft 在内的互联网公司都是计算机辅助翻译工具的拥护者。微软后来成为 Trados 的股东。. 如今,这些互联网公司仍在开发新的翻译技术,尤其是机器翻译技术。

    无论是欧盟、杨百翰大学等国际组织还是科技公司,都发现机器翻译并不能完全胜任他们的国际交流工作,因此必须使用计算机辅助翻译工具,高质量的文本必须由人工翻译提供。所以我认为国际交流是计算机辅助翻译技术发展的驱动力。

    但是为什么今天著名的计算机辅助翻译工具不是由美国或中国公司开发的呢?我猜这是因为虽然中国是一个多民族国家,但我们的通用语是中文,所以政府并没有花太多的钱在翻译上促进内部交流,而在国际交流的过程中,中国政府和美国与此类似,政府仍然更相信自动翻译的价值,尤其是军事机器翻译的价值,而不是计算机辅助翻译工具的价值。中国公司也与美国公司非常相似。他们不仅发展机器翻译,也深刻认识到机器翻译在企业国际交流中的价值。因此,今天’

    总结

    前面我介绍了翻译技术的基本原理和内在驱动力。现在让我们“推演”一下,想想今天的中国需要什么样的翻译技术。

    必须承认,机器翻译极为重要,但计算机辅助翻译技术的发展在中国的国际交流中也发挥着重要作用。无论是我们的国语服务,还是个人的商务语言服务,都必须注意翻译。技术的发展,我们需要仔细思考前面提到的问题:在翻译过程中,我们可以使用哪些计算机软硬件,我们有哪些数字资源,我们可以嵌入哪些算法?只有回答了这三个问题,我们才能真正将翻译技术应用到国际交流过程中。

    对比我们今天对“翻译技术”的普遍理解,我认为除了工具和功能的介绍之外,如果你想在未来真正“解读”下一代计算机辅助翻译工具,并且想创造性地推动翻译技术的发展,要真正提高国际语言服务质量,应该深入原则翻译记忆理论及几款计算机辅助翻译软件评介,不能肤浅。

    站内大部分资源收集于网络,若侵犯了您的合法权益,请联系我们删除!
    欧资源网 » 什么是翻译技术的原理?+翻译记忆+术语+机器翻译

    常见问题FAQ

    免费下载或者VIP会员专享资源能否直接商用?
    本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
    提示下载完但解压或打开不了?
    最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。若排除这种情况,可在对应资源底部留言,或 联络我们.。
    找不到素材资源介绍文章里的示例图片?
    对于PPT,KEY,Mockups,APP,网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。
    欧资源网
    一个高级程序员模板开发平台

    发表评论