简言

其他

“简言语言服务”公益直播第二期:简言机器翻译应用

简言语言服务随着“语言服务”概念的不断成熟,人们发现语言服务行业覆盖面极广,潜力巨大。但即便如此,依然会有许多人不了解语言服务。为此简言微信公众号计划推出“简言语言服务”系列公益直播活动,依托北京语言大学国际语言服务研究院、国家语言服务出口基地、高级翻译学院邀请行业内有代表性的企业和专家对谈语言服务。欢迎大家关注!第二期:简言机器翻译应用机器翻译应用如果我问大家哪款机器翻译工具最好用,估计大家会有完全不同的答案,有人会说谷歌,有人会说有道,有人会说百度、有人会说腾讯,有人会说DeepL,等等。但如果我问Dallas,他可能会告诉大家一些不为人知的数据。Dallas
2022年11月26日
其他

“简言语言服务”公益直播第一期:简言翻译教育技术

简言语言服务随着“语言服务”概念的不断成熟,人们发现语言服务行业覆盖面极广,潜力巨大。但即便如此,依然会有许多人不了解语言服务。为此简言微信公众号计划推出“简言语言服务”系列公益直播活动,依托北京语言大学高级翻译学院、中外语言服务人才培养基地、国家级语言服务出口基地邀请行业内有代表性的企业和专家对谈语言服务。欢迎大家关注第一期活动:简言翻译教育技术第一期:简言翻译教育技术翻译教育技术过去很长一段时间,大家在谈及翻译技术时谈到更多的是计算机辅助翻译技术、机器翻译技术、自然语言处理技术,并且是围绕翻译实践环节展开的。所以“翻译教育技术”是一个被许多人忽略但本身极为重要的翻译技术领域。在北京语言大学,我们一直在探索将传统的信息技术和新兴的语言技术与口笔译教学环节相结合,思考如何通过技术手段来改善口笔译教学的效果,并推动建设更智能的翻译技术实验室。学生和教师如果在口笔译教学阶段就能体会到技术带来的便利,未来在语言服务实践中也会自然而然推动新技术在传统业务中的应用。目前国内有许多家企业在推动翻译教育技术的研发,比如北京的试译宝、上海的一者科技和上海文化贸易语言服务基地等,形成了鲜明的中国翻译教育技术研发特色。上海文化贸易语言服务基地和北京语言大学均为首批国家级语言服务出口基地,在翻译技术、翻译教育技术等领域也有诸多合作,所以在第一期简言语言服务直播活动中,我们邀请了基地管理层、运营端和技术端的三位专家,共同探讨翻译教学平台的发展方向以及新技术在口笔译教学中的具体应用。“参与方式第一期简言语言服务直播将于2022年9月26日(周一)19:00
2022年9月18日
其他

如何基于SRX将英文文本切分成句(一)

在之前的帖子中我们介绍过读懂翻译记忆库文件(TMX)所需的XML和DTD基础知识和使用Tmxmall的文档解析API来进行多种类型文档的断句,以及如何基于TMX来制作翻译记忆库(如何制作一个简易的大会报告双语检索工具)。同样是基于XML技术的SRX却一直没有介绍过,其全称是“Segmentation
2021年4月27日
其他

为什么我们会误解机器翻译?

很多人问我对最近某豆瓣热门事件怎么看,外校的老师也在问,本校的同学也在问。我觉得此事因“机器翻译”而起,但并没有真正涉及“机器翻译”本身。许多与本次事件相关的讨论已经脱离了翻译本身。所以我对此事的定性是:此事因各方对机器翻译的误解而起,兴于网民对学术权力滥用和行政决策不公的挞伐,终将引发我们对文学翻译、翻译教育、翻译研究和机器翻译关系的再思考。如果我们把原评论改成:“错译痕迹严重,糟蹋了Benedett的作品。还是老话,没有金刚钻别揽瓷器活””而非“机翻痕迹严重,糟蹋了Benedett的作品。还是老话,没有金刚钻别揽瓷器活”是否还会有今天大家看到的争议吗?如果学生没有道歉,如果没有公开出来的学生教师聊天记录,后续会引发这样的争议吗?我想是不会的。但整件事情反映出的人文社科圈子对机器翻译的无知却那么的令人咋舌。我姑且问几个问题:·
2021年4月6日
其他

译者的第一个博客

本文转载于我刚刚创建的一个静态博客:CodeSlator.blog正文:我希望通过这篇帖子鼓励更多翻译专业的同学、职业译者、翻译爱好者建立自己的第一个博客。当你看完这篇帖子时,希望你能够立即着手创建自己的第一个博客。我们开始吧!一、译者为何要创建博客我给大家说说为什么我想创建博客:我希望拥有自己的专属域名我希望创建自己的职业品牌我希望发布自己的特色文章这些年来我一直鼓动我的学生开通微信公众号,从大学时代就养成写作的习惯,但是他们遇到了许多问题:微博不适合文章写作微信公众平台限制写作灵感个人博客搭建难度大个人博客维护成本高第三方博客随时会倒闭基于以上原因,借着推广译者编程项目的势头,我给大家提供一种可以解决以上问题方法:创建自己的Github
2021年1月8日
其他

读懂翻译记忆库文件(TMX)所需的XML和DTD基础知识

在我的翻译与本地化实践(一)课程中,我一般都会在翻译专业(本地化方向)学生二年级的时候介绍什么是XML,因为只有理解了XML才能把翻译行业的众多基于XML的数据交换标准搞清楚,比如存储翻译记忆的TMX[1]、存储术语库的TBX、存储断句规则的SRX等等[2]。现在越来越多的老师开始关注技术写作,其中涉及的DITA也是一种基于XML的文档写作解决方案,懂了XML也有利于玩儿转DITA和技术写作。我在之前的文章中介绍过如何从TMX文件中读取双语数据来制作在线翻译记忆搜索工具:如何制作一个简易的大会报告双语检索工具,从中可以看出理解XML的作用。另外,虽然现在主流的数据格式是json,一种更加简单轻便的数据存储格式,但在翻译行业常用的各类计算机辅助翻译工具中,XML的应用还是非常广的,所以对于翻译技术感兴趣的同学和老师还是有必要深入学习XML的。基于这几年上课的内容,这次疫情防控期间我录制了一些视频给学生观看,我也放到这里来分享给大家。在这篇文章中我一共分享两个视频,一个是:什么是XML;一个是什么是DTD。都是相对来说比较基础的内容,总共时长为1小时。简单来说,XML中包含的是要传输的数据,DTD定义了要传输的数据以怎样的结构存在于XML中。下面,就请大家观看这两个视频吧:01
2020年3月9日
其他

使用Tmxmall的文档解析API来进行多种类型文档的断句

背景这个学期我在教学生怎么开发一个简易的CAT工具(往期成果参见:计算机辅助翻译工具开发竞赛作品展示:小译通),在开发过程中同学们遇到了一个文档解析的难题,即如何能把不同类型的文本都导入到CAT工具并自动完成分句。这个功能非常不容易开发,但好在一者科技(Tmxmall)的张井、陈件已经把这个功能开发好,并做成API(应用程序接口)了,我们直接调用即可。在这篇文章中我将简要介绍如何去调用他们的文档解析API。正文第一步:了解调用API的简单方法Tmxmall的文档解析API地址是:https://www.tmxmall.com/docs/openapi-fileparser/在这个地址中可以看到这样的说明:从中可知,文档解析API的作用是:“文档解析API提供了极其简单的编程接口,可以快速解析指定格式的文件,返回从文件中提取的文本和样式数据对象。”我填写了上面的申请表,并很快拿到了所需的信息。接下来就是去看他们提供的在线文档:第一次看到这些信息的人会觉得不知所措,但实际上这部分写得非常简洁明了,我给大家解释一下:知识点一:接口完整路径其实这里的“接口完整路径”就是一个网址,但是这个网址你不能直接在浏览器访问,如果访问的话会出现下面的错误提示:可见这不是一个我们常用的网址。知识点二:请求方式:POST我们在浏览器中直接输入这个网址并按回车键时,我们就是在“请求”(Request)这个网址。对于程序员来说,要通过写代码的方式来请求,而不是打开浏览器的方式,这时要用“POST”的方式来请求。简单来说,“POST”就是“寄信”的意思,比如邮局叫“Post
2019年11月22日
其他

面向文科生的正则表达式基础视频教程

背景《Word里面的通配符:基础知识》发布之后反响很好,帖子下方有很多人都在问有没有正则表达式的基础教程。正则表达式可以用来帮助我们去快速找到文本中特定模式的字符串,是极为高效的文本处理工具。本来这学期我就准备录制教程的,大家的留言激励我赶快录出来。因为我之前只是在我的微信公众号中写过一些跟正则表达式相关的例子,包括:小议网站本地化中的正则表达式之所以写这个例子是因为,像SDL
2019年9月22日
其他

Word里面的通配符:基础知识

通配符是一种可以在Word里提高文本处理效率的法宝。今天这篇帖子将会详细讲讲“通配符”的基础知识。我们先来看这样一个问题:请在Word中将下面这段文字的所有英文删掉。要想解决这个问题的话,就要用到“通配符”,因为我们要用一段“通用”的代码来“匹配”相应的“字符”。不过“通配符”的全称并非前面这半句,它是英文“Wildcard”一词的缩写。“Wildcard”是我最喜欢的英文单词之一,因为它的意思很有趣。在计算机领域,我们将其翻译成“通配符”;在体育领域,它的译名是“外卡”;在英语口语中,它有“不可预知的人或事”的意思;在棋牌游戏中,它又叫“万能牌”,比如在著名的“UNO”游戏中,就有一类牌叫“Wildcard”,牌友们还会戏称其为“野牌”。我没有查到“Wildcard”最初是怎么引入到计算机领域的,但如今在这个圈子里基本上已经路人皆知了。每当谈起“通配符”,人们首先想到的是这么几个符号:“*”、“?”、“[]”、“{}”、“@”、“\”、“()”、“”、“!”等等。接下来我将逐个介绍每一个符号的作用,希望这部分的介绍能够让大家充分的了解这些符号的叫法和用法。1、*在中文中我们称这个符号为“星号”,在英文中可称为:asterisk或star。我们平时在印刷品中看到这个符号时,常用这个符号来表示注释,或者是省略的内容。我去查了一下词源,“aster”可看作是“a
2019年9月20日
其他

ParaTrans 2.0:百度、有道、搜狗、谷歌四款机器翻译服务大PK!

关注简言的朋友是否还记得“神奇的机器翻译服务大PK平台上线”这篇文章?如果你还记得那你肯定是老粉丝了!在这篇2017年中旬的帖子中我介绍了自己做的小工具“ParaTrans”:自从这个平台上线后,不少朋友告诉我这是个好东西,并且非常期待有更多功能的“付费版”。昨天我跟我导师讨论论文的时候,她问我何时把搜狗的也更新上来,我正好趁着这个机会把原本打算做的“付费版”给做出来。今天用了大半天的时间,终于完成了ParaTrans
2019年1月17日
其他

计算机辅助翻译工具开发竞赛作品展示:小译通

版权:归北京语言大学季薇璐、叶力豪、何杨林三位同学很开心我们三巨头小组可以凭借“小译通”成为这次计算机辅助翻译工具开发竞赛的冠军组(鼓掌欢呼)。感谢韩老师的倾情赞助👍,让我们可以快快乐乐过双十一。接下来是“小译通”的详细介绍⬇️01工具理念我们在项目初始就为“小译通”想了一个听起来霸气的slogan:“人人都是好翻译”。这个标语很好地体现了我们的理念:
2018年11月10日
其他

人工智能时代传统翻译教育的危机

开设翻译专业本科和翻译专业硕士的学校是不会担心招不到学生的,因为本科文凭和硕士帽子是人人都要拿的,但语言水平特别优秀的高中生和语言底子打得不错的考研学生应该是不会考虑读翻译专业了。
2018年3月17日
其他

如何制作一个简易的大会报告双语检索工具

自从大会报告双语版本发布以来,各大平台都在热转,尤其是翻译圈的各种微信公众号。然而,一个有价值的双语版报告不是那种以段段对照的形式发布成文章的,而是一个可以在网上实时检索的,比如这样:在这篇帖子中,我将展示如何制作这个简易的双语报告检索工具,感兴趣的也可以自己尝试一下。第一步:获取双语报告的TMX格式文件在我所研究的“计算机辅助翻译”领域,双语的句子大多是以“.tmx”格式的文件存储的,这种叫作“翻译记忆”(Translation
2017年10月22日
自由知乎 自由微博
其他

巧用正则表达式整理双语术语数据

”吗?其实不是,如果仔细观察会发现,加号前面是个空格。也就是说这段代码寻找的是各种标点符号后面有空格的情况。示例如下:那么后面的“$1”指代的是哪段代码呢?是“/([。,!?〔〕()《》“”])
2017年7月13日
其他

神奇的机器翻译服务大PK平台上线

上个月底我写了一篇文章,名为《如何设计并开发一个对比百度翻译和有道翻译结果的小网页》。我把小网页开发的整个过程都写了下来,还给出了这个网页的源代码。我给这个小网页取了一个震耳欲聋的中文名字:神奇的机器翻译服务大PK平台。还取了一个秀气的英文名字:ParaTrans。为了能让更多读者亲自感受神奇的机器翻译服务大PK平台,我今天又干了几件事儿:花了280元租了一台一年使用期的服务器;花了70元买了一个非常霸气的网站域名;花了30分钟把这个霸气的网站域名和我租的服务器绑定到了一起;花了3分钟把神奇的机器翻译服务大PK平台迁移到了服务器上;做了一个假的付费版神奇的机器翻译服务大PK平台钓鱼入口。最后的页面在电脑上看是这样的:在手机上看是这样的:那么怎么样才能访问那个非常霸气的网站域名来体验神奇的机器翻译服务大PK平台呢?请在浏览器里访问:http://translation.education或者点击“阅读原文”。对于那些持币待购的用户,请不要着急,目前的免费版仅用于体验,付费版用于提升个人成就感。免费版主要功能是查看待译中文的有道和百度机器翻译结果,并比较两个结果之间的相似度。暑假里还将(根据我的心情)上线更多付费功能。(这个域名是不是很霸气,哈哈哈哈哈哈..........)如果对该产品有任何反馈,请不吝打赏。
2017年7月9日
其他

如何设计并开发一个对比百度翻译和有道翻译结果的小网页

前言:前几日写了一个帖子,《被机器翻译替代不可怕,可怕的是被替代后还不会用技术》,阅读量将近900。这是我的微信公众平台首次开通“赞赏”功能,帖子发出后,总共收到了36.88元的读者打赏。我很兴奋,于是决定将这笔钱全部捐给我们家小猫咪Catti的“零食基金”。这篇帖子发出后,也收到一些回应,比如:“你倒是说说,怎么用技术?”、“能展示一下使用技术的具体办法吗?”正好我这学期给学生上一点跟编程相关的皮毛课,所以我准备简单展示一下“使用高深技术的简单方法”。一、设想现在国内有几家技术杠杠的公司都推出了他们的机器翻译服务,比如百度翻译、有道翻译、搜狗翻译等等。我们一般使用这些机器翻译服务的方法都是这样的:前往某个机器翻译服务的网站主页,粘贴或者输入要翻译的内容,然后看看机器翻译的结果。查完一个如果觉得不爽,再去使用另一个机器翻译服务。那么,有没有另外一种可能:我在一个页面中输入一次要翻译的内容,点击“翻译”按钮,出来多个机器翻译服务给出的译文。二、实现为了实现上面这个设想,我决定做个小小的网页程序。第一步:做一个网页一提起做网页,有些读者可能觉得,这哪是说做就做啊,是不是得学编程,是不是要学数学,我可不行,我高中数学可不好了。没事,我们可以找一个捷径:http://www.layoutit.com/通过这个网站,我们可以不写代码就可以做出一个像模像样的网页,如下图:点击“START
2017年6月29日
其他

小议网站本地化中的正则表达式

一、背景:这学期的《翻译与本地化实践》课给学生布置了一个期末项目,是很早之前一次计算机辅助翻译大赛的赛题,也是北京大学计算机辅助翻译专业的一次本地化课程期末小组作业。项目内容就是将一个网站本地化成中文,其中有一个文件长这个样子:啊,好像看不出来这个文件长什么样。其实是下面这个样子:这是一个格式为“PHP”的文件,里面存储的是网站上一些文本内容,也就是我们在做网站本地化时要翻译的文本。(小注:PHP
2017年6月21日
其他

论“翻译教育技术”

关注我的课程公众平台,及时了解课程的最新信息,学业问题、生活问题等均可在此与我交流。
2016年9月10日