《翻译与本地化技术原理》课程教学大纲

2021年2月修订

课程说明

本课程为北京语言大学高级翻译学院翻译专业(本地化方向)二年级必修课,开设时间为二年级下学期。本课程的先修课程为《初级编程》、《网站设计与开发》和《翻译与本地化实践》,学生已经完成Python、HTML、CSS、JavaScript和PHP的入门学习,已经对数据库的设计有了基本认识,能够根据需求自主设计关系型数据库,并使用PHP和HTML构造简单的具备增删改查功能的信息系统。

《翻译与本地化技术原理》旨在帮助学生了解翻译记忆、术语、质量检查、机器翻译等翻译与本地化核心技术原理,并基于此开发简易的在线计算机辅助翻译工具。

在学期结束前,学生将分组完成计算机辅助翻译工具的设计与开发。

学时学分

总课时为32课时,总学分为2学分。

考核方式

平时成绩(40%)+期末项目(60%)

课程大纲

模块一:翻译记忆技术

第一周:编辑距离和最短编辑距离

第二周:使用PHP实现最短编辑距离计算

第三周:实践:引入中文分词技术调整最短编辑距离计算算法

第四周:小组汇报:不同计算机辅助翻译工具相似度匹配结果对比

相关资料:

关于计算机辅助翻译技术起源的奇妙发现

全球化、国际化、本地化与翻译

简言翻译记忆的原理(一):写错单词最少要罚多少钱?

简言翻译记忆的原理(二):用动态规划算法求解最短编辑距离

简言翻译记忆的原理(三):自动计算两个字符串间的相似度

参考:

  1. https://www.dreamxu.com/books/dsa/dp/edit-distance.html

模块二:术语技术

(注:术语技术的大部分内容已经在《术语学》课程中讲解过,为保证本课程体系的连贯性,依然会在课程教学大纲中展示)

第一周:TF-IDF算法

第二周:使用PHP实现TF-IDF算法

模块三:断句

第一周:基于SRX的断句方法

第二周:引入TMXmall文档解析API进行断句

模块四:机器翻译

第一周:神经机器翻译原理

第二周:引入百度翻译和有道翻译

第三周:引入搜狗翻译和谷歌翻译

模块五:计算机辅助翻译工具雏形开发

第一周:基于jsGrid开发一个可编辑的表格

第二周:将机器翻译、翻译记忆、术语和文档解析融合到一个页面中

第三周:实践:开发简易界面实现基本的计算机辅助翻译功能

第四周:产品设计入门

模块六:计算机辅助翻译工具开发

第一周:各小组汇报计算机辅助翻译工具开发计划

第二周至学期结束:完成计算机辅助翻译工具开发,并不断优化功能,撰写开发报告