基于MTI典籍翻译教学的双语平行语料库建设
——以自建《论语》汉英平行语料库为例
来源:
摘 要:在MTI典籍翻译教学中,自建教学型国学典籍翻译双语平行语料库,便于教师在教学中便捷、直观地进行以句为单位的译文比较翻译教学,有利于学生对概念词、核心词、文化负载词等为单位的语块翻译的习得。本文以自建《论语》汉英双语平行语料库为例,详细探讨该库设计、预料选择、语料采集、语料对齐、语料标注等操作方案。本研究对同类文本语料库的创建具有可操作性、适用性和借鉴意义。
关键词:MTI典籍翻译教学;双语平行语料库;《论语》汉英平行语料库;
1. 引言
儒学经典的对外传播,推动了中西文化的交流。《论语》作为儒家的经典,是中国历史上最具权威的典籍文献之一。《论语》的英文翻译,最早见于传教士马希曼(Joshua Marshman)的节译本The Works of Confucius (1809) (王东波,2008:120)。 随后两百多年间,其英译本不断面世,而对于《论语》英译的研究也随着国学热在国际、国内的兴起以及“让中国文化走出去”的国家文化发展战略的提出,对其传播和研究倍受学界关注和重视。
双语平行语料库(Bilingual Parallel Corpus)是指能将源语言文本和其译语文本进行全文检索并对照显示的语料库,可用于译文比较、译者风格、翻译教学等多领域的研究。由于大型双语语料库受到版权限制等诸多因素的影响,不方便于广大教学工作者或教学研究者的利用,因此,借助计算机辅助翻译系统,自建所需的双语平行语料库就成了这类群体人员迫切的需求。在自建双语平行语料库的研究中,谢家成(2004:45-48)运用ParaConc对语料进行处理,但ParaConc软件仅支持段落对齐,使得翻译研究和翻译教学均有很大的局限性。王正和孙东云(2009:80-85)介绍了基于句级对齐的翻译记忆系统来自建双语平行语料库,推荐的软件是TRADOS WinAlign,但由于该系统为全英文系统,需要花费较长时间熟练软件,对于大多数使用者而言显得较为复杂。本文推荐北京东方雅信有限公司推出的雅信CAT全中文翻译记忆软件,达到句级对齐的同时,更能方便使用者迅速掌握软件功能和导出Excel等文本,其功能文章后面部分将详细阐述。
本文基于MTI典籍翻译教学而创建的《论语》汉英双语平行语料库,着重介绍自建《论语》汉英双语平行语料库的过程,具体探讨该库设计、语料选择、语料采集、语料对齐以及语料标注等操作的可行性方案,以期为典籍翻译教学及其研究提供一条新思路、新途径,为培养“把中国介绍给世界”(闫国华,2014:9)的翻译人才助一臂之力。
2. 《论语》汉英双语平行语料库的创建
2.1 语料库的设计
《论语》汉英双语平行语料库是参照廖志勤和姬岳江“基于教学型国学翻译汉英语料库构建的几点思考”(2011:44-47)一文中对于构建教学型国学翻译汉英语料库的建库参数和表征而设计的。作为教学型国学翻译汉英语料库初创部分,《论语》汉英平行语料库的设计目的主要是应用于MTI国学典籍翻译教学与研究,考察东西方对同一部经典的不同解读,在文本译介过程中存在的流变以及西方思维模式、意识形态、历史环境因素上存在的差异,探索流变根源。利用语料库检索和对照优势,在教学中对不同《论语》译本中以“概念词”、“核心词”和“文化负载词”等语块单位的译文和以句子为单位的译文进行比较、评析,例如,在教学中,利用出现频率比较高的概念词“仁”、“礼”、“ 义”、“ 德”、“信”、“君子”(在《论语》中分别出现过109、75、12、40、38和107次)等,通过检索就可直观地看到不同译者的不同译文;句子可按照孔子的“政治主张”、“伦理思想”、“教育原则”等分类进行检索、比较、评析。这就要求《论语》汉英平行语料库要达到句级对齐、概念词、核心词、文化负载词等检索快速、使用方便。由于是自建小型双语语料库,受到人力和技术方面的限制,语料库的规模相对较小。本库选取了一个《论语》中文版本和四个具有代表性的由中外译者分别翻译的《论语》英译版本作为语料,待使用一段时间后,根据使用情况及其学生反馈,再增加英译本和其他国学经典双语语料,丰富该库内容,扩大该库容量。
2.2 语料选择
《论语》古今注释书籍可谓汗牛充栋,举不胜举(杨伯峻,2009:导言32)。为了便于语料的统一,本语料库中文语料采用中华书局出版的杨伯峻的《论语译注》,除去该书因得到中外较高的评价和认可这一因素外,还因该书附有论语辞典,便于概念词的研究。全书共有20篇,共512章,语料只采集古文部分,导言、注释等不予采集。
据目前掌握的资料,《论语》英译本从1809年马歇曼译本肇始至2010年林茂荪译本面世,已接近60个。按照译者身份,我们将《论语》英译本分为四大类:海外传教士译本,海外汉学家译本,海外华人汉学家译本和国内学者译本。第一类海外传教士译本,其中于1861年初在香港出版的理雅各版(James Legge),学者王辉评论其译本道“行世一百多年来,一直被奉为标准译本,成为后起译者无法回避的高峰。”(2004:140)第二类海外汉学家译本中,韦利(Arthur Waley)译本于1938年问世,1998年外语教学与研究出版社发行了大陆版本。韦利的《论语》译文比较有现代气息,通畅易懂,产生了较大的影响力,波及普通读者群(程刚,2002:23) 。第三类是海外华人汉学家的译本,他们拥有深厚的汉学底蕴并深受国外文化熏陶,既有驾驭双语的能力,又有熟谙双文化的能力,译本之中不乏精品,其中刘殿爵(D.C.Lau) 所译的《论语》于1979年出版。刘殿爵的译作在海内外大获成功,其原因除了英语造诣高、语言精确明晰之外,还有一个重要的因素,那就是他对中国典籍的了解,根植于深厚的学养(杨平,2010:29) 。第四类,国内学者译本中林茂荪先生译本于2010年出版。王宏印教授认为:“林译价值较高,体现了各个方面的学术研究和艺术效果。”(2011:10)
基于上述缘由,本库英文语料选定为理雅各版(孔祥林,James Legge:2006)、韦利版(孔子,Arthur Waley:1998)、刘殿爵版(D.C.Lau:1979)和林戊荪版(林戊荪:2010)。这四个译本具有一定代表性,英译初版出现在不同时期,后经不同出版社出版,译者身份不一,翻译动机以及文化背景各异。我们认为四个译本属于《论语》英译版本中的经典译本之列,在择词用句、风格、修辞等方面都展现出不尽相同的特点,值得学习和比较研究。
2.3语料采集
确定了《论语》汉英平行语料库的中英文文本后,便开始语料的采集录入工作。中文语料杨伯峻《论语译注》简体版本可从网上下载,整理成Word文档格式后,去掉导言、注释等部分,只留下正文,按篇章依次排列,以方便下一步语料的对齐。英文语料中,理雅各译本可从网上下载PDF格式,其他译本没能直接下载。笔者对于林戊荪译本采取手工录入的方式,花费了不少时日,虽文本质量有保证,但并不可取。对于韦利译本和刘殿爵译本采用先将文本扫描成PDF版本,再使用汉王OCR软件将文本转化为Word文档(汉王OCR软件可免费下载:http://dl.pconline.com.cn/download/54490-1.html),这样的方法大大缩短了文本录入时间,且准确率高,但仍需逐一核对后保存文档。
图表一为汉王OCR软件的页面图,点击“文件”选择“打开图像”,将扫描好的PDF文件打开,页面中有两个窗口,上面一个是识辨结果区,下面一个是识辨图像区,PDF文件打开后会在下面一个窗口出现并自动分析版面;或者使用工具栏,按照工具栏一行的图标指示进行操作,点击“开始识辨”图标后,识别结果将在识辨结果区出现,操作者可选择复制粘贴里面的内容,然后到Word文档进行调整,或者直接选择“输出”到指定格式的文件后进行修改。如果识辨结果不理想或有遗漏识辨,可选择“取消版面分析结果”,自行分析后识辨,这样会按照操作者的意愿进行识辨,准确率高。
图一:汉王OCR软件页面
2.4 语料对齐
语料对齐是指原文与译文之间建立起相对应的关系,包括篇章对齐、段落对齐、句对齐和词对齐。篇章对齐和段落对齐都是粗略的对齐方式,研究意义不大。然而词对齐虽研究作用最大,但受到中英文语序和用词的差异,很难实现真正或完全意义上的对齐。所以双语平行语料库一般采用句对齐的对齐方式,既能使得对齐具有研究意义,又能保持中英文对齐的一致性。
本库选择的对齐软件是雅信CATv4.0,其测试版可在北京东方雅信有限公司官网(http://www.yxcat.com/Html/suport_rjxz.asp)进行下载。该公司还出品机辅笔译教学等翻译系统,国内一些大学,如北京外国语大学、香港中文大学,西南科技大学等大学均在翻译教学中应用该系统。作为国内计算机辅助翻译系统,雅信CATv4.0(Computer Aided Translation, CAT)主要采用翻译记忆(Translation Memory, TM)和灵活的人机交互方式处理翻译文本,其优秀的记忆机制可以做到一次翻译,永久受益;并与MS-Word, MS-Excel, MS-Powerpoint连接,做到翻译文本和原文本格式一致,还可以双语保存;除了自带的近百个专业库外,还可以根据所需,自建语料库,参见文后图二所示的雅信CATv4.0主页面。
本库创建主要使用主页面中“工具”里面的“YXCAM”快速建库功能。参见文后图三所示的快速建库页面。操作者将整理好的中文语料和英文语料分别存放在两个不同的Word版本中,由于《论语》中文语料为杨伯峻版本,英文语料中的理雅各版、韦利版翻译中因参考中文版本的不同,所以章节有差异,但总的内容一致,所以需要调整统一于杨伯峻版本的章节。选择“文件”里面的“新建”,按照弹出的对话框填写相关内容后,点击“确定”,中英文语料就会出现在页面中间的两个窗口中,分别为原文区和译文区。原文和译文之间的对齐以及调整可根据页面中间操作区的指示来完成,选择所要操作的句子,按照指示即可完成句子的对齐。对齐结果在页面下面的对齐例句区出现,未导入语料库前若需要修改,还可以“撤销句子对齐”,也就是将对齐添加好的句子复原后进行调整,对齐过程中可在句尾标注作者姓名,方便检索,对比不同译者的译文。上文中提到本库使用的是句子对齐,但在实际操作过程中,由于原文句子多采用问答式,对于问答句子简短的,可合在一句,保留原文的意义完整,不一定按照自然句断句,如表一所示:
表一
2.6 孟武伯问孝。子曰:“父母唯其疾之忧。” |
2.6 Mang Wu asked what filial piety was. The Master said, 'Parents are anxious lest their children should be sick.' ?(理雅各) |
2.13子贡问君子。子曰:“先行其言而后从之。” |
2.13 Tsze-kung asked what constituted the superior man. The Master said, 'He acts before he speaks, and afterwards speaks according to his actions.' ?(理雅各) |
2.6 孟武伯问孝。子曰:“父母唯其疾之忧。” 2.6 Mang Wu asked what filial piety was. The Master said, 'Parents are anxious lest their children should be sick.' (理雅各)
2.13子贡问君子。子曰:“先行其言而后从之。” 2.13 Tsze-kung asked what constituted the superior man. The Master said, 'He acts before he speaks, and afterwards speaks according to his actions.' (理雅各)
同时,在一个话语中有两句或两句以上的回答,若句子字数不长(在30字以内),也可考虑不拆分句子,保留语义流畅完整,如表二所示:
表二
2.9子曰:“吾与回言终日,不违,如愚。退而省其私,亦足以发,回也不愚。” |
2.9 The Master said, “Hui never disagrees with me even when we spend the whole day talking to each other. It would seem as though he were slow-witted. But later I found that when he is on his own, he is quite creative. Hui is actually not slow-witted at all.”(林戊荪) |
2.17子曰:“由!诲汝知之乎!知之为知之,不知为不知,是知也。” |
2.17 The Master said, “Zilu, shall I tell you what true knowledge is? Say you know when you know, and say you don’t know when you don’t”, that is true knowledge. (林戊荪) |
2.9子曰:“吾与回言终日,不违,如愚。退而省其私,亦足以发,回也不愚。” 2.9 The Master said, “Hui never disagrees with me even when we spend the whole day talking to each other. It would seem as though he were slow-witted. But later I found that when he is on his own, he is quite creative. Hui is actually not slow-witted at all.”(林戊荪)
2.17子曰:“由!诲汝知之乎!知之为知之,不知为不知,是知也。” 2.17 The Master said, “Zilu, shall I tell you what true knowledge is? Say you know when you know, and say you don’t know when you don’t”, that is true knowledge. (林戊荪)
由上,我们在实际操作过程中有时为了确保语义完整、问答对应等因素,会将句子合并,同时需要将四个版本对齐句子切分,使其一致,利于教学及其研究。
中英文本添加过程中可以导入语料库,也可以添加完成后,再完成此操作。点击“文件”,选择里面的“导入到记忆库”,然后根据需要“导入新的记忆库”或“导入到现有记忆库”。建库完成后,可在雅信CAT主页面的“库维护”中点击“库维护”对已建立的语料库进行管理,同时可以“导出”所建立的语料库资料,导出的文本格式可以为Excel和纯文本TXT等文档。
2.5 语料标注
语料的标注是指对语料库的预料样本属性或语言学特征进行描述,分为片头信息和片体信息标注。后者包括段落标注、词句标注、词性标注、语法标注和语义标注等。胡开宝和邹颂兵(2009:64-71)在莎士比亚戏剧英汉平行语料库的创建中采用ICT CLA S3.0和CLAWS等软件对中英文语料进行词性标注处理,段落标注则使用EmEeditor软件。刘泽权等人(2008:329-339)在《红楼梦》中英文平行语料库的创建中使用MMAX(Multi-modal Annotation in XML)标注程序对文本进行句子层面的赋码,并详细罗列了标注项、其指代意义以及每个标注项下设的具体类别。王正和孙东云(2009:80-85)建议使用GoTagger对英语语料进行词性标注,使用海量智能中文分词系统对中文进行词性标注。《论语》双语平行语料库的更高层次的标注可充分利用上述软件,目前的标注主要包括篇名、章数、作者等基本信息。
2.6 语料检索
语料检索中雅信CAT能做到句级检索。在图二的雅信CAT主页面,除了上面的工具栏外,从上到下分别是原文区、译文区、参考例句区以及MS-Word窗体。点击“设置”,选择“系统设定”,点击“本地库”,在本地库分类中选择“记忆库”,点击“添加”,将新建好的语料库加入记忆库中。操作完成后,在主页面的翻译过程中,只要出现和记忆库中相同的句子,都会在参考例句区出现。对于词一级的检索,可以使用Excel的“查找”功能,做到一般的检索。然而当检索词量大,需要大量统计数据时,需要选择专门的语料检索软件,常用的有ParaConc和WordSmith等国外软件。本文推荐由国内程南昌博士开发的CUC_ParaConc (中国传媒大学平行语料检索)软件,该软件可以在国家语言资源检测与研究中心有声媒体语言分中心 (http://ling.cuc.edu.cn/chs/News_View.asp?NewsID=195) 免费下载。该软件主要用于检索双语、多语平行语料,支持多种语言的平行语料检索,包括汉语、英语、法语、俄语、韩语、日语等。《论语》双语平行语料库建设中词一级的检索正是采用此软件完成的。
前文提到所建立的语料库除了可以导出Excel文本外,还可以导出纯文本TXT格式,以满足CUC-ParaConc软件的要求。纯文本的语料形式可以是双语语料保存在一个文本中交错分布,也可以是按照语种不同,分别保存在两个文本中整体分布。参见文后图四所示的CUC-ParaConc软件的主页面,建库者可根据自身需要选择一对一平行语料检索和一对多平行语料检索。本文将介绍一对一平行语料检索,而一对多平行语料检索与此相似。点击“一对一平行语料检索”,首先选择“语料及设置检索参数”,点击“源文本目录”选择语料,此语料为整理好的纯文本语料,笔者整理的是林戊荪译《论语》版,中英交错在一个文本中。选择好文本后,根据建库自身的情况选择加载语料的方式和检索结果的设置。语料调入和设置参数完成后,点击“检索中英对齐语料”,如文后图五所示,可以在“中文关键词”和“英文关键词”处输入建库者所期望检索的关键词,点击“检索”,检索结果将在“检索结果区”一一呈现。图五中,笔者尝试检索了《论语》“概念词”中的“孝”,检索结果如图五所示。检索的关键词既可以单独检索中文和英文关键词,也可以同时检索。而一对多平行语料检索中,CUC-ParaConc最多支持八个译本同时检索。该软件满足了《论语》双语平行语料库的建库目的,达到建库要求,将不同译本的关键词能做到检索和对比,有利于该语料库的不同教学需要。
3. 结语
国学典籍已融入中华民族的血脉,成为国人的基因。中国传统文化的经典著作代表了我中华民族的“文明自信”,文化经典不仅要传承,而且更要使其发扬光大;若要有效地发扬光大、必向世界传播我中华之文明,能起传播媒介的非翻译这个“利器”不可,然要执行翻译之任务者离不开懂我中华文明的译者,典籍翻译者的培养更离不开作为教学“母鸡”基地的课堂教学。本文正是基于为提高国学典籍翻译课堂教学质量、培养国学典籍翻译人才而创建并完成了《论语》汉英平行语料库,仅仅围绕该库设计、语料选择、语料采集、语料对齐、语料标注和语料检索等几个层面进行了较为详细的阐述。本库的创建有助于优化国学典籍翻译资源,辅助翻译教学,使翻译教学手段呈现出多元化,为教学型国学典籍翻译汉英语料库的进一步拓建积累了宝贵的初步经验,以期更多有识之士加入到国学典籍汉英双语语料库的建设队伍中,为培养新一代国学典籍翻译人尽绵薄之力。
图二:雅信CATv4.0主页面
图三:雅信CATv4.0快速建库平台
图四:CUC-ParaConc 软件主界面:
图五:检索中英对齐语料
*基金项目:本文为教育部人文社会科学研究规划基金项目(10YJA740057)、四川外国语言文学中心重点项目(SCWY11-01)、四川外国语言文学中心一般项目(SCWY12-20)与西南科技大学社科基金翻译理论与实践研究团队项目(13sxt020)阶段性成果。
参考文献:
[1] D.C. Lau. Confucius The Analects [M]. Prnguin Books, 1979.
[2] 程钢.理雅各与韦利《论语》译文体现的义理系统的比较分析[J].孔子研究,2002(2):17-28.
[3] 胡开宝,邹颂兵.莎士比亚戏剧英汉平行语料库的创建与应用[J].外语研究,2009(5):64-71.
[4] 孔祥林(今译),James Legge.论语,The Analects of
Confucius[M].北京:外文出版社, 2006.
[5] 孔子,Arthur Waley.论语,The Analects[M].北京:外语教学与研究出版社,1998.
[6] 廖志勤,姬岳江.基于教学型国学翻译汉英语料库构建的几点思考[J].上海翻译2011(4):44-47.
[7] 林戊荪.论语新译(Getting to Know Confucius—A New Translation of The Analects) [M].北京:外文出版社,2010.
[8] 刘泽权 田璐 刘超朋.《红楼梦》中英文平行语料库的创建[J].当代语言学,2008(4):329-339.
[9] 王东波.《论语》英译的缘起与发展[J].孔子研究,2008(2):119-125.
[10] 王宏印.译品双壁,译事典范—林戊荪先生典籍英译探究侧记[J].中国翻译,2011(6):7-11.
[11] 王辉.理雅各、庞德《论语》译本比较[J].四川外语学院学报,2004(5):140-144.
[12] 王正 孙东云.利用翻译记忆系统自建双语平行语料库[J].外语研究,2009(5):80-85.
[13] 谢家成.小型英汉平行语料库的建立与运用[J].解放军外国语学院院报,2004(3):45-48.
[14] 闫国华.文化对外传播与非通用语种翻译人才培养[J]. 中国翻译,2014(5):9.
[15] 杨伯峻.论语译注[M].北京:中华书局,2009.
[16] 杨平.20世纪《论语》的英译与诠释[J].孔子研究, 2010(2):19-30.