他们在尝试用人工智能生成中国古代文献的英译

「無巧工、不巧工,皆以此五者為法。」翻译为「All artisans, whether skilled or unskilled, employ these five standards.」,这样的翻译的相当之不错,具备信达雅的程度和美感了。这是中国哲学书电子化计划的一项很有意义的尝试,目前至少初步完成了包含 21 史的内容(史记、汉书、后汉书、三国志、晋书、宋书、南齐书、梁书、陈书、魏书、北齐书、周书、南史、北史、隋书、旧唐书、新唐书、旧五代史、新五代史、宋史、辽史)。

就在 3 月 1 日,我收到了中国哲学书电子化计划发来的一封邮件,内容如下:

尊敬的mengxu:

感謝您對中國哲學書電子化計劃的支持。現在很高興與您分享網站的最新消息:

使用人工智能生成的中國古代文獻英譯文 (https://ctext.org/instructions/translation/zh )已新增至ctext.org。
此次新增內容包括先前尚無譯文的先秦兩漢文獻全集、二十五史,以及數百種其他歷史、文學、哲學與詩歌作品等。其他文獻的譯文亦將陸續補充。

由人工智能生成的譯文難免包含錯誤;所有譯文均與原文逐句對齊,以便於辨識與修正錯誤。使用者可透過詞典功能進行修訂,該功能提供逐句對齊顯示,並支持直接編輯。

此外,現亦支持以中文與英文撰寫、可編輯的歷史實體摘要 (https://ctext.org/instructions/textwiki/zh )(如人物、著作、官職等),
以補充數據維基 (https://ctext.org/datawiki.pl?if=gb )中既有的結構化資料。目前已收錄超過十萬條摘要,未來將持續增加。

若您在閱讀文本時不希望顯示英文譯文,只需在頁面頂部的「翻譯顯示」中點選「不顯示」即可。

此通知也可以在網站上閱讀:https://ctext.org/discuss.pl?if=gb&thread=129

感謝您的支持,
中國哲學書電子化計劃系統敬上

这次使用中国哲学书电子化计划使用人工智能生成的中国古代文献英译文,是一次不错的尝试。现代汉语与古代汉语差异极大,就算是现代文,采用人工智能生成英译文都会存在语不达意。现在是中国古代文献的英译文采用人工智能完成,能发布包含了 21 史的内容,一定程序上说明使用人工智能生成的中国古代文献英译文,经过了学者的初步审核,达到了翻译的精度要求。很多时候,就是学现代文的人看古文,都会对文义产生模棱两可的解读。

我以前文言文较差,或许是看的古籍越来越多,后来不知不觉的可以直接阅读了,甚至能看出权威出版社经典书籍中的翻译错误,有一段时间我自己对自己的古文理解能力产生了怀疑。我个人的阅读体验,除先秦古籍中,最难懂的是尚书,我连翻译都读的不顺,可能是译者本人也没有领悟具体的含义。有时候甚至多处对原文的理解与译文刚好相反,也不知道我理解的对还是译者理解的对。我喜欢古籍,是因为古籍中存着大量的智慧,古籍看多了,天下无新鲜事,是真的无新鲜事了。

中国哲学书电子化计划或许是一个小众网站,但内容做的很好,我很喜欢在上面看古籍。站点上的古籍虽然包含各个朝代,但主要集中在先秦两汉时期的儒家、墨家、道家、法家、名家、兵家、算书、杂家、史书、经典文献、字书、医学等。最让我感到兴奋的是,这个站的古籍原文与目前大陆市面上发行的版本存在诸多不同,特别我是常看的道家、医学、法家、兵家经典,有时是字的不同,有时是段落的不同,有时是意的不同。我内心是更愿意相信中国哲学书电子化计划上的古籍的。

我不知道这个站的贡献者具体是谁,但应该是一个群体,包含中文的一些学者。这些默默为中国古籍文献做出数字科学化努力的成果应当传播的更远。

《他们在尝试用人工智能生成中国古代文献的英译》上有4条评论

  1. 好巧,今天中午在博客俱乐部就看到了你的博客,当时忙着搞内网穿透隧道,没留下评论,然后你就到我的博客来评论了,哈哈
    现在我的博客应该趋于稳定了,除非家里停电或者我折腾别的东西,不然就一直在线
    现在AI确实厉害,我2月初的时候翻译了个叫happyDomain的项目,之前那帮老外用的机翻甚至把简体中文翻译成官话了,哈哈,现在的AI翻译自然多了

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注