生成式AI在日译汉翻译中的质量评估研究——以大语言模型GPT-4o为例
引言
自2018年OpenAI推出基于Transformer架构的生成式预训练模型(Generative Pre-Trained Transformer, GPT)以来,生成式AI在自然语言处理领域进步显著。到2024年,GPT模型参数规模扩大到万亿级,形成大型语言模型(Large Language Models, LLMs)。本研究以2024年OpenAI新发布的GPT-4o为研究对象,评估其在日译汉翻译任务中的质量表现。
文献综述与理论基础
本研究基于自然语言处理和机器翻译领域的最新研究成果,特别是关于生成式AI在翻译任务中的应用。通过对相关文献的综述,本研究确定了评估GPT-4o翻译质量的关键指标和方法。\n
研究设计与方法
本研究采用对比实验的方法,将GPT-4o的翻译结果与人工翻译进行对比,并使用自动评估指标BLEU(Bilingual Evaluation Understudy)对翻译质量进行量化评估。实验数据包括不同类型的日文文本,如信息型文本、表情型文本和感染型文本。
GPT-4o的笔译质量表现
通过自动评估和人工评估,GPT-4o在日译汉笔译任务中表现出较高的译文质量。然而,与人工译文相比,GPT-4o在翻译的准确性和流畅性方面仍存在差距。\n
GPT-4o的口译质量表现
在口译任务中,GPT-4o对政界演讲的翻译表现优于TED演讲和大学典礼演讲,尤其在处理正式、结构化内容时效果更佳。\n
结论
本研究结果表明,尽管GPT-4o在日译汉翻译任务中表现出较高的质量,但生成式AI翻译仍需与人工翻译协同工作。译后编辑步骤对于提高翻译质量至关重要。未来,随着AI技术的不断发展,生成式AI在翻译领域的应用将更加广泛和深入。\n
讨论
本研究的结果对于翻译实践和翻译研究具有重要意义。首先,它为生成式AI在翻译领域的应用提供了实证依据。其次,它指出了生成式AI翻译的局限性,为未来的研究提供了方向。最后,它强调了译后编辑在翻译过程中的重要性。\n
参考文献
[1] 王羽迪. 生成式AI在日译汉翻译中的质量评估研究——以大语言模型GPT-4o为例[J]. 日语学习与研究, 2025, (02): 12-24.

“`