文章

Agent化文档翻译：从“能翻译”到“可执行交付”

2026/3/19 更新于 2026/3/19 AIAgent翻译工程化本地优先

拆解 Translator 仓库如何把网页与 Markdown 翻译做成一条可执行、可校验、可恢复的本地优先流水线：从 plan-and-execute、整体到部分、ReAct 式补救到 Markdown 质量兜底。

很多翻译项目的问题，不是"翻得不像人"，而是交付物不稳定。

让模型翻一段不难；真正难的是把任务推进到"把真实网页或 Markdown 稳定交付成结构不坏的中文 Markdown 文件"。一旦目标变成后者，问题就不只是语言转换，而是完整的工程执行。

Translator 仓库最值得写的，不是"它用了 Flask + DeepSeek"，而是背后的 agent 构建范式：plan-and-execute、整体到部分、ReAct 循环，以及质量兜底。它不是把 LLM 当"会翻译的函数"，而是包进一条能落地、能验收、能反复执行的交付流水线。

一、不是翻译 demo，是本地优先的文档交付链路

Translator 是一个把网页或本地 Markdown 转成中文 Markdown 的本地优先工具，提供 CLI 和 Web 双入口。表面像翻译器，实际是受约束的 agent 工作流：

不是"调一次模型接口返回字符串"，而是有计划、有执行、有检查、有补救的完整过程。

CLI 和 Web 不各写一套逻辑，共用同一条后端翻译流水线：

核心模块：

翻译前先为整篇文档建一个 profile：术语倾向、人名地名处理方式、代码语言、标题层级风格。这个 profile 会注入每个 chunk 的翻译 prompt。

没有全局 profile，chunk 之间术语漂移、层级错乱是必然的。这一步把"一篇文档"的信息压缩成一个轻量上下文约束，避免逐 chunk 丢失全局视野。

Markdown 的结构非常脆。代码块、行内代码、LaTeX 公式、链接、图片引用——模型一碰就坏。Translator 的做法是翻译前先用占位符替换所有敏感结构，翻译完再恢复。

不是新思路，但实现上几个细节值得注意：

这是整个项目最有 agent 味的部分。翻译完 lint 后，如果发现残留英文、结构破损、占位符未恢复，系统不会报错退出，而是进入 ReAct 循环：

最多循环 3 轮。大部分情况下 1-2 轮就能修好。

普通翻译脚本失败就失败了。Agent 化系统的区别在于：它能在失败后自己补救。

翻译后跑一道自定义 lint：标题层级是否连续、列表缩进是否一致、代码块是否闭合、链接是否完整、残留英文比例是否过高。能自动修的自动修，修不了的标记出来交给 ReAct 循环。

这道兜底让系统的下限不会太低，即使模型偶尔抽风，最终交付物至少结构是完整的。

整个翻译流程本质上是 plan-and-execute 模式：

这比"整篇扔给模型"更可控，也比"逐段翻译无全局视野"更稳。拆是为了并发和控制粒度，合是为了术语一致和上下文连贯。

Translator 真正值得看的，不是"接了一个翻译模型"，而是它把文档翻译做成了一条具备计划、分解、反馈修补与质量兜底能力的 agent 化交付流水线。

不是追求一次回答多聪明，而是让系统在真实任务里，稳稳地把事情做完。