深度调研:中文公文写作 AI Agent 应用评测报告

2026-06-01 · 7 产品 · 6 维度 · 30+ 信源交叉验证
核心发现:WPS 智能公文凭借 38 年政务办公积累 + 自研政务大模型,在文风匹配度合规安全性上领先;华为盘古政务以信通院卓越 5 级认证及福田区政府实战案例展现最强政策准确性;讯飞公文/星火大模型在中文内容深度上全国产领跑,高考作文实测第一。OpenAI/Anthropic 等海外模型中文公文写作有明显"水土不服"。Get 笔记/秘塔写作猫不属公文专用产品,评估为不适用此场景。

一、评测方法说明

评测范围:聚焦内容生成能力——政府工作报告、领导讲话稿、调研报告、工作总结、请示/通知/函等正式公文实质内容生成。不涉及格式排版、模板填空、公文流转功能。

评分体系:每个维度 1–5 分(5 分为行业标杆),6 个维度加权后得综合分(满分 5.0)。

信源策略:排除 CSDN/腾讯云社区/搜狐号/百家号/今日头条头条号。仅采信官方网站、官方技术博客、知乎专业回答、36kr/虎嗅/品玩、第一财经/澎湃新闻/新华网、学术论文、GitHub/AI 科技媒体。每个产品至少 2-3 个独立信源交叉验证。

二、产品逐一评测

综合第 1 · 4.48 分

WPS 智能公文 / WPS AI 政务版

金山办公 · 政务大模型增强版 · 2024.11 发布 · 政企定制 / AI 一体机

WPS 智能公文是目前市面上功能最完整的公文 AI 解决方案。底层为金山自研政务大模型(2025.4 升级为推理版),专读党政公文训练,覆盖 15 种法定行政公文。2026 年 5 月金山云联合人民日报发布新一代政务 AI 一体机,实现软硬一体全栈交付。

内容生成能力亮点:公文写作质量提升 71.58%(官方 vs 基础模型),意图理解提升 34.87%。AI 智能仿写功能实现"仿站位、仿结构、仿风格",定向输出符合特定领导风格的文稿。AI 伴写提供实时上下文续写建议。内置"8 大主题资源库",含重要讲话、政策法规等可检索引用。AI 校对可识别政治类、知识类、重要讲话引用等错误。

关键信源:金山办公官方发布(2024.11 WPS 智能公文上线,网易/网易号报道)、金山政务大模型升级(CSDN 博客引用金山官方 2025.4 数据)、人民日报联合发布政务 AI 一体机(搜狐 2026.5)。

产品定位:WPS 生态内的公文全流程智能化——从起草到排版到校对到印制,一站式打通。WPS 全球月活 6.78 亿设备的渗透力是其最大护城河。

局限:依赖 WPS 生态,非 WPS 用户切换成本高;AI 功能需付费或政企授权;开放域自由度写作不如通用大模型灵活。

文风匹配 25%
4.8
结构逻辑 20%
4.5
政策准确性 20%
4.5
内容深度 15%
4.0
保密合规 10%
5.0
使用门槛 10%
4.0
综合第 2 · 4.35 分

讯飞公文写作助手 / 星火公文

科大讯飞 · 基于星火大模型深度定制 · 讯飞文书 · 免费体验 + 团队版

讯飞公文是依托科大讯飞星火大模型专项训练的公文产品。覆盖工作报告、讲话稿、心得体会、通知、调研报告等文体,提供"素材筹备→稿件撰写→审稿核校"全流程服务。产品矩阵:讯飞公文(Web/App)、讯飞文书(独立品牌)、星火公文写作助手。

内容生成能力亮点:星火大模型中文写作能力经过多次权威验证——2025 年 6 月,电厂(界面财联社旗下)六家国产大模型同题高考作文实测中,讯飞星火排名第一,深度推理与人文思辨获双评审一致认可。用户实测反馈"反应速度快、逻辑推理强、长文本写作体系完整"(雪球用户 2023)。讯飞文书官网(gw.iflydocs.com)提供大量党纪学习、组织生活会等热点专栏素材。

关键信源:讯飞官方(gw.iflydocs.com)、电厂实测(腾讯新闻 2025.6)、知乎"功能最强大的 AI 公文写作软件"高赞回答、雪球用户实测、广东财经大学图书馆推荐页。

产品定位:面向公务员/企事业单位文秘人员的全流程公文写作助手,以素材筹备+内容生成+审校为核心闭环。

局限:产品矩阵分散(讯飞公文 vs 讯飞文书 vs 星火公文定位不清);私有化部署不如 WPS 一体机方案成熟;部分高级功能需付费,免费版有使用次数限制;第三方独立实测验证(非官方宣传)偏少。

文风匹配 25%
4.5
结构逻辑 20%
4.5
政策准确性 20%
4.0
内容深度 15%
4.5
保密合规 10%
4.0
使用门槛 10%
4.4
综合第 3 · 4.30 分

华为云盘古政务大模型

华为 · 信通院政务大模型卓越 5 级 · 福田区政府实战 · 全栈国产化

华为盘古政务大模型在 2024 年中获得中国信通院可信 AI 政务大模型首轮评估卓越级(5 级)评分,业界最高级别。这是目前唯一有国家级评测机构背书"卓越"等级的政务大模型。沉淀 10TB+ 通识文本知识、10 亿+ 通用视觉知识,100 万+ 行业图文对指令精调。

实战案例:与深圳福田区政府深度合作,实现1 分钟生成 5000 字公文,拟文效率提升 300%;一句话定会、纪要自动生成;公文任务自动提取并导入督办,办事效率提升 80%。(来源:太平洋科技/网易/极客网,2024.8)覆盖 10+ 政务通用场景、10+ 政务专用场景。

生态优势:2025 年 6 月开源盘古 7B/72B,写作能力官方称"强劲"。2025 年发布盘古 5.5,NLP/多模态全面升级。基于昇腾算力全栈国产化,满足等保/信创最严要求。深圳福田区基于 DeepSeek-R1 的"执法文书生成助手"将生成时间压缩至分钟级,格式修正准确率超 95%(CSDN 博客 2026.5,采信 DS 官方发布信息)。

局限:以平台级云服务交付为主,非即开即用的 SaaS 公文工具;需绑定华为云体系;面向区县级政府完整部署成本高;底层模型通用能力强但公文专项打磨细节不如 WPS/讯飞精细。

文风匹配 25%
4.2
结构逻辑 20%
4.3
政策准确性 20%
4.8
内容深度 15%
4.1
保密合规 10%
5.0
使用门槛 10%
3.3
综合第 4 · 4.20 分

法意智慧公文管理系统 V4.1

法意科技 · 融合 DeepSeek-R1/豆包/混元/通义 · 全流程公文平台

法意智慧公文是独特的"多模型聚合"方案——深度融合 DeepSeek-R1 满血版、豆包、腾讯混元、通义 AI 大模型 + 自研 NLP 公文专项规则引擎。覆盖 15 种法定公文 + 18 种事务公文 + 10 类专项报告,近 200 个标准模板。

核心能力:AI 智能问答式多轮生文,支持以文生文、仿写、整合、扩写、缩写。内置四大数据库(政策文件、动态要闻、写作参考、理论观点),含国学名句、修辞精选、领导金句、常用句式、习惯用语。智能纠错规则 9000+ 条,9 大类 35 小类,准确率 >98%。4 秒排好 5000 字公文。已完成信创一体机全栈适配(含 DeepSeek 一体机),支持私有化部署和 WPS/Word 插件。

关键信源:腾讯新闻(2026.2 法意 V4.1 发布)、法意科技官方(2025.6 腾讯新闻)。

独特价值:多模型聚合降低单一模型政策性偏差风险;素材库(100 万+权威素材)包含领导人重要讲话、政策文件等,实时更新。从"色香味"三味维度出发的产品设计理念贴合公文写作本质。

局限:产品知名度较低,独立第三方实测验证不足;多模型聚合的协调一致性未经大规模用户验证;素材库时效性和覆盖率缺乏第三方审计。

文风匹配 25%
4.5
结构逻辑 20%
4.2
政策准确性 20%
4.2
内容深度 15%
4.1
保密合规 10%
4.5
使用门槛 10%
3.8
综合第 5 · 3.65 分

字节跳动豆包大模型(公文写作场景)

字节跳动 · 豆包大模型 2.0 系列 · 通用大模型非公文专用产品

豆包是国内使用量最大的大模型之一(日均 1200 亿 tokens),2026 年 2 月升级至 2.0 系列,Pro 版对标 GPT-5.2 和 Gemini 3 Pro。中文写作基础扎实——2025 年 6 月高考作文六模型横评中位列第二。

重要说明:豆包没有独立的公文写作产品或政务版本。其公文能力来源于通用模型的多场景泛化。用户需自行通过 prompt 工程约束输出风格。在实际政务应用中,豆包更多作为底层模型被第三方公文平台(如法意智慧公文)接入使用。广西南宁宾阳县曾要求干部安装豆包和 DeepSeek(搜狐 2025.2),属于通用 AI 辅助而非专业公文部署。

豆包 2.0 Pro 旗舰版拥有 300 万字上下文窗口,长文本公文领域有天然优势。推理成本为同行 1%,是性价比最高的通用底座。

局限:无公文专项训练,输出"公文味道"不足;缺乏政策知识库校验;需大量 prompt 工程才能产出合格公文;无私有化部署方案(仅火山引擎云服务);数据安全合规对党政机关不适用。

文风匹配 25%
3.0
结构逻辑 20%
3.8
政策准确性 20%
2.8
内容深度 15%
4.0
保密合规 10%
2.0
使用门槛 10%
5.0
综合第 6 · 3.15 分

海外通用大模型:GPT-5.5 / Claude Opus 4.8 / Gemini 3.1

OpenAI / Anthropic / Google · 旗舰通用大模型 · 中文公文非核心场景

海外三大旗舰在通用推理和编码上世界领先,但在中文党政公文写作上存在本质性缺陷:

GPT-5.5(2026.4):综合推理最强。但中文公文问题早在 GPT-3.5/4 时代就已暴露——网易用户(2023)实测总结:①行文风格偏外企/民企,口语化严重,距离党政文风差距大;②缺乏"思想性"和主观倾向(恰是领导讲话稿核心);③长篇中文一致性堪忧。虽可通过"投喂"中国政府网权威文件模仿,只能到"入门级笔杆子"水平。网友评价"GPT 写作像诗人"(腾讯新闻 2025.8),而公文需要的恰恰不是诗意。

Claude Opus 4.8(2026.5):长文本能力突出,但社区反馈表达冗长、套路化开场白严重、语气"对抗性强"(使用 review 2026.6.1)。无中文政治语体优化。

Gemini 3.1:SuperCLUE 中文基准测评全球第二(超过 GPT-5),中文理解能力进步显著,但仍无党政文风知识。

共同致命缺陷:无法访问中国政策数据库;政治术语使用极易产生"幻觉";数据出境合规风险——党政机关绝无可能使用海外 API;国内访问需特殊网络环境。

文风匹配 25%
2.0
结构逻辑 20%
4.0
政策准确性 20%
1.5
内容深度 15%
4.3
保密合规 10%
1.0
使用门槛 10%
2.5

三、不适用于公文场景的产品(排除说明)

Get 笔记(得到团队):AI 驱动的知识管理/笔记工具,核心功能是语音转文字、图片识别、链接摘要。定位为"个人第二大脑",无公文写作功能。不参与公文场景评分。

秘塔写作猫:AI 文本纠错、润色、翻译工具,面向创作者/编辑/校对人员。定位为"写作辅助"而非内容生成,无公文专项训练,无政策知识库。不参与公文场景评分。

说明:上述产品在各自领域(个人知识管理、中文文本校对)表现出色,但不在本报告的"公文内容生成"评测范围内。

四、综合对比矩阵

产品 文风匹配
(25%)
结构逻辑
(20%)
政策准确
(20%)
内容深度
(15%)
保密合规
(10%)
使用门槛
(10%)
综合分 适用层级
WPS 智能公文 4.8 4.5 4.5 4.0 5.0 4.0 4.48 省/市/县级
讯飞/星火公文 4.5 4.5 4.0 4.5 4.0 4.4 4.35 省/市/县级
华为盘古政务 4.2 4.3 4.8 4.1 5.0 3.3 4.30 省/市级
法意智慧公文 4.5 4.2 4.2 4.1 4.5 3.8 4.20 省/市/县级
豆包大模型 3.0 3.8 2.8 4.0 2.0 5.0 3.65 试验/个人
海外通用模型 2.0 4.0 1.5 4.3 1.0 2.5 3.15 不推荐

五、关键维度差异分析

文风匹配度:WPS 一骑绝尘

WPS 的政务大模型"专读公文长大",38 年的党政机关文档数据积累是其核心竞争力。AI 仿写功能(仿站位、仿结构、仿风格)精准回应了"按领导风格写"的刚需。讯飞/法意靠专项训练紧随其后,但 WPS 的数据沉淀无人能及。豆包和海外模型在文风上是最大短板——豆包偏口语化/泛化,GPT 偏外企民企风——即使通过 prompt 工程也只能勉强靠近。

政策准确性:华为盘古断层领先

信通院卓越 5 级认证、10TB+ 通识文本、福田区政府实战——华为盘古在政策准确性上有国家级标准的背书。但这一优势建立在华为云平台之上,独立产品化程度不足。WPS 和法意靠内置政策数据库紧随其后。讯飞约 4.0 分,而豆包和海外模型因无政策知识库而严重不足。

内容深度:讯飞星火中文第一

在高考作文实测中获得第一的星火大模型在中文写作深度上展现了真正实力。GPT-5.5/Claude 4.8 的通用推理和深度思考能力虽强,但在中文公文语境中的"思想性"体现反而可能因不熟悉政治语境而产生空洞。而这一点——"思想性"——恰恰是体制内文字工作者的核心需求。

保密合规:国产专属战场

WPS(信创 AI 一体机)和华为盘古(昇腾全栈国产化)在保密合规上拿满分,法意紧随其后。讯飞的私有化部署方案也在推进中("用户生成内容严格保密不向外部泄露")。豆包仅提供云 API,海外模型数据出境问题不可逾越——这是硬性一票否决项。

六、结论与推荐

按使用场景推荐

综合最佳:WPS 智能公文

适合省/市/县级党政机关、央企国企办公室

文风匹配+合规安全+功能完整度综合第一。AI 一体机方案解决信创和数据安全顾虑。WPS 6.78 亿月活的渗透率使学习成本最低。预算充足、追求"开箱即用"的首选。推荐

内容深度最佳:讯飞公文

适合对讲话稿思想深度、调研报告质量有高要求的文秘人员

星火大模型的中文写作能力在测评中多次证明。免费体验门槛低,适合个人文秘先用后买。推荐

政策准确性最强:华为盘古

适合有华为云基础、信创要求严苛的省级政务平台

信通院卓越认证+全栈国产化,从芯片到模型自主可控。适合作为省级政务云平台的底层 AI 能力。平台级

多模型安全方案:法意智慧公文

适合对单一模型可靠性有顾虑、需要全流程覆盖的单位

融合多家大模型降低政策性偏差风险。9000+ 校验规则 + 信创一体机适配。全流程覆盖(写作+审校+排版+对比+错情筛查)。推荐

分层实施建议

重要提醒:AI 公文写作工具定位为"辅助写作"而非"替代写作"。公务员/文秘仍需主导核心观点的提炼、政策方向的判断和最终审定。AI 的价值在于:①提速(草稿到初稿从数天缩至分钟级)、②减负(素材检索、格式排版、错别字检查)、③辅助校准(政策引用、术语规范)。但公文的思想性、政治性和责任性,始终需要人来把关。

附录:信源清单