核心定义生成是指通过自动或人工的方式，从一篇或多篇较长的源文本（如文章、报告、论文、新闻）中，提取其核心信息和主旨，生成一段更短、更精炼、保留原意的文字的过程。其核心目标是实现信息的压缩和价值提取

星博讯 AI基础认知 2026-04-09 43

关键分类 维度

基于生成方式
- 提取式摘要：从源文本中直接“提取”重要的句子、短语，并将其组合成摘要，就像用荧光笔划出重点句。
  - 优点：忠实于原文，不易出现事实错误。
  - 缺点：摘要可能不连贯，语言生硬，无法概括未直接表述的信息。
- 生成式摘要：通过自然语言生成技术，理解原文后“重新组织语言”来生成摘要，就像读懂文章后，用自己的话复述核心内容。
  - 优点：摘要更流畅、连贯，能进行概括和 paraphrasing。
  - 缺点：可能引入原文没有的信息（幻觉），对模型要求更高。
基于源文本数量
- 单文档摘要：对单一文档生成摘要。
- 多文档摘要：从多篇谈论同一主题或事件的文档中，生成一份综合摘要，需要处理信息重叠、冲突和互补。
基于摘要功能/长度
- 指示性摘要：仅说明原文的主题、范围和结构，类似于“目录”或“简介”，帮助读者判断是否需要阅读全文。
- 报道性摘要：浓缩原文的主要论点、发现和结论，提供核心内容，使读者无需阅读全文即可了解关键信息。
- 极端摘要：生成非常简短的摘要（如标题、一句话摘要）。

内部评价：将自动摘要与人工编写的参考摘要进行比较。
- ROUGE：最常用的指标，通过计算N-gram（词序列）的重叠度来评估内容召回率。
外部评价：评估摘要对下游任务的帮助。
用摘要来分类文档,看准确率是否与用全文接近。
人工评价：从通顺度、连贯性、信息性、忠实度（是否歪曲原意）等维度进行人工评分，这是最可靠但成本最高的方法。

传统方法：基于统计、图排序（如TextRank）、主题模型。
现代主流：基于深度学习，尤其是预训练语言模型。
- 序列到序列模型：如BART、T5、PEGASUS，这些模型专为文本生成任务预训练，在生成式摘要上表现出色。
- 大型语言模型：如GPT系列，通过指令微调可以实现高质量的生成式摘要。
当前挑战：
- 事实一致性：生成的内容与原文事实不符（“幻觉”问题）。
- 长文档处理：模型对长文本的理解和记忆能力有限。
- 可控生成：如何生成满足特定长度、风格或侧重点的摘要。
- 低资源语言：缺乏高质量训练数据。