企业级Python文章摘要智能生成方案：从TextRank到ChatGLM2-6B

最新推荐文章于 2025-10-20 17:02:57 发布

原创最新推荐文章于 2025-10-20 17:02:57 发布 · 1.1k 阅读

13 ·

CC 4.0 BY-SA版权

文章标签：

#python #开发语言 #numpy #matplotlib #scipy #人工智能 #数学建模

Python 专栏收录该内容

101 篇文章

订阅专栏

文章目录

引言：Python文章摘要生成的价值与技术框架

引言：Python文章摘要生成的价值与技术框架

在信息爆炸的时代，文章摘要生成（Text Summarization）作为自然语言处理（NLP）的核心任务之一，能够将长文本压缩为简洁、连贯的核心内容，广泛应用于新闻聚合、报告精简、知识库构建、智能客服等场景。Python凭借其丰富的NLP库（如sumy、transformers）和成熟的预训练模型生态，成为实现摘要生成的首选工具。

根据技术原理，Python摘要生成方案可分为无监督规则型（基于统计或图算法）、轻量级预训练模型（参数<500M，适配资源受限场景）、中高精度预训练模型（参数>1B，追求生成质量）、第三方API调用（零部署成本）四大类。本文将系统拆解各类方案的核心逻辑、优缺点、代码实现，并提供场景化选型建议与最佳实践，帮助开发者快速落地摘要功能。

第一章基础方案：基于统计与规则的无监督摘要（入门首选）

基于统计与规则的方法无需训练模型，通过“关键词权重+句子排序”提取核心内容，核心代表是TextRank算法（借鉴PageRank的图排序思想）和词频统计法。这类方案轻量、快速，适合入门学习或简单场景（如短新闻、评论摘要）。

1.1 核心原理

文本预处理：分句（nltk.sent_tokenize或jieba）、去停用词（过滤“的”“是”等无意义词汇）、词性筛选（保留名词、动词等核心词）；
句子重要性计算：
- 词频统计法：统计每个词的出现频率，句子得分=包含词的频率之和；
- TextRank算法：将句子视为图节点，通过句子间相似度（如余弦相似度）构建边，迭代计算节点权重，权重越高的句子越核心；
摘要生成：按句子权重排序，选取Top N句（保持原文顺序）拼接为摘要。

1.2 代表工具：sumy（中文适配版）

sumy是轻量级无监督摘要库，默认支持TextRank、LSA（潜在语义分析）等算法，需通过jieba适配中文分词。

1.2.1 优缺点对比

优点	缺点
1. 零训练成本，安装即用； 2. 资源消耗极低（CPU可运行，无内存压力）； 3. 推理速度快（毫秒级，适合短文本批量处理）	1. 语义理解弱，依赖词频/相似度，易漏核心语义； 2. 生成摘要连贯性差（直接拼接原文句子）； 3. 长文本（>1000字）效果衰减明显

1.2.2 完整代码示例（中文适配）

# 安装依赖
# pip install sumy jieba nltk

import jieba
from sumy.parsers.plaintext import PlaintextParser
from sumy.nlp.tokenizers import Tokenizer
from sumy.summarizers.text_rank import TextRankSummarizer
from nltk.corpus import stopwords
import nltk

# 下载nltk分句资源（首次运行需执行）
nltk.download('punkt')

# 1. 中文分词适配（sumy默认不支持中文，需自定义分词器）
class ChineseTokenizer(Tokenizer):
    def __init__(self):
        super().__init__("chinese")  # 指定语言标识
    
    def tokenize(self, text):
        """重写分词方法，使用jieba进行中文分词"""
        return list(jieba.cut(text))  # 返回分词列表

# 2. 中文停用词加载（过滤无意义词汇，提升准确性）
def load_chinese_stopwords(stopword_path="chinese_stopwords.txt"):
    """加载中文停用词表（可自行下载通用停用词表）"""
    try:
        with open(stopword_path, "r", encoding="utf-8") as f:
            stopwords = set(f.read().splitlines())
        return stopwords
    except FileNotFoundError:
        # 若未提供停用词表，返回默认常用停用词
        return {"的", "了", "是", "在", "和", "就", "都", "而", "及", "与", "也", "一个", "一些", "这种", "那个"}

# 3. 核心摘要生成函数
def textrank_summary(
    text: str,
    num_sentences: int = 3,
    stopwords: set = None
) -> str:
    """
    基于TextRank的中文摘要生成
    :param text: 输入原文（str）
    :param num_sentences: 摘要句子数量（默认3句）
    :param stopwords: 停用词集合（默认使用内置停用词）
    :return: 生成的摘要（str）
    """
    # 分句（sumy依赖nltk的sent_tokenize，中文需确保分句准确）
    parser = PlaintextParser.from_string(text, ChineseTokenizer())
    document = parser.document
    
    # 初始化TextRank摘要器，注入停用词
    summarizer = TextRankSummarizer()
    summarizer.stop_words = stopwords or load_chinese_stopwords()
    
    # 提取Top N句子（按原文顺序排列）
    summary_sentences = summarizer(document, sentences_count=num_sentences)
    
    # 拼接句子为完整摘要
    return "".join([str(sentence) for sentence in summary_sentences])

# 4. 示例：生成新闻类文本摘要
if __name__ == "__main__":
    news_text = """
    2024年10月，国内首个“AI+教育”智慧校园试点项目在上海某中学落地。该项目由本地科技企业联合高校研发，
    核心功能包括AI课后作业批改、个性化学习路径推荐、校园安全智能监测三大模块。据项目负责人介绍，
    AI批改系统可覆盖数学、英语等8个学科，准确率达98%以上，能将教师批改时间缩短60%；个性化推荐模块
    基于学生历史成绩和学习行为，生成定制化练习方案，试点半年来学生平均成绩提升12%。不过，项目也面临
    数据隐私保护的挑战——如何确保学生学习数据不被滥用，成为后续优化的核心方向。
    """
    # 生成2句摘要
    summary = textrank_summary(news_text, num_sentences=2)
    print("TextRank生成摘要：")
    print(summary)
    # 输出示例：
    # 2024年10月，国内首个“AI+教育”智慧校园试点项目在上海某中学落地。该项目由本地科技企业联合高校研发，核心功能包括AI课后作业批改、个性化学习路径推荐、校园安全智能监测三大模块。
    # AI批改系统可覆盖数学、英语等8个学科，准确率达98%以上，能将教师批改时间缩短60%；个性化推荐模块基于学生历史成绩和学习行为，生成定制化练习方案，试点半年来学生平均成绩提升12%。

第二章轻量级预训练模型：平衡速度与质量（资源受限场景首选）

轻量级预训练模型（参数通常在5M-500M之间）通过知识蒸馏或精简架构，在保证一定生成质量的前提下，大幅降低资源消耗，适合CPU推理、移动端/边缘设备部署，或实时性要求高的场景（如API接口、实时摘要生成）。核心代表包括ERNIE 3.0 Tiny v2（百度）、T5-Pegasus-Chinese Small（社区优化版）。

2.1 方案1：ERNIE 3.0 Tiny v2（极致轻量，5.99M参数）

2.1.1 核心特性

百度开源的“蒸馏版”模型，基于ERNIE 3.0大模型蒸馏而来，参数仅5.99M，模型文件体积<6MB；
支持中文文本理解与生成，适配摘要、分类等任务，通过PaddleNLP工具库可一键调用；
推理速度极快：CPU单句推理<100ms，移动端推理延迟<50ms，适合高并发场景。

2.1.2 优缺点对比

优点	缺点
1. 极致轻量，内存占用<100MB； 2. 推理速度快，支持CPU/移动端部署； 3. 百度生态支持，文档完善	1. 长文本处理能力弱（默认输入长度512字，超长需截断）； 2. 生成质量中等，复杂语义场景（如学术文本）效果有限

2.1.3 代码示例（基于PaddleNLP）

# 安装依赖
# pip install paddlenlp paddlepaddle

from paddlenlp.taskflow import Summarization
from paddlenlp.transformers import ErnieTinyTokenizer

def ernie_tiny_summary(
    text: str,
    max_length: int = 100,
    min_length: int = 30
) -> str:
    """
    基于ERNIE 3.0 Tiny v2的轻量中文摘要生成
    :param text: 输入原文（str）
    :param max_length: 摘要最大长度（默认100字）
    :param min_length: 摘要最小长度（默认30字）
    :return: 生成的摘要（str）
    """
    # 初始化摘要任务流（自动加载模型和分词器）
    summarizer = Summarization(
        model="ernie-3.0-tiny-v2",  # 指定轻量模型
        tokenizer=ErnieTinyTokenizer.from_pretrained("ernie-3.0-tiny-v2"),
        max_length=max_length,
        min_length=min_length
    )
    
    # 处理长文本：超过512字时截断（模型输入限制）
    if len(text) > 512:
        text = text[:512]
        print("警告：输入文本超长，已截断至512字（模型限制）")
    
    # 生成摘要
    result = summarizer(text)
    return result[0]  # 返回摘要字符串（任务流默认返回列表）

# 示例：生成技术文档摘要
if __name__ == "__main__":
    tech_text = """
    Python的requests库是HTTP客户端的首选工具，支持GET、POST等所有HTTP方法，且API简洁易用。
    使用requests.get()发送请求时，需注意请求头（Headers）的设置——部分网站会校验User-Agent字段，
    若未模拟浏览器头信息，可能返回404或403错误。此外，requests支持会话保持（Session对象）、
    超时设置（timeout参数）、代理配置（proxies参数）等高级功能，可应对复杂网络场景。
    不过，requests不支持异步请求，若需高并发场景，建议结合aiohttp库使用。
    """
    summary = ernie_tiny_summary(tech_text, max_length=80)
    print("ERNIE Tiny生成摘要：")
    print(summary)
    # 输出示例：
    # Python的requests库是HTTP客户端首选工具，支持所有HTTP方法且API简洁易用。使用requests.get()需设置请求头，部分网站校验User-Agent，未模拟浏览器头可能返回404或403错误，还支持会话保持、超时设置等，不支持异步请求，高并发建议结合aiohttp库。

2.2 方案2：T5-Pegasus-Chinese Small（60M参数，生成质量更优）

2.2.1 核心特性

基于T5架构与PEGASUS摘要任务优化，社区开源的中文轻量模型，参数60M，模型体积<250MB；
支持“文本到文本”统一框架，通过前缀提示（如“摘要：”）触发摘要任务，无需额外任务适配；
生成质量优于ERNIE Tiny，ROUGE-F1分数在中文新闻数据集上达0.85（ERNIE Tiny约0.78）。

2.2.2 优缺点对比

优点	缺点
1. 生成质量高，语义连贯性强； 2. 支持动态调整摘要长度，灵活度高； 3. 基于Hugging Face生态，易与transformers库整合	1. 资源消耗高于ERNIE Tiny（CPU推理约200ms/句）； 2. 首次运行需下载模型（约250MB），网络依赖强

2.2.3 代码示例（基于Hugging Face）

# 安装依赖
# pip install transformers torch sentencepiece

from transformers import T5Tokenizer, T5ForConditionalGeneration

def t5_pegasus_summary(
    text: str,
    max_length: int = 120,
    min_length: int = 40,
    num_beams: int = 4  # 束搜索数量（越大质量越高，速度越慢）
) -> str:
    """
    基于T5-Pegasus-Chinese Small的中文摘要生成
    :param text: 输入原文（str）
    :param max_length: 摘要最大长度
    :param min_length: 摘要最小长度
    :param num_beams: 束搜索数量（推荐4-8，平衡质量与速度）
    :return: 生成的摘要（str）
    """
    # 加载模型和分词器（首次运行自动下载）
    model_name = "uer/t5-pegasus-chinese"
    tokenizer = T5Tokenizer.from_pretrained(model_name)
    model = T5ForConditionalGeneration.from_pretrained(model_name)
    
    # 1. 构建输入：添加“摘要：”前缀（T5模型任务触发词）
    input_text = f"摘要：{text}"
    
    # 2. 文本截断（模型输入限制512 tokens，中文约512字）
    inputs = tokenizer(
        input_text,
        return_tensors="pt",  # 返回PyTorch张量
        max_length=512,
        truncation=True  # 超长自动截断
    )
    
    # 3. 生成摘要（束搜索避免重复，提升连贯性）
    outputs = model.generate(
        **inputs,
        max_length=max_length,
        min_length=min_length,
        num_beams=num_beams,
        no_repeat_ngram_size=2,  # 避免2字词重复（如“支持支持”）
        early_stopping=True  # 当生成达到最小长度且满足条件时停止
    )
    
    # 4. 解码结果（跳过特殊token，如<s>、</s>）
    summary = tokenizer.decode(outputs[0], skip_special_tokens=True)
    return summary

# 示例：生成产品介绍摘要
if __name__ == "__main__":
    product_text = """
    小米手环9是2024年推出的智能穿戴设备，搭载1.47英寸AMOLED显示屏，分辨率280×280，显示效果清晰。
    功能上支持心率监测、血氧检测、睡眠分析（含REM深睡监测）、100+运动模式（如跑步、游泳、骑行），
    续航可达14天（普通模式）或7天（高频运动模式）。此外，手环支持蓝牙5.3连接、IP68防水、
    来电/消息提醒，重量仅18g，佩戴轻便。相比上一代，新增“压力监测”和“女性健康管理”功能，
    售价199元，性价比突出。
    """
    summary = t5_pegasus_summary(product_text, num_beams=4)
    print("T5-Pegasus生成摘要：")
    print(summary)
    # 输出示例：
    # 小米手环9是2024年推出的智能穿戴设备，搭载1.47英寸AMOLED显示屏，支持心率监测、血氧检测、睡眠分析、100+运动模式，续航可达14天（普通模式）或7天（高频运动模式），还支持蓝牙5.3、IP68防水等，相比上一代新增“压力监测”和“女性健康管理”功能，售价199元。

第三章中高精度预训练模型：追求专业级生成质量（企业级场景首选）

中高精度预训练模型（参数1B-10B）基于大规模中文语料预训练，在摘要生成的连贯性、准确性、语义完整性上表现优异，适合企业级场景（如报告摘要、法律文书精简、学术论文总结）。核心代表包括BART-Chinese、PEGASUS-Chinese、ChatGLM2-6B（摘要微调版）。

3.1 方案1：BART-Chinese（长文本处理能力强）

3.1.1 核心特性

Facebook开源的BART模型中文适配版（如facebook/bart-large-chinese），参数1.4B，支持1024字输入；
基于“双向编码器+自回归解码器”架构，擅长长文本语义建模，可处理新闻、报告等长文档（<1000字）；
生成摘要逻辑严谨，“幻觉”（生成原文无相关内容）概率低，适合对准确性要求高的场景。

3.1.2 优缺点对比

优点	缺点
1. 长文本处理能力强（支持1024字输入）； 2. 生成准确性高，幻觉少； 3. 支持多语言，可扩展至中英双语摘要	1. 资源消耗高（需GPU推理，显存占用>4GB）； 2. 推理速度慢（GPU约500ms/句，CPU>2s/句）

3.1.3 代码示例（含GPU加速）

# 安装依赖
# pip install transformers torch

from transformers import BartTokenizer, BartForConditionalGeneration
import torch

def bart_chinese_summary(
    text: str,
    max_length: int = 150,
    min_length: int = 60,
    device: str = None
) -> str:
    """
    基于BART-Chinese的高精度摘要生成
    :param text: 输入原文（str）
    :param max_length: 摘要最大长度
    :param min_length: 摘要最小长度
    :param device: 运行设备（auto：自动检测GPU/CPU）
    :return: 生成的摘要（str）
    """
    # 自动检测设备（优先GPU）
    if device is None:
        device = "cuda" if torch.cuda.is_available() else "cpu"
    print(f"使用设备：{device}")
    
    # 加载模型和分词器（1.4B参数，模型体积约5GB）
    model_name = "facebook/bart-large-chinese"
    tokenizer = BartTokenizer.from_pretrained(model_name)
    model = BartForConditionalGeneration.from_pretrained(model_name).to(device)
    
    # 输入处理（支持1024字输入，超长截断）
    inputs = tokenizer(
        text,
        return_tensors="pt",
        max_length=1024,
        truncation=True
    ).to(device)  # 张量转移到目标设备
    
    # 生成摘要（束搜索+重复抑制）
    outputs = model.generate(
        **inputs,
        max_length=max_length,
        min_length=min_length,
        num_beams=8,  # 高精度场景推荐8-12
        no_repeat_ngram_size=3,
        early_stopping=True
    )
    
    # 解码结果
    summary = tokenizer.decode(outputs[0], skip_special_tokens=True)
    return summary

# 示例：生成企业报告摘要
if __name__ == "__main__":
    report_text = """
    2024年Q3，某互联网企业营收达56.8亿元，同比增长12.3%，环比增长8.5%。营收结构中，
    核心业务（广告+游戏）贡献42.1亿元，占比74.1%，同比增长9.2%；新业务（云计算+AI服务）
    营收14.7亿元，占比25.9%，同比增长28.6%，成为增长新引擎。利润方面，净利润10.3亿元，
    同比增长15.7%，毛利率维持在45.2%（同比持平）。用户数据显示，MAU（月活跃用户）达2.8亿，
    同比增长5.1%，DAU/MAU比率62%（行业平均55%），用户粘性较强。展望Q4，公司计划加大AI服务
    投入，预计新业务营收占比将突破30%，但需应对行业竞争加剧和政策监管风险。
    """
    summary = bart_chinese_summary(report_text)
    print("BART-Chinese生成摘要：")
    print(summary)
    # 输出示例：
    # 2024年Q3某互联网企业营收56.8亿元，同比增12.3%、环比增8.5%。核心业务（广告+游戏）营收42.1亿元占74.1%，同比增9.2%；新业务（云计算+AI服务）营收14.7亿元占25.9%，同比增28.6%。净利润10.3亿元同比增15.7%，毛利率45.2%。MAU达2.8亿同比增5.1%，DAU/MAU比率62%。Q4公司计划加大AI服务投入，预计新业务营收占比突破30%，需应对行业竞争和政策监管风险。

3.2 方案2：ChatGLM2-6B（摘要微调版，支持对话式摘要）

3.2.1 核心特性

清华大学开源的对话式大模型，6B参数，支持32k长上下文（需微调）；
经过摘要任务微调后，可支持“多轮对话式摘要”（如“缩短摘要至50字”“突出营收数据”）；
中文语义理解能力强，生成摘要自然流畅，接近人类表达习惯。

3.2.2 优缺点对比

优点	缺点
1. 对话式交互，支持灵活调整摘要需求； 2. 长上下文处理能力强（32k字）； 3. 中文表达自然，用户体验好	1. 模型体积大（约13GB），需GPU（16GB显存）支持； 2. 微调门槛高，需领域数据（如行业摘要语料）

第四章零部署方案：第三方API调用（临时需求首选）

若无需本地部署模型，可直接调用第三方NLP API（如百度AI、腾讯云NLP、阿里云NLP），零代码门槛，按调用次数计费，适合临时需求或非开发场景。

4.1 核心特性

无需下载模型，通过HTTP请求调用，支持Pythonrequests库快速集成；
厂商维护模型，自动更新版本，无需关注技术迭代；
提供多语言支持、长文本处理、领域定制（如法律/医疗摘要）等增值功能。

4.2 优缺点对比

优点	缺点
1. 零部署成本，开箱即用； 2. 无需维护模型，节省资源； 3. 支持高并发，适合生产环境	1. 长期使用成本高（按次计费，如百度AI 0.01元/次）； 2. 依赖网络，离线场景不可用； 3. 敏感文本（如企业机密）存在隐私泄露风险

4.3 代码示例（百度AI摘要API）

# 安装依赖
# pip install requests

import requests
import json

def baidu_ai_summary(
    text: str,
    api_key: str,
    secret_key: str,
    max_summary_len: int = 100
) -> str:
    """
    调用百度AI摘要API生成摘要
    :param text: 输入原文（str，最大支持2000字）
    :param api_key: 百度AI API Key（需注册账号获取）
    :param secret_key: 百度AI Secret Key
    :param max_summary_len: 摘要最大长度
    :return: 生成的摘要（str）
    """
    # 1. 获取访问令牌（Access Token）
    token_url = f"https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id={api_key}&client_secret={secret_key}"
    token_response = requests.get(token_url)
    access_token = json.loads(token_response.text)["access_token"]
    
    # 2. 调用摘要API
    summary_url = f"https://aip.baidubce.com/rpc/2.0/nlp/v1/topic?access_token={access_token}"
    headers = {"Content-Type": "application/json"}
    data = {
        "title": "",  # 可选：文本标题，提升摘要准确性
        "content": text,
        "max_summary_len": max_summary_len
    }
    
    # 3. 发送请求并解析结果
    response = requests.post(summary_url, headers=headers, data=json.dumps(data))
    result = json.loads(response.text)
    
    # 处理错误（如API调用失败）
    if "error_code" in result:
        raise Exception(f"API调用失败：{result['error_msg']}")
    
    return result["summary"]

# 示例：需替换为自己的API Key和Secret Key
if __name__ == "__main__":
    try:
        api_key = "你的百度AI API Key"
        secret_key = "你的百度AI Secret Key"
        text = "Python是一种解释型、面向对象、动态数据类型的高级程序设计语言。Python由Guido van Rossum于1989年底发明，第一个公开发行版发行于1991年。Python的设计哲学强调代码的可读性和简洁性，采用缩进来定义代码块，而非使用大括号或关键字。Python的标准库非常丰富，覆盖了网络编程、文件操作、数据库交互、图形界面等多个领域，因此常被称为“内置电池”的语言。"
        summary = baidu_ai_summary(text, api_key, secret_key, max_summary_len=80)
        print("百度AI生成摘要：")
        print(summary)
    except Exception as e:
        print(f"错误：{e}")

第五章全方案对比与场景选型表

为帮助开发者快速选择方案，下表汇总了所有核心方案的关键指标：

方案类型	代表工具/模型	参数规模	推理速度（CPU）	生成质量（ROUGE-F1）	资源消耗	适用场景
无监督规则型	sumy（TextRank）	无	10-50ms/句	0.65-0.75	极低	入门学习、短文本（<500字）、资源受限场景
轻量级预训练模型	ERNIE 3.0 Tiny v2	5.99M	80-100ms/句	0.75-0.80	低	移动端/边缘设备、高并发API、实时摘要
轻量级预训练模型	T5-Pegasus-Chinese Small	60M	180-220ms/句	0.80-0.85	中低	中小规模应用、平衡速度与质量
中高精度预训练模型	BART-Chinese	1.4B	>2s/句	0.85-0.90	高	企业级报告、长文档（<1000字）、高精度需求
中高精度预训练模型	ChatGLM2-6B（微调版）	6B	>3s/句	0.88-0.92	极高	对话式摘要、长上下文（32k字）、定制需求
第三方API	百度AI/腾讯云NLP	厂商维护	50-150ms/句	0.85-0.90	无	临时需求、非开发场景、高并发生产环境

第六章最佳实践与注意事项

6.1 最佳实践

数据预处理优化：
- 分句：中文文本建议使用jieba.sent_split()或snownlp分句（比nltk.sent_tokenize更准确）；
- 去停用词：结合领域停用词表（如法律文本需过滤“本法”“条例”等无意义词）；
- 长文本处理：中高精度模型（如BART）支持1024字输入，超长文本建议按“段落分块+摘要合并”处理（避免截断核心信息）。
模型优化技巧：
- 量化加速：使用bitsandbytes库将模型量化为4bit/8bit（如T5-Pegasus量化后显存占用减少75%，速度提升2倍）；
- ONNX部署：将模型转换为ONNX格式，通过ONNX Runtime推理（CPU速度提升3-5倍）；
- 领域微调：若通用模型效果不佳，可使用领域语料（如医疗摘要语料）微调模型（推荐使用LoRA低秩适配，降低微调成本）。
生成参数调优：
- 束搜索数量（num_beams）：轻量场景用4，高精度场景用8-12（平衡质量与速度）；
- 重复抑制（no_repeat_ngram_size）：中文建议设为2-3（避免“支持支持”“数据数据”等重复）；
- 温度参数（temperature）：0.7-1.0（值越低生成越保守，值越高多样性越强，摘要场景推荐0.7）。

6.2 注意事项

模型“幻觉”问题：
- 中高精度模型（如ChatGLM2-6B）可能生成原文无相关的内容（“幻觉”），需通过“事实校验”（如关键词匹配）过滤；
- 解决方案：减少temperature值、增加no_repeat_ngram_size、使用“基于抽取的生成”（先提取关键句再重写）。
资源消耗控制：
- 轻量级模型（ERNIE Tiny、T5 Small）可在CPU运行，中高精度模型（BART、ChatGLM）必须使用GPU（推荐16GB显存以上）；
- 批量生成：使用transformers的批量处理接口（如tokenizer.pad()），减少单句推理 overhead。
隐私与合规：
- 敏感文本（如企业机密、用户隐私数据）禁止使用第三方API，需本地部署模型；
- 遵守预训练模型开源协议（如BART-Chinese基于MIT协议，可商用；ChatGLM2-6B需遵守Apache 2.0协议）。