【限时免费】项目实战：用MiniCPM-2B-sft-fp32构建一个智能会议纪要生成器，只需100行代码！...-优快云博客

项目实战：用MiniCPM-2B-sft-fp32构建一个智能会议纪要生成器，只需100行代码！

【免费下载链接】MiniCPM-2B-sft-fp32 项目地址: https://gitcode.com/mirrors/OpenBMB/MiniCPM-2B-sft-fp32

项目构想：我们要做什么？

在日常工作中，会议纪要的整理是一项繁琐且耗时的任务。尤其是对于需要快速总结会议内容并生成结构化文本的场景，手动记录往往效率低下。因此，我们设计了一个基于MiniCPM-2B-sft-fp32的智能会议纪要生成器，它能够根据会议录音或文本输入，自动生成结构清晰、内容准确的会议纪要。

输入与输出

输入：会议的文本记录（可以是人工转录的文本或语音转文字的结果）。
输出：结构化的会议纪要，包括会议主题、讨论要点、决策事项和待办任务等。

技术选型：为什么是MiniCPM-2B-sft-fp32？

MiniCPM-2B-sft-fp32是一款轻量级但性能强大的语言模型，具有以下核心亮点，非常适合实现我们的项目：

高效性能：尽管参数量仅为2.4B，但其性能接近Mistral-7B，在中文任务上表现尤为突出，能够高效处理会议文本的生成任务。
端侧部署能力：支持在手机或低功耗设备上部署，适合企业或个人在本地环境中使用，保障数据隐私。
低成本开发：仅需一张1080/2080显卡即可进行微调，适合快速迭代和二次开发。

核心实现逻辑

我们的项目核心逻辑分为以下几步：

输入处理：将会议文本输入模型，并进行必要的预处理（如分段、去噪）。
Prompt设计：设计一个清晰的Prompt，引导模型生成结构化的会议纪要。
模型调用：调用MiniCPM-2B-sft-fp32模型，生成会议纪要。
后处理：对生成的文本进行格式化处理，确保输出清晰易读。

关键代码逻辑

以下是核心代码逻辑的伪代码：

# 加载模型和分词器
model = AutoModelForCausalLM.from_pretrained("openbmb/MiniCPM-2B-sft-fp32", torch_dtype=torch.float32, device_map="cuda")
tokenizer = AutoTokenizer.from_pretrained("openbmb/MiniCPM-2B-sft-fp32")

# 设计Prompt
prompt = """
请根据以下会议记录生成一份结构化的会议纪要：
会议记录：{input_text}
会议纪要应包括以下部分：
1. 会议主题
2. 讨论要点
3. 决策事项
4. 待办任务
"""

# 调用模型生成会议纪要
input_ids = tokenizer(prompt, return_tensors="pt").input_ids.to("cuda")
output = model.generate(input_ids, max_length=500, temperature=0.7, top_p=0.9)
meeting_summary = tokenizer.decode(output[0], skip_special_tokens=True)

# 输出结果
print(meeting_summary)

代码全览与讲解

以下是完整的项目代码，并对关键部分进行了详细注释：

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

# 设置随机种子以保证结果可复现
torch.manual_seed(0)

def generate_meeting_summary(input_text):
    """
    生成会议纪要的核心函数
    :param input_text: 会议记录的文本
    :return: 生成的会议纪要
    """
    # 加载模型和分词器
    model_path = "openbmb/MiniCPM-2B-sft-fp32"
    tokenizer = AutoTokenizer.from_pretrained(model_path)
    model = AutoModelForCausalLM.from_pretrained(model_path, torch_dtype=torch.float32, device_map="cuda", trust_remote_code=True)

    # 设计Prompt
    prompt = f"""
    请根据以下会议记录生成一份结构化的会议纪要：
    会议记录：{input_text}
    会议纪要应包括以下部分：
    1. 会议主题
    2. 讨论要点
    3. 决策事项
    4. 待办任务
    """

    # 调用模型生成会议纪要
    input_ids = tokenizer(prompt, return_tensors="pt").input_ids.to("cuda")
    output = model.generate(input_ids, max_length=500, temperature=0.7, top_p=0.9)
    meeting_summary = tokenizer.decode(output[0], skip_special_tokens=True)

    return meeting_summary

# 示例输入
input_text = """
今天的会议讨论了项目A的进度。开发团队表示前端部分已完成80%，后端部分完成60%。测试团队建议在下周进行集成测试。最终决定在下周三进行集成测试，并分配了相关责任人。
"""

# 生成会议纪要
summary = generate_meeting_summary(input_text)
print("生成的会议纪要：\n", summary)

代码讲解

模型加载：使用AutoModelForCausalLM和AutoTokenizer加载MiniCPM-2B-sft-fp32模型和分词器。
Prompt设计：通过设计清晰的Prompt，引导模型生成结构化的会议纪要。
生成文本：调用model.generate方法生成会议纪要，并通过tokenizer.decode解码为可读文本。

效果展示与功能扩展

效果展示

假设输入以下会议记录：

今天的会议讨论了项目A的进度。开发团队表示前端部分已完成80%，后端部分完成60%。测试团队建议在下周进行集成测试。最终决定在下周三进行集成测试，并分配了相关责任人。

生成的会议纪要可能如下：

1. 会议主题：项目A进度讨论
2. 讨论要点：
   - 前端完成80%，后端完成60%。
   - 测试团队建议下周进行集成测试。
3. 决策事项：
   - 下周三进行集成测试。
4. 待办任务：
   - 分配集成测试的相关责任人。

功能扩展

多语言支持：通过调整Prompt，可以支持生成英文或其他语言的会议纪要。
语音输入集成：结合语音识别API，实现从会议录音直接生成纪要。
自定义模板：允许用户自定义会议纪要的模板，满足不同场景的需求。

通过这个项目，我们可以看到MiniCPM-2B-sft-fp32在轻量级任务中的强大表现，希望它能激发你更多的创意！