【限时免费】项目实战：用bloom_1b1构建一个智能会议纪要生成器，只需100行代码！...-优快云博客

项目实战：用bloom_1b1构建一个智能会议纪要生成器，只需100行代码！

【免费下载链接】bloom_1b1 1B1 pretrained checkpoint of BigScience Large Open-science Open-access Multilingual Language Model 项目地址: https://gitcode.com/openMind/bloom_1b1

项目构想：我们要做什么？

在现代职场中，会议是沟通和决策的重要方式，但冗长的会议记录往往让人头疼。为了解决这一问题，我们设计了一个基于bloom_1b1模型的智能会议纪要生成器。该应用能够将会议录音或文字记录作为输入，自动生成简洁、结构化的会议纪要，包括会议主题、关键讨论点、决策事项和待办任务等。

输入与输出

输入：会议录音（需转换为文字）或直接输入会议文字记录。
输出：结构化的会议纪要，包含以下部分：
- 会议主题
- 关键讨论点
- 决策事项
- 待办任务（分配责任人）

技术选型：为什么是bloom_1b1？

bloom_1b1是一个开源的多语言大语言模型，具有以下核心亮点，非常适合实现我们的智能会议纪要生成器：

强大的文本生成能力：bloom_1b1能够根据输入的文本生成连贯、有逻辑的文本输出，非常适合从会议记录中提取关键信息并生成结构化内容。
多语言支持：支持中英文等多种语言，可以满足国际化团队的需求。
开源与易用性：模型开源且提供了简单的API接口，开发者可以快速上手并集成到自己的应用中。
高效的推理性能：模型在生成文本时具有较高的效率，适合实时或近实时的应用场景。

核心实现逻辑

我们的项目主要分为以下几个步骤：

输入处理：将会议录音转换为文字（可以使用第三方语音转文字工具），或直接输入会议文字记录。
Prompt设计：设计一个有效的Prompt，引导模型从输入文本中提取关键信息并生成结构化会议纪要。
模型调用：使用bloom_1b1模型生成会议纪要。
结果解析：对模型生成的文本进行解析，提取结构化信息并格式化输出。

关键代码逻辑

以下是核心代码逻辑的伪代码：

# 1. 输入处理
input_text = "会议讨论了项目A的进度，决定下周由张三负责提交报告。"

# 2. Prompt设计
prompt = f"""以下是会议记录：
{input_text}

请生成一份会议纪要，包含以下内容：
- 会议主题
- 关键讨论点
- 决策事项
- 待办任务（分配责任人）"""

# 3. 模型调用
response = bloom_1b1.generate(prompt)

# 4. 结果解析
print(response)

代码全览与讲解

以下是完整的项目代码，并对关键部分进行了详细注释：

import torch
from openmind import AutoModelForCausalLM, AutoTokenizer

# 初始化模型和分词器
tokenizer = AutoTokenizer.from_pretrained("PyTorch-NPU/bloom_1b1", trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("PyTorch-NPU/bloom_1b1", trust_remote_code=True, device_map="auto")

def generate_meeting_summary(input_text):
    # 设计Prompt
    prompt = f"""以下是会议记录：
    {input_text}

    请生成一份会议纪要，包含以下内容：
    - 会议主题
    - 关键讨论点
    - 决策事项
    - 待办任务（分配责任人）"""

    # 分词并生成输入张量
    inputs = tokenizer(prompt, return_tensors="pt")
    inputs = inputs.to(model.device)

    # 生成文本
    pred = model.generate(**inputs, max_new_tokens=512, repetition_penalty=1.1)
    summary = tokenizer.decode(pred.cpu()[0], skip_special_tokens=True)

    return summary

# 示例输入
input_text = "会议讨论了项目A的进度，决定下周由张三负责提交报告。"
summary = generate_meeting_summary(input_text)
print(summary)

代码讲解

模型初始化：加载bloom_1b1模型和对应的分词器。
Prompt设计：通过设计清晰的Prompt，引导模型生成结构化的会议纪要。
文本生成：调用模型的generate方法生成文本，设置max_new_tokens和repetition_penalty以控制生成效果。
结果解析：将生成的文本解码为可读格式。

效果展示与功能扩展

效果展示

假设输入以下会议记录：

会议讨论了项目A的进度，决定下周由张三负责提交报告。

生成的会议纪要可能如下：

会议主题：项目A进度讨论
关键讨论点：项目A的当前进度和下一步计划。
决策事项：决定下周提交项目A的报告。
待办任务：张三负责提交报告。

功能扩展

多语言支持：利用bloom_1b1的多语言能力，支持更多语言的会议纪要生成。
语音输入集成：结合语音转文字工具，实现从录音直接生成会议纪要。
自定义模板：允许用户自定义会议纪要的模板，满足不同场景的需求。
历史记录存储：将生成的会议纪要存储到数据库，方便后续查询和分析。

通过这个项目，开发者可以快速体验bloom_1b1的强大能力，并在此基础上扩展更多实用功能。希望这篇教程能激发你的灵感，动手尝试构建自己的智能应用！