【限时免费】项目实战：用Qwen3-14B-FP8构建一个智能会议纪要生成器，只需100行代码！...-优快云博客

项目实战：用Qwen3-14B-FP8构建一个智能会议纪要生成器，只需100行代码！

【免费下载链接】Qwen3-14B-FP8 项目地址: https://gitcode.com/hf_mirrors/Qwen/Qwen3-14B-FP8

项目构想：我们要做什么？

在现代职场中，会议是沟通和决策的重要方式，但冗长的会议内容往往让人难以快速抓住重点。为了解决这一问题，我们设计了一个基于Qwen3-14B-FP8的智能会议纪要生成器。该应用能够自动将会议录音或文字记录转换为简洁、结构化的会议纪要，帮助用户快速回顾会议核心内容。

输入：会议的录音文件（需转换为文字）或直接输入会议文字记录。
输出：一份结构化的会议纪要，包括会议主题、讨论要点、决策事项和待办任务。

技术选型：为什么是Qwen3-14B-FP8？

Qwen3-14B-FP8是一款功能强大的开源大语言模型，具有以下核心亮点，非常适合实现我们的智能会议纪要生成器：

无缝切换思考模式与非思考模式：
- 会议纪要生成需要模型在“思考模式”下进行逻辑推理和内容提炼，而在“非思考模式”下快速生成简洁的文本。Qwen3-14B-FP8支持动态切换这两种模式，确保高效完成任务。
强大的推理能力：
- 会议内容通常包含复杂的逻辑关系和上下文信息，Qwen3-14B-FP8在数学、代码生成和常识推理方面的能力远超同类模型，能够准确提取关键信息。
多语言支持：
- 支持100多种语言和方言，适用于国际化团队的会议记录需求。
人类偏好对齐：
- 生成的会议纪要更加自然、结构化，符合人类的阅读习惯。

核心实现逻辑

输入处理：
- 如果输入是录音文件，使用语音转文字工具（如Whisper）将其转换为文字；如果是文字记录，直接输入。
模型调用：
- 使用Qwen3-14B-FP8的“思考模式”对会议内容进行分析，提取关键信息；随后切换到“非思考模式”生成简洁的会议纪要。

Prompt设计：

设计一个清晰的Prompt，指导模型完成会议纪要的生成任务。例如：

请根据以下会议记录生成一份会议纪要，包括会议主题、讨论要点、决策事项和待办任务：
[会议记录内容]

输出解析：
- 解析模型的输出，提取结构化信息并格式化展示。

代码全览与讲解

以下是完整的项目代码，基于Qwen3-14B-FP8的快速上手代码扩展而来：

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

class MeetingSummarizer:
    def __init__(self, model_name="Qwen/Qwen3-14B-FP8"):
        # 加载模型和分词器
        self.tokenizer = AutoTokenizer.from_pretrained(model_name)
        self.model = AutoModelForCausalLM.from_pretrained(
            model_name,
            torch_dtype="auto",
            device_map="auto"
        )

    def summarize(self, meeting_text):
        # 设计Prompt
        prompt = f"""
        请根据以下会议记录生成一份会议纪要，包括会议主题、讨论要点、决策事项和待办任务：
        {meeting_text}
        """
        messages = [{"role": "user", "content": prompt}]

        # 调用模型生成内容
        text = self.tokenizer.apply_chat_template(
            messages,
            tokenize=False,
            add_generation_prompt=True,
            enable_thinking=True  # 启用思考模式
        )
        model_inputs = self.tokenizer([text], return_tensors="pt").to(self.model.device)

        # 生成文本
        generated_ids = self.model.generate(
            **model_inputs,
            max_new_tokens=1024,
            temperature=0.6,
            top_p=0.95,
            top_k=20
        )
        output_ids = generated_ids[0][len(model_inputs.input_ids[0]):].tolist()

        # 解析输出
        summary = self.tokenizer.decode(output_ids, skip_special_tokens=True)
        return summary

# 示例使用
if __name__ == "__main__":
    summarizer = MeetingSummarizer()

    # 模拟会议记录
    meeting_text = """
    会议主题：项目进度汇报
    讨论要点：
    1. 开发团队汇报了当前模块的开发进度，预计下周完成。
    2. 测试团队提出了一些性能问题，需要开发团队优化。
    决策事项：
    1. 开发团队需在下周三前完成优化。
    2. 测试团队将在下周五进行最终测试。
    待办任务：
    1. 开发团队提交优化后的代码。
    2. 测试团队准备测试环境。
    """

    # 生成会议纪要
    summary = summarizer.summarize(meeting_text)
    print("生成的会议纪要：")
    print(summary)

代码讲解：

模型加载：
- 使用AutoTokenizer和AutoModelForCausalLM加载Qwen3-14B-FP8模型。
Prompt设计：
- 通过apply_chat_template方法将用户输入转换为模型可理解的格式，并启用“思考模式”。
文本生成：
- 调用generate方法生成会议纪要，参数temperature、top_p和top_k用于控制生成文本的多样性和质量。
输出解析：
- 使用tokenizer.decode将生成的ID转换为可读文本。

效果展示与功能扩展

效果展示：

输入一段会议记录后，生成的会议纪要如下：

会议主题：项目进度汇报  
讨论要点：  
1. 开发团队汇报了当前模块的开发进度，预计下周完成。  
2. 测试团队提出了一些性能问题，需要开发团队优化。  
决策事项：  
1. 开发团队需在下周三前完成优化。  
2. 测试团队将在下周五进行最终测试。  
待办任务：  
1. 开发团队提交优化后的代码。  
2. 测试团队准备测试环境。

功能扩展：

支持多语言：
- 利用Qwen3-14B-FP8的多语言能力，支持生成其他语言的会议纪要。
语音输入集成：
- 结合语音转文字工具（如Whisper），实现从录音直接生成会议纪要。
自定义模板：
- 允许用户自定义会议纪要的模板，例如添加“参会人员”或“会议时间”字段。
实时生成：
- 结合流式处理技术，实现会议内容的实时纪要生成。

通过以上扩展，可以进一步提升应用的实用性和用户体验。希望这个项目能激发你的兴趣，动手尝试构建自己的智能会议纪要生成器！