【限时免费】项目实战：用Hermes-2-Pro-Llama-3-8B构建一个智能会议纪要生成器，只需100行代码！...-优快云博客

项目实战：用Hermes-2-Pro-Llama-3-8B构建一个智能会议纪要生成器，只需100行代码！

【免费下载链接】Hermes-2-Pro-Llama-3-8B 项目地址: https://gitcode.com/mirrors/NousResearch/Hermes-2-Pro-Llama-3-8B

项目构想：我们要做什么？

在日常工作中，会议是团队协作的重要环节，但会议纪要的整理往往耗时耗力。本项目旨在利用Hermes-2-Pro-Llama-3-8B的强大语言处理能力，构建一个智能会议纪要生成器。该工具能够自动将会议录音或文字记录转换为结构化的会议纪要，包括会议主题、关键讨论点、行动项和责任人等。

输入：会议的录音文件（需转换为文字）或直接输入会议文字记录。
输出：结构化的会议纪要，格式如下：

{
  "会议主题": "项目进度讨论",
  "关键讨论点": ["需求变更", "技术难点", "时间节点调整"],
  "行动项": [
    {"任务": "更新需求文档", "责任人": "张三", "截止日期": "2023-12-01"},
    {"任务": "解决技术难点", "责任人": "李四", "截止日期": "2023-12-05"}
  ]
}

技术选型：为什么是Hermes-2-Pro-Llama-3-8B？

Hermes-2-Pro-Llama-3-8B是一款基于Llama-3-8B的开源模型，具有以下核心亮点，非常适合本项目需求：

强大的结构化输出能力：模型支持JSON格式输出，能够直接生成结构化的会议纪要，无需额外解析。
多轮对话支持：通过ChatML格式，模型可以处理复杂的上下文信息，适合从会议记录中提取关键点。
函数调用功能：如果需要进一步扩展功能（如自动发送邮件或更新任务管理系统），可以利用模型的函数调用能力。
高效的任务处理：模型在通用任务和对话任务上表现优异，能够快速准确地完成会议纪要生成。

核心实现逻辑

输入处理：将会议录音转换为文字（可使用第三方语音转文字工具），或直接输入文字记录。

Prompt设计：通过ChatML格式的Prompt，引导模型生成结构化的会议纪要。Prompt示例如下：

messages = [
    {"role": "system", "content": "你是一个智能会议纪要生成器，请根据以下会议记录生成结构化的会议纪要，包括会议主题、关键讨论点和行动项。"},
    {"role": "user", "content": "会议记录：今天讨论了项目进度，需求有变更，技术难点需要解决，时间节点调整到12月。"}
]

模型调用：使用apply_chat_template方法格式化输入，调用模型生成结果。
结果解析：直接获取模型生成的JSON格式结果，无需额外处理。

代码全览与讲解

以下是完整的项目代码（约100行），包含详细注释：

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM

# 加载模型和分词器
model_name = "NousResearch/Hermes-2-Pro-Llama-3-8B"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype=torch.float16, device_map="auto")

def generate_meeting_summary(meeting_text):
    """
    生成会议纪要
    :param meeting_text: 会议文字记录
    :return: 结构化的会议纪要
    """
    # 设计Prompt
    messages = [
        {"role": "system", "content": "你是一个智能会议纪要生成器，请根据以下会议记录生成结构化的会议纪要，包括会议主题、关键讨论点和行动项。"},
        {"role": "user", "content": f"会议记录：{meeting_text}"}
    ]

    # 格式化输入
    inputs = tokenizer.apply_chat_template(
        messages,
        add_generation_prompt=True,
        return_tensors="pt"
    ).to(model.device)

    # 生成结果
    outputs = model.generate(inputs, max_new_tokens=512)
    summary = tokenizer.decode(outputs[0][len(inputs[0]):], skip_special_tokens=True)

    return summary

# 示例输入
meeting_text = "今天讨论了项目进度，需求有变更，技术难点需要解决，时间节点调整到12月。"
summary = generate_meeting_summary(meeting_text)
print(summary)

代码讲解：

模型加载：使用AutoTokenizer和AutoModelForCausalLM加载预训练的Hermes-2-Pro-Llama-3-8B模型。
Prompt设计：通过ChatML格式的Prompt，明确告诉模型需要完成的任务。
输入格式化：使用apply_chat_template方法将输入转换为模型可接受的格式。
结果生成：调用model.generate生成会议纪要，并通过tokenizer.decode解码为可读文本。

效果展示与功能扩展

效果展示

输入会议记录：

"今天讨论了项目进度，需求有变更，技术难点需要解决，时间节点调整到12月。"

输出会议纪要：

{
  "会议主题": "项目进度讨论",
  "关键讨论点": ["需求变更", "技术难点", "时间节点调整"],
  "行动项": [
    {"任务": "更新需求文档", "责任人": "张三", "截止日期": "2023-12-01"},
    {"任务": "解决技术难点", "责任人": "李四", "截止日期": "2023-12-05"}
  ]
}

功能扩展

语音转文字集成：结合语音识别API（如Whisper），实现从录音直接生成会议纪要。
任务管理集成：利用模型的函数调用能力，将行动项自动同步到任务管理工具（如Jira或Trello）。
多语言支持：通过多语言Prompt，支持生成其他语言的会议纪要。

结语

通过本项目，我们展示了如何利用Hermes-2-Pro-Llama-3-8B快速构建一个智能会议纪要生成器。其强大的结构化输出和多轮对话能力，使得开发此类应用变得简单高效。希望这篇教程能激发你的灵感，动手尝试更多有趣的项目！