利用qwen api做评论打标

最新推荐文章于 2026-01-07 13:36:22 发布

原创

最新推荐文章于 2026-01-07 13:36:22 发布 · 592 阅读

10 ·

CC 4.0 BY-SA版权

文章标签：

#python #qwen #人工智能

import os
import pandas as pd
from openai import OpenAI
import json
import time
import re
import hashlib

# === 配置（硬编码）===
API_KEY = ""
MODEL_LIST = ["qwen3-max", "qwen3-max-preview"]  # 注意：千问免费额度有限，在做长内容分析时最好给几个模型备用。
input_file = r""
output_file = r""
CACHE_FILE = r""#缓存文件，避免后续重复分析

# 初始化 OpenAI 客户端（兼容 DashScope）
client = OpenAI(
    api_key=API_KEY,
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1"
)

# 8个维度：前7个为具体维度，第8个为整体情感（自己设定，也可利用其他工具总结主要问题）
CATEGORIES = ["1问题", "2问题", "3问题", "4问题", "5问题", "6问题", "7问题", "8问题"]


def robust_parse_list(text: str):
    """从可能含杂文本的响应中提取第一个合法的 [-1,0,1] 列表（长度=8）"""
    match = re.search(r"\[([-\d,\s]+)\]", text)
    if not match:
        return None
    try:
        lst = json.loads("[" + match.group(1) + "]")
        if len(lst) == 8 and all(x in (-1, 0, 1) for x in lst):
            return lst
    except Exception:
        pass
    return None


def get_comment_hash(comment: str) -> str:
    """生成评论的唯一哈希（忽略大小写和首尾空格）"""
    ret