import os
import pandas as pd
from openai import OpenAI
import json
import time
import re
import hashlib
# === 配置(硬编码)===
API_KEY = ""
MODEL_LIST = ["qwen3-max", "qwen3-max-preview"] # 注意:千问免费额度有限,在做长内容分析时最好给几个模型备用。
input_file = r""
output_file = r""
CACHE_FILE = r""#缓存文件,避免后续重复分析
# 初始化 OpenAI 客户端(兼容 DashScope)
client = OpenAI(
api_key=API_KEY,
base_url="https://dashscope.aliyuncs.com/compatible-mode/v1"
)
# 8个维度:前7个为具体维度,第8个为整体情感(自己设定,也可利用其他工具总结主要问题)
CATEGORIES = ["1问题", "2问题", "3问题", "4问题", "5问题", "6问题", "7问题", "8问题"]
def robust_parse_list(text: str):
"""从可能含杂文本的响应中提取第一个合法的 [-1,0,1] 列表(长度=8)"""
match = re.search(r"\[([-\d,\s]+)\]", text)
if not match:
return None
try:
lst = json.loads("[" + match.group(1) + "]")
if len(lst) == 8 and all(x in (-1, 0, 1) for x in lst):
return lst
except Exception:
pass
return None
def get_comment_hash(comment: str) -> str:
"""生成评论的唯一哈希(忽略大小写和首尾空格)"""
ret
利用qwen api做评论打标
最新推荐文章于 2026-01-07 13:36:22 发布

最低0.47元/天 解锁文章
1794

被折叠的 条评论
为什么被折叠?



