相片: 亲,我会想你

def _is_valid_sample(self, scene: str, turns: List[Dict]) -> tuple[bool, str]: """综合逻辑校验""" binding = next((s for s in self.config["scenes"] if s.scene == scene), None) if not binding: return False, "未知场景" valid_actions = set(binding.user_actions + binding.yizi_actions) for turn in turns: action = turn.get("body_language", "").strip() if action and action not in valid_actions: return False, f"动作与场景不符: {action}" speaker = turn["speaker"] utt = turn["utterance"] # 禁止AI词汇 forbidden = ["AI", "人工智能", "模型", "系统"] if any(f in utt for f in forbidden): return False, f"包含禁止词: {utt}" # 心理矛盾检测 thought = turn.get("inner_thought", "") if ("不在乎" in utt or "随便" in utt) and any(kw in thought for kw in ["在乎", "牵挂", "担心"]): return False, "话语与心理矛盾" if not self._check_emotion_progression(turns): return False, "情感未完成递进" return True, "有效" 生成parting时很快,但是生成撒娇时一直出现"情感未完成递进" def _check_emotion_progression(self, turns: List[Dict]) -> bool: """检查情感是否完成递进""" total = len(turns) if total < 4: return False start_end = max(2, total // 3) middle_start = start_end middle_end = max(middle_start + 1, 2 * total // 3) final_start = middle_end has_start = any( any(kw in turn.get("utterance", "") for kw in ["舍不得", "别走", "担心", "难过"]) for turn in turns[:start_end] ) has_middle = any( any(kw in turn.get("utterance", "") for kw in ["解释", "叮嘱", "记得", "照顾好"]) for turn in turns[middle_start:middle_end] ) has_final = any( any(kw in turn.get("utterance", "") for kw in ["等你回来", "会你", "约定", "回来"]) for turn in turns[final_start:] ) return has_start and has_middle and has_final
最新发布
12-01
【EI复现】基于深度强化学习的微能源网能量管理与优化策略研究(Python代码实现)内容概要:本文围绕“基于深度强化学习的微能源网能量管理与优化策略”展开研究,重点利用深度Q网络(DQN)等深度强化学习算法对微能源网中的能量调度进行建模与优化,旨在应对可再生能源出力波动、负荷变化及运行成本等问题。文中结合Python代码实现,构建了包含光伏、储能、负荷等元素的微能源网模型,通过强化学习智能体动态决策能量分配策略,实现经济性、稳定性和能效的多重优化目标,并可能与其他优化算法进行对比分析以验证有效性。研究属于电力系统与人工智能交叉领域,具有较强的工程应用背景和学术参考价值。; 适合人群:具备一定Python编程基础和机器学习基础知识,从事电力系统、能源互联网、智能优化等相关方向的研究生、科研人员及工程技术人员。; 使用场景及目标:①学习如何将深度强化学习应用于微能源网的能量管理;②掌握DQN等算法在实际能源系统调度中的建模与实现方法;③为相关课题研究或项目开发提供代码参考和技术思路。; 阅读建议:建议读者结合提供的Python代码进行实践操作,理解环境建模、状态空间、动作空间及奖励函数的设计逻辑,同时可扩展学习其他强化学习算法在能源系统中的应用。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值