- 博客(2)
- 收藏
- 关注
原创 强化学习Q-Learning、DQN和多智能体QMix算法
Q-learning 的更新公式为:其核心是通过时序差分误差(TD Error)逐步优化 Q 值函数,最终找到最优策略。Q-learning 是一种简单而强大的算法,适用于离散状态和动作空间的问题。
2025-03-20 11:27:44
536
原创 Win 11本地搭建部署RagFlow
基于Docker部署和Linux源码启动均可参考地址:https://github.com/infiniflow/ragflow/blob/main/README_zh.md。启动ragflow:运行api里面的ragflow_server.py,浏览器输入http://IP:9222。Github源码地址:https://github.com/infiniflow/ragflow。按照ragflow目录下docker里面的nginx配置本地nginx。
2024-07-27 13:42:18
5332
4
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人