- 博客(21)
- 收藏
- 关注
原创 Large Language Models Are Implicitly Topic Models大语言模型是隐式主题模型论文解读
Large Language Models Are Implicitly Topic Models论文解读
2024-10-20 22:45:53
1139
原创 强化学习存在的问题
为了让RL做正确的事,奖励函数必须准确地与想要实现的功能相匹配。而设计一个可以让智能体学到想要的行为的奖励函数并不容易。有形的奖励通常更容易学习,因为即使智能体还没有学到可以完整解决问题的策略依旧会获得一些反馈。比如稀疏奖励只能目标状态下给予奖励,而在其他任何地方都没有奖励,类似于离散,智能体很可能找不到优化的方向。而有形的奖励类似于连续,智能体在任何地方都能较快的找到增加奖励的方向。不幸的是,丰厚的报酬可能会影响学习。
2024-08-23 20:51:59
1015
原创 VScode报错:ModuleNotFoundError: No module named ‘xxxx‘
PS D:\桌面\复杂网络> & C:/Users/2chen/AppData/Local/Microsoft/WindowsApps/python3.9.exe d:/桌面/大三/Python/example1.py。运行C:/Users/2chen/AppData/Local/Microsoft/WindowsApps/python3.9.exe -m pip install numpy。同理,networkx和matplotlib也可以这么安装。右键点击开始菜单,选择终端管理员。
2024-02-29 17:20:42
789
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人