- 博客(1)
- 收藏
- 关注
原创 EasyR1 GRPO训练vlm模型尝试
注意:数据集在huggingface上存储为parquet格式,但是数据加载和处理的底层格式是arrow(arrow和parquet格式数据:https://blog.youkuaiyun.com/shizheng_Li/article/details/144132714)然而本地的.arrow格式数据集会报错,因此还是推送数据集到huggingface。最近要使用GRPO训一个vlm模型,听说easy R1是一个比较稳定的框架,尝试一下。官方链接:https://github.com/hiyouga/EasyR1。
2025-06-18 15:42:50
677
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅