当前位置: 首页 > news >正文

大模型强化学习教程

大模型强化学习教程

https://huggingface.co/docs/trl/dpo_trainer