ChatGPT 中的人类反馈强化学习 (RLHF) 实战

sockstack / 113 / 2024-02-28 13:02:38


ChatGPT 中的人类反馈强化学习 (RLHF) 实战
作者
sockstack
许可协议
CC BY 4.0
发布于
2024-02-28
修改于
2024-09-16