ChatGPT技术原理解析:从RL之PPO算法、RLHF到GPT4、instructGPT

sockstack / 182 / 2023-11-09 13:02:11


ChatGPT技术原理解析:从RL之PPO算法、RLHF到GPT4、instructGPT
作者
sockstack
许可协议
CC BY 4.0
发布于
2023-11-09
修改于
2024-09-16