ppo
Topic | Replies | Views | Activity | |
---|---|---|---|---|
使用 PPO 算法进行 RLHF 的 N 步实现细节 |
![]() |
0 | 1022 | November 16, 2023 |
Topic | Replies | Views | Activity | |
---|---|---|---|---|
使用 PPO 算法进行 RLHF 的 N 步实现细节 |
![]() |
0 | 1022 | November 16, 2023 |