trl
| 话题 | 回复 | 浏览量 | 活动 | |
|---|---|---|---|---|
| 为视觉语言多模态模型进行偏好优化 | 
              
                 | 
          0 | 216 | 2024 年7 月 17 日 | 
| 使用 DDPO 在 TRL 中微调 Stable Diffusion 模型 | 
              
                 | 
          0 | 529 | 2023 年10 月 23 日 | 
| 话题 | 回复 | 浏览量 | 活动 | |
|---|---|---|---|---|
| 为视觉语言多模态模型进行偏好优化 | 
              
                 | 
          0 | 216 | 2024 年7 月 17 日 | 
| 使用 DDPO 在 TRL 中微调 Stable Diffusion 模型 | 
              
                 | 
          0 | 529 | 2023 年10 月 23 日 |