#rlhf

标签为 #rlhf 内容如下：

首页 Tag Archives: rlhf

Karpathy观点惹争议：RLHF不是真正的强化学习，谷歌、Meta下场反对

Karpathy观点惹争议：RLHF不是真正的强化学习，谷歌、Meta下场反对

老板不要肥肉

2年前 19

首届大模型顶会COLM 高分论文：偏好搜索算法PairS，让大模型进行文本评估更高效

首届大模型顶会COLM 高分论文：偏好搜索算法PairS，让大模型进行文本评估更高效

老板不要肥肉

2年前 27