为什么最新的大语言模型(如ChatGPT)都使用强化学习来做微调(finetuning)?

标签:#ChatGPT##RLHF##大语言模型##强化学习# 时间:2023/03/01 20:56:27 作者:小木

欢迎大家关注DataLearner官方微信,接受最新的AI技术推送