为什么最新的大语言模型(如ChatGPT)都使用强化学习来做微调(finetuning)?

标签:#ChatGPT##RLHF##大语言模型##强化学习# 时间:2023/03/01 20:56:27 作者:小木

相关博客
最热博客