DataLearner 标志DataLearnerAI
最新AI资讯
大模型评测
大模型列表
大模型对比
资源中心
AI工具导航

加载中...

DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
  1. 首页/
  2. 博客列表/
  3. 博客详情

OpenAI发布最新最强大的AI对话系统——GPT3.5微调的产物ChatGPT

2022/12/01 22:24:17
8,387 阅读
GPTOpenAI

今天,OpenAI公布了最新的一个基于AI的对话系统ChatGPT。根据官方介绍,ChatGPT以对话方式进行交互。对话格式使ChatGPT能够回答后续问题、承认错误、质疑不正确的前提和拒绝不适当的请求。ChatGPT是InstructGPT的兄弟模型,它被训练为在提示中遵循指令并提供详细的响应。

OpenAI开放了一个在线演示的系统(地址:https://chat.openai.com/auth/login ) ,不过由于访问人数太多,现在已经无法使用。

根据网友使用反馈,大家只有一个感觉,Google完蛋了。下图是几个例子。

  • 一、直接根据描述给出latex公式结果
  • 二、解释冒泡排序最坏时间复杂度
  • 三、根据描述编程
  • 四、代码的review和解决问题
  • 五、自动修复bug

一、直接根据描述给出latex公式结果

有人问如何使用latex表示微分结果,下图一个是谷歌一个是ChatGPT:

而ChatGPT的结果直接给出来了。

二、解释冒泡排序最坏时间复杂度

下图是直接让ChatGPT给出冒泡排序的最坏时间复杂度,需要一步一步解释:

三、根据描述编程

问如何使用Tailwind建立3列的页脚结果:

四、代码的review和解决问题

一个人写了一段buffer溢出代码,给出了运行错误,问为什么,ChatGPT也能给出解释。

五、自动修复bug

直接问下面代码的bug是啥

除了上述描述的内容,还可以根据需求设计装潢(给出装潢结果图)、解释AWS的IAM策略、采访关于债务可持续性、写一篇关于如何使用matplotlib画图的博客、写计算机网络的作业。

这个ChatGPT实在是太吓人了。官方介绍如下:

我们使用来自人类反馈的强化学习(RLHF)来训练这个模型,使用与InstructionGPT相同的方法,但数据收集设置略有不同。我们使用有监督的微调训练了一个初始模型:人工智能训练师提供对话,他们扮演用户和人工智能助手的双方角色。我们让培训师获得模型书面建议,以帮助他们撰写回复。

为了创建强化学习的奖励模型,我们需要收集比较数据,其中包括两个或多个按质量排序的模型响应。为了收集这些数据,我们进行了AI培训师与聊天机器人的对话。我们随机选择了一个模型撰写的消息,抽样了几个备选的完成,并让AI培训师对其进行排名。使用这些奖励模型,我们可以使用近端策略优化对模型进行微调。我们对这个过程进行了多次迭代。

ChatGPT是从GPT-3.5系列中的一个模型进行微调的,该系列于2022年初完成了培训。您可以在这里了解有关3.5系列的更多信息。ChatGPT和GPT 3.5在Azure AI超级计算基础设施上进行了培训。

官方介绍地址:https://openai.com/blog/chatgpt/

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码
返回博客列表

相关博客

  • OpenAI发布GPT-5:这是一个包含实时路由的AI系统,而不仅仅是一个模型
  • OpenAI内部通用大模型已经可以拿到国际数学奥利匹克竞赛金牌:AI推理能力已经接近人类顶级水平
  • 【辟谣,该数据是预测】重磅!疑似GPT-5评测结果泄露,超过当前所有模型评分,人类最后难题得分56.6,比当前最好模型还要高27%,大幅超过Gemini 2.5 Pro,Grok 4 Heavy等
  • OpenAI发布最强大模型OpenAI o3-pro:业界评价该模型解决复杂问题效果很好,但是回复一句“Hi”也需要三分钟
  • AI盛世如你所愿!昨天2个最新的开源“GPT”模型发布!
  • GPT-4来了!微软德国CTO透露GPT-4将是多模态模型,并于下周发布!
  • 最强AI对话系统ChatGPT不完全使用指南——已发掘功能展览!
  • OpenAI发布Frontier:一个企业级的Agent构建平台,把 AI 变成企业里的“数字同事”,那么OpenAI Frontier能做什么?

热门博客

  • 1Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)
  • 2回归模型中的交互项简介(Interactions in Regression)
  • 3贝塔分布(Beta Distribution)简介及其应用
  • 4矩母函数简介(Moment-generating function)
  • 5普通最小二乘法(Ordinary Least Squares,OLS)的详细推导过程
  • 6使用R语言进行K-means聚类并分析结果
  • 7深度学习技巧之Early Stopping(早停法)
  • 8手把手教你本地部署清华大学的ChatGLM-6B模型——Windows+6GB显卡本地部署