ChatGpt是什么？

ChatGPT是由OpenAI训练的会话大规模语言模型，以会话方式进行交互。它属于与先前模型相同的级别模型指令，代表 “GPT 3.5” 生成。微软和OpenAI之前签署了战略合作计划，因此包括ChatGPT在内的GPT 3.5 generation的所有型号都在Azure AI supercomputing cluster上训练。

OpenAI使用了前面提到的RLHF技术来训练ChatGPT: 简而言之，在训练原始模型时，OpenAI要求人类训练师充当对话的双方 (用户vs聊天机器人)，并提供对话作为学习材料。当人类玩聊天机器人时，OpenAI也会让模型产生一些建议，帮助训练者写出自己的回应。

这些机器生成的答案，然后是培训师的评分排名，将更好的结果输入回模型，以实现强化学习培训的奖励机制。作为聊天机器人，ChatGPT具有当代同类产品的一些主流特征，尤其是多轮对话能力，可以在同一对话时段回答上下文相关的后续问题。

计算大模型GPT-3.5支持的通用聊天机器人原型ChatGPT可以回答一系列问题，承认自己的错误，质疑不正确的假设，甚至拒绝不合理的需求。

正当人们期待GPT-4的出现时，OpenAI低调推出了GPT-3.5。在GPT-3.5的祝福下，ChatGPT提高了他们在训练后像流一样回答问题的能力。GPT-3仅预测任何给定单词字符串之后的文本，而ChatGPT则尝试以更人性化的方式与用户进行交互。ChatGPT交互通常非常流畅，并且具有参与各种主题的能力。与几年前才问世的聊天机器人相比，它显示出巨大的进步。

OpenAI官员表示，ChatGPT是在人类的帮助下创建和培训的，人类培训师对早期版本的AI回答问题的方式进行了排名和评分。然后，这些信息被反馈到系统中，该系统根据培训师的喜好调整答案-一种标准的人工智能训练方法，称为强化学习。

ChatGPT还具有出色的能力来回答基本的，甚至有些无聊的琐碎问题。这让许多人相信，像这样的人工智能系统总有一天会取代搜索引擎。聊天机器人是根据从网络收集的信息进行培训的。因此，如果可以准确地呈现这些信息，并以更流畅，更对话的语气提供反馈，则将代表传统搜索的巨大进步。

本站链接：https://www.mianshi.online

_{^{声明 | 部分内容来源网络，仅供读者学习交流。文章版权归原作者所有。如有不妥，请联系删}}

本文链接：https://www.mianshi.online/1587.html