微信公众号:路人zhang
扫码关注微信公众号

回复“面试手册”,获取本站PDF版

回复“简历”,获取高质量简历模板

回复“加群”,加入程序员交流群

回复“电子书”,获取程序员类电子书

ChatGPT是由OpenAI训练的会话大规模语言模型,以会话方式进行交互。它属于与先前模型相同的级别模型指令,代表 “GPT 3.5” 生成。微软和OpenAI之前签署了战略合作计划,因此包括ChatGPT在内的GPT 3.5 generation的所有型号都在Azure AI supercomputing cluster上训练。

OpenAI使用了前面提到的RLHF技术来训练ChatGPT: 简而言之,在训练原始模型时,OpenAI要求人类训练师充当对话的双方 (用户vs聊天机器人),并提供对话作为学习材料。当人类玩聊天机器人时,OpenAI也会让模型产生一些建议,帮助训练者写出自己的回应。

这些机器生成的答案,然后是培训师的评分排名,将更好的结果输入回模型,以实现强化学习培训的奖励机制。作为聊天机器人,ChatGPT具有当代同类产品的一些主流特征,尤其是多轮对话能力,可以在同一对话时段回答上下文相关的后续问题。

计算大模型GPT-3.5支持的通用聊天机器人原型ChatGPT可以回答一系列问题,承认自己的错误,质疑不正确的假设,甚至拒绝不合理的需求。

正当人们期待GPT-4的出现时,OpenAI低调推出了GPT-3.5。在GPT-3.5的祝福下,ChatGPT提高了他们在训练后像流一样回答问题的能力。GPT-3仅预测任何给定单词字符串之后的文本,而ChatGPT则尝试以更人性化的方式与用户进行交互。ChatGPT交互通常非常流畅,并且具有参与各种主题的能力。与几年前才问世的聊天机器人相比,它显示出巨大的进步。

OpenAI官员表示,ChatGPT是在人类的帮助下创建和培训的,人类培训师对早期版本的AI回答问题的方式进行了排名和评分。然后,这些信息被反馈到系统中,该系统根据培训师的喜好调整答案-一种标准的人工智能训练方法,称为强化学习。

ChatGPT还具有出色的能力来回答基本的,甚至有些无聊的琐碎问题。这让许多人相信,像这样的人工智能系统总有一天会取代搜索引擎。聊天机器人是根据从网络收集的信息进行培训的。因此,如果可以准确地呈现这些信息,并以更流畅,更对话的语气提供反馈,则将代表传统搜索的巨大进步。

本站链接:https://www.mianshi.online


声明 | 部分内容来源网络,仅供读者学习交流。文章版权归原作者所有。 如有不妥,请联系删

本文链接:https://www.mianshi.online/1587.html