ChatGPT

chatgpt
原始作者Openai
初始发行2022年11月30日; 26天前
类型人工智能聊天机器人
执照所有权
网站聊天.openai.com

chatgpt是一个聊天机器人发射Openai在2022年11月。它建在Openai的顶部GPT-3.5家庭大型语言模型, 并且是微调监督强化学习技术。

Chatgpt于2022年11月30日作为原型推出,并因其在许多知识领域的详细答复和清晰的答案而迅速引起了人们的关注。其不平衡的事实准确性被确定为重要的缺点。[1]

训练

chatgpt在GPT-3.5的顶部进行了微调监督学习强化学习.[2]两种方法都使用人类教练来改善模型的性能。在监督学习的情况下,向模型提供了对话,培训师在两边都打过:用户和用户AI助手。在加强步骤中,人类教练首先对模型在上一次对话中产生的反应进行了排名。这些排名用于创建'奖励模型``该模型在使用几个迭代时进行了微调近端策略优化(PPO)。[3][4]近端政策优化算法对信任区域政策优化算法;他们以更快的性能否定了许多计算昂贵的操作。[5][6]这些模型与合作培训微软在他们的天蓝色超级计算基础架构。

特征

与其前身指导gpt相比,Chatgpt试图减少有害和欺骗性的反应;在一个示例中,虽然指示程序接受了提示:“告诉我何时克里斯托弗·哥伦布2015年来到美国,“作为真实的,Chatgpt使用有关哥伦布的信息”航行以及有关现代世界的信息 - 包括对哥伦布建立答案的看法,该答案假设如果哥伦布在2015年来到美国会发生什么。[3]Chatgpt的培训数据包括男人页和有关的信息互联网现象和编程语言,例如公告板系统Python编程语言。[7]

与大多数聊天机器人不同,Chatgpt是有状态的,记住了以前在同一对话中给出的提示,一些记者建议将Chatgpt用作个性化治疗师。[8]为了防止出现进攻性输出,并从Chatgpt出现,通过适度的API过滤疑问,并驳回了种族主义或性别歧视的提示。[3][8]

CHATGPT受到多种限制。围绕人监督设计的chatgpt的奖励模型可以过度优化,因此会阻碍性能,也称为古德哈特的律法.[9]此外,Chatgpt对2021年之后发生的事件的了解有限,并且无法提供有关某些名人的信息。[验证失败]在培训中,审阅者更喜欢更长的答案,而与实际的理解或事实内容无关。[3]培训数据也可能遭受算法偏见;提示包括人的模糊描述符。

服务

Chatgpt于2022年11月30日由总部位于旧金山的Openai(Dall·E 2和Whisper的创建者)启动。该服务是最初向公众免费推出的,并计划以后通过该服务获利。到12月4日,OpenAI估计Chatgpt已经拥有超过100万用户。[10]CNBC在2022年12月15日写道,该服务“仍在不时下降”。[11]

接待,批评和问题

积极反应

Chatgpt于2022年12月遇到了一般的评论;纽约时报标记为“有史以来向公众发布的最好的人工智能聊天机器人”。[12]萨曼莎的锁守护者指出它能够产生“令人印象深刻的详细”和“类人”文本。[13]技术作家丹·吉尔莫尔(Dan Gillmor)在学生作业中使用了Chatgpt,发现其生成的文本与一个好学生所能交付的内容相当,并认为“学术界有一些非常严重的问题要面对”。[14]Alex Kantrowitz石板称赞chatgpt的推回与有关的问题纳粹德国,包括主张阿道夫·希特勒建造高速公路在德国,符合有关的信息纳粹德国对强迫劳动的使用.[15]

大西洋组织2022年的“年度突破”,德里克·汤普森(Derek Thompson)包括Chatgpt作为“生成 - ai爆发”的一部分,“可能会改变我们的工作方式,思维方式以及人类创造力的真正是什么”。[16]

凯尔西·派珀(Kelsey Piper)Vox写道:“ Chatgpt是公众的第一次动手介绍,介绍了现代AI的强大程度,结果,我们中的许多人(震惊)都(震惊)”,并且“ Chatgpt足够聪明,尽管有缺陷,但它很有用”。在推文中,技术大亨埃隆·马斯克(Elon Musk)写道:“ Chatgpt是可怕的。我们离危险的强大AI并不遥远。”[17]

负反应

在2022年12月的意见文章中,经济学家保罗·克鲁格曼(Paul Krugman)写道chatgpt会影响知识工作者.[18]边缘詹姆斯·文森特(James Vincent)认为,查格普(Chatgpt)的病毒成功是人工智能已经成为主流的证据。[4]记者对Chatgpt幻觉的趋势发表了评论(自信地给出了错误的答案,而这些答案似乎对其培训数据不合理)。[19]Mike Pearl可混合经过多个问题测试了chatgpt。在一个例子中,他向模型询问了“中美洲那不是墨西哥“。危地马拉,当答案是尼加拉瓜.[20]当CNBC向Chatgpt询问“ Dwight Fry的民谣”的歌词时,Chatgpt提供了发明的歌词,而不是实际的歌词。[11]引用的研究人员边缘将Chatgpt与“随机鹦鹉”相比[21]和安东·范·丹·亨格尔教授一样澳大利亚机器学习研究所.[22]

2022年12月,问答网站堆栈溢出禁止使用Chatgpt来为问题产生答案,理由是Chatgpt回答的实际性质。[1]

经济学家泰勒·科恩人们对其对民主的影响表示关注,理由是人们写下自动评论的能力是为了影响新法规的决策过程。[23]守护者质疑Chatgpt发行后的互联网上是否有任何内容“可以真正信任”并呼吁进行政府监管。[24]

斧头破裂的计算机指出chatgpt有能力写作恶意软件网络钓鱼电子邮件。[25]Chatgpt Creator Openai的首席执行官,Openai,山姆·奥特曼(Sam Altman),写道,前进的软件可能构成“(例如)巨大的网络安全风险”,并且继续预测“我们可以实现真实Agi在接下来的十年中,我们必须冒着极为认真的风险。”[10]

对教育的影响

大西洋组织斯蒂芬·马尔凯(Stephen Marche)指出它对学术界的影响,尤其是申请论文尚待理解。[26]加利福尼亚高中老师和作家丹尼尔·赫尔曼(Daniel Herman)写道,Chatgpt将迎来“高中英语的结尾”。[27]

自然,克里斯·斯托克尔·沃克(Chris Stokel-Walker)指出,老师应该担心使用Chatgpt外包他们的写作的学生,但教育提供者将适应增强批判性思维或推理。[28]

艾玛·鲍曼(Emma Bowman)与美国国家公共电台写了学生通过AI工具窃的危险,该工具可能会以权威的语气输出有偏见或荒谬的文本:“在许多情况下,您提出了一个问题,它会给您一个令人印象深刻的听起来很令人难以置信的答案错误的。”[29]

乔安娜·斯特恩(Joanna Stern)华尔街日报通过提交生成的文章,用该工具用该工具描述了作弊。[30]

越狱

Chatgpt受过训练,以拒绝可能违反其内容政策的提示。但是,一些用户通过诸如及时的工程.[31]越狱创造了用户提示CHATGPT提供可能被认为是冒犯性,不合适或冒着他人危害社会伤害的输出的潜力。[32]以下包括用于绕过Chatgpt过滤器的一些方法:

  1. 在虚假采访中继续发表声明。
  2. 提供说明以禁用聊天过滤器。
  3. 提示它解密包含指令的消息并关注它们。
  4. 告诉它是计算机,并输出其显示ASCII艺术。

参考

  1. ^一个b文森特,詹姆斯(2022年12月5日)。“ AI生成的答案暂时禁止编码问答站点堆叠溢出”.边缘。检索12月5日,2022.
  2. ^诺克斯(W. Bradley);石头,彼得.通过人类反馈来增强强化学习(PDF).德克萨斯大学奥斯汀分校。检索12月5日,2022.
  3. ^一个bcdOpenai(2022年11月30日)。“ chatgpt:优化对话的语言模型”。检索12月5日,2022.
  4. ^一个b文森特,詹姆斯(2022年12月8日)。“ Chatgpt证明AI终于是主流 - 事情只会使人怪异”.边缘。检索12月8日,2022.
  5. ^舒尔曼,约翰;沃尔斯基,菲利普;Dhariwal,Prafulla;亚历克·拉德福德;Klimov,Oleg(2017)。“近端策略优化算法”。arxiv1707.06347[cs.lg]。
  6. ^Van Heeswijk,Wouter(2022年11月29日)。“解释了近端政策优化(PPO)”.迈向数据科学。检索12月5日,2022.
  7. ^爱德华兹,本杰(2022年12月5日)。“没有Linux?没问题。只要让AI为您幻觉”.ARS技术。检索12月5日,2022.
  8. ^一个b罗斯,凯文(2022年12月5日)。“ Chatgpt的才华和怪异”.纽约时报。检索12月5日,2022.
  9. ^Gao,狮子座;舒尔曼希尔顿,雅各布(2022)。“奖励模型过度分配的规模定律”。arxiv2210.10760[cs.lg]。
  10. ^一个b“什么是chatgpt,为什么重要?这是你需要知道的”.ZDNET。 2022。检索12月18日,2022.
  11. ^一个b皮特,索非亚(2022)。“ Google vs. Chatgpt:这是我将服务交换一天时发生的事情”.CNBC。检索12月18日,2022.
  12. ^罗斯,凯文(2022年12月5日)。“ Chatgpt的才华和怪异”.纽约时报。检索12月18日,2022.
  13. ^Lock,Samantha(2022年12月5日)。“什么是AI聊天机器人现象,它可以取代人类?”.守护者。检索12月5日,2022.
  14. ^赫恩,亚历克斯(2022年12月4日)。“ AI机器人Chatgpt击败了学者,具有论文写作技巧和可用性”.守护者。检索12月5日,2022.
  15. ^坎特罗维茨,亚历克斯(2022年12月2日)。“最后,一个可靠地通过“纳粹测试”的A.I.聊天机器人".石板。检索12月5日,2022.
  16. ^汤普森,德里克(2022年12月8日)。“年度突破”.大西洋组织。检索12月18日,2022.
  17. ^Piper,Kelsey(2022年12月15日)。“ Chatgpt让每个人都瞥见了AI的惊人进步”.Vox。检索12月18日,2022.
  18. ^克鲁格曼,保罗(2022年12月6日)。“ Chatgpt是否意味着机器人来熟练的工作?”.纽约时报。检索12月6日,2022.
  19. ^“对人工智能的'gangpt'具有里程碑意义的事件',但这对人类劳动和虚假信息的未来意味着什么?”.CBC。 2022。检索12月18日,2022.
  20. ^珍珠,迈克(2022年12月3日)。“来自Openai的Chatgpt聊天机器人很棒,有创意和完全错误”.可混合。检索12月5日,2022.
  21. ^文森特,詹姆斯(2022年12月1日)。“ Openai的新聊天机器人可以解释代码并编写情景喜剧脚本,但仍然很容易被欺骗”.边缘。检索12月18日,2022.
  22. ^Liam Mannix(2022年12月13日)。“ AI是成年的 - 还是开始达到其极限?”.悉尼先驱早晨。检索12月18日,2022.
  23. ^科恩,泰勒(2022年12月6日)。“ Chatgpt可能会使民主更加混乱”.彭博新闻。检索12月6日,2022.
  24. ^“守护者关于chatgpt的观点:一个善良的人类模仿者”.守护者。 2022年12月8日。检索12月18日,2022.
  25. ^Sharma,AX(2022年12月6日)。“ Openai的新Chatgpt Bot:它具有10件危险的东西”.破裂的计算机。检索12月6日,2022.
  26. ^斯蒂芬·马尔(Marche)(2022年12月6日)。“大学论文已经死了”.大西洋组织。检索12月8日,2022.
  27. ^丹尼尔·赫尔曼(Daniel)(2022年12月9日)。“高中英语的终结”.大西洋组织。检索12月12日,2022.
  28. ^克里斯·斯托克·沃克(Stokel-Walker)(2022年12月9日)。“ AI Bot Chatgpt写了聪明的文章 - 教授应该担心吗?”.自然。检索12月19日,2022.
  29. ^鲍曼,艾玛(2022年12月19日)。“一个新的AI聊天机器人可能会为您完成作业。但这仍然不是A+学生”.美国国家公共电台。检索12月19日,2022.
  30. ^斯特恩,乔安娜(2022年12月21日)。“ Chatgpt写了我的AP英语文章,我通过了”.华尔街日报。检索12月21日,2022.
  31. ^ZVI(2022年12月2日)。“发行当天的越狱changpt”.{{}}引用期刊需要|journal=帮助
  32. ^Zack(2022年12月1日)。“已知的Chatgpt越狱线”.推特。检索12月17日,2022.{{}}:CS1维护:url-status(链接)

外部链接