什么是“思想算法”(AoT)?微软的类人人工智能训练方法

decrypt.co 2023-09-15 11:05:32

想获得一个免费的链上证书来炫耀你的人工智能知识吗?参加解密U的免费课程之一,开始使用AI、AI和音乐,以及AI做生意。

OpenAI的创始人微软于2023年8月20日与弗吉尼亚理工大学联合发表了一份白皮书,介绍了其开创性的“思想算法”(AoT)。正如论文所说,这种新的人工智能方法旨在使ChatGPT等大型语言模型以“类似于人类”的方式学习。

AoT旨在超越以往LLM教学方法。这篇论文大胆地宣称:“我们的研究结果表明,使用算法指导LLM可以使其性能超过算法本身。”

什么是ChatGPT?人工智能自然语言处理工具解读

这是否意味着算法使自己比…更聪明。。。它本身可以说,这就是人类思维的方式。这是人工智能的圣杯,从一开始就是如此。

人类认知

微软声称,AoT融合了“人类推理的细微差别和算法方法的精确性”

这听起来很大胆,但这种愿望本身并不是什么新鲜事。“机器学习”可以追溯到20世纪50年代,其先驱阿瑟·塞缪尔将其定义为“使计算机能够在没有特定编程的情况下进行学习的研究领域”。与传统的计算机编程不同,在传统的计算机程序中,程序员必须创建一个详细的指令列表,供计算机遵循,才能完成设定的任务。机器学习使用数据来训练计算机,训练其自己找到模式并解决问题。换句话说,以一种模糊地类似于人类认知的方式运作。OpenAI的ChatGPT使用了一种名为RLHF(来自人类反馈的强化学习)的机器学习,这使其具有与人类用户“对话”的来回性质。

OpenAI的聊天GPT变得更智能:以下是AI聊天机器人的最新消息

AoT甚至超越了这一点,声称要超越所谓的“思想链”(CoT)方法。

思路:AOT的目标是解决什么问题?

如果所有的发明都是为了解决现有的现状问题,那么人们可能会认为AoT是为了解决思想链方法的缺点而创建的。根据微软的说法,在COT中,LLM通过将提示或问题分解为“更简单的线性步骤来得出答案”来提出解决方案。虽然与标准提示相比,这是一个巨大的进步,只需要一个简单的步骤,但它也存在一些陷阱。

这是否意味着算法使自己比…更聪明。。。它本身

它有时会提出不正确的步骤来得出答案,因为它是基于先例得出结论的。基于给定数据集的先例仅限于数据集的范围。微软表示,这会导致“成本、内存和计算开销的增加”

OpenAI希望阻止AI幻觉和撒谎

AoT前往救援。该算法评估最初的步骤——“思想”,用一个通常只与人类相关的词——是否正确,从而避免了早期错误的“思想”滚雪球般发展成荒谬结果的情况。

微软将如何处理AOT?

尽管微软没有明确表示,但可以想象,如果AoT是它被破解的样子,它可能有助于缓解所谓的人工智能“幻觉”——一种有趣、令人担忧的现象,像ChatGPT这样的程序会吐出虚假信息。在一个更臭名昭著的例子中,2023年5月,一位名叫斯蒂芬·a·施瓦茨的律师承认,在为一份长达10页的简报进行研究时,他作为消息来源“咨询”了ChatGPT。问题是:这份简报将几项法院裁决称为法律先例。。。从未存在过。

OpenAI在其官方网站上的一篇帖子中表示:“缓解幻觉是建立一致AGI的关键一步。”。

本文来源于 decrypt.co

免责声明:
1. 本文版权归属原作所有,仅代表作者本人观点,不代表币推儿的观点或立场。
2. 如发现文章、图片等侵权行为,侵权责任将由作者本人承担。