什么是“思想算法”（AoT）？微软的类人人工智能训练方法

想获得一个免费的链上证书来炫耀你的人工智能知识吗？参加解密U的免费课程之一，开始使用AI、AI和音乐，以及AI做生意。

OpenAI的创始人微软于2023年8月20日与弗吉尼亚理工大学联合发表了一份白皮书，介绍了其开创性的“思想算法”（AoT）。正如论文所说，这种新的人工智能方法旨在使ChatGPT等大型语言模型以“类似于人类”的方式学习。

AoT旨在超越以往LLM教学方法。这篇论文大胆地宣称：“我们的研究结果表明，使用算法指导LLM可以使其性能超过算法本身。”

什么是ChatGPT？人工智能自然语言处理工具解读

这是否意味着算法使自己比…更聪明。。。它本身可以说，这就是人类思维的方式。这是人工智能的圣杯，从一开始就是如此。

人类认知

微软声称，AoT融合了“人类推理的细微差别和算法方法的精确性”

这听起来很大胆，但这种愿望本身并不是什么新鲜事。“机器学习”可以追溯到20世纪50年代，其先驱阿瑟·塞缪尔将其定义为“使计算机能够在没有特定编程的情况下进行学习的研究领域”。与传统的计算机编程不同，在传统的计算机程序中，程序员必须创建一个详细的指令列表，供计算机遵循，才能完成设定的任务。机器学习使用数据来训练计算机，训练其自己找到模式并解决问题。换句话说，以一种模糊地类似于人类认知的方式运作。OpenAI的ChatGPT使用了一种名为RLHF（来自人类反馈的强化学习）的机器学习，这使其具有与人类用户“对话”的来回性质。

OpenAI的聊天GPT变得更智能：以下是AI聊天机器人的最新消息

AoT甚至超越了这一点，声称要超越所谓的“思想链”（CoT）方法。

思路：AOT的目标是解决什么问题？

如果所有的发明都是为了解决现有的现状问题，那么人们可能会认为AoT是为了解决思想链方法的缺点而创建的。根据微软的说法，在COT中，LLM通过将提示或问题分解为“更简单的线性步骤来得出答案”来提出解决方案。虽然与标准提示相比，这是一个巨大的进步，只需要一个简单的步骤，但它也存在一些陷阱。

这是否意味着算法使自己比…更聪明。。。它本身

它有时会提出不正确的步骤来得出答案，因为它是基于先例得出结论的。基于给定数据集的先例仅限于数据集的范围。微软表示，这会导致“成本、内存和计算开销的增加”

OpenAI希望阻止AI幻觉和撒谎

AoT前往救援。该算法评估最初的步骤——“思想”，用一个通常只与人类相关的词——是否正确，从而避免了早期错误的“思想”滚雪球般发展成荒谬结果的情况。

微软将如何处理AOT？

尽管微软没有明确表示，但可以想象，如果AoT是它被破解的样子，它可能有助于缓解所谓的人工智能“幻觉”——一种有趣、令人担忧的现象，像ChatGPT这样的程序会吐出虚假信息。在一个更臭名昭著的例子中，2023年5月，一位名叫斯蒂芬·a·施瓦茨的律师承认，在为一份长达10页的简报进行研究时，他作为消息来源“咨询”了ChatGPT。问题是：这份简报将几项法院裁决称为法律先例。。。从未存在过。

OpenAI在其官方网站上的一篇帖子中表示：“缓解幻觉是建立一致AGI的关键一步。”。