AI应用

什么是 AI 智能体

2025-02-15 2 0

简介 人工智能 (AI) 智能体是指能够通过设计其工作流和利用可用工具,代表用户或其他系统自主执行任务的系统或程序。 AI 智能体可以包含自然语言处理之外的广泛功能,包括决策、解决问题、与外部环境交互和执行操作。

人工智能 (AI) 智能体是指能够通过设计其工作流和利用可用工具,代表用户或其他系统自主执行任务的系统或程序。

AI 智能体可以包含自然语言处理之外的广泛功能,包括决策、解决问题、与外部环境交互和执行操作。

这些 AI 智能体可以部署在各种应用程序中,以解决各种企业环境中的复杂任务,从软件设计和 IT 自动化到代码生成工具和对话助手。它们使用大型语言模型 (LLM) 的先进自然语言处理技术,逐步理解和响应用户输入,并确定何时调用外部工具。

What are AI Agents?
What are AI Agents? (12:28 min)
指南
如何选择合适的 AI 基础模型
使用此模型选择框架选择最合适的模型,同时平衡性能要求与成本、风险和部署需求。

相关内容
使用 watsonx 在 Python 中创建 LangChain AI 智能体
什么是多智能体系统?
AI 智能体的工作原理
AI 智能体的核心是大型语言模型 (LLM)。因此,AI 智能体通常被称为 LLM 智能体。传统的 LLM(例如 IBM® Granite 模型)根据用于训练它们的数据产生响应,并且受知识和推理限制。相比之下,AI 智能体技术通过调用后台工具来获取最新信息、优化工作流并自主创建子任务,从而实现复杂的目标。

在此过程中,自主智能体会随着时间的推移而学着适应用户的期望。此智能体可将过去的交互存储在记忆中并计划未来的行动,从而提供个性化的体验和全面的响应。1此工具调用可在没有人工干预的情况下实现,并可拓宽这些 AI 系统在现实环境下的应用可能性。AI 智能体为实现用户所设目标而采取的方法包括以下三个阶段:

目标初始化和规划
虽然 AI 智能体的决策流程为自主流程,但它们需要由人工确定的目标和环境。2影响自主智能体行为的主要因素共有三个:

设计和训练智能体 AI 系统的开发团队。
部署 AI 智能体并为用户提供访问权限的团队。
为 AI 智能体提供要完成的具体目标并建立要使用的可用工具的用户。
考虑到用户的目标和智能体的可用工具,AI 智能体随后会执行任务分解以提高性能。3本质上,智能体会创建一个包含特定任务和子任务的计划来实现复杂的目标。

对于简单任务,规划不是必要步骤。相反,智能体可以迭代地反映其响应并改进它们,而无需规划其后续步骤。

使用可用工具进行推理
AI 智能体会根据它们感知到的信息来采取行动。通常,AI 智能体并不具备解决复杂目标内所有子任务所需的完整知识库。为解决此问题,AI 智能体会使用自己的可用工具。这些工具可能包括外部数据集、Web 搜索、API 甚至是其他智能体。从这些工具检索到缺失的信息后,智能体便可更新其知识库。这意味着,智能体在其中每一步均会重新评估其行动计划并自我更正。

为了帮助说明这一过程,请想象一个用户正在计划自己的假期。用户要求 AI 智能体预测明年哪一周的天气最适合他们在希腊的冲浪之旅。由于作为智能体核心的 LLM 模型并不专注于天气模式,因此智能体从外部数据库中收集信息,该数据库包含希腊过去几年的每日天气报告。

尽管可获得这些新信息,但智能体依然无法确定冲浪的最佳天气条件,因此会创建了下一子任务。对于该子任务,智能体会与专门负责冲浪的外部智能体进行通信。假设在此过程中,智能体了解到涨潮、阳光明媚的天气外加几乎无雨的情况下可提供最佳冲浪条件。

智能体现在可以组合从其工具中学到的信息来识别模式。它可以预测明年希腊的哪一周可能会有涨潮、晴天和下雨的可能性低。然后将这些发现呈现给用户。工具之间的这种信息共享使 AI 智能体比传统的 AI 模型更具通用性。3

学习与反思
AI 智能体会使用其他 AI 智能体和“人在回路”(HITL) 等反馈机制来提高其响应的准确性。为强调这一点,让我们回到之前的冲浪示例。在智能体对用户形成响应之后,智能体会将学习到的信息与用户的反馈一同存储,以便提高性能并根据用户对未来目标的偏好进行相应调整。

如果使用了其他智能体来实现此目标,则也可能会使用他们的反馈。多智能体反馈在最大限度缩短人类用户提供指导所花费的时间方面特别有用。但是,用户也可在整个智能体的动作和内部推理过程中提供反馈,以使结果与预期目标更趋一致。2

反馈机制提高了 AI 智能体的推理能力和准确性,这通常被称为迭代改进。3为了避免重复同样的错误,AI 智能体还可以在知识库中存储有关先前障碍解决方案的数据。

AI 智能体与非 AI 智能体聊天机器人
AI 智能聊天机器人使用会话式 AI 技术(如自然语言处理 (NLP))技术来理解用户问题并自动回复。这些聊天机器人是一种模式,而智能体则是一种技术框架。

非智能体 AI 聊天机器人缺少可用的工具、记忆和推理能力。它们只能实现短期目标,且无法提前规划。据我们所知,非智能体聊天机器人需要用户持续输入信息才能进行响应。它们可对常见提示做出响应,而这些提示很可能符合用户的期望,但在仅针对该用户及其数据的问题方面表现不佳。由于这些聊天机器人没有记忆,因此当它们的回复无法令人满意时也无法从错误中吸取教训。

相比之下,智能体 AI 聊天机器人会随着时间的推移学着适应用户期望,以便提供更为个性化的体验和全面的响应。它们可通过创建无需人工干预的子任务并考虑不同的计划来完成复杂的任务。这些计划也可按需进行自我更正和更新。与非智能体聊天机器人不同,智能体 AI 聊天机器人会评估它们的工具,并使用自身的可用资源来填补信息空白。

推理范式
没有一种用于构建 AI 智能体的标准架构。存在几种解决多步骤问题的范式。

ReAct(推理与行动)

通过这种范式,我们可以指示 AI 智能体在采取每次行动和每个工具响应后进行“思考”和计划,以决定下一步使用哪个工具。通过这些”思考-行动-观察”循环,逐步解决问题,并不断改进应对措施。

通过提示结构,可以指示智能体缓慢推理并显示每个“想法”。4通过智能体的语言推理,我们可以了解如何做出反应。在这个框架中,智能体会根据新的推理不断更新其上下文。这可以被解读为一种思路链提示的形式。

ReWOO(无观察推理)

与 ReAct 不同,ReWOO 方法消除了行动规划对工具输出的依赖。相反,智能体会提前制定计划。在收到用户的初始提示后,可预测使用哪些工具,从而避免重复使用工具。从以人为本的角度来看,这是可取的,因为用户可以在执行计划之前确认计划。

ReWOO 工作流由三个模块组成。在计划模块中,智能体根据用户的提示预测其后续步骤。下一阶段需要收集通过调用这些工具生成的输出。最后,智能体将初始计划与工具输出配对以制定应对措施。这种提前的计划可以大大降低令牌的使用和计算的复杂性以及中间工具故障的影响。5

AI 智能体的类型
AI 智能体可开发出不同程度的能力。对于简易目标,可能会将简易智能体作为首选,以限制不必要的计算复杂性。按照从最简单到最先进的顺序进行排序,共有 5 大 AI 智能体类型:

  1. 简单反射 AI 智能体
    简单反射智能体是最简单的智能体形式,它会根据当前感知来制定行动。如果缺少信息,此智能体则不会保存任何记忆,也不会与其他智能体交互。此类智能体会根据一组所谓的反射或规则来工作。这意味着,此智能体会经过预编程以便执行与满足的特定条件相对应的动过。

如果智能体遇到未做好相应准备的情况,它便无法做出适当的响应。仅当在完全可观察的环境中,此类智能体才能有效地获取所有必要的信息。6

举例说明:每晚在设定时间打开供暖系统的自动调温器。例如,这里的条件操作规则是,如果现在是晚上 8 点,则启动供暖。

简单的反射智能体图
简单的反射智能体图

  1. 基于模型的反射 AI 智能体
    基于模型的反射智能体利用其当前的感知和记忆来维护世界的内部模型。随着智能体继续收到新信息,模型也会更新。智能体的行为取决于其模型、反射、先前的感知和当前的状态。

这些智能体与简单的反射智能体不同,可以将信息存储在内存中,并可以在部分可观察和变化的环境中使用。然而,它们仍然受到其规则的限制。6

示例:吸尘器机器人。在清扫脏乱的房间时,它会感知到家具等障碍物并进行调整。机器人还存储了已清洁区域的模型,以避免陷入重复清洁的循环中。

基于模型的反射智能体图
基于模型的反射智能体图

  1. 基于目标的 AI 智能体
    基于目标的智能体具有内部世界模型,以及一个或一组目标。此类智能体会搜索达到其目标的行动序列,并在采取行动之前对这些行动进行规划。与简单智能体和基于模型的反射智能体相比,此搜索与规划能力可提高其有效性。7

示例:导航系统会推荐到达目的地的最快路线。该模型考虑了到达您的目的地(或者换句话说,您的目标)的各种路线。在此示例中,智能体的条件操作规则规定,如果找到更快的路由,智能体会推荐该路由。

基于目标的智能体图
基于目标的智能体图

  1. 基于效用的 AI 智能体
    基于效用的智能体会选择旨在达到目标而需完成的行动顺序,并最大限度地提高效用或奖励。效用是使用效用函数来计算的。此函数会根据一组固定标准为每个场景分配一个效用值;即,用于衡量动作的有用性或它可让智能体达到的“满意”程度的指标。

此标准可包括实现目标的进度、时间要求或计算复杂性等因素。然后,智能体会选择能使预期效用最大化的行动。因此,当多个场景能实现期望目标且必须选择最佳场景时,此类智能体将非常有用。7

例如:导航系统可为您推荐前往目的地的路线,以优化燃油效率,最大限度地减少交通时间和过路费用。该智能体通过这组标准来衡量效用,以选择最有利的路线。

基于效用的智能体的示意图
基于效用的智能体的示意图

  1. 学习 AI 智能体
    学习智能体具有与其他智能体类型相同的功能,但其学习能力是独一无二的。新的体验被添加到他们最初的知识库中,这是自主发生的。这种学习增强了智能体在不熟悉的环境中使用的能力。学习智能体的推理可能基于效用或目标,并由四个主要元素组成:7

学习:它是指通过环境中的规则和传感器进行学习,从而提高智能体的知识水平。
批评者:它向智能体提供反馈,说明其回复质量是否符合性能标准。
执行:该要素负责在学习后选择行动。
问题生成器:这为应采取的行动提出了各种建议。
示例:电子商务网站上的个性化推荐。这些智能体在其记忆中跟踪用户活动和偏好。这些信息用于向用户推荐某些产品和服务。每次提出新的建议,都会重复这样的循环。用户的活动会被持续存储以供学习目的。这样,智能体就能不断提高其准确性。

学习智能体图
学习智能体图

AI 智能体的用例
客户体验
可以将 AI 智能体集成到网站和 应用程序中, 通过充当虚拟助理、提供心理健康支持、模拟面试和其他相关任务,提升客户体验。8 有许多无代码模板可供用户实施,使创建这些人工智能智能体的过程变得更加简单。

医疗保健
AI 智能体可用于各种实际的医疗保健应用。在此类情况下,多智能体系统对于解决问题特别有用。从急诊科患者的治疗计划到药物流程的管理,此类系统可为医疗专业人员节省时间和精力,以便他们能完成更紧急的任务。9

应急响应
当发生自然灾害时,AI 智能体可以使用深度学习算法来检索社交媒体网站上需要救援的用户信息。可以绘制这些用户的位置图,以协助救援服务在更短的时间内拯救更多的人。因此,AI 智能体在日常任务和拯救生命的情况下都可以极大地造福人类生活。10

AI 智能体的优点
任务自动化

随着生成式 AI 的不断进步,人们对使用 AI 或智能自动化来优化工作流程的兴趣变得日益浓厚。AI 智能体是一种 AI 工具,它们可自动执行原本需借助人力资源来完成的复杂任务。如此一来,便可经济、快速且大规模地实现目标。反过来,这些进步意味着人类智能体无需为 AI 助手提供创建和浏览其任务所需的指导。

更高的性能

多智能体框架往往优于单个智能体。11 这是因为智能体可用的行动计划越多,学习和反思就越多。一个 AI 智能体如果能从其他相关领域的专业 AI 智能体那里获得知识和反馈,对信息合成非常有用。AI 智能体的这种 后端 协作和填补信息空白的能力是智能体框架所独有的,这使它们成为人工智能的强大工具和有意义的进步。

响应质量

较之传统 AI 模型,AI 智能体可为用户提供更全面、更准确和个性化的响应。作为用户,此特性对我们来说极其重要,因为更高质量的响应通常会带来更好的客户体验。如前所述,这是通过与其他智能体交换信息、使用外部工具和更新其记忆流来实现的。这些行为会自行出现,而非预先设定。12

风险和限制
多智能体依赖关系

某些复杂任务需要了解多个 AI 智能体程序的知识。在实施这些多智能体框架时,有可能出现故障。建立在相同基础模型上的多智能体系统可能会遇到共同的缺陷。这些薄弱环节可能导致所有相关智能体的全系统瘫痪,或暴露出易受不利攻击的弱点。13这凸显了数据治理在构建基础模型以及全面的培训和测试流程方面的重要性。

无限反馈回路

人类用户使用 AI 智能体的不干涉推理的便利性也伴随着其风险。无法制定全面计划或反思其发现的智能体可能会发现自己反复调用相同的工具,从而调用无限的反馈循环。为避免这些冗余,可采用某种程度的实时人工监控。13

计算复杂性

从头开始构建 AI 智能体既十分耗时,还可能非常昂贵。训练一个高性能智能体所需的资源可能非常之多。此外,根据任务的复杂程度,智能体可能需要几天时间才能完成任务。

点赞 0

文章评论

已关闭评论

阿文博客

人生的价值,并不是用时间,而是用深度量去衡量的。——列夫·托尔斯泰

23 文章 71 浏览 2 评论

站点信息

  • 建站时间:2020-10-01
  • 更新时间:2021-03-09
  • 网站程序:ruoyi-plus
  • 主题模板《今夕何夕》
  • 文章统计23篇文章
  • 标签总数8
  • 加我微信:扫码,加我微信