AI Agent（智能体）简介

本文概述了智能体（AI Agents）的核心概念，即具备自主感知、决策与执行的闭环系统。通过对比AI、模型等概念，引入OpenAI五级量表划分发展层级：当前主流产品（如ChatGPT）处于1-2级对话阶段，第3级执行者智能体进入实验期。系统架构涵盖单一智能体（LLM+工具）及多智能体方案，以及AI Agent的应用场景覆盖服务业、医疗等多领域举例。

╭⌒若隐_RowYet——大数据

907人浏览 · 2025-12-21 00:00:48

╭⌒若隐_RowYet——大数据 · 2025-12-21 00:00:48 发布

1. 什么是智能体

智能体（AI Agents或Agents）是指能够自主感知环境、做出决策并执行行动的系统或程序。

IBM：智能体是“能够通过设计其工作流和利用可用工具，代表用户或其他系统自主执行任务的系统或程序。

Google：In it’s most fundamental form, a Generative AI agent can be defined as an application that attempts to achieve a goal by observing the world and acting upon it using the tools that it has at its disposal.

谷歌：从最基本的层面来看，生成式人工智能代理可以被定义为这样一种应用程序：它通过观察周围环境并利用自身所拥有的工具来采取行动，从而试图达成某个目标。

2. 智能体界的明星

产品	公司	智能体产品
Deep Research	openai	https://openai.com/index/introducing-deep-research/
Manus	manus	https://manus.im/
扣子（Coze）空间	字节跳动	https://www.coze.cn/

3. AI&模型&大模型&智能体的区别

AI：人工智能（Artificial Intelligence，AI）是计算机科学的一个分支学科。
模型：传统的模型，是通过从数据中学习规律沉淀出一个模型，再利用该模型实现特定的功能，如预测模型（分类、回归），生成模型（文本、图像生成）等模型，本身是无实体的工具，且不具有自主性。
大模型：模型中的特殊形态，首先要满足参数规模巨大（达到百亿、千亿甚至万亿）的显著特征，其次对人类（语言）指令有很强的遵循、理解能力，从而完成复杂的任务和推理。
智能体：智能体式够感知环境、自主决策并执行行动以实现特定目标的系统或程序，能够形成完整的“感知-决策-行动”闭环。

4. 智能体的发展阶段

OpenAI根据自身技术研发与产品开发提出了通往AGI的五级量表，将AI Agent分为五个阶段，每个阶段代表更高级的能力水平：

级别	名称与定义	典型代表 / 现状分析
第1级	对话式AI (Chatbots) 能够进行类似人类的对话，帮助完成基础的写作、编程等任务。	当前已全面实现。例如：ChatGPT、Claude、Gemini、文心一言等主流大语言模型均属于此列。
第2级	人类水平的推理者 (Reasoners) 具备与博士水平人类相媲美的基础推理能力，能独立解决复杂的学术或技术问题。	处于突破前夜，部分能力已显现。前沿模型（如GPT-4o、Claude 3.5 Sonnet、o1-preview）已在数学、代码、科学推理中展现出初级推理能力，但稳定性、深度和通用性仍未完全达到稳定的人类博士水平。这是当前竞争的焦点。
第3级	执行者 (Agents) 能在数天内主动规划并执行复杂任务，例如独立完成一个完整的研究项目。	处于早期实验阶段。以AI智能体（如GPTs、Claude Projects、国内各平台Agent）为代表，它们能自动执行多步骤任务，但自主性、可靠性和任务时长与定义仍有巨大差距。
第4级	创新者 (Innovators) 能够进行原创性的、对人类而言也是新的发现和创新，相当于顶级科研合作者。	尚未实现。当前AI的所有“创新”本质上仍是对人类已有知识的重组和延伸，不具备真正意义上的原创科学发现能力。
第5级	组织者 (Organizers) 能替代一个人类组织（如公司）的绝大部分职能，自主完成目标管理、协作和执行。	属于科幻范畴。这远超出当前技术框架，涉及通用人工智能的终极形态。

图4.1 AGI的五级量表

5. 智能体的应用

各行各业都可以通过AI-Agent得到重塑，如：

服务业：智能客服、个性化推荐系统……
医疗行业：医学影像辅助和诊断、药物研发和临床试验优化……
销售行业：智能营销Agent
……

6. 智能体架构

单一智能体：
- LLM（Large Language Model 大模型）必选；
- Tools 必选；
多智能体：
- 低代码平台：FastGPT、Dify、Coze etc.
- 代码实现：建议Python代码，因为AI生态较完整，Python的LangChian、LangGraph框架，LangSmith（Event-Tracking，类似埋点最终，企业版本license收费，可以用开源的替代品如Langfuse等代替）为主；代码实现也有以Google为代表的Google ADK（Agent Development Kit），考虑到现状Google生态在国内的尴尬，ADK并不足与发挥他的最大威力，如一键部署Google Cloud Run，调用Google的Gemini等。
智能体的调用：
- Python
- Node（Http）

图6.1 AI Agent 通用架构图

以上就是AI Agent（智能体）的简单介绍，下期一起聊聊基于代码实战、基于低代码平台、基于AI编码工具的QuickStart（快速实现）。

松山湖开发者村综合服务平台

助力广东及东莞地区开发者，代码托管、在线学习与竞赛、技术交流与分享、资源共享、职业发展，成为松山湖开发者首选的工作与学习平台

更多推荐

【2025最新高维多目标优化】基于城市场景下无人机三维路径规划的导航变量的多目标粒子群优化算法NMOPSO研究（Matlab代码实现）

随着无人机应用场景的复杂化，城市场景下的三维路径规划需同时优化路径长度、飞行时间、威胁规避、能耗等多个相互冲突的目标。传统单目标优化算法难以平衡多目标需求，而基于导航变量的多目标粒子群优化算法（NMOPSO）通过引入导航变量引导粒子搜索方向，结合多目标优化框架，在保持种群多样性的同时提升收敛速度，为无人机三维路径规划提供了高效解决方案。本文系统阐述NMOPSO算法的原理、在三维路径规划中的建模与实