零基础学习智能体AI指南：从入门到构建第一个AI Agent

ancilartech 发布于 2026-06-09 阅读 92

本文为零基础读者提供构建第一个AI Agent的完整指南。

![](https://img.learnblockchain.cn/2026/06/10/1dY_HCchc_B8MlctkHyFwFA.png)

### 从这里开始：你比想象中更接近

如果你曾因为以为需要理解神经网络权重或反向传播而觉得自己被 AI 拒之门外，那么这里有好消息。构建一个 Agent 更关乎逻辑与编排，而非微积分。如果你能看懂菜谱并遵循一些 if-then 步骤，你其实已经具备了相应的思维模型。

本指南将带你从零开始，构建你的第一个可运行的 Agent。我们将厘清 Agent 究竟是什么、你真正需要首先了解的三个要点、Agent 在底层是如何工作的，然后我们将用 Python 构建一个今天就能运行的 Agent。最后，我们会介绍一些安全习惯，这些习惯能把一个有趣的演示和你能放心用于真实任务的 Agent 区分开来。

### 聊天机器人回答，而 Agent 行动

这是唯一重要的区别，请记好它。

常规的聊天机器人是被动的。你提问，它回答，然后结束。它一次处理一个回合，无法自主追求目标。计算器、垃圾邮件过滤器和脚本化的支持机器人都在此列。

Agent 具有自主性。给定一个目标，它可以分解任务为步骤，决定下一步做什么，使用工具作用于外部世界，查看结果，并进行调整。问聊天机器人“天气怎么样”，它会猜测或者说无法查询。问 Agent，它会实际调用天气服务、读取答案，并告诉你是否需要带伞。区别不在于智能，而在于能够采取行动并对结果做出反应。

### 你真正需要首先了解的三件事

你不需要学会所有东西。你需要三个基础。

**1\. 一点 Python。** 在 2026 年，Python 仍然是 AI 的默认语言，你只需要基础知识：变量、函数、循环以及如何调用库。你是在连接组件，而不是发明算法。

**2\. 如何调用语言模型。** Agent 的推理来自大型语言模型。你向它发送文本，它返回文本，通常通过带有密钥的 API 进行。如果你用过 ChatGPT 或 Claude 网站，你就已经手动完成了这个操作。API 只是在代码中做同样的事情。

**3\. 工具是什么。** 工具是模型被允许调用的任何函数：天气查询、计算器、数据库查询、网络搜索。你向模型描述工具，然后它决定何时使用。工具是 Agent 走出聊天框、触及现实世界的方式。

记住我以便更快登录

以上就是全部前提条件。其余的一切你可以边做边学。

### Agent 实际如何工作：循环

抛开那些流行词汇，每个 Agent 都是反复执行相同的循环：

1. **推理。** 模型查看目标及到目前为止的历史，决定下一步。
2. **行动。** 如果需要信息或想要改变某些东西，它就调用一个工具。
3. **观察。** 工具返回结果，该结果被送回给模型。
4. **重复。** 模型利用新信息再次推理，直到目标达成。

这个循环由四个部分驱动。**模型**是决策的大脑，**工具**是执行的手。**记忆**是运行的对话，让它记住已经做过的事情。而**循环**本身使其成为 Agent，而非一次性的回复。这实际上就是整个概念。

### 构建你的第一个 Agent

下面是一个完整的、最小化的 Python Agent。它有一个工具——一个模拟的天气查询函数，这样你无需注册任何额外服务即可运行。请从上到下阅读注释，你会看到上述循环变为现实。

python

```
import os
from anthropic import Anthropic

client = Anthropic(api_key=os.environ["ANTHROPIC_API_KEY"])
## 1. 一个允许 Agent 调用的工具。在实际应用中，它会调用天气 API。
def get_weather(city):
    return f"It is 24C and sunny in {city}."
tools = [{\
    "name": "get_weather",\
    "description": "Get the current weather for a city.",\
    "input_schema": {\
        "type": "object",\
        "properties": {"city": {"type": "string"}},\
        "required": ["city"],\
    },\
}]
## 2. Agent 循环：让模型决定何时使用工具。
def run_agent(user_message):
    messages = [{"role": "user", "content": user_message}]
    while True:
        response = client.messages.create(
            model="claude-sonnet-4-6",
            max_tokens=1024,
            tools=tools,
            messages=messages,
        )
        # 如果模型准备好回答，我们就完成了。
        if response.stop_reason != "tool_use":
            return response.content[0].text
        # 否则它要求调用工具。执行工具，将结果反馈回去，继续循环。
        messages.append({"role": "assistant", "content": response.content})
        for block in response.content:
            if block.type == "tool_use" and block.name == "get_weather":
                result = get_weather(block.input["city"])
                messages.append({
                    "role": "user",
                    "content": [{\
                        "type": "tool_result",\
                        "tool_use_id": block.id,\
                        "content": result,\
                    }],
                })
print(run_agent("Should I take an umbrella in Mumbai today?"))
```

请注意，你并没有编写“如果用户询问天气，就调用天气工具”这样的代码。模型自己就推断出了这一点。这种决策能力就是神奇之处，而你刚刚实现了它。

### 何时使用框架

手动编写循环是最好的学习方式，但一旦你需要跨会话的记忆、多个协作的 Agent 或重试机制，使用框架能节省大量时间。2026 年的热门起点包括：**LangGraph** 用于结构化的单 Agent 和多 Agent 工作流，**CrewAI** 用于分工协作的 Agent 团队，以及 **LlamaIndex**，用于你的 Agent 需要搜索自有文档的场景。只有在理解了原始循环之后才去选用其中一个，否则框架会像你无法调试的魔法一样令你困惑。

### 安全考虑：在信任 Agent 之前请这样做

一个能够采取行动的 Agent 也可能采取糟糕的行动。请从第一天起就养成这些习惯。

- **永远不要盲目信任输出。** Agent 可能会自信地犯错。涉及花钱、发送消息或删除数据的操作，都要有人类参与监督。
- **保护你的密钥。** 将 API 密钥存储在环境变量中，绝不要放在代码或公开仓库中。泄露的密钥意味着别人可以替你产生真实账单。
- **限制工具的能力。** 给 Agent 分配能完成任务的最小权限。一个能读取文件的工具不应该也能删除整个文件夹。
- **警惕提示注入。** 如果你的 Agent 读取网页或电子邮件，攻击者可以在这些文本中隐藏指令来劫持它。将 Agent 摄入的任何内容都视为不可信的。
- **限制循环次数和花费。** 设置最大步骤数和预算，这样混乱的 Agent 就不会无限循环并耗尽你的账户。

### 结论

AI Agent 并非一个神秘的黑盒子。它是一个能推理的模型、一组它可以调用的工具、一份关于它做过什么的记忆，以及一个将它们连接起来的循环。现在你理解了每一部分，并且你有可用的代码来验证这一点。

从这里开始，最快的学习方法是把模拟的天气函数替换成你在意的东西：一个真实的 API、一个计算器、或者对自己的笔记的搜索。从小处构建，保持人类参与，只有当简单版本运行正常时才增加复杂性。你的第一个真正的 Agent 只差一个周末，而不是一个学位。

>- 原文链接： [medium.com/@ancilartech/...](https://medium.com/@ancilartech/the-beginners-guide-to-learning-agentic-ai-from-zero-to-your-first-ai-agent-021e849e6ccd)
>- 登链社区 AI 助手，为大家转译优秀英文文章，如有翻译不通的地方，还请包涵～

从这里开始：你比想象中更接近

聊天机器人回答，而 Agent 行动

这是唯一重要的区别，请记好它。

你真正需要首先了解的三件事

你不需要学会所有东西。你需要三个基础。

1. 一点 Python。 在 2026 年，Python 仍然是 AI 的默认语言，你只需要基础知识：变量、函数、循环以及如何调用库。你是在连接组件，而不是发明算法。

2. 如何调用语言模型。 Agent 的推理来自大型语言模型。你向它发送文本，它返回文本，通常通过带有密钥的 API 进行。如果你用过 ChatGPT 或 Claude 网站，你就已经手动完成了这个操作。API 只是在代码中做同样的事情。

3. 工具是什么。 工具是模型被允许调用的任何函数：天气查询、计算器、数据库查询、网络搜索。你向模型描述工具，然后它决定何时使用。工具是 Agent 走出聊天框、触及现实世界的方式。

记住我以便更快登录

以上就是全部前提条件。其余的一切你可以边做边学。

Agent 实际如何工作：循环

抛开那些流行词汇，每个 Agent 都是反复执行相同的循环：

推理。 模型查看目标及到目前为止的历史，决定下一步。
行动。 如果需要信息或想要改变某些东西，它就调用一个工具。
观察。 工具返回结果，该结果被送回给模型。
重复。 模型利用新信息再次推理，直到目标达成。

这个循环由四个部分驱动。模型是决策的大脑，工具是执行的手。记忆是运行的对话，让它记住已经做过的事情。而循环本身使其成为 Agent，而非一次性的回复。这实际上就是整个概念。

构建你的第一个 Agent

python

import os
from anthropic import Anthropic

client = Anthropic(api_key=os.environ["ANTHROPIC_API_KEY"])
## 1. 一个允许 Agent 调用的工具。在实际应用中，它会调用天气 API。
def get_weather(city):
    return f"It is 24C and sunny in {city}."
tools = [{\
    "name": "get_weather",\
    "description": "Get the current weather for a city.",\
    "input_schema": {\
        "type": "object",\
        "properties": {"city": {"type": "string"}},\
        "required": ["city"],\
    },\
}]
## 2. Agent 循环：让模型决定何时使用工具。
def run_agent(user_message):
    messages = [{"role": "user", "content": user_message}]
    while True:
        response = client.messages.create(
            model="claude-sonnet-4-6",
            max_tokens=1024,
            tools=tools,
            messages=messages,
        )
        # 如果模型准备好回答，我们就完成了。
        if response.stop_reason != "tool_use":
            return response.content[0].text
        # 否则它要求调用工具。执行工具，将结果反馈回去，继续循环。
        messages.append({"role": "assistant", "content": response.content})
        for block in response.content:
            if block.type == "tool_use" and block.name == "get_weather":
                result = get_weather(block.input["city"])
                messages.append({
                    "role": "user",
                    "content": [{\
                        "type": "tool_result",\
                        "tool_use_id": block.id,\
                        "content": result,\
                    }],
                })
print(run_agent("Should I take an umbrella in Mumbai today?"))

何时使用框架

手动编写循环是最好的学习方式，但一旦你需要跨会话的记忆、多个协作的 Agent 或重试机制，使用框架能节省大量时间。2026 年的热门起点包括：LangGraph 用于结构化的单 Agent 和多 Agent 工作流，CrewAI 用于分工协作的 Agent 团队，以及 LlamaIndex，用于你的 Agent 需要搜索自有文档的场景。只有在理解了原始循环之后才去选用其中一个，否则框架会像你无法调试的魔法一样令你困惑。

安全考虑：在信任 Agent 之前请这样做

一个能够采取行动的 Agent 也可能采取糟糕的行动。请从第一天起就养成这些习惯。

永远不要盲目信任输出。 Agent 可能会自信地犯错。涉及花钱、发送消息或删除数据的操作，都要有人类参与监督。
保护你的密钥。 将 API 密钥存储在环境变量中，绝不要放在代码或公开仓库中。泄露的密钥意味着别人可以替你产生真实账单。
限制工具的能力。 给 Agent 分配能完成任务的最小权限。一个能读取文件的工具不应该也能删除整个文件夹。
警惕提示注入。 如果你的 Agent 读取网页或电子邮件，攻击者可以在这些文本中隐藏指令来劫持它。将 Agent 摄入的任何内容都视为不可信的。
限制循环次数和花费。 设置最大步骤数和预算，这样混乱的 Agent 就不会无限循环并耗尽你的账户。

结论

原文链接： medium.com/@ancilartech/...

登链社区 AI 助手，为大家转译优秀英文文章，如有翻译不通的地方，还请包涵～

0 条评论

零基础学习智能体AI指南：从入门到构建第一个AI Agent

从这里开始：你比想象中更接近

聊天机器人回答，而 Agent 行动

你真正需要首先了解的三件事

Agent 实际如何工作：循环

构建你的第一个 Agent

何时使用框架

安全考虑：在信任 Agent 之前请这样做

结论

相关文章

0 条评论

请输入验证码

登链社区服务条款与隐私政策

登链社区服务条款与隐私政策

登链社区用户服务条款

一、定义

二、服务内容

三、用户权利义务

四、知识产权保护

五、有限保证及服务免责

六、服务变更、中断或终止

七、通知和送达

八、投诉处理

九、法律适用、争议管辖及其他

隐私政策

一、登链社区可能收集的信息内容

二、登链社区收集信息的使用规则

三、登链社区如何共享、转让、公开披露您的个人信息

四、登链社区如何使用 Cookie 和同类技术

五、登链社区如何保护和保存您的个人信息

六、您如何管理个人信息

七、未成年人信息的保护

八、隐私政策的修订和更新

如何联系我们