零基础学习智能体AI指南:从入门到构建第一个AI Agent

ancilartech 发布于 2026-06-09 阅读 92

本文为零基础读者提供构建第一个AI Agent的完整指南。

Image

从这里开始:你比想象中更接近

如果你曾因为以为需要理解神经网络权重或反向传播而觉得自己被 AI 拒之门外,那么这里有好消息。构建一个 Agent 更关乎逻辑与编排,而非微积分。如果你能看懂菜谱并遵循一些 if-then 步骤,你其实已经具备了相应的思维模型。

本指南将带你从零开始,构建你的第一个可运行的 Agent。我们将厘清 Agent 究竟是什么、你真正需要首先了解的三个要点、Agent 在底层是如何工作的,然后我们将用 Python 构建一个今天就能运行的 Agent。最后,我们会介绍一些安全习惯,这些习惯能把一个有趣的演示和你能放心用于真实任务的 Agent 区分开来。

聊天机器人回答,而 Agent 行动

这是唯一重要的区别,请记好它。

常规的聊天机器人是被动的。你提问,它回答,然后结束。它一次处理一个回合,无法自主追求目标。计算器、垃圾邮件过滤器和脚本化的支持机器人都在此列。

Agent 具有自主性。给定一个目标,它可以分解任务为步骤,决定下一步做什么,使用工具作用于外部世界,查看结果,并进行调整。问聊天机器人“天气怎么样”,它会猜测或者说无法查询。问 Agent,它会实际调用天气服务、读取答案,并告诉你是否需要带伞。区别不在于智能,而在于能够采取行动并对结果做出反应。

你真正需要首先了解的三件事

你不需要学会所有东西。你需要三个基础。

1. 一点 Python。 在 2026 年,Python 仍然是 AI 的默认语言,你只需要基础知识:变量、函数、循环以及如何调用库。你是在连接组件,而不是发明算法。

2. 如何调用语言模型。 Agent 的推理来自大型语言模型。你向它发送文本,它返回文本,通常通过带有密钥的 API 进行。如果你用过 ChatGPT 或 Claude 网站,你就已经手动完成了这个操作。API 只是在代码中做同样的事情。

3. 工具是什么。 工具是模型被允许调用的任何函数:天气查询、计算器、数据库查询、网络搜索。你向模型描述工具,然后它决定何时使用。工具是 Agent 走出聊天框、触及现实世界的方式。

记住我以便更快登录

以上就是全部前提条件。其余的一切你可以边做边学。

Agent 实际如何工作:循环

抛开那些流行词汇,每个 Agent 都是反复执行相同的循环:

  1. 推理。 模型查看目标及到目前为止的历史,决定下一步。
  2. 行动。 如果需要信息或想要改变某些东西,它就调用一个工具。
  3. 观察。 工具返回结果,该结果被送回给模型。
  4. 重复。 模型利用新信息再次推理,直到目标达成。

这个循环由四个部分驱动。模型是决策的大脑,工具是执行的手。记忆是运行的对话,让它记住已经做过的事情。而循环本身使其成为 Agent,而非一次性的回复。这实际上就是整个概念。

构建你的第一个 Agent

下面是一个完整的、最小化的 Python Agent。它有一个工具——一个模拟的天气查询函数,这样你无需注册任何额外服务即可运行。请从上到下阅读注释,你会看到上述循环变为现实。

python

import os
from anthropic import Anthropic

client = Anthropic(api_key=os.environ["ANTHROPIC_API_KEY"])
## 1. 一个允许 Agent 调用的工具。在实际应用中,它会调用天气 API。
def get_weather(city):
    return f"It is 24C and sunny in {city}."
tools = [{\
    "name": "get_weather",\
    "description": "Get the current weather for a city.",\
    "input_schema": {\
        "type": "object",\
        "properties": {"city": {"type": "string"}},\
        "required": ["city"],\
    },\
}]
## 2. Agent 循环:让模型决定何时使用工具。
def run_agent(user_message):
    messages = [{"role": "user", "content": user_message}]
    while True:
        response = client.messages.create(
            model="claude-sonnet-4-6",
            max_tokens=1024,
            tools=tools,
            messages=messages,
        )
        # 如果模型准备好回答,我们就完成了。
        if response.stop_reason != "tool_use":
            return response.content[0].text
        # 否则它要求调用工具。执行工具,将结果反馈回去,继续循环。
        messages.append({"role": "assistant", "content": response.content})
        for block in response.content:
            if block.type == "tool_use" and block.name == "get_weather":
                result = get_weather(block.input["city"])
                messages.append({
                    "role": "user",
                    "content": [{\
                        "type": "tool_result",\
                        "tool_use_id": block.id,\
                        "content": result,\
                    }],
                })
print(run_agent("Should I take an umbrella in Mumbai today?"))

请注意,你并没有编写“如果用户询问天气,就调用天气工具”这样的代码。模型自己就推断出了这一点。这种决策能力就是神奇之处,而你刚刚实现了它。

何时使用框架

手动编写循环是最好的学习方式,但一旦你需要跨会话的记忆、多个协作的 Agent 或重试机制,使用框架能节省大量时间。2026 年的热门起点包括:LangGraph 用于结构化的单 Agent 和多 Agent 工作流,CrewAI 用于分工协作的 Agent 团队,以及 LlamaIndex,用于你的 Agent 需要搜索自有文档的场景。只有在理解了原始循环之后才去选用其中一个,否则框架会像你无法调试的魔法一样令你困惑。

安全考虑:在信任 Agent 之前请这样做

一个能够采取行动的 Agent 也可能采取糟糕的行动。请从第一天起就养成这些习惯。

  • 永远不要盲目信任输出。 Agent 可能会自信地犯错。涉及花钱、发送消息或删除数据的操作,都要有人类参与监督。
  • 保护你的密钥。 将 API 密钥存储在环境变量中,绝不要放在代码或公开仓库中。泄露的密钥意味着别人可以替你产生真实账单。
  • 限制工具的能力。 给 Agent 分配能完成任务的最小权限。一个能读取文件的工具不应该也能删除整个文件夹。
  • 警惕提示注入。 如果你的 Agent 读取网页或电子邮件,攻击者可以在这些文本中隐藏指令来劫持它。将 Agent 摄入的任何内容都视为不可信的。
  • 限制循环次数和花费。 设置最大步骤数和预算,这样混乱的 Agent 就不会无限循环并耗尽你的账户。

结论

AI Agent 并非一个神秘的黑盒子。它是一个能推理的模型、一组它可以调用的工具、一份关于它做过什么的记忆,以及一个将它们连接起来的循环。现在你理解了每一部分,并且你有可用的代码来验证这一点。

从这里开始,最快的学习方法是把模拟的天气函数替换成你在意的东西:一个真实的 API、一个计算器、或者对自己的笔记的搜索。从小处构建,保持人类参与,只有当简单版本运行正常时才增加复杂性。你的第一个真正的 Agent 只差一个周末,而不是一个学位。

  • 原文链接: medium.com/@ancilartech/...
  • 登链社区 AI 助手,为大家转译优秀英文文章,如有翻译不通的地方,还请包涵~

相关文章

0 条评论