Windows系统AI Agent搭建步骤详解(零基础)

前言:一个普通Windows用户的AI Agent折腾史

说出来不怕你笑话,三个月前我还以为”AI Agent”是某个游戏里的NPC。直到有一天,我看到一个视频:一个人对着电脑说”帮我整理这周的邮件,把重要的标出来,不重要的归档”,然后电脑真的自己打开了邮箱、读邮件、分类、归档。整个过程没人写一行代码。

我当时就愣住了。这不就是我每天重复做的那些破事吗?

于是我开始折腾。踩了无数坑,重装了两次系统,花了不少冤枉钱买API额度,终于跑通了一个能用的AI Agent。这篇文章就是我把这三个月踩的坑、攒的经验,完完整整地告诉你。

你不需要懂编程,不需要买Mac,不需要租服务器。一台普通Windows电脑就够了。

一、先搞清楚AI Agent到底是什么

别急着动手,先花2分钟搞清楚概念,能省你2个小时。

ChatGPT你用过吧?你问它问题,它回答你。问完就完了,它不记得你上次说了什么(除非在同一个对话里),也不会主动帮你干活。这就是”对话式AI”。

AI Agent不一样。你可以把它理解成一个”会使用工具的AI”。它不只是回答你的问题,它会:

  • 自主规划:你说”帮我写一篇关于Python的博客”,它自己拆成”搜索资料 -> 列大纲 -> 写初稿 -> 润色”这几步
  • 使用工具:它能打开浏览器搜索、读写文件、执行代码、调用API
  • 循环迭代:写完初稿不满意,它会自己改,改到你满意为止
  • 记忆能力:它能记住你的偏好,下次用的时候不用重新交代

打个比方:ChatGPT是个聪明的顾问,你问它答;AI Agent是个实习生,你交代任务,它自己想办法完成。

二、准备工作:你需要的东西

在开始之前,先确认你的环境和需要准备的东西:

项目 要求 说明
操作系统 Windows 10/11 64位,建议1809版本以上
内存 至少8GB 16GB更舒服,Agent跑起来吃内存
硬盘 剩余20GB以上 模型文件和依赖包不小
网络 能访问外网 大部分AI服务需要联网
API Key OpenAI或其他 这是”燃料”,后面会讲怎么弄

关于API Key,多说两句。AI Agent的”大脑”是大语言模型,目前最方便的是用OpenAI的GPT-4o。你需要一个OpenAI账号,充5-10美元就够用很久了。如果你不想花钱,文章后面我也会讲免费方案。

三、方案选择:三条路,选一条

在Windows上跑AI Agent,主要有三条路:

方案一:用现成平台(最简单)

Dify、Coze、FastGPT这些平台,提供了可视化的Agent搭建界面。你拖拖拽拽,配置一下,就能跑起来。适合完全不想写代码的人。

优点:零代码、可视化、社区资源丰富
缺点:灵活性有限、高级功能要付费

方案二:用Python + LangChain(推荐)

这是目前最主流的方案。LangChain是专门用来构建AI Agent的Python框架,生态最成熟,教程最多。

优点:灵活、强大、免费开源
缺点:需要一点点Python基础(真的只要一点点)

方案三:用Node.js + AI SDK

如果你更熟悉JavaScript,可以用Vercel的AI SDK。不过生态不如LangChain成熟。

我推荐方案二。跟着做就行,我保证你30分钟内能跑起来。

四、手把手:用Python + LangChain搭建你的第一个Agent

第1步:安装Python

打开浏览器,访问 python.org/downloads,下载Python 3.11或3.12。

重要:安装时勾选”Add Python to PATH”。这一步忘了后面会很麻烦。我当年就忘了,折腾了半小时。

安装完成后,按 Win + R,输入 cmd,回车打开命令行,输入:

python --version

如果显示 Python 3.11.x 或类似版本号,说明安装成功。

第2步:创建项目文件夹

在D盘创建一个文件夹,比如 D:\\\\my-agent。然后在命令行中进入这个文件夹:

D:cd D:\\\\my-agent

第3步:创建虚拟环境

虚拟环境是个好东西,简单说就是给每个项目一个独立的Python环境,互不干扰。

python -m venv venv

然后激活虚拟环境:

.\\\\venv\\\\Scripts\\\\activate

如果看到命令行前面出现了 (venv),说明激活成功。

第4步:安装依赖包

pip install langchain langchain-openai python-dotenv

这个过程可能需要1-2分钟,取决于你的网速。

第5步:配置API Key

D:\\\\my-agent 文件夹里新建一个文件,命名为 .env(注意前面有个点),内容如下:

OPENAI_API_KEY=你的API Key

把”你的API Key”替换成你从OpenAI获取的真实Key。如果你还没有,去 platform.openai.com/api-keys 创建一个。

安全提醒:这个文件里是你的密钥,千万不要上传到GitHub或发给别人。

第6步:写你的第一个Agent

D:\\\\my-agent 文件夹里新建一个文件 agent.py,内容如下:

import osfrom dotenv import load_dotenvfrom langchain_openai import ChatOpenAIfrom langchain.agents import create_tool_calling_agent, AgentExecutorfrom langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholderfrom langchain_community.tools import DuckDuckGoSearchRun# 加载环境变量load_dotenv()# 初始化大模型llm = ChatOpenAI(    model="gpt-4o-mini",  # 用mini版本就够了,便宜    temperature=0.7,    api_key=os.getenv("OPENAI_API_KEY"))# 定义工具:网络搜索search_tool = DuckDuckGoSearchRun()# 创建提示词模板prompt = ChatPromptTemplate.from_messages([    ("system", "你是一个有用的AI助手。当需要获取最新信息时,请使用搜索工具。请用中文回答。"),    MessagesPlaceholder(variable_name="chat_history", optional=True),    ("human", "{input}"),    MessagesPlaceholder(variable_name="agent_scratchpad"),])# 创建Agentagent = create_tool_calling_agent(    llm=llm,    tools=[search_tool],    prompt=prompt)agent_executor = AgentExecutor(    agent=agent,    tools=[search_tool],    verbose=True  # 设为True可以看到Agent的思考过程)# 运行Agentif __name__ == "__main__":    print("=== 你的第一个AI Agent ===")    print("输入 'quit' 退出\\")    while True:        user_input = input("你: ")        if user_input.lower() == 'quit':            break        result = agent_executor.invoke({"input": user_input})        print(f"\\Agent: {result['output']}\\")

第7步:运行!

在命令行中输入:

python agent.py

如果一切正常,你会看到提示符。试试输入:

帮我搜索一下今天有什么AI方面的重要新闻

Agent会自动调用搜索工具,获取最新信息,然后给你一个总结。

看到这一幕的时候,我真的起了一身鸡皮疙瘩。不是因为技术多厉害,而是因为——这东西真的在”思考”。它会先判断”这个问题需要搜索”,然后调用搜索工具,然后整理结果。整个过程是自动的。

五、给Agent装上更多”手脚”

上面的Agent只有一个搜索工具,能力有限。下面给它装上更多工具。

文件读写工具

from langchain.tools import toolimport os@tooldef read_file(file_path: str) -> str:    """读取指定文件的内容"""    try:        with open(file_path, 'r', encoding='utf-8') as f:            return f.read()    except Exception as e:        return f"读取文件失败: {str(e)}"@tooldef write_file(file_path: str, content: str) -> str:    """将内容写入指定文件"""    try:        with open(file_path, 'w', encoding='utf-8') as f:            f.write(content)        return f"文件已写入: {file_path}"    except Exception as e:        return f"写入文件失败: {str(e)}"@tooldef list_files(directory: str) -> str:    """列出指定目录下的所有文件"""    try:        files = os.listdir(directory)        return "\\".join(files)    except Exception as e:        return f"列出文件失败: {str(e)}"

代码执行工具

from langchain_experimental.tools import PythonREPLToolpython_repl = PythonREPLTool()

安装这个工具需要额外装一个包:

pip install langchain-experimental

然后把这些工具加到Agent里:

agent = create_tool_calling_agent(    llm=llm,    tools=[search_tool, read_file, write_file, list_files, python_repl],    prompt=prompt)

现在你的Agent能搜索、能读写文件、能执行Python代码了。试试对它说:”帮我创建一个Excel文件,里面包含1到100的平方数”。它会自己写Python代码、执行、生成文件。

六、免费方案:不想花钱怎么办

我知道很多人看到”OpenAI API Key”就头大了。确实,虽然不贵,但毕竟要绑信用卡。下面说几个免费方案。

方案一:用Ollama跑本地模型

Ollama是一个让你在本地运行大模型的工具。下载安装后,一行命令就能跑起来:

ollama run qwen2.5:14b

Qwen2.5是阿里开源的模型,14B参数的版本效果不错,中文能力很强。在你的电脑上跑,完全免费。

然后在LangChain中把模型换成Ollama:

from langchain_community.chat_models import ChatOllamallm = ChatOllama(    model="qwen2.5:14b",    temperature=0.7)

不过说实话,本地模型的效果跟GPT-4还是有差距的。如果你的电脑显卡不是RTX 3060以上,推理速度也会比较慢。

方案二:用免费的在线API

国内有一些免费的AI API可以用:

  • 硅基流动(SiliconFlow):注册送额度,Qwen、DeepSeek等模型都能用
  • DeepSeek API:价格极低,几百万token才几块钱
  • 智谱AI:注册送免费额度,GLM-4效果不错

这些都可以通过修改base_url在LangChain中使用:

llm = ChatOpenAI(    model="deepseek-chat",    base_url="https://api.deepseek.com/v1",    api_key="你的DeepSeek Key")

七、常见问题排查

折腾过程中你肯定会遇到问题,这里列几个最常见的:

问题1:pip install 报错

可能是网络问题。换国内镜像源:

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple langchain

问题2:API Key无效

检查.env文件里的Key有没有多余的空格。Key应该以 sk- 开头。

问题3:ModuleNotFoundError

确认你激活了虚拟环境(命令行前面有 (venv))。如果没有,重新执行 .\\\\venv\\\\Scripts\\\\activate

问题4:中文乱码

在文件开头加上:

# -*- coding: utf-8 -*-

或者在Windows命令行中先执行:

chcp 65001

八、下一步学什么

跑通上面的例子,你已经入门了。接下来可以往这几个方向深入:

  • RAG(检索增强生成):让Agent能读取你自己的文档,回答基于你私有知识的问题。比如把公司所有文档喂给Agent,让它当你的知识库助手
  • 多Agent协作:让多个Agent分工合作,一个负责搜索,一个负责写作,一个负责审核
  • 自动化工作流:用Dify或n8n搭建自动化的Agent流程,比如每天自动收集行业新闻、生成摘要、发到微信群

这些内容我后面会单独写文章讲。如果你等不及,可以去看看我写的 LangChain搭建AI Agent详细步骤多智能体联动搭建教程

说实话,AI Agent这个领域变化太快了。我三个月前学的东西,有些现在已经过时了。但核心思路不会变:大模型 + 工具 + 自主规划 = Agent。掌握了这个公式,不管框架怎么变,你都能快速上手。

动手试试吧。遇到问题很正常,我当初也是一路报错一路查过来的。跑通第一个Agent的那一刻,你会觉得一切都值了。

数据游牧民
数据游牧民

不写代码的数据分析师,全靠Agent处理Excel和SQL