基于大语言模型（LLM）的智能体（Agent）构建指南

Agent

发布日期: 2024-10-03

更新日期: 2025-04-01

文章字数: 791

阅读时长: 3 分

LLM Agent架构图

图1：LLM Agent核心架构示意图

# 一、LLM Agent 技术解析

# 1.1 什么是智能体（Agent）？

在人工智能领域，智能体（Agent）是指能够感知环境并自主采取行动实现目标的智能系统。具有主观能动性，实现从 “计划”，“组织”，“执行”，“学习” 等过程直至完成一个任务。

Agent：大模型驱动的自主智能体。Agent 具有以下核心特征：

Agent = 大模型 + 工具插件 + 执行流程 / 思维链
图1：Agent的组成

Automatic：全流程自动，无需人工干预的独立决策能力，这也是 Agent 和 Workflow（需要人工干预）最大的区别
Reflection：自我反思
Tool Use：工具调用
Planning：规划设计
Memory：记忆

# 1.2 大语言模型在 Agent 中的角色

现代 LLM Agent 通常采用三层架构：

class LLMAgent:
    def __init__(self, llm, tools):
        self.llm = llm  # 大语言模型核心
        self.memory = VectorStore()  # 向量记忆库
        self.tools = {tool.name: tool for tool in tools}  # 工具集

    def run(self, query):
        plan = self._generate_plan(query)
        while not plan.complete():
            action = plan.next_step()
            if action.type == "TOOL_USE":
                result = self.tools[action.tool].execute(action.params)
                self.memory.store(result)
            elif action.type == "LLM_CALL":
                response = self.llm.generate(
                    prompt=action.prompt,
                    memory=self.memory.search(action.context)
                )
                plan.update(response)
        return plan.final_output()

# 1.2 关键技术组件

规划模块：基于 Chain-of-Thought 的推理机制
记忆系统：向量数据库 + 时序记忆的混合架构
工具集成：通过 API 调用实现现实世界交互

图2：Agent的典型工作流程

# 二、实践：构建会议安排 Agent

# 2.1 环境准备

使用 LangChain 框架和 OpenAI API：

pip install langchain openai python-dotenv

然后进行 .env 文件配置

OPENAI_API_KEY="your-api-key"

# 2.2 核心代码实现

from langchain.agents import AgentExecutor, create_openai_tools_agent
from langchain_core.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI

# 自定义工具定义
class CalendarTool:
    name = "calendar_access"
    description = "访问用户日历数据"

    def execute(self, params):
        # 实现日历访问逻辑
        return available_slots

# 构建Agent
llm = ChatOpenAI(model="gpt-4-turbo")
tools = [CalendarTool()]
prompt = ChatPromptTemplate.from_messages([
    ("system", "你是专业会议助手，当前时间：{current_time}"),
    ("user", "{input}")
])

agent = create_openai_tools_agent(llm, tools, prompt)
agent_executor = AgentExecutor(agent=agent, tools=tools)

# 执行示例
result = agent_executor.invoke({
    "input": "安排下周团队会议",
    "current_time": "2024-05-15 14:00"
})
print(result["output"])

# 2.3 功能扩展

添加邮件通知功能：

class EmailTool:
    name = "send_email"
    description = "发送会议通知邮件"
    
    def execute(self, params):
        # 实现邮件发送逻辑
        return f"邮件已发送至{params['recipients']}"

tools.append(EmailTool())

# 三、进阶优化策略

# 3.1 记忆优化

使用 Chroma 向量数据库实现长期记忆：

from langchain_community.vectorstores import Chroma
from langchain_openai import OpenAIEmbeddings

class EnhancedMemory:
    def __init__(self):
        self.vectorstore = Chroma(embedding_function=OpenAIEmbeddings())
        self.buffer = []
    
    def store(self, record):
        self.vectorstore.add_texts([record["content"]])
        self.buffer.append(record)
    
    def retrieve(self, query):
        return self.vectorstore.similarity_search(query)

# 3.2 多 Agent 协同

集成本地和云端模型：

class HybridLLM:
    def __init__(self):
        self.cloud = ChatOpenAI()
        self.local = Ollama(model="llama3")
    
    def generate(self, prompt):
        cloud_res = self.cloud.invoke(prompt)
        local_res = self.local.generate(prompt)
        return self._blend_responses(cloud_res, local_res)