PocketFlow：100行代码的极简LLM框架，让AI应用开发回归优雅-代码号

Name: PocketFlow
Author: 原创

PocketFlow

用户：原创发布日期：2026-03-08 已有人查阅

PocketFlow 是一个极简主义的开源 LLM（大型语言模型）框架，核心代码仅约100行。它通过“节点”和“流”的图结构抽象，让开发者能够以极低的门槛和零外部依赖，快速构建从简单的聊天机器人到复杂的多智能体协作、RAG（检索增强生成）工作流等各类AI应用。它为“人-AI协同设计”而生，让开发者甚至AI助手都能轻松理解并构建维护复杂的AI系统。

在大型语言模型应用开发框架日益臃肿的当下，PocketFlow 反道而行之，追求极致的精简与透明。它的核心理念是，构建复杂的AI应用并不需要一个庞大且充满依赖的“黑盒”框架，只需要一组精炼而强大的核心抽象。

PocketFlow 的核心是一个基于图结构的执行引擎。它将任何复杂的任务分解为两个基本元素：

节点：是执行单一、原子任务的单元，拥有明确的prep（准备）、exec（执行）和post（处理）生命周期，确保了代码的模块化和可测试性。
流：负责编排节点的执行顺序和逻辑路径，支持顺序执行、分支、循环、并行甚至嵌套（即一个“流”本身可以作为另一个“流”的“节点”），从而构建出任意复杂的 workflows 。

这种极简设计带来了巨大的优势：零依赖、零供应商锁定。开发者可以自由选择任何LLM提供商、向量数据库或他工具，而不会被框架绑定。同时，约100行的核心代码让整个框架极易理解和调试，无论是人类开发者还是AI编程助手，都能快速上手。

官网入口地址

https://the-pocket.github.io/PocketFlow/

下载地址

开源项目地址：https://github.com/The-Pocket/PocketFlow
Python PyPI安装：pip install pocketflow-framework
PHP版本安装：composer require projectsaturnstudios/pocketflow-php

功能介绍

尽管核心代码极少，但PocketFlow通过强大的图抽象，支持丰富的功能模式，这在它的cookbook示例中有充分体现：

基础流程控制：支持顺序执行的工作流、基于条件的智能分支、以及实现持续交互的自循环（如聊天机器人）。
高效处理模式：提供批处理功能，可对多个输入重复执行相同流程；通过异步节点实现并行处理，大幅提升多LLM调用等I/O密集型任务的效率，官方示例展示了数倍的加速效果。
高级智能体能力：支持构建能够自主决策和调用工具（如网络搜索）的单一智能体；更支持多智能体系统，中多个智能体可通过共享存储等机制进行异步通信与协作，完成复杂任务。还可以构建“监督者”智能体来监控和指导他智能体的工作。
增强生成技术：原生支持构建检索增强生成流程，通过节点从外部知识库检索信息，再由另一节点生成答案。也支持“思维链”模式，通过让模型自我反思和记录思考过程来解决复杂推理问题。
内存管理：通过共享存储（Shared Store）机制，节点间可以高效传递数据和上下文。在此基础上，可以实现结合短期对话历史和长期向量数据库的复杂记忆系统。
多模态与交互：实例包含语音聊天应用，整合了VAD（语音活动检测）、STT（语音转文字）、LLM和TTS（文字转语音）技术。同时，提供了与Streamlit、FastAPI等框架集成的示例，便于构建Web应用和实时交互界面。

应用场景

PocketFlow 适用于从个人开发者到企业级的所有LLM应用构建场景：

快速原型设计：极简特性允许开发者快速验证一个关于AI应用的想法，无需在框架配置和依赖上耗费时间。
教育与学习：作为学习LLM应用背后原理（如工作流、RAG、多智能体协作）的教材，代码透明，易于理解。
构建生产级工作流：从自动化报告生成、内容创作工作流到客户服务聊天机器人，PocketFlow足以支撑稳定、可维护的生产系统。
复杂多智能体系统：利用嵌套、分支和异步通信能力，构建模拟社会经济系统、自动化研究助手等需要多个智能体协同的复杂应用。
“人-AI协同”开发：它的设计初衷就是让AI（如Cursor）能够理解并辅助人类编写AI应用代码，是探索下一代人机协作编程范式的理想工具。

必要的补充介绍

定价：PocketFlow 是一个免费且开源的项目，遵循MIT许可协议。你可以免费用于任何商业或个人项目。
应用示例：一个典型的示例是构建一个自循环聊天机器人。ChatNode在prep阶段获取用户输入并存入共享存储，在exec阶段调用LLM生成回复，在post阶段将AI回复打印并存入历史，然后返回一个特定信号让Flow再次启动ChatNode，从而实现持续对话。另一个强大的示例是并行批处理，将一段文本同时翻译成8种语言，使用AsyncParallelBatchNode可以将总耗时从串行的十几分钟大幅缩短到仅相当于一次翻译请求的时间。