Multi Agent P P T
MultiAgentPPT 是一个集成了 A2A(Agent2Agent)+ MCP(Model Context Protocol)+ ADK(Agent Development Kit) 架构的智能化演示文稿生成系统,支持通过多智能体协作和流式并发机制
MultiAgentPPT 是一个集成了 A2A(Agent2Agent)+ MCP(Model Context Protocol)+ ADK(Agent Development Kit) 架构的智能化演示文稿生成系统,支持通过多智能体协作和流式并发机制
暂未识别到可直接复制的 MCP 配置,请查看 GitHub README。后台管理员可以补充配置。
DATABASE_URL="postgresql://postgres:welcome@localhost:5432/presentation_ai" A2A_AGENT_OUTLINE_URL="http://localhost:10001" A2A_AGENT_SLIDES_URL="http://localhost:10011" DOWNLOAD_SLIDES_URL="http://localhost:10021"
# 🚀 MultiAgentPPT **News**: 当前的版本不再维护,因为PPT内容和模版无法很好的维护,所以采用新的方案重构。 推荐采用PPT的模版的方式,更企业化的版本: https://github.com/johnson7788/TrainPPTAgent 作者微信答疑解惑:  一个基于 A2A + MCP + ADK 的多智能体系统,支持流式并发生成高质量 (可在线编辑)PPT 内容。 ## 🧠 一、项目简介 MultiAgentPPT 利用多智能体架构实现从主题输入到完整演示文稿生成的自动化流程,主要步骤包括: 1. **大纲生成 Agent**:根据用户需求生成初步内容大纲。 2. **Topic 拆分 Agent**:将大纲内容细分为多个主题。 3. **Research Agent 并行工作**:多个智能体分别对每个主题进行深入调研。 4. **Summary Agent 汇总输出**:将调研结果汇总生成 PPT 内容,实时流式返回前端。 ## 优点 - **多Agent协作**:通过多智能体并行工作,提高内容生成的效率和准确性。 - **实时流式返回**:支持流式返回生成的 PPT 内容,提升用户体验。 - **高质量内容**:结合外部检索和智能体协作,生成高质量的内容大纲和演示文稿。 - **可扩展性**:系统设计灵活,易于扩展新的智能体和功能模块。 ## 二、近期升级 ### ✅ 已完成(Done) - ✅ 除 Gemini 以外流的输出 Bug 修复,ADK 和 A2A 的包问题:[查看详情](https://github.com/johnson7788/MultiAgentPPT/blob/stream/backend/birthday_planner/README.md) - ✅ 图片渲染方面:根据是否为背景图动态切换样式(`object-cover` 或 `object-contain`),并在非背景图下展示说明文字。为保证 PPT 页面唯一性,使用大模型输出中的 `page_number` 作为唯一标识,替代原先基于标题的方式,以支持内容更新与校对。 - ✅ 使用循环 Agent 生成每一页 PPT,代替一次性生成全部内容,方便生成更多页数,避免 LLM 的 token 输出限制。 - ✅ 引入 PPTChecker Agent 检查每一页生成的 PPT 质量。实际测试效果良好,请自行替换为真实图片数据和内容 RAG 数据。 - ✅ 前端显示每个 Agent 的生成过程状态。 - ✅ pptx下载,使用python-pptx下载前端json数据,后端渲染。 - ✅ metadata 数据传输:支持前端向 Agent 传输配置,Agent 返回结果时附带 metadata 信息。 - ✅ [本地模型适配.md](docs/%E6%9C%AC%E5%9C%B0%E6%A8%A1%E5%9E%8B%E9%80%82%E9%85%8D.md) ### 📝 待完成(Todo) - 🔄 整合编辑可见可下载的pptx前端 ## 三、使用界面截图展示 以下是 MultiAgentPPT 项目的核心功能演示: ### 1. 输入主题界面 用户在界面中输入希望生成的 PPT 主题内容:  ### 2. 流式生成大纲过程 系统根据输入内容,实时流式返回生成的大纲结构:  ### 3. 生成完整大纲 最终系统将展示完整的大纲,供用户进一步确认:  ### 4. 流式生成PPT内容 确认大纲后,系统开始流式生成每页幻灯片内容,并返回给前端:  ### 5. 对于多Agent生成PPT,slide_agent中,添加进度细节展示      ## 📊 并发的多Agent的协作流程(slide_agent + slide_outline) ```mermaid flowchart TD A[用户输入研究内容] --> B[调用 Outline Agent] B --> C[MCP 检索资料] C --> D[生成大纲] D --> E{用户确认大纲} E --> F[发送大纲给 PPT 生成 Agent] F --> G[Split Outline Agent 拆分大纲] G --> H[Parallel Agent 并行处理] %% 并发 Research Agent H --> I1[Research Agent 1] H --> I2[Research Agent 2] H --> I3[Research Agent 3] I1 --> RAG1[自动知识库检索 RAG] I2 --> RAG2[自动知识库检索 RAG] I3 --> RAG3[自动知识库检索 RAG] RAG1 --> J[SummaryAgent合并结果] RAG2 --> J RAG3 --> J J --> L[Loop PPT Agent 生成幻灯片页] subgraph Loop PPT Agent L1[Write...
Expose your FastAPI endpoints as Model Context Protocol (MCP) tools, with Auth!
面向 AWS 文档和云服务知识查询的 MCP 服务,适合架构设计和云产品检索。
Build effective agents using Model Context Protocol and simple workflow patterns
面向 SQLite 数据库的轻量 MCP 服务,可用于本地数据查询、原型开发和小型工具分析。
抓取网页内容并转换为更适合 AI 处理的文本,适合网页摘要和内容收集。
读取和搜索 Obsidian vault,适合个人知识库、笔记检索和资料整理。