agent以及框架和项目 #agent以及框架

从ReAct到Loop Engineering：一文讲透13种AI Agent设计模式与选型指南

文章探讨了AI Agent在企业应用中的发展趋势和挑战，预测到2026年40%的企业应用将引入AI Agent，但同时指出超过40%的Agentic AI项目可能因成本失控和扩展困难而被叫停。文章强调成功与失败的关键在于架构选择而非模型或工具的选择，并详细介绍了13种主流Agent设计模式，包括Single Agent、ReAct、Plan-and-Execute等，从基础到高级逐步讲解每种模式的应用场景及实现方法。文章还提出了一种推荐的组合架构，并总结了选型的第一性原理，即根据实际问题的症状来选择合适的模式，而不是盲目追求复杂度。最后，为工程师提供了实战备忘录，强调了安全性和效率的重要性。

Administrator 发布于 2026-06-30

AI前沿科技信息 #AI前沿科技信息

LOOP Engerning循环工程

Loop Engineering（循环工程） Loop Engineering（循环工程）是 2026 年 6 月在 AI 编程社区迅速传播的一个新概念，由 Google 工程师 Addy Osmani 系统整理，Anthropic Claude Code 负责人 Boris Cherny 和开发者

Administrator 发布于 2026-06-30

AI前沿科技信息 #AI前沿科技信息

以视图视角出发的harness五大子系统架构设计详解

本文详细介绍了从实现视角出发的Harness架构，定义了一个实用且可操作的框架，由五个子系统组成：指令、工具、环境、状态和反馈。每个子系统都有明确的功能和评判标准。**指令子系统**通过创建`AGENTS.md`文件来提供项目概览与硬性约束；**工具子系统**确保代理有足够的访问权限但遵循最小权限原则；**环境子系统**利用如Docker等技术保证环境一致性；**状态子系统**通过`PROGRESS.md`跟踪长任务进度；而**反馈子系统**则通过列出验证命令（如测试、类型检查）以提高开发效率。核心要点强调了这五个子系统的不可或缺性及其在提升模型能力方面的作用，特别指出反馈子系统往往能带来最高的投入产出比。此外，建议定期审计整个Harness系统以维护其有效性。

Administrator 发布于 2026-06-30

强化学习+RHLF #强化学习

06RLHF

Administrator 发布于 2026-06-29

强化学习+RHLF #强化学习

05PPO

Administrator 发布于 2026-06-29

强化学习+RHLF #强化学习

04DPO

Administrator 发布于 2026-06-29

强化学习+RHLF #强化学习

03DQN

Administrator 发布于 2026-06-29

强化学习+RHLF #强化学习

02多臂老虎机

Administrator 发布于 2026-06-29

AI前沿科技信息 #AI前沿科技信息

Claude code源码与记忆系统设计

大家好，我是alex。

Administrator 发布于 2026-06-29

agent以及框架和项目 #agent以及框架 #多agent以及项目

10MutilAgent的三种主流架构与通信方式

一、主流多agent架构目前主流的 1、集中型/路由型（Router Agent） 2、分布式 3、混合式

Administrator 发布于 2026-06-29

agent以及框架和项目 #agent以及框架

09Agent主流记忆框架与管理（5种）

1、智能记忆管理 2

Administrator 发布于 2026-06-29

RAG主流框架和项目 #RAG

17多模态RAG

本文介绍了多模态检索增强生成（RAG）技术的演进路线及其应用场景。传统的RAG系统主要处理文本到文本的检索，而现代多模态RAG则能够处理图像和文本的交互。文章详细探讨了四种技术方案：CLIP双编码器、VLM Captioning、Qwen3-VL黄金架构以及Agentic RAG。 1. **CLIP双编码器**：通过对比学习将文本和图像映射到统一向量空间，实现文搜图和图搜图功能，简洁高效但语义理解深度有限。 2. **VLM Captioning**：利用视觉语言模型为图像生成详细的文本描述，再进行文本检索，提升语义理解深度，但成本较高且信息有损失。 3. **Qwen3-VL黄金架构**：结合Embedding粗筛和Reranker精排，兼顾召回率和精度，支持原生多模态检索，但系统复杂度和计算成本较高。 4. **Agentic RAG**：引入智能Agent动态选择检索策略，具备推理能力和迭代优化能力，智能化程度高但延迟和成本也较高。针对不同场景，文章推荐了相应的技术方案，并建议采用渐进式演进策略，从简单方案开始逐步升级。未来，随着多模态大模型的进步，跨模态理解、检索效率和智能化水平将进一步提升。

Administrator 发布于 2026-06-03

大模型微调 #大模型微调

03Ranker模型微调

好的，请提供需要生成摘要的文章内容。

Administrator 发布于 2026-04-14

大模型微调 #大模型微调

02GPT模型微调

当然，我可以帮助你生成文章的摘要。请将你需要我总结的文章内容提供给我吧。

Administrator 发布于 2026-04-14

大模型微调 #大模型微调

01 Bert分类模型微调

好的，请提供需要生成摘要的文章内容。

Administrator 发布于 2026-04-14

大模型微调 #大模型微调

00 模型微调概述

好的，请提供需要生成摘要的文章内容。

Administrator 发布于 2026-04-14

RAG主流框架和项目 #RAG

16RAG/Agent长短期记忆混合存储方案实现

本文介绍了长短期记忆混合存储架构方案，包括其工作流程、代表框架及主被动触发写入长期记忆的机制。文章首先描述了分层存储结构，将短期记忆分为窗口层、摘要层和会话全局摘要，并详细解释了混合模式架构图。接着，重点讨论了主动与被动两种触发写入长期记忆的方式：主动触发依赖于Agent自身判断或用户指令，而被动触发则基于系统预设规则（如容量或时间阈值）。文章还对比了两者的优缺点，并提供了基于LangChain的完整代码实现示例，展示了如何结合这两种机制来优化长期记忆管理。最后，通过一个演示运行实例，展示了该架构的实际应用效果。

Administrator 发布于 2026-04-14

agent以及框架和项目 #agent以及框架

08RAG/Agent长短期记忆主流实现方式

本文介绍了长短期记忆混合存储架构的设计与实现，重点讨论了如何通过主动和被动两种方式将短期记忆中的重要信息转移到长期记忆中。文章首先概述了混合存储架构的层次结构，包括窗口层（L0）、摘要层（L1）和会话全局摘要层（L2）。接着详细说明了主被动触发写入长期记忆的工作流程、代表框架及其实现方式，并对比了两者的优缺点。主动触发机制依赖于模型判断或用户指令，实时性强但可能遗漏信息；被动触发则基于系统预设规则，如容量或时间阈值，确保核心信息不丢失但可能引入冗余。最后，文章提供了基于LangChain的完整代码示例，展示了如何在实际应用中实现这一混合记忆架构，支持Agent自主决策保存以及系统自动整理压缩记忆。

Administrator 发布于 2026-04-14

agent以及框架和项目 #agent以及框架

07Agent常见问题

本文档详细探讨了Agent系统在实现与部署过程中可能遇到的16个典型问题及其解决方案，并提供了相应的代码示例。文档首先概述了这些问题，包括Agent组成、使用时机、状态变换判断、任务失败处理、用户代码执行安全、任务分解程度、工具调用幻觉、上下文溢出、循环执行、并行工具调用冲突、部分成功状态置信度、非确定性输出、长期任务持久化、多Agent协作竞态、工具输出注入攻击以及奖励分配稀疏下的信用分配。对于每个问题，文档不仅指出了现象和场景，还给出了具体的工程解法，例如通过定义最小组成模块、建立决策树来判断是否使用Agent、设置明确的状态机、定义降级链、使用隔离环境等方法。此外，文档还提供了一个面试快速应答表，帮助读者快速掌握关键点，并附有一句话记忆口诀便于记忆。最后，文档展示了多个难度等级的代码示例，如工具调用幻觉防御、非确定性输出处理、长期任务持久化及恢复机制、多Agent协作中的死锁预防等，旨在构建一个从POC到生产的完整生产级Agent框架。

Administrator 发布于 2026-04-09

强化学习+RHLF #强化学习

01Q-Learing算法实战

本文介绍了Q-Learning算法的基本概念及其在实际问题中的应用。Q-Learning是一种无模型强化学习方法，通过智能体与环境的交互来学习最优策略，不需要事先知道环境的状态转移概率。文章首先解释了Q-Learning的核心思想：基于奖励最大化原则更新动作价值函数（Q函数），进而指导决策过程。接着，通过一个简单的迷宫寻路案例展示了如何使用Python实现Q-Learning算法，并详细解析了关键代码段落。最后，讨论了Q-Learning算法的优势如简单易用以及局限性比如可能遇到的探索与利用平衡难题等。通过本教程，读者能够掌握Q-Learning的基础知识并尝试将其应用于解决实际问题中。

Administrator 发布于 2026-04-08

菜单

作者：Administrator

从ReAct到Loop Engineering：一文讲透13种AI Agent设计模式与选型指南

LOOP Engerning循环工程

以视图视角出发的harness五大子系统架构设计详解

06RLHF

05PPO

04DPO

03DQN

02多臂老虎机

Claude code源码与记忆系统设计

10MutilAgent的三种主流架构与通信方式

09Agent主流记忆框架与管理（5种）

17多模态RAG

03Ranker模型微调

02GPT模型微调

01 Bert分类模型微调

00 模型微调概述

16RAG/Agent长短期记忆混合存储方案实现

08RAG/Agent长短期记忆主流实现方式

07Agent常见问题

01Q-Learing算法实战

经典老歌

00大模型训练、推理、微调与部署：主流框架与平台全解析

02Python命名规则

07Agent常见问题

01Agent主流框架

热门电影

08大模型训练，推理显存占用和工具

06NLP-多分类问题说明

00常见数据库总览

纯音乐