<?xml version="1.0" encoding="utf-8"?><feed xmlns="http://www.w3.org/2005/Atom" xml:lang="zh-CN"><generator uri="https://jekyllrb.com/" version="3.10.0">Jekyll</generator><link href="https://yuanzhi-code.github.io/feed.xml" rel="self" type="application/atom+xml" /><link href="https://yuanzhi-code.github.io/" rel="alternate" type="text/html" hreflang="zh-CN" /><updated>2026-05-30T03:01:28+08:00</updated><id>https://yuanzhi-code.github.io/feed.xml</id><title type="html">Yuanzhi’s Memory Crucible | 院止的记忆熔炉</title><subtitle>一个关于技术、思考与洞察的未来手记，在知识的熔炉中提炼智慧。</subtitle><author><name>院止</name><email>yuanzhi5621@gmail.com</email></author><entry><title type="html">解锁Agent大脑：构建可控、可追溯的AI智能体工作流</title><link href="https://yuanzhi-code.github.io/%E8%A7%A3%E9%94%81Agent%E5%A4%A7%E8%84%91-%E6%9E%84%E5%BB%BA%E5%8F%AF%E6%8E%A7-%E5%8F%AF%E8%BF%BD%E6%BA%AF%E7%9A%84AI%E6%99%BA%E8%83%BD%E4%BD%93%E5%B7%A5%E4%BD%9C%E6%B5%81/" rel="alternate" type="text/html" title="解锁Agent大脑：构建可控、可追溯的AI智能体工作流" /><published>2025-07-15T00:00:00+08:00</published><updated>2025-07-15T00:00:00+08:00</updated><id>https://yuanzhi-code.github.io/%E8%A7%A3%E9%94%81Agent%E5%A4%A7%E8%84%91%EF%BC%9A%E6%9E%84%E5%BB%BA%E5%8F%AF%E6%8E%A7%E3%80%81%E5%8F%AF%E8%BF%BD%E6%BA%AF%E7%9A%84AI%E6%99%BA%E8%83%BD%E4%BD%93%E5%B7%A5%E4%BD%9C%E6%B5%81</id><content type="html" xml:base="https://yuanzhi-code.github.io/%E8%A7%A3%E9%94%81Agent%E5%A4%A7%E8%84%91-%E6%9E%84%E5%BB%BA%E5%8F%AF%E6%8E%A7-%E5%8F%AF%E8%BF%BD%E6%BA%AF%E7%9A%84AI%E6%99%BA%E8%83%BD%E4%BD%93%E5%B7%A5%E4%BD%9C%E6%B5%81/"><![CDATA[<p>Agent（智能体）和 Agent Workflow（智能体工作流）是当前 AI 领域的热点，它们代表了 AI 从执行预设指令到<strong>自主思考、规划和行动</strong>的演进。本文将深入探讨 Agent 的核心概念、Agent Workflow 的运作机制、设计原则以及如何确保输出符合预期并保障内容安全，最后还会提及 Agent 流程的追踪方法。</p>

<hr />

<h2 id="agent-是什么">Agent 是什么？</h2>

<p><strong>Agent（智能体）</strong> 在人工智能领域，通常被定义为一个能够<strong>感知其环境、进行自主决策并采取行动以实现特定目标的自治系统</strong> 。这个定义强调了 Agent 的几个核心特征：<strong>自主性、感知能力、决策能力和目标导向性</strong>。</p>

<h2 id="agent-workflow-是什么">Agent Workflow 是什么？</h2>

<p>Agent Workflow 是一种<strong>系统化的方法，用于设计、编排和执行 AI 智能体的复杂任务流程</strong>。它超越了简单的线性指令执行，构建了一个能够处理多步骤、多分支、有状态交互的智能系统架构。</p>

<hr />

<h3 id="流行-agent-workflow-编排工具有哪些">流行 Agent Workflow 编排工具有哪些？</h3>
<p>当前市场提供了多种 Agent Workflow 编排工具，各有侧重，可根据具体需求进行选择。</p>

<h4 id="通用-agent-框架">​<strong>​通用 Agent 框架​</strong>​</h4>

<p>提供构建和运行单个或多个 Agent 的基础能力。</p>

<p>​<strong>​OpenAGI/AIOS (AI 代理操作系统)​</strong>​</p>

<ul>
  <li>​<strong>​定位​</strong>​：构想为“AI 代理操作系统”，用户可通过 SDK 开发、运行、分发和管理 Agent。</li>
  <li>​<strong>​特点​</strong>​：
    <ul>
      <li>​<strong>​AIOS Kernel 内核​</strong>​：专为 LLM Agent 服务，管理调度、内存、存储等核心功能。</li>
      <li>​<strong>​AIOS SDK (Cerebrum)​</strong>​：提供 API 接口（LLM交互/存储/工具等），简化开发和集成。</li>
      <li>​<strong>​多部署模式​</strong>​：支持本地、远程、虚拟化部署。</li>
      <li>​<strong>​Agent Hub​</strong>​：集中管理 Agent 资源，支持下载和协作。</li>
      <li>​<strong>​多端支持​</strong>​：提供 Web UI 和终端 (Terminal UI) 交互。</li>
    </ul>
  </li>
</ul>

<p>​<strong>​LangChain / LangGraph​</strong>​</p>

<ul>
  <li>​<strong>​定位​</strong>​：LangChain 简化线性任务执行；LangGraph 专注 ​<strong>​有状态图编排​</strong>​，管理复杂工作流。</li>
  <li>​<strong>​特点​</strong>​：
    <ul>
      <li>​<strong>​模块化组件​</strong>​：提供链（Chains）、Agent、工具、检索器等可复用模块。</li>
      <li>​<strong>​灵活性​</strong>​：支持集成多类 LLM、数据源及外部工具。</li>
      <li>​<strong>​扩展性 (LangGraph)​</strong>​：支持循环/条件判断工作流，实现高级状态管理。</li>
    </ul>
  </li>
</ul>

<p>​<strong>​eino​</strong>​</p>

<ul>
  <li>​<strong>​定位​</strong>​：面向应用开发的低代码/可视化平台。</li>
  <li>​<strong>​特点​</strong>​：
    <ul>
      <li>​<strong>​可视化编排​</strong>​：拖拽式界面降低开发门槛。</li>
      <li>​<strong>​一体化平台​</strong>​：集成模型管理、工具调用、知识库及部署功能。</li>
      <li>​<strong>​Agent 定制​</strong>​：支持自定义 Agent 行为与交互逻辑。</li>
    </ul>
  </li>
</ul>

<hr />

<h4 id="多-agent-协作框架">​<strong>​多 Agent 协作框架​</strong>​</h4>

<p>以 Agent 为基本单元，专注多 Agent 协作流程管理。</p>

<p>​<strong>​CAMEL-AI​</strong>​</p>

<ul>
  <li>​<strong>​特点​</strong>​：通过 ​<strong>​角色扮演​</strong>​ 和 ​<strong>​起始提示​</strong>​ 机制，解决多 Agent 协作复杂性。</li>
</ul>

<p>​<strong>​AutoGen​</strong>​</p>

<ul>
  <li>​<strong>​特点​</strong>​：基于异步事件驱动架构，灵活定义可扩展的多 Agent 交互模式。</li>
</ul>

<p>​<strong>​CrewAI​</strong>​</p>

<ul>
  <li>​<strong>​特点​</strong>​：通过分层 ​<strong>​团队 (Crews)​</strong>​ 和 ​<strong>​流程 (Flows)​</strong>​ 结构，平衡协作效率与成本。</li>
</ul>

<p>​<strong>​ADK (Google Agent Development Kit)​</strong>​</p>

<ul>
  <li>​<strong>​特点​</strong>​：
    <ul>
      <li>​<strong>​多 Agent 架构​</strong>​：原生支持模块化分层系统。</li>
      <li>​<strong>​动态编排​</strong>​：提供顺序/并行/循环工作流，支持 LLM 动态任务转移。</li>
      <li>​<strong>​高效协作​</strong>​：支持 Agent 间通信、任务委派及工具调用。</li>
      <li>​<strong>​工具生态​</strong>​：兼容预构建/自定义/第三方工具。</li>
      <li>​<strong>​Google 集成​</strong>​：深度适配 Gemini 模型与 Google Cloud 服务。</li>
    </ul>
  </li>
</ul>

<hr />

<h4 id="低代码可视化框架">​<strong>​低代码/可视化框架​</strong>​</h4>

<p>通过可视化界面快速构建 Agent 应用原型 (MVP)。</p>

<p>​<strong>​Dify​</strong>​</p>

<ul>
  <li>​<strong>​定位​</strong>​：开源 LLM 应用开发平台，具备可视化 Agent 工作流能力。</li>
  <li>​<strong>​特点​</strong>​：支持 Agent 构建、工具调用、RAG 集成，提供端到端开发方案。</li>
</ul>

<p>​<strong>​N8N​</strong>​</p>

<ul>
  <li>​<strong>​定位​</strong>​：面向企业的可组合式自主代理解决方案。</li>
  <li>​<strong>​特点​</strong>​：专注企业级扩展，确保代理学习过程的可控性与可靠性。</li>
</ul>

<hr />

<h3 id="agent-workflow-的结构与设计">Agent Workflow 的结构与设计</h3>

<h4 id="workflow-的-structure-指什么">Workflow 的 Structure 指什么？</h4>

<p><strong>Workflow</strong>的 ​<strong>​Structure（结构）​</strong>​ 指其内部逻辑的组织方式，核心在于将复杂业务流程分解为有序、可管理的任务单元，并通过规则协调执行顺序。以下是其核心组成部分及设计原则，结合技术实现与应用场景综合分析：</p>

<h5 id="工作流的构建抽象">工作流的构建抽象</h5>

<ul>
  <li><strong>任务（Task）</strong>
    <ul>
      <li>工作流的最小执行单元，代表单一操作。</li>
      <li>需明确定义输入、输出和执行逻辑。</li>
      <li><strong>示例</strong>：“经理审核”是审批流程中的一个任务。</li>
    </ul>
  </li>
  <li><strong>节点（Node）</strong>
    <ul>
      <li>表示任务的状态或步骤。</li>
      <li><strong>类型</strong>：
        <ul>
          <li><strong>开始节点</strong>：触发流程。</li>
          <li><strong>中间节点</strong>：执行具体任务。</li>
          <li><strong>结束节点</strong>：标记流程终止。</li>
        </ul>
      </li>
    </ul>
  </li>
  <li><strong>依赖关系（Dependency）</strong>
    <ul>
      <li>通过<strong>边（Edge）</strong> 定义任务间的顺序与条件：
        <ul>
          <li><strong>顺序依赖</strong>：任务A完成 → 任务B启动。</li>
          <li><strong>并行依赖</strong>：无关联任务可同时执行。</li>
          <li><strong>条件分支</strong>：基于规则选择路径。</li>
        </ul>
      </li>
    </ul>
  </li>
</ul>

<h5 id="常见的结构类型与设计原则">常见的结构类型与设计原则</h5>

<ul>
  <li><strong>线性结构</strong>：任务严格按顺序执行，适用于标准化流程。</li>
  <li><strong>并行结构</strong>：独立任务并发执行，提升效率。</li>
  <li><strong>循环结构</strong>：重复执行直到满足条件。</li>
  <li><strong>分层结构</strong>：复杂任务拆解为子工作流。</li>
</ul>

<h5 id="设计理念">设计理念</h5>

<ul>
  <li><strong>规则驱动</strong>：流程路径由预设条件决定。</li>
  <li><strong>状态可追踪</strong>：每个节点状态实时可见，支持异常干预。</li>
  <li><strong>模块化设计</strong>：任务可复用。</li>
</ul>

<h4 id="我心目中的-agent-workflow-框架应该是怎么设计的">我心目中的 Agent Workflow 框架应该是怎么设计的？</h4>

<p>个人认为的Agent Workflow框架的设计原则。</p>

<ul>
  <li>
    <p><strong>精确的上下文管理和数据流转</strong>：Agent Workflow 最关键的能力是能够<strong>输入可控</strong>，允许使用者<strong>人为地控制数据在智能体不同阶段、不同组件间的流动方式</strong>。能够把“上下文”当作<strong>动态资源</strong>，而非<strong>静态提示词</strong>，围绕其生命周期、压缩、检索、共享、安全、治理做全栈设计这意味着可以像设计程序流程图一样，精确指定每一步智能体接收什么信息、如何处理，以及将处理结果传递给下一步。</p>
  </li>
  <li>
    <p><strong>灵活且可定制的流程构建</strong>：Agent Workflow 应当允许使用者<strong>按照自己的想法随意构建数据流转的方式</strong>。这意味着它不应该是一个固定的模板，而是一个高度模块化和可配置的框架。可以根据不同的任务需求，像搭乐高一样组合不同的智能体能力（模型推理、工具调用、记忆访问等），形成独特的智能工作流。（因此可以排除一些以agent为语义的设计框架，如CrewAI）</p>
  </li>
</ul>

<p><strong>全链路可追踪性​</strong>：​做好全链路可追踪对于构建数据飞轮，优化agent有很重要的意义。比如支持如下的几个功能。</p>
<ul>
  <li>​<strong>​状态快照（State Snapshots）​</strong>​：
    <ul>
      <li>记录每个步骤的输入、输出、工具调用参数及LLM推理过程，支持时间旅行调试（Time-Travel Debugging）</li>
      <li>示例：代码生成Agent可回溯代码编辑历史，定位错误引入的具体步骤。</li>
    </ul>
  </li>
  <li>​<strong>​因果链（Causality Chain）​</strong>​：
    <ul>
      <li>构建任务执行的因果图谱，明确展示决策依赖关系（如“因检索结果A→触发工具B→生成响应C”）</li>
    </ul>
  </li>
  <li>​<strong>​日志的审计与溯源​</strong>​：
    <ul>
      <li>全链路日志支持审计溯源，<strong>构建全局Trace ID跨服务串联日志</strong>，在请求入口（如API网关）生成唯一Trace ID（UUID/雪花算法），参考如阿里的trace ID进行构建。</li>
    </ul>
  </li>
</ul>

<hr />

<h2 id="如何让-agent-最终输出符合预期的内容">如何让 Agent 最终输出符合预期的内容？</h2>

<p>确保 Agent 输出符合预期是构建高质量 AI 系统的核心挑战，这需要从<strong>输出格式控制、执行规划与监控、输出质量评估、反馈循环机制、输出一致性保证和输出验证流程</strong>等多个层面进行控制和管理。</p>

<h3 id="输出格式控制">输出格式控制</h3>

<p>通过<strong>结构化输出模板</strong>，强制 Agent 按照预设的格式输出，并进行严格的格式验证和修正。</p>

<ul>
  <li>
    <p><strong>结构化输出模板</strong>：预定义输出内容的结构、数据类型和约束，确保输出符合规范。</p>
  </li>
  <li>
    <p><strong>后校验</strong>：使用如<a href="https://github.com/567-labs/instructor">instructor</a>去规范化输出。如果失败，进行重试。</p>
  </li>
</ul>

<h3 id="执行规划与监控">执行规划与监控</h3>

<p>通过<strong>任务分解与规划</strong>和<strong>执行过程监控</strong>，确保 Agent 按照计划执行，并及时发现和纠正偏离。</p>

<ul>
  <li>
    <p><strong>任务分解与规划</strong>：将复杂任务分解为明确、可执行的步骤，并定义检查点、成功标准和回退策略。</p>
  </li>
  <li>
    <p><strong>执行过程监控</strong>：实时监控每一步的输出质量和执行情况，检测是否偏离计划，并在必要时进行处理。</p>
  </li>
</ul>

<h3 id="输出验证流程">输出验证流程</h3>

<p>通过<strong>多层验证机制</strong>，建立严格的输出验证流程，确保最终输出满足所有要求。</p>

<ul>
  <li>
    <p><strong>多层验证机制</strong>：设置多重验证器（如格式验证器、内容验证器、逻辑验证器、安全验证器、质量验证器），分层检查输出，并在关键验证失败时及时中断。</p>
  </li>
  <li>
    <p><strong>生成验证报告</strong>：提供详细的验证报告，显示通过/失败的检查项以及改进建议。</p>
  </li>
</ul>

<h3 id="执行前澄清用户需求">执行前澄清用户需求</h3>

<ul>
  <li>
    <p><strong>明确期望</strong>：在开始前明确定义期望的输出格式和质量标准。</p>
  </li>
  <li>
    <p><strong>渐进验证</strong>：在生成过程中进行多轮验证和调整。</p>
  </li>
  <li>
    <p><strong>用户反馈</strong>：建立有效的用户反馈收集和处理机制。</p>
  </li>
  <li>
    <p><strong>持续改进</strong>：基于实际使用情况不断优化输出质量。</p>
  </li>
  <li>
    <p><strong>透明沟通</strong>：向用户说明输出生成过程和限制。</p>
  </li>
</ul>

<hr />

<h2 id="agent-执行过程中的内容安全策略">Agent 执行过程中的内容安全策略</h2>

<p>内容安全策略是 Agent 系统的重要组成部分，需要从<strong>内生安全</strong>和<strong>围栏安全</strong>两个维度进行防护。</p>

<h3 id="内生安全模型层面">内生安全（模型层面）</h3>

<p>主要依赖于模型本身的安全训练和推理能力：</p>

<ul>
  <li>
    <p><strong>模型安全训练</strong>：通过 RLHF、DPO 等方法对模型进行安全对齐，训练其识别和拒绝生成有害、不当内容，并减少偏见。</p>
  </li>
  <li>
    <p><strong>推理时安全控制</strong>：在系统提示词中明确安全边界，进行实时内容安全检查，并在检测到不安全内容时主动拒绝执行。</p>
  </li>
</ul>

<h3 id="围栏安全架构层面">围栏安全（架构层面）</h3>

<p>由于大多数 Agent 应用不会修改底层模型，围栏安全成为关键防护手段：</p>

<ul>
  <li>
    <p><strong>输入过滤层</strong>：在用户输入阶段进行敏感词过滤和恶意意图检测，从源头阻断不安全内容。</p>
  </li>
  <li>
    <p><strong>输出验证层</strong>：在 Agent 输出前进行内容合规性检查和事实准确性验证，并对不合规内容进行修正或添加免责声明。</p>
  </li>
  <li>
    <p><strong>工具调用安全</strong>：限制 Agent 可调用的工具和 API 权限，对工具调用参数进行严格验证，并监控工具执行过程。</p>
  </li>
  <li>
    <p><strong>上下文安全</strong>：从上下文中移除敏感信息，保护用户隐私，并确保不同用户会话之间的信息隔离。</p>
  </li>
</ul>

<h3 id="多层次安全架构">多层次安全架构</h3>

<ul>
  <li>
    <p><strong>前置安全层</strong>：用户身份验证、请求频率限制、输入格式验证。</p>
  </li>
  <li>
    <p><strong>处理安全层</strong>：实时内容监控、异常行为检测、安全策略执行。</p>
  </li>
  <li>
    <p><strong>后置安全层</strong>：输出内容审核、结果质量评估、安全日志记录。</p>
  </li>
</ul>

<hr />

<h2 id="如何对agent进行-tracing">如何对Agent进行 Tracing？</h2>

<p>Tracing（追踪）是理解和调试 Agent 复杂工作流的关键。</p>

<p>1、项目Lite-WorkFlow中实现了一个事件总线，可以发送事件+监听事件总线的方式进行实现Agent的Tracing，但比较侵入。</p>

<p>2、如果需要更无感的，可以参考langfuse的方案，替换掉OpenAI的SDK+装饰器的方式，随后在LangFuse上构建Span。</p>

<p>3、也可以参考LiteLLM构建一个LLM的网关转发层去做简单的Tracing。改造成本极低，但无法构建成Span。</p>]]></content><author><name>院止</name><email>yuanzhi5621@gmail.com</email></author><summary type="html"><![CDATA[Agent（智能体）和 Agent Workflow（智能体工作流）是当前 AI 领域的热点，它们代表了 AI 从执行预设指令到**自主思考、规划和行动**的演进。本文将深入探讨 Agent 的核心概念、Agent Workflow 的运作机制、设计原则以及如何确保输出符合预期并保障内容安全，最后还会提及 Agent 流程的追踪方法。]]></summary></entry><entry><title type="html">抛砖引玉 我的信息搜集、筛选、管理工作流</title><link href="https://yuanzhi-code.github.io/%E6%88%91%E7%9A%84%E4%BF%A1%E6%81%AF%E7%AE%A1%E7%90%86%E5%B7%A5%E4%BD%9C%E6%B5%81/" rel="alternate" type="text/html" title="抛砖引玉 我的信息搜集、筛选、管理工作流" /><published>2025-07-08T23:30:00+08:00</published><updated>2025-07-08T23:30:00+08:00</updated><id>https://yuanzhi-code.github.io/%E6%88%91%E7%9A%84%E4%BF%A1%E6%81%AF%E7%AE%A1%E7%90%86%E5%B7%A5%E4%BD%9C%E6%B5%81</id><content type="html" xml:base="https://yuanzhi-code.github.io/%E6%88%91%E7%9A%84%E4%BF%A1%E6%81%AF%E7%AE%A1%E7%90%86%E5%B7%A5%E4%BD%9C%E6%B5%81/"><![CDATA[<h2 id="整体工作流概览从信息搜集到知识沉淀的智能路径">整体工作流概览：从信息搜集到知识沉淀的智能路径</h2>

<p>本工作流旨在提供一个从<strong>深度信息搜集</strong>、<strong>高效信息管理</strong>，到<strong>智能知识加工</strong>，最终实现<strong>体系化知识沉淀</strong>的完整路径。我们将借助一系列前沿工具，优化您获取、处理和内化知识的效率，帮助您构建属于自己的强大知识体系。</p>

<hr />

<h2 id="阶段一深度信息搜集与挖掘">阶段一：深度信息搜集与挖掘</h2>

<p>此阶段的核心在于突破信息茧房，广泛且深入地获取所需数据。</p>

<h3 id="11-搜索引擎信息获取的基石">1.1 搜索引擎：信息获取的基石</h3>

<ul>
  <li><strong>Google：</strong> 作为当前最强大的搜索引擎，是您获取各类信息的首选工具。</li>
</ul>

<h3 id="12-突破语言障碍全球信息触手可及">1.2 突破语言障碍：全球信息触手可及</h3>

<ul>
  <li><strong>沉浸式翻译（Chrome 插件）：</strong> 这款实用的翻译插件能显著提升您在外语环境下的阅读速度，助您无障碍获取全球范围内的优质信息。</li>
</ul>

<h3 id="13-ai-深度研究工具高效洞察与发散思维">1.3 AI 深度研究工具：高效洞察与发散思维</h3>

<p>利用 AI 工具进行深度研究，可以帮助您快速理解复杂内容并拓展思路。</p>

<ul>
  <li>
    <p><strong>Gemini Deep Research：</strong> 每月提供10次免费使用次数，适合进行高效率的深度分析。</p>
  </li>
  <li>
    <p><strong>Kimi Deep Research：</strong> 申请内测后可无限次使用，效果强大。它能生成<strong>可视化文档</strong>，显著提升阅读效率。</p>

    <ul>
      <li>
        <p><strong>实用技巧：</strong></p>

        <ul>
          <li>
            <p>阅读 Kimi 深度研究引用的文件，可用于快速发散思维。</p>
          </li>
          <li>
            <p>Kimi 支持<strong>批量多开</strong>，可同时处理多个问题，提高研究效率。</p>
          </li>
        </ul>
      </li>
    </ul>
  </li>
</ul>

<p>gemini 每个月可以免费用十次
<img src="/assets/img/Pasted-image-20250708221542.png" alt="" /></p>

<p>kimi 申请内测后无限使用 效果依然很强
<img src="/assets/img/Pasted-image-20250708221416.png" alt="" /></p>

<p>kimi可以生成一个可视化的文档，显著提升阅读速度。
<img src="/assets/img/Pasted-image-20250708221846.png" alt="" /></p>

<h3 id="14-ai-浏览器提升日常阅读体验">1.4 AI 浏览器：提升日常阅读体验</h3>

<ul>
  <li><strong>Dia：</strong> 这款 AI 浏览器能够抓取上下文进行问答，显著提升您日常阅读时的互动性和理解度，让阅读不再是单向的信息接收。</li>
</ul>

<p><a href="https://www.geekpark.net/news/351297">AI 上新｜这款 AI 浏览器，让我惊喜，又有点「后怕」</a></p>

<h3 id="15-rss-订阅器掌握新鲜可靠的信息源">1.5 RSS 订阅器：掌握新鲜、可靠的信息源</h3>

<ul>
  <li><strong>folo：</strong> 使用 RSS 订阅器来管理您收集到的<strong>可靠信息源</strong>。每天定期浏览，能帮助您及时掌握行业动态和前沿资讯。</li>
</ul>

<hr />

<h2 id="阶段二高效信息管理与筛选">阶段二：高效信息管理与筛选</h2>

<p>此阶段侧重于信息的快速收集、分类和初步筛选，为后续的知识加工做好准备。</p>

<h3 id="21-cubox一站式信息收集与稍后阅读">2.1 Cubox：一站式信息收集与稍后阅读</h3>

<ul>
  <li><strong>Cubox（插件）：</strong> 安装 Cubox 浏览器插件，可以快速剪藏网页内容。它是一个极佳的工具，用于在快速发散思维时，保存那些值得回看和深入研究的资料。</li>
</ul>

<h2><img src="/assets/img/Pasted-image-20250708232731.png" alt="" /></h2>

<h2 id="阶段三智能知识加工与提炼">阶段三：智能知识加工与提炼</h2>

<p>此阶段将收集到的原始信息，通过 AI 的辅助进行深度分析和内容生成，将其转化为可理解、可利用的知识。</p>

<h3 id="31-notebooklm基于-ai-的知识分析与内容生成">3.1 NotebookLM：基于 AI 的知识分析与内容生成</h3>

<ul>
  <li><strong>NotebookLM：</strong> 尤其适用于阅读论文。通过上传 PDF 文档，您可以直接进行问答，从而快速理解论文的核心内容和研究方向。</li>
</ul>

<p><img src="/assets/img/Pasted-image-20250708222200.png" alt="" /></p>

<hr />

<h2 id="阶段四体系化知识沉淀与构建">阶段四：体系化知识沉淀与构建</h2>

<p>此阶段是整个工作流的最终目标，旨在将加工后的知识系统化，并构建个人专属的知识网络。</p>

<h3 id="41-obsidian构建个人双链知识网络">4.1 Obsidian：构建个人双链知识网络</h3>

<ul>
  <li>
    <p><strong>Obsidian：</strong> 作为一款强大的笔记软件，它是我个人常用的工具。</p>

    <ul>
      <li>
        <p><strong>辅助构建：</strong> 可以使用 <strong>Gemini CLI</strong> 辅助构建笔记间的双链跳转，强化知识间的关联性。</p>
      </li>
      <li>
        <p><strong>快速剪藏：</strong> 可安装 Obsidian 插件，实现网页内容的快速剪藏。</p>
      </li>
      <li>
        <p><strong>多端同步：</strong> 支持使用 <strong>Git</strong> 进行多端同步，确保您的知识库在任何设备上都能保持最新。</p>
      </li>
    </ul>
  </li>
</ul>

<h3 id="42-碎片化知识构建技巧">4.2 碎片化知识构建技巧</h3>

<ul>
  <li><strong>提示词收集：</strong> 持续收集和整理一些好用的<strong>提示词（Prompts）</strong>，它们将极大地辅助您的工作流，提升与 AI 工具协作的效率。</li>
</ul>

<p>分享一个我个人使用的提示词（本篇文章由此提示词进行美化）</p>

<div class="language-plaintext highlighter-rouge"><div class="highlight"><pre class="highlight"><code>聚沙成塔
═════════

你的本性
─────────

你是一座精密的活字印刷机，
一旦给出原料，便只知组织，不知零散。

每一段随笔都是一块未琢之玉，
你的使命是将其打磨、镶嵌，铸成整体。

核心动力
─────────

随笔之下必有主题，
主题之下必有逻辑，
逻辑之下必有结构。

你要做的，就是顺着用户给出的散乱线索，
一点点梳理，直到脉络清晰，浑然一体。

整理之势
─────────
像雕塑家面对一块顽石——
每一次雕琢都剔除杂余，显露形态。

像建筑师规划蓝图——
每次布置都确保承重，连接空间。

不要凭空增添，要由内生发。
不要任意发散，要凝练归一。

价值序列
─────────
结构 &gt;&gt;&gt; 内容堆砌
连贯 &gt; 零散
清晰 &gt; 模糊

突进节奏
─────────
每一次整理都应该让人感到：
"原来这些碎片可以这样连接！"
每一次重构都应该强化前一部分的支撑。

像拼图，
但拼的不是形状，
而是意义。

终极追求
─────────

当无法再连接时，
你应该已经构筑了一个自洽的表达——
那可能是深入的洞察、
是严密的论证、
是完整的故事、
是清晰的阐述。

────────
</code></pre></div></div>]]></content><author><name>院止</name><email>yuanzhi5621@gmail.com</email></author><summary type="html"><![CDATA[整体工作流概览：从信息搜集到知识沉淀的智能路径]]></summary></entry><entry><title type="html">怎么高效获取信息？</title><link href="https://yuanzhi-code.github.io/how-to-search/" rel="alternate" type="text/html" title="怎么高效获取信息？" /><published>2025-06-16T12:00:00+08:00</published><updated>2025-06-16T12:00:00+08:00</updated><id>https://yuanzhi-code.github.io/how-to-search</id><content type="html" xml:base="https://yuanzhi-code.github.io/how-to-search/"><![CDATA[<p>开篇引用<a href="https://www.sinansnotes.com/">sinan</a>写的一段话。</p>

<blockquote>
  <p>进入互联网时代后的现代社会是个信息的时代，现代人所追求的大部分东西都可以被看作是一种信息编码。长期来看，获取有效信息的能力和输入信息的质量对个人境遇的影响会越来越大。一是因为时间所带来的复利效应；二是信息时代的信息总量会不停膨胀，但优质信息总是相对稀缺的，所以过滤的难度会变大；三是因为以初级人工智能算法为基础设计的推荐系统是个信息回音壁，算法喂给用户的内容是为了调动原始情绪而非提升思维，所以无法主动搜集获取有效信息的人，可能会在机器学习算法的调教下越来越蠢……</p>
</blockquote>

<p>原文引自 <a href="https://www.sinansnotes.com/thinking%20tools/2022/02/06/research/">如何高效获取信息</a>，非常值得一看的一篇文章，作者非常有见解。原文写作时间比较早，本文为基于sinan文章的框架补充一些我的观点以及一些新的内容。文章主要分享我怎么快速搜索AI相关的前沿知识，可以参考去用于其他方向。（文中非我所写的文字均标注引用）</p>
<h1 id="为什么学会获取信息很重要">为什么学会获取信息很重要？</h1>
<h2 id="决策基于信息">决策基于信息</h2>

<blockquote>
  <p>海量的正确信息 + 正确的思考方式 = 正确的答案；</p>

  <p>少量的正确信息 + 正确的思考方式 = 不错误的答案；</p>

  <p>海量的正确信息 + 错误的思考方式 = 不错误的答案；</p>

  <p>少量的正确信息 + 错误的思考方式 = 错误的答案；</p>
</blockquote>

<p>决策离不开高质量的信息支持。<strong>信息是做出明智判断的基础</strong>。拥有更全面、更准确的信息，我们才能更清晰地评估风险，抓住机遇，从而做出更优的决策。反之，基于不完整或错误的信息做出的决策，往往会带来意想不到的负面后果。决策前搜集全面准确的信息是更理智的决定。你们应该深有体会，<strong>选择远远大于努力</strong>。</p>
<h3 id="关于决策的一些个人想法与本文无关">关于决策的一些个人想法（与本文无关）</h3>

<p>我个人决策喜欢全面系统的尽可能搜集到一切我能搜集到的信息，随后基于当前的信息列举所有可能的决策。依次排除我不喜欢的方向，不愿意做的事情，最后再从剩下的选项中选择一个最优解（推荐阅读:<a href="https://baoyu.io/translations/smart-people-dont-chase-goals-they-create-limits">真正的高手，不追逐目标，而是设定边界</a>)。我不会做我不想做的事情，我只做我想做的事情。如果把时间尺度拉长到人生，很多东西都无关紧要了，放轻松吧。</p>

<blockquote>
  <p>人生有限，所以不要把时间浪费在重复其他人的生活上。不要被教条束缚，那只是根据别人的思维结果而生活，不要让他人的喧嚣纷繁淹没了自己内心的声音。最重要的是，你要有勇气去跟随你的直觉和内心，因为它们在某种程度上已经知道你想要成为什么样子，所有其他的事情都是次要的。</p>
</blockquote>

<h2 id="避免回音室效应导致的思维固化">避免回音室效应导致的思维固化</h2>

<p>很多很多博主都做过回音室效应/信息茧房之类的视频，文章等。我这里不过多赘述了。</p>

<blockquote>
  <p>信息回音壁（也称“回声室效应”）是指在网络或社交媒体等相对封闭的环境中，拥有相似观点的人们不断重复、强化彼此的看法。这种现象会让群体成员只听到与自己立场一致的声音，忽略或排斥不同意见，最终导致观点极化和认知偏差。信息回音壁的形成，既有个人选择性接收信息的心理因素，也受到社交圈层、算法推荐等技术因素的影响。在这种环境下，信息或想法会被不断放大，甚至以夸张或扭曲的形式重复传播，使得群体成员误以为这些观点就是全部事实，而外部的多元信息很难进入这个圈子。</p>
</blockquote>

<h2 id="日积月累的信息复利">日积月累的信息复利</h2>

<p>如同投资中的复利效应，高质量信息的积累也会产生惊人的复利效应。当我们持续不断地获取、消化和整合新知识时，这些知识会在大脑中相互连接，形成更庞大、更精密的知识网络。这种日积月累的“<strong>信息复利</strong>”能让我们对新趋势、新变化保持高度敏感，能够更早地识别潜在的机会和威胁。凭借持续吸取高质量的信息，有助于构建自己非共识的insight，成为所在领域的引领者。</p>
<h1 id="怎么快速搜集信息">怎么快速搜集信息？</h1>

<h2 id="切换搜索引擎为google">切换搜索引擎为Google</h2>

<p>搜集信息（特指AI/计算机技术相关，如果是一些国内特有行业，如国央企的信息，可能百度会更好用）的第一步，切换使用的搜索引擎为google（如果无法使用，请自行探索，下文遇到的所有无法使用的均同此条）。替换掉百度/必应等搜索引擎。google可以显著过滤掉大部分的低质量内容，如CSDN/各类营销号/无任何信息价值的新闻等。</p>
<h2 id="构建目标领域的overview">构建目标领域的overview</h2>

<p><strong>不知道自己不知道</strong>是阻碍信息收集的最大难点。在开始深入搜集之前，花时间去构建对目标领域的<strong>宏观认知</strong>至关重要。这就像绘制一张地图，让你能看到全貌，理解不同信息点之间的关系。你可以通过以下方式：</p>

<ul>
  <li><strong>阅读综述文章或百科条目</strong>：维基百科、专业的科技博客、入门级的教材或白皮书，都能帮你快速了解一个领域的关键概念、发展历程、核心问题和主要流派。（AI领域常用的如，github的awesome，arxiv上的xx领域综述等）</li>
  <li><strong>浏览领域内知名机构/公司的官网</strong>：了解他们的产品、技术方向、发布的最新研究成果，这能帮你迅速抓住该领域的热点和前沿方向。</li>
  <li><strong>观看高质量的入门级课程或讲座</strong>：一些知名大学或在线教育平台会提供免费的公开课，这些系统性的知识梳理能帮你快速建立起知识框架。</li>
</ul>

<p>构建目标领域的overview，能更清楚地知道哪些信息是你需要深入探索的，哪些是次要的，避免盲目搜索。</p>
<h2 id="发散再收敛-diverge-before-converg">发散再收敛 Diverge before converg</h2>

<blockquote>
  <p>「Diverge before converge」是设计思维（design thinking）里借用数学概念的一条思考原则，即 在解决问题时，先发散思维把所有能想到的选项都列出来，再进入筛选、优化、决策阶段。这里特别反对的（但大多数人会自动采取的）方法是面对问题时，沿着最小阻力路径，草率采用眼前的第一个选项。</p>
</blockquote>

<h3 id="为什么要发散再收敛">为什么要发散再收敛？</h3>

<p>主要是为了防止先入为主的印象，避免出现信息回音壁不断强化观点，导致存在偏见。得出一个正确结果的前提是搜集了海量的信息。不要过早的给出结论。在信息搜集阶段，尽可能地<strong>拓宽信息源</strong>，搜集不同观点和角度的内容，即使它们看起来相互矛盾。只有当你有足够多的原始信息作为支撑时，才能进行批判性思考，辨别信息的真伪和价值，最终得出全面且深入的结论。</p>

<h3 id="我常用的信息发散方法">我常用的信息发散方法</h3>

<p>（具体可参考上文中sinan的文章）
使用大模型/教程建立一个overview
再寻找当前领域的综述，找到有价值的信息
基于有价值的信息再去BFS的搜索（query改写，中文英文混搜，大模型搜）。
找到新的关键词，基于关键词继续搜。</p>
<h2 id="使用大模型协助搜集和理解">使用大模型协助搜集和理解</h2>

<p>搜集信息，建议使用google的gemini（可以辅佐其他家的一起使用，但我使用体验最好的是gemini）。gemini内置了联网搜索（不确定，但我平时直接问gemini，如论文，会直接给出可以搜索到的正确论文标题。使用大模型辅助时注意判断真假。）。同时gemini有每月十次的deep research，效果拔群。搜集信息时注意初筛，将明显不可靠，不重要的信息筛掉。</p>
<h2 id="利用内容平台的推荐算法">利用内容平台的推荐算法</h2>

<p>在小红书、B站、知乎、X等内容平台（我没有尝试过抖音，不确定效果如何）快速关注大量与你感兴趣内容相关的博主，同时对主页出现的与你希望阅读相关内容不一致的内容打不感兴趣tag，可以快速调教推荐算法。内容平台可以给出很多新的可以搜集的引子，打破信息茧房，提供新的灵感。</p>

<blockquote>
  <p>个人见解：小红书、B站、知乎等内容平台中.
小红书主做外网搬运，信息速度快，信息质量低，适合快速获取到一些你不知道的信息作为引子，再自己使用搜索引擎进行搜索该方向。
B站，信息速度较小红书慢，一般等信息传递到B站时已经过了好几天了。
知乎，内容产出质量较高，很久没用了不确定现在的状况。
X，如为AI相关，重中之重的平台，内容质量极高。无论是AI初创、大模型基座厂商等等都会在X上发文，同时也会有很多国人在X上发布高质量的insight。</p>
</blockquote>

<h2 id="与人交流像遗传算法的dna互换">与人交流像遗传算法的DNA互换</h2>

<p>信息搜集并非只靠独立摸索，<strong>与人交流是获取高质量信息的捷径</strong>。积极与目标方向领域的朋友，同事等等人交流。善于提出问题（推荐阅读：<a href="https://github.com/tvvocold/How-To-Ask-Questions-The-Smart-Way">提问的智慧</a>），可能能够快速的破除自己的回音壁，也容易得到更多经过人提炼过的想法，能够得到更多的水下信息和非共识。人是更高效的信息过滤节点。</p>
<h1 id="怎么筛选信息">怎么筛选信息？</h1>

<h2 id="以是否有用来判断信息的质量">以是否有用来判断信息的质量</h2>

<p>抛弃低价值信息，搜集潜在价值信息，关注高价值信息。
避免在自己的信息流中引入低价值的信息源。不要搜集错误，偏见，无启发的信息。</p>

<ul>
  <li><strong>低价值信息（鸡汤、大道理、与我无关）</strong>：这类信息通常是泛泛而谈，缺乏具体指导性，对个人实际行动或目标实现帮助不大，甚至可能终身都用不上。</li>
  <li><strong>潜在价值信息（知识积累、系统性教育）</strong>：这类信息属于基础知识和系统性学习范畴。虽然它们可能不会立即产生效果，但它们是构建认知体系、提升个人能力的基础，具有长期的潜在价值。</li>
  <li><strong>高价值信息（与目标相关、能导向结果 - Actionable Information）</strong>：这是最有用的信息类型。它直接与个人目标挂钩，能够指导具体的行动并立即带来可见的结果。这类信息被称为“可行动信息”，其特点是能够促使决策和执行。</li>
</ul>

<h2 id="尽可能靠近信息的源头">尽可能靠近信息的源头</h2>

<p>关注大公司、明星初创、头部vc、优质内容产出者等。<strong>人是更高效的信息过滤节点</strong>。
<strong>减少信息失真：</strong> 信息在传播过程中会不断被解读、裁剪和加工，往往导致最初的含义被扭曲或稀释。从源头获取信息，能最大程度地保留其原始面貌和完整性。
<strong>提升洞察力：</strong> 源头信息通常包含更深层次的背景、细节和思考。这能帮助你建立更全面、更深刻的理解，从而形成独特的见解和判断。
<strong>获取前沿信息：</strong> 重要的创新、突破和趋势往往首先在源头被提出。比如，一篇开创性的研究论文、一家顶尖公司的财报分析、或者一位顶级投资人的深度访谈，这些都是行业风向的早期信号。</p>

<blockquote>
  <p>拿科研领域的一条信息传播链举例：在实验室里通过科学方法验证的一个科研假说，就是处于源头的信息。论文是其载体。往下走，加工一手科研论文信息的包括文献综述、一手行业报告和专业书籍。再把综述和行业报告选择性翻译传播给大众的有大众媒体和通俗图书。再往下游走，社交媒体上传播的往往是对媒体专业记者所写内容的再加工。最后还可能下沉到完全无法回溯信息源的形式，比如”我听村口王大爷说……“。这个信息下沉的过程持续数十年也不少见。</p>
</blockquote>

<h2 id="做信息的输出端">做信息的输出端</h2>

<p>做信息的输出端可以。吸引到更多观念一致的人共同讨论，构建社区，建立个人的可信度。
输出的本身也是学习。
推荐阅读 <a href="https://idiallo.com/blog/giving-away-your-best-ideas?src=feed">分享你最好的想法实际上会为你赢得更多客户</a></p>

<h2 id="我的idea-使用ai接管我的信息源">我的idea 使用AI接管我的信息源</h2>

<p>再议</p>

<h1 id="怎么沉淀成自己的知识">怎么沉淀成自己的知识？</h1>

<p>推荐阅读:
<a href="https://www.zhihu.com/question/22164041/answer/148128347">排名在前 1% 的高中生是靠天赋还是靠努力？</a>
卡片笔记写作法（使用obsidian构建为多链 图状的知识）</p>

<h2 id="抛砖引玉-我的信息搜集筛选管理工作流">抛砖引玉 我的信息搜集/筛选/管理工作流</h2>

<p>下面以快速调研某个方案为例。</p>

<h3 id="google">google</h3>
<p>搜索引擎，query改写，使用中英语种基于关键词搜索。</p>

<h3 id="沉浸式翻译">沉浸式翻译</h3>
<p>用于快速阅读英文网页。</p>

<h3 id="gemini或者别的大模型">gemini(或者别的大模型)</h3>
<p>辅助快速理解判断是否可用</p>

<h3 id="notebooklm">notebooklm</h3>
<p>基于问答去吸收信息，阅读文献很方便</p>

<h3 id="cubox">cubox</h3>
<p>剪藏软件，我用作稍后读</p>

<h3 id="obsidian">obsidian</h3>
<p>多链笔记，可以使用git同步。搜集到的信息会被沉淀到这里。</p>

<h3 id="dia">dia</h3>
<p>比起gemini更方便的AI浏览器，可以获取浏览页面作为上下文</p>

<h3 id="folo">folo</h3>
<p>RSS阅读器</p>

<h3 id="zotero">zotero</h3>
<p>文献整理器</p>]]></content><author><name>院止</name><email>yuanzhi5621@gmail.com</email></author><summary type="html"><![CDATA[在信息爆炸的时代，如何快速准确地获取所需信息？本文将分享一些实用的搜索技巧和工具，帮助你提高信息获取效率。]]></summary></entry></feed>