CJ's Blog

嗨，我是 CJ 👋

当模型给出一个很好的答案，那是推理，还是记忆？当一个产品让人感动，那是设计，还是艺术？时刻保持好奇心，将沿途看到的东西记录下来，在进化飞快的世界中让自己保持良好的节奏。

关于 AI 的边界在哪，关于认知是怎么被重塑的，偶尔也聊聊那些让我觉得「啊，原来如此」的瞬间。

@tarko/agent vs pi-mono

背景与生态定位最近看了下因为 openclaw 被带火的 pi-mono 框架用法和基本架构，感觉和 tarko 有很多相似之处，二者都尽量轻量化、提供必要的开箱即用的能力、保留足够的扩展性，所以想着对二者做一些框架使用、设计理念的对比，看能否有额外的收获。首先基本情况对比： ...

中关村咖话-内存篇

饭后和同事散步，聊起最近看的 sandbox snapshot，然后讨论起 mmap。其实是一个很普通的问题，但技术话题经常就是这样，你一言我一语，后面就会牵出一串问题： ...

AI 浏览器自动化工具对比

这篇文章主要对 browser-use、Chrome DevTools MCP 和 agent-browser 三类工具做一个并排分析，方便在不同场景下做选型。它们看起来都属于“AI + 浏览器自动化”，但本质上处于不同抽象层： ...

MCP Apps 生态：从规范到落地

MCP Apps MCP Apps Extension (SEP - 1865) 是 MCP 协议的可选扩展，使 MCP Server 能够向 Host 提供交互式用户界面，目标是：统一标准：统一 MCP-UI 与 OpenAI Apps SDK 的两套方案多端支持：Web、桌面、移动端通用把 Apps SDK 的 UI 能力，搬进 MCP Extension 体系 ...

Code Mode & Code Execution

背景：MCP 工具调用的问题 2024 年 11 月，Anthropic 开源 Model Context Protocol（MCP）后，社区热情高涨，几个月内涌现出数千个 MCP 服务器。但随着实际应用深入，一个根本性的矛盾暴露出来： ...

用 Tiny Stable Diffusion + Pillow 生成带文字的 AI 封面图

AI 生成的图片有个公认的死穴——文字。无论是 Stable Diffusion、DALL-E 还是 Midjourney，生成的文字几乎不可用：乱码、拼写错误、字母变形，根本原因是扩散模型的"文字生成"本质是像素预测，没有字形约束。 ...

RAG 系统从零构建：原理、实现与工程化

RAG（Retrieval-Augmented Generation，检索增强生成）解决的是一个很实际的问题：大模型的知识有训练截止日期，不知道你公司内部的文档，也可能"一本正经地胡说"。 ...

ACP 协议：Coding Agent 的 LSP

研究日期：2026-02-02 一句话说清楚 Agent Client Protocol (ACP) 是一个开放标准协议，让任何 AI 编码 Agent 能在任何支持的编辑器里跑起来，就像 LSP 让任何语言服务器能在任何编辑器里工作一样。你不再需要绑死在某个 IDE + 某个 AI Agent 的组合上了。 ...

OpenClaw/ClawdBot 使用指南&实践

快速认识 OpenClaw 是一个开源的、可本地部署的个人 AI 智能体（Personal AI Agent），它的前身是 ClawdBot 和 MoltBot。其核心设计理念是“本地优先”（Local-first），它将 AI 的“大脑”即 Gateway（网关）控制平面运行在你自己的设备上。这意味着： ...

AG-UI 调研以及 A2UI 对比

讨论背景：从 A2UI 和 AG-UI 的基本概念对比开始，逐步深入到 AG-UI 的协议细节、使用方式、与 A2UI / MCP Apps 的集成支持。 1. A2UI vs AG-UI 核心对比项目全称发起方核心作用层级定位典型生态支持 A2UI Agent-to-User Interface Google（开源）声明式生成式 UI 规范（JSON 格式），Agent 生成安全、可渲染的交互 UI 描述 UI 描述层（内容） Flutter、Angular、Web Components、Lit 等渲染器；跨平台 AG-UI Agent–User Interaction Protocol CopilotKit 团队等双向事件/交互协议：前后端实时通信、状态同步、事件处理传输/运行时层（管道） CopilotKit、Vercel AI SDK、LangGraph 等；常与 A2UI 搭配区别： ...

Ralph Loop：让 AI 自己跑完全程

一句话定义：Ralph Loop 是一个"把 AI 放进 while true 里"的自主迭代开发技术——你定义终点，AI 自己跑，跑完为止。是什么 Ralph Loop（也叫 Ralph Wiggum Loop）： ...

A2UI 协议深度解析

研究日期: 2026-01-29 一句话说清楚 A2UI（Agent-to-User Interface）是 Google 在 2025 年 12 月开源的一套声明式 UI 协议——AI Agent 不再吐 HTML 或写代码，而是发一段 JSON “蓝图”，告诉客户端"我想要一个日期选择器和一个提交按钮"，客户端拿着这份蓝图用自己的原生组件去渲染。安全得像数据，表达力像代码。 ...

Claude Cowork：桌面 AI 代理评测

摘要背景：Claude Cowork 是 Anthropic 于 2026 年 1 月 12 日发布的桌面 AI 代理工具，本质上是"给非程序员用的 Claude Code"——让普通用户也能通过自然语言指挥 AI 自主操作本地文件。 ...

Agent Skills：从概念到实践的技术剖析

一、前言想象一下，你雇了一位实习生，开始时你教了一些规范： “我们公司的 PPT 要用这个颜色，这个字体，Logo 放左上角……” “代码审查要检查这些安全项，那些性能点……” ...

V8 Inspector 调试机制

V8 Inspector，也常被称为 V8 Inspector Protocol，或理解为 Chrome DevTools Protocol 中与 V8 调试相关的那部分能力。它是 V8 JavaScript 引擎暴露给外部调试工具的标准调试接口。 ...

提示工程最佳实践

这篇文章整理自 Anthropic 官方博客《Best practices for prompt engineering》。原文发表于 2025 年 11 月 10 日，本文在保留原意的基础上做了中文整理和润色，便于直接阅读。 ...