嗨,我是 CJ 👋
当模型给出一个很好的答案,那是推理,还是记忆?当一个产品让人感动,那是设计,还是艺术?时刻保持好奇心,将沿途看到的东西记录下来, 在进化飞快的世界中让自己保持良好的节奏。
关于 AI 的边界在哪,关于认知是怎么被重塑的,偶尔也聊聊那些让我觉得「啊,原来如此」的瞬间。
嗨,我是 CJ 👋
当模型给出一个很好的答案,那是推理,还是记忆?当一个产品让人感动,那是设计,还是艺术?时刻保持好奇心,将沿途看到的东西记录下来, 在进化飞快的世界中让自己保持良好的节奏。
关于 AI 的边界在哪,关于认知是怎么被重塑的,偶尔也聊聊那些让我觉得「啊,原来如此」的瞬间。
背景与生态定位 最近看了下因为 openclaw 被带火的 pi-mono 框架用法和基本架构, 感觉和 tarko 有很多相似之处, 二者都尽量轻量化、 提供必要的开箱即用的能力、 保留足够的扩展性, 所以想着对二者做一些框架使用、设计理念的对比, 看能否有额外的收获。首先基本情况对比: ...
饭后和同事散步,聊起最近看的 sandbox snapshot,然后讨论起 mmap。 其实是一个很普通的问题,但技术话题经常就是这样,你一言我一语,后面就会牵出一串问题: ...
这篇文章主要对 browser-use、Chrome DevTools MCP 和 agent-browser 三类工具做一个并排分析,方便在不同场景下做选型。 它们看起来都属于“AI + 浏览器自动化”,但本质上处于不同抽象层: ...
MCP Apps MCP Apps Extension (SEP - 1865) 是 MCP 协议的可选扩展,使 MCP Server 能够向 Host 提供交互式用户界面,目标是: 统一标准:统一 MCP-UI 与 OpenAI Apps SDK 的两套方案 多端支持:Web、桌面、移动端通用 把 Apps SDK 的 UI 能力,搬进 MCP Extension 体系 ...
背景:MCP 工具调用的问题 2024 年 11 月,Anthropic 开源 Model Context Protocol(MCP)后,社区热情高涨,几个月内涌现出数千个 MCP 服务器。但随着实际应用深入,一个根本性的矛盾暴露出来: ...
AI 生成的图片有个公认的死穴——文字。无论是 Stable Diffusion、DALL-E 还是 Midjourney,生成的文字几乎不可用:乱码、拼写错误、字母变形,根本原因是扩散模型的"文字生成"本质是像素预测,没有字形约束。 ...
RAG(Retrieval-Augmented Generation,检索增强生成)解决的是一个很实际的问题:大模型的知识有训练截止日期,不知道你公司内部的文档,也可能"一本正经地胡说"。 ...
研究日期:2026-02-02 一句话说清楚 Agent Client Protocol (ACP) 是一个开放标准协议,让任何 AI 编码 Agent 能在任何支持的编辑器里跑起来,就像 LSP 让任何语言服务器能在任何编辑器里工作一样。你不再需要绑死在某个 IDE + 某个 AI Agent 的组合上了。 ...
快速认识 OpenClaw 是一个开源的、可本地部署的个人 AI 智能体(Personal AI Agent),它的前身是 ClawdBot 和 MoltBot。 其核心设计理念是“本地优先”(Local-first),它将 AI 的“大脑”即 Gateway(网关)控制平面运行在你自己的设备上。这意味着: ...
讨论背景:从 A2UI 和 AG-UI 的基本概念对比开始,逐步深入到 AG-UI 的协议细节、使用方式、与 A2UI / MCP Apps 的集成支持。 1. A2UI vs AG-UI 核心对比 项目 全称 发起方 核心作用 层级定位 典型生态支持 A2UI Agent-to-User Interface Google(开源) 声明式生成式 UI 规范(JSON 格式),Agent 生成安全、可渲染的交互 UI 描述 UI 描述层(内容) Flutter、Angular、Web Components、Lit 等渲染器;跨平台 AG-UI Agent–User Interaction Protocol CopilotKit 团队等 双向事件/交互协议:前后端实时通信、状态同步、事件处理 传输/运行时层(管道) CopilotKit、Vercel AI SDK、LangGraph 等;常与 A2UI 搭配 区别: ...
一句话定义:Ralph Loop 是一个"把 AI 放进 while true 里"的自主迭代开发技术——你定义终点,AI 自己跑,跑完为止。 是什么 Ralph Loop(也叫 Ralph Wiggum Loop): ...
研究日期: 2026-01-29 一句话说清楚 A2UI(Agent-to-User Interface)是 Google 在 2025 年 12 月开源的一套声明式 UI 协议——AI Agent 不再吐 HTML 或写代码,而是发一段 JSON “蓝图”,告诉客户端"我想要一个日期选择器和一个提交按钮",客户端拿着这份蓝图用自己的原生组件去渲染。安全得像数据,表达力像代码。 ...
摘要 背景:Claude Cowork 是 Anthropic 于 2026 年 1 月 12 日发布的桌面 AI 代理工具,本质上是"给非程序员用的 Claude Code"——让普通用户也能通过自然语言指挥 AI 自主操作本地文件。 ...
一、前言 想象一下,你雇了一位实习生,开始时你教了一些规范: “我们公司的 PPT 要用这个颜色,这个字体,Logo 放左上角……” “代码审查要检查这些安全项,那些性能点……” ...
V8 Inspector,也常被称为 V8 Inspector Protocol,或理解为 Chrome DevTools Protocol 中与 V8 调试相关的那部分能力。它是 V8 JavaScript 引擎暴露给外部调试工具的标准调试接口。 ...
这篇文章整理自 Anthropic 官方博客《Best practices for prompt engineering》。原文发表于 2025 年 11 月 10 日,本文在保留原意的基础上做了中文整理和润色,便于直接阅读。 ...