Posts

L4-1 · Langfuse 深度解构：开源、Self-hosted、Prompt 闭环

TL;DR · 本文论证：Langfuse 是当前最完整的开源 + self-hostable + framework-agnostic 的 LLM 可观测栈；它的真正护城河不是 trace UI，是把"调用观测 + Prompt 治理 + Eval + 离线回归"四件事缝合在一个数据模型上的设计。 · 写给：要做 LLM 可观测选型的工程师 / 架构师 / SRE——特别是国内合规敏感、数据必须留在自己基础设施内的团队。 · 不读会错过：Langfuse 与 LangSmith 的本质差异、self-hosted v3 架构（5 个组件起步）的真实运维成本、Prompt 版本化闭环的工作机制。 ...

L4-0 · AI 可观测格局：从 30 个产品到一个选型坐标系

TL;DR · 本文把当前 AI 可观测赛道的 30+ 产品按"它们在 LLM 调用链路的哪个位置切入"分成 5 种路线（Trace-first 专用平台 / OTel-native / Gateway / Eval-first / 传统 APM 扩展），给出二维选型坐标系和决策树。 · 写给：要做 AI 可观测选型的 SRE / 架构师 / AI 应用 tech lead——尤其是国内合规敏感、需要 self-hostable 路线的团队。 · 不读会错过：每条路线在赌什么、它的天花板在哪里、哪条最可能在三年洗牌后存活。 ...

L1-4 · 当被观测对象是 LLM：可观测性理论需要重写吗？

TL;DR · 本文论证：当被观测对象从确定性系统变成 LLM，前面三篇建立的三个回声（状态可推断 / 可控性对偶 / 状态空间维度）部分有效、部分崩塌——AI 可观测不是传统可观测的延伸，是一组新工程问题。 · 写给：构建 LLM 应用 / Agent / RAG 系统的工程师与架构师；以及已经在做传统可观测、想理解 AI 时代变了什么的 SRE。 · 不读会错过：“为什么 OpenTelemetry GenAI Conventions 必要但远不够"的根本理由——以及为什么 SRE 体系的 error budget 自动闭环在 LLM 上不能照搬。 ...

L1-3 · 基数、采样与认识论：你不可能记录全部

TL;DR · 本文论证：可观测体系永远是 lossy 的，每次采样、聚合、保留期决策都是认识论选择——它决定了你能回答什么问题、不能回答什么问题、什么问题永远问不出来。 · 写给：被可观测成本压住、被基数爆炸打过、做过 retention 取舍的 SRE / 平台工程师 / 架构师。 · 不读会错过：“为什么我们投入这么多还是看不清"的真正答案，以及为什么"完备性"是个伪命题。 ...

L1-2 · "三支柱"是一个误导的框架

TL;DR · 本文论证：metrics / logs / traces 不是可观测性的三个维度，是同一种"事件"的三种输出格式。把它当作理论框架已经造成了过去七八年的工程混乱——三套独立存储、三套查询语言、三道事故现场的墙。 · 写给可观测后端选型者、SRE、平台工程师、AI 应用架构师。 · 不读会错过：为什么 OTLP / Exemplar / 列存后端的兴起本质上是"三支柱在悄悄解体"，以及为什么 AI 可观测不应再走老路。 ...

L1-1 · 可观测性的原始定义：从 Kalman 到 Honeycomb

TL;DR · 本文论证：observability 不是工具的清单，是被观测系统的一个数学性质——这件事六十年前 Kalman 就讲清楚了，我们后来弄丢了。 · 写给已经在用 Prometheus / Datadog / Honeycomb 但没认真想过"为什么"的工程师与架构师。 · 不读会错过：为什么 dashboard 加得越多反而越说不清状态、为什么"接入了可观测平台"≠ 可观测做完了、为什么 SLO + error budget 是 SRE 体系的真正核心。 ...

L1-0 · 可观测性关键词地图：100 个概念，一张地图

TL;DR · 本文用 100 个关键词构建可观测 / AI 可观测领域的拓扑地图——10 组、按"哲学 → 信号 → 协议 → 采集 → 存储 → 采样 → SLO → 告警 → 用户视角 → AI"逻辑排列。 · 写给：进入这个领域不超过两年、想快速建立全景的工程师；以及已经在领域内、想用这个地图做术语校准 / 选型决策 / 团队对齐的架构师。 · 不读会错过：词条之间的关系——光知道每个词的定义还不够，真正有用的是看懂"为什么 cardinality 决定 sampling 决定 cost"这种横跨多组的因果链。Notes: 行就是用来承载这种关系的。 ...

应县木塔 · 千年孤构

远看擎天柱，近似百尺莲。在中国境内现存的所有古代纯木结构楼阁中，应县木塔是最高、最老、唯一硕果仅存的一座。它建成于公元 1056 年，比北宋开封的繁华尚早；它经历过至少七次有感地震、1926 年军阀混战的两百余发炮弹、近千年的风雪雷电，却仍在山西朔州的塬上立着。本文是对它的一份系统笔记——历史背景、营建始末、结构解构、塑像匾额、千年劫难、辽代秘藏、梁思成的测绘，以及它当下令人忧心的倾斜与修缮困局。 ...

云冈石窟（下）· 云冈大成

这是《云冈石窟》系列的下篇，承接上篇（历史背景、营建分期与早中期主要洞窟、昙曜五窟）。下篇覆盖第 14–15 窟与西部窟群（21–45）、云冈模式的形成、胡风胡韵的多元交融，以及保护历程与今日云冈。一、第 14、15 窟与西部窟群 Chapter Seven · Caves 14–15 & Western Group (Caves 21–45) ...

云冈石窟（上）· 北魏凿石

这是《云冈石窟》系列的上篇，覆盖历史背景、营建分期与早中期主要洞窟（1-13 窟、昙曜五窟 16-20）。下篇接续 14-15 窟与西部窟群（21-45），及艺术风格、文化交融与保护历程。 ...