L4-1 · Langfuse 深度解构:开源、Self-hosted、Prompt 闭环

TL;DR · 本文论证:Langfuse 是当前最完整的开源 + self-hostable + framework-agnostic 的 LLM 可观测栈;它的真正护城河不是 trace UI,是把"调用观测 + Prompt 治理 + Eval + 离线回归"四件事缝合在一个数据模型上的设计。 · 写给:要做 LLM 可观测选型的工程师 / 架构师 / SRE——特别是国内合规敏感、数据必须留在自己基础设施内的团队。 · 不读会错过:Langfuse 与 LangSmith 的本质差异、self-hosted v3 架构(5 个组件起步)的真实运维成本、Prompt 版本化闭环的工作机制。 ...

June 1, 2026 · 15 min · 7208 words

L4-0 · AI 可观测格局:从 30 个产品到一个选型坐标系

TL;DR · 本文把当前 AI 可观测赛道的 30+ 产品按"它们在 LLM 调用链路的哪个位置切入"分成 5 种路线(Trace-first 专用平台 / OTel-native / Gateway / Eval-first / 传统 APM 扩展),给出二维选型坐标系和决策树。 · 写给:要做 AI 可观测选型的 SRE / 架构师 / AI 应用 tech lead——尤其是国内合规敏感、需要 self-hostable 路线的团队。 · 不读会错过:每条路线在赌什么、它的天花板在哪里、哪条最可能在三年洗牌后存活。 ...

June 1, 2026 · 14 min · 6768 words

L1-4 · 当被观测对象是 LLM:可观测性理论需要重写吗?

TL;DR · 本文论证:当被观测对象从确定性系统变成 LLM,前面三篇建立的三个回声(状态可推断 / 可控性对偶 / 状态空间维度)部分有效、部分崩塌——AI 可观测不是传统可观测的延伸,是一组新工程问题。 · 写给:构建 LLM 应用 / Agent / RAG 系统的工程师与架构师;以及已经在做传统可观测、想理解 AI 时代变了什么的 SRE。 · 不读会错过:“为什么 OpenTelemetry GenAI Conventions 必要但远不够"的根本理由——以及为什么 SRE 体系的 error budget 自动闭环在 LLM 上不能照搬。 ...

June 1, 2026 · 14 min · 6885 words

L1-3 · 基数、采样与认识论:你不可能记录全部

TL;DR · 本文论证:可观测体系永远是 lossy 的,每次采样、聚合、保留期决策都是认识论选择——它决定了你能回答什么问题、不能回答什么问题、什么问题永远问不出来。 · 写给:被可观测成本压住、被基数爆炸打过、做过 retention 取舍的 SRE / 平台工程师 / 架构师。 · 不读会错过:“为什么我们投入这么多还是看不清"的真正答案,以及为什么"完备性"是个伪命题。 ...

June 1, 2026 · 12 min · 5784 words

L1-2 · "三支柱"是一个误导的框架

TL;DR · 本文论证:metrics / logs / traces 不是可观测性的三个维度,是同一种"事件"的三种输出格式。把它当作理论框架已经造成了过去七八年的工程混乱——三套独立存储、三套查询语言、三道事故现场的墙。 · 写给可观测后端选型者、SRE、平台工程师、AI 应用架构师。 · 不读会错过:为什么 OTLP / Exemplar / 列存后端的兴起本质上是"三支柱在悄悄解体",以及为什么 AI 可观测不应再走老路。 ...

June 1, 2026 · 12 min · 5639 words

L1-1 · 可观测性的原始定义:从 Kalman 到 Honeycomb

TL;DR · 本文论证:observability 不是工具的清单,是被观测系统的一个数学性质——这件事六十年前 Kalman 就讲清楚了,我们后来弄丢了。 · 写给已经在用 Prometheus / Datadog / Honeycomb 但没认真想过"为什么"的工程师与架构师。 · 不读会错过:为什么 dashboard 加得越多反而越说不清状态、为什么"接入了可观测平台"≠ 可观测做完了、为什么 SLO + error budget 是 SRE 体系的真正核心。 ...

June 1, 2026 · 11 min · 5397 words

L1-0 · 可观测性关键词地图:100 个概念,一张地图

TL;DR · 本文用 100 个关键词构建可观测 / AI 可观测领域的拓扑地图——10 组、按"哲学 → 信号 → 协议 → 采集 → 存储 → 采样 → SLO → 告警 → 用户视角 → AI"逻辑排列。 · 写给:进入这个领域不超过两年、想快速建立全景的工程师;以及已经在领域内、想用这个地图做术语校准 / 选型决策 / 团队对齐的架构师。 · 不读会错过:词条之间的关系——光知道每个词的定义还不够,真正有用的是看懂"为什么 cardinality 决定 sampling 决定 cost"这种横跨多组的因果链。Notes: 行就是用来承载这种关系的。 ...

June 1, 2026 · 20 min · 9837 words
应县木塔正面全景

应县木塔 · 千年孤构

远看擎天柱,近似百尺莲。 在中国境内现存的所有古代纯木结构楼阁中,应县木塔是最高、最老、唯一硕果仅存的一座。它建成于公元 1056 年,比北宋开封的繁华尚早;它经历过至少七次有感地震、1926 年军阀混战的两百余发炮弹、近千年的风雪雷电,却仍在山西朔州的塬上立着。本文是对它的一份系统笔记——历史背景、营建始末、结构解构、塑像匾额、千年劫难、辽代秘藏、梁思成的测绘,以及它当下令人忧心的倾斜与修缮困局。 ...

April 30, 2026 · 16 min · 7516 words
云冈第 12 窟(音乐窟)内景

云冈石窟(下)· 云冈大成

这是《云冈石窟》系列的下篇,承接上篇(历史背景、营建分期与早中期主要洞窟、昙曜五窟)。下篇覆盖第 14–15 窟与西部窟群(21–45)、云冈模式的形成、胡风胡韵的多元交融,以及保护历程与今日云冈。 一、第 14、15 窟与西部窟群 Chapter Seven · Caves 14–15 & Western Group (Caves 21–45) ...

April 29, 2026 · 26 min · 12675 words
云冈石窟全景航拍

云冈石窟(上)· 北魏凿石

这是《云冈石窟》系列的上篇,覆盖历史背景、营建分期与早中期主要洞窟(1-13 窟、昙曜五窟 16-20)。下篇接续 14-15 窟与西部窟群(21-45),及艺术风格、文化交融与保护历程。 ...

April 29, 2026 · 36 min · 17696 words