持续更新 · 跟随时代需求

知识库更新日志

这不是一套停留在旧数仓时代的文档集合,而是持续跟随 AI-Native Data Stack、Agent、RAG、语义层、向量数据库和现代数据治理演进的知识体系。

2,200+ 篇

深度文档

2,500 万+字

专业内容

29 个

技术栈

11 大行业

行业覆盖

最新日志2026-04-19

Batch 5 夏季规划立项

春季扩充完成后,继续立项 Vibe Data Engineering、Small Language Model / Edge AI、Synthetic Data 2.0、Data Product Marketplace、A2A 与 MCP 分工、Vector-Native 表格式。

6 个新话题

  • Vibe Data Engineering:数据工程的 Vibe Coding 范式
  • Synthetic Data 2.0 · Small Language Model / Edge AI · Data Product Marketplace
  • Agent-to-Agent 协议与 MCP 分工 · Vector-Native 表格式演化
立场微调2026-04-19

基于石头反馈完成 5 处立场微调

对新增与重写文章的判断口径做二次校准,避免只追热点,继续保持“对数据从业者怎么办”有明确立场。

5 处判断修订

  • Agentic Analytics 增加 D 类过渡建议
  • Agentic Data Engineering 增加大厂 / 中小厂双时间线
  • 语义层降调,AI-First 治理加过渡期说明,Unity vs Open 改中立描述
Batch 42026-04-19

升级既有文档全部落盘

完成 Text-to-SQL、Prompt Engineering、Kafka、LLM 成本控制、Fine-tune 决策框架等既有核心文档的 2026 升级。

5 篇重写 / 新建 / 扩充

  • Text-to-SQL 重写为 2026 升级版:语义层 + 多 Agent 范式
  • Prompt Engineering 重写为 Context Engineering
  • 新建 Diskless Kafka,扩充 LLM 成本控制,新增 Fine-tune 决策框架
Batch 32026-04-19

治理与可观测性专题全部落盘

围绕 AI 时代治理、血缘、可观测性和目录治理完成专题扩充,补齐从数据资产到 Agent 运行过程的治理视角。

5 篇新增

  • AI Lineage:从数据血缘到 Prompt / Model 血缘
  • Agent Observability:Trace、Eval、Guardrail 三件套
  • 非结构化数据治理 · AI-First Governance Model · Unity Catalog vs Open Catalog
Batch 22026-04-19

硬技术重头戏全部落盘

完成 Iceberg V3、语义层、Flink Agents、Agentic Analytics、LanceDB、非结构化数据管道等硬技术专题。

6 篇新增

  • Apache Iceberg V3:为 AI workload 重新设计的表格式
  • Flink Agents 与事件驱动 AI · 语义层工程实践 · Agentic Analytics
  • LanceDB 多模态 Lakehouse · 非结构化数据管道
Batch 12026-04-19

地基与导航三篇全部落盘

完成 2026 数据人必学 TOP 10、MCP Gateway 与生产部署、Agentic Data Engineering 方法论三篇地基内容。

3 篇新增 / 重写

  • 2026 数据人必学 TOP 10
  • MCP Gateway 与生产部署
  • Agentic Data Engineering 方法论
路线图初建2026-04-19

2026 春季知识库扩充路线图初建

正式回应 AI-Native Data Stack 成为共识的拐点,把 MCP、Iceberg V3、Flink Agents、Agentic Analytics 等方向纳入知识库扩充路线。

Batch 1 启动

  • 第一消费者从人 + BI 扩展到 Agent + LLM
  • 数据获取方式从 SQL / 管道代码扩展到自然语言 + 语义层 + Agent 编排
  • 数据工程师定位从管道工迁移到意图架构师

开始使用持续进化的知识库

基本功、工程实践、AI 新栈和职业成长放在同一个系统里持续更新。