持续更新 · 跟随时代需求

知识库更新日志

这不是一套停留在旧数仓时代的文档集合,而是持续跟随 AI-Native Data Stack、Agent、RAG、语义层、向量数据库和现代数据治理演进的知识体系。

2,200+ 篇

深度文档

2,500 万+字

专业内容

29 个

技术栈

11 大行业

行业覆盖

下一阶段预告2026-04-19

6 个 AI 数据工程专题进入扩充计划

春季扩充完成后,知识库下一阶段将继续围绕 AI 数据工程的新工作流扩展内容,覆盖从数据开发方式、模型成本到跨 Agent 协作的关键变化。

6 个专题方向

  • Vibe Data Engineering、Synthetic Data 2.0、Small Language Model / Edge AI
  • Data Product Marketplace、Agent-to-Agent 协议与 MCP 分工
  • Vector-Native 表格式:围绕 Iceberg 与 Lance 演化继续补齐新栈判断
内容校准2026-04-19

关键观点与适用建议完成复核

对本轮新增和重写内容做二次评审,补充不同团队阶段、岗位角色和技术成熟度下的适用建议,避免只追热点。

5 处内容判断优化

  • Agentic Analytics 补充不同分析团队的过渡建议
  • Agentic Data Engineering 补充大厂与中小团队的落地节奏差异
  • 语义层、AI-First Governance、Unity Catalog 与 Open Catalog 的判断口径更克制
内容升级2026-04-19

5 篇核心文档完成 2026 版升级

围绕自然语言查询、上下文工程、Kafka 新范式、LLM 成本控制和 Fine-tune 决策框架,完成一组既有核心文档升级。

5 篇重写 / 新建 / 扩充

  • Text-to-SQL 升级到语义层 + 多 Agent 范式
  • Prompt Engineering 升级到 Context Engineering
  • 新增 Diskless Kafka,扩充 LLM 成本控制,补齐 Fine-tune 决策框架
已上线2026-04-19

5 篇 AI 治理与可观测性专题已上线

补齐 AI 时代数据治理、血缘、非结构化数据和 Agent 可观测性能力,让数据资产治理延伸到 Prompt、Model 与 Agent 运行过程。

5 篇新增

  • AI Lineage:从数据血缘到 Prompt / Model 血缘
  • Agent Observability:Trace、Eval、Guardrail 三件套
  • 非结构化数据治理 · AI-First Governance Model · Unity Catalog vs Open Catalog
已上线2026-04-19

6 篇核心技术专题已上线

围绕 AI-Native Data Stack 的关键基础设施,新增 Iceberg V3、Flink Agents、语义层、Agentic Analytics、LanceDB 和非结构化数据管道等内容。

6 篇新增

  • Apache Iceberg V3:面向 AI workload 的表格式演进
  • Flink Agents 与事件驱动 AI · 语义层工程实践 · Agentic Analytics
  • LanceDB 多模态 Lakehouse · 非结构化数据管道
已上线2026-04-19

3 篇学习导航与方法论内容已上线

为 AI 时代数据人补齐学习导航和方法论入口,帮助用户判断哪些能力应优先补、哪些技术值得深入。

3 篇新增 / 重写

  • 2026 数据人必学 TOP 10
  • MCP Gateway 与生产部署
  • Agentic Data Engineering 方法论
方向升级2026-04-19

知识库扩充方向升级为 AI-Native Data Stack

本轮扩充正式回应数据工作方式变化:数据消费者从人和 BI 扩展到 Agent 与 LLM,数据获取方式从 SQL 和管道代码扩展到自然语言、语义层和 Agent 编排。

春季扩充启动

  • 从 Data Stack 与 AI Stack 分离,走向 AI-Native Data Stack 融合
  • 数据工程师从管道实现者,进一步转向意图架构师
  • 知识库将持续覆盖 MCP、Agent、语义层、向量数据库和 AI 数据治理等方向

开始使用持续进化的知识库

基本功、工程实践、AI 新栈和职业成长放在同一个系统里持续更新。