SHISUI KNOWLEDGE BASE

AI 时代数据人的
全栈知识库

2,215 篇深度原创文档,覆盖数据工程、业务分析、AI 应用全链路。从传统数仓到 AI-Native Data Stack,从 SQL 到 Agentic Analytics——持续更新的系统化学习路径,助你在当前时代持续进阶。

持续保持更新

按路线图补充新技术、新案例和新岗位能力,避免内容停留在旧经验里。

持续迎合时代需求

覆盖 MCP、LLMOps、Agentic Analytics、Flink Agents、Iceberg V3 等新方向。

基本功与新能力并重

SQL、数仓、治理、分析方法继续夯实,同时补齐 AI 时代的数据工作流。

正在验证登录状态...

加载中...
pro.ss-data.cc / Welcome
知识库移动端预览

LEARNING SYSTEM

三大核心优势,让你的学习事半功倍

CONTENT MAP

10+ 大内容板块,从数据基本功到 AI-Native Data Stack

从数据治理到向量数据库,从技术工具到行业实践,构建面向当前时代的数据知识体系

最新扩充

AI 与大数据

38 篇核心 · 春季扩充

Agent · RAG · LLMOps · MCP

求职就业专题

139 篇 · 7 大岗位

技术与工具

622 篇 · 40+ 技术栈

数据分析与运营

246 篇

行业基础知识

817 篇 · 11 个行业

数据开发与架构

157 篇

数据治理与管理

150 篇

查看完整目录

2,215 篇 · 全部模块

浏览目录

RECENT UPDATES

持续更新,紧跟时代

知识库按路线图持续迭代,确保内容跟上 AI、数据工程和业务实践的真实变化

下一阶段预告2026年4月19日

6 个 AI 数据工程专题进入扩充计划

春季扩充完成后,知识库下一阶段将继续围绕 AI 数据工程的新工作流扩展内容,覆盖从数据开发方式、模型成本到跨 Agent 协作的关键变化。

  • Vibe Data Engineering、Synthetic Data 2.0、Small Language Model / Edge AI
  • Data Product Marketplace、Agent-to-Agent 协议与 MCP 分工
  • Vector-Native 表格式:围绕 Iceberg 与 Lance 演化继续补齐新栈判断
6 个专题方向查看完整日志 →
内容校准2026年4月19日

关键观点与适用建议完成复核

对本轮新增和重写内容做二次评审,补充不同团队阶段、岗位角色和技术成熟度下的适用建议,避免只追热点。

  • Agentic Analytics 补充不同分析团队的过渡建议
  • Agentic Data Engineering 补充大厂与中小团队的落地节奏差异
  • 语义层、AI-First Governance、Unity Catalog 与 Open Catalog 的判断口径更克制
5 处内容判断优化
内容升级2026年4月19日

5 篇核心文档完成 2026 版升级

围绕自然语言查询、上下文工程、Kafka 新范式、LLM 成本控制和 Fine-tune 决策框架,完成一组既有核心文档升级。

  • Text-to-SQL 升级到语义层 + 多 Agent 范式
  • Prompt Engineering 升级到 Context Engineering
  • 新增 Diskless Kafka,扩充 LLM 成本控制,补齐 Fine-tune 决策框架
5 篇重写 / 新建 / 扩充
已上线2026年4月19日

5 篇 AI 治理与可观测性专题已上线

补齐 AI 时代数据治理、血缘、非结构化数据和 Agent 可观测性能力,让数据资产治理延伸到 Prompt、Model 与 Agent 运行过程。

  • AI Lineage:从数据血缘到 Prompt / Model 血缘
  • Agent Observability:Trace、Eval、Guardrail 三件套
  • 非结构化数据治理 · AI-First Governance Model · Unity Catalog vs Open Catalog
5 篇新增
已上线2026年4月19日

6 篇核心技术专题已上线

围绕 AI-Native Data Stack 的关键基础设施,新增 Iceberg V3、Flink Agents、语义层、Agentic Analytics、LanceDB 和非结构化数据管道等内容。

  • Apache Iceberg V3:面向 AI workload 的表格式演进
  • Flink Agents 与事件驱动 AI · 语义层工程实践 · Agentic Analytics
  • LanceDB 多模态 Lakehouse · 非结构化数据管道
6 篇新增
已上线2026年4月19日

3 篇学习导航与方法论内容已上线

为 AI 时代数据人补齐学习导航和方法论入口,帮助用户判断哪些能力应优先补、哪些技术值得深入。

  • 2026 数据人必学 TOP 10
  • MCP Gateway 与生产部署
  • Agentic Data Engineering 方法论
3 篇新增 / 重写
方向升级2026年4月19日

知识库扩充方向升级为 AI-Native Data Stack

本轮扩充正式回应数据工作方式变化:数据消费者从人和 BI 扩展到 Agent 与 LLM,数据获取方式从 SQL 和管道代码扩展到自然语言、语义层和 Agent 编排。

  • 从 Data Stack 与 AI Stack 分离,走向 AI-Native Data Stack 融合
  • 数据工程师从管道实现者,进一步转向意图架构师
  • 知识库将持续覆盖 MCP、Agent、语义层、向量数据库和 AI 数据治理等方向
春季扩充启动

以上仅为近期更新,知识库持续迭代。完整内容演进记录可查看知识库更新日志

USER VOICES

来自用户的真实反馈

他们在这里找到了成长的方向

1,200+

付费会员

2,215

深度文档

10+

内容板块

4.9

用户评分

李同学

数据分析师 · 互联网大厂

知识库的内容非常系统,从基础到进阶都有覆盖。特别是行业案例部分,帮我快速了解了不同业务场景下的数据分析方法,面试时派上了大用场。

王先生

数据工程师 · 金融科技

技术文档写得很清晰,Spark、Flink 这些大数据技术的讲解深入浅出。最难得的是有很多生产环境的实战经验分享,避免了很多坑。

张女士

产品经理转数据 · 电商

作为转行的人,这个知识库帮我建立了完整的数据知识体系。学习路线很清晰,不用到处找资料了。现在已经成功转型数据产品经理!

陈同学

应届生 · 数据科学硕士

求职专题太实用了!简历模板、面试题库、薪资谈判技巧都有。按照里面的方法准备,拿到了 3 个大厂 offer,最后选了字节。

刘先生

数据负责人 · 创业公司

数据治理和数据中台的内容很全面,帮我们从 0 到 1 搭建了公司的数据体系。遇到问题在社群里问,响应也很快。

赵女士

BI 分析师 · 零售行业

行业知识库太香了!零售、电商的业务指标和分析框架整理得很完整,直接拿来就能用。老板都夸我业务理解能力提升很快。