SHISUI KNOWLEDGE BASE
AI 时代数据人的
全栈知识库
2,215 篇深度原创文档,覆盖数据工程、业务分析、AI 应用全链路。从传统数仓到 AI-Native Data Stack,从 SQL 到 Agentic Analytics——持续更新的系统化学习路径,助你在当前时代持续进阶。
持续保持更新
按路线图补充新技术、新案例和新岗位能力,避免内容停留在旧经验里。
持续迎合时代需求
覆盖 MCP、LLMOps、Agentic Analytics、Flink Agents、Iceberg V3 等新方向。
基本功与新能力并重
SQL、数仓、治理、分析方法继续夯实,同时补齐 AI 时代的数据工作流。
正在验证登录状态...

LEARNING SYSTEM
三大核心优势,让你的学习事半功倍
CONTENT MAP
10+ 大内容板块,从数据基本功到 AI-Native Data Stack
从数据治理到向量数据库,从技术工具到行业实践,构建面向当前时代的数据知识体系
AI 与大数据
38 篇核心 · 春季扩充
Agent · RAG · LLMOps · MCP
求职就业专题
139 篇 · 7 大岗位
技术与工具
622 篇 · 40+ 技术栈
数据分析与运营
246 篇
行业基础知识
817 篇 · 11 个行业
数据开发与架构
157 篇
数据治理与管理
150 篇
查看完整目录
2,215 篇 · 全部模块
RECENT UPDATES
持续更新,紧跟时代
知识库按路线图持续迭代,确保内容跟上 AI、数据工程和业务实践的真实变化
6 个 AI 数据工程专题进入扩充计划
春季扩充完成后,知识库下一阶段将继续围绕 AI 数据工程的新工作流扩展内容,覆盖从数据开发方式、模型成本到跨 Agent 协作的关键变化。
- •Vibe Data Engineering、Synthetic Data 2.0、Small Language Model / Edge AI
- •Data Product Marketplace、Agent-to-Agent 协议与 MCP 分工
- •Vector-Native 表格式:围绕 Iceberg 与 Lance 演化继续补齐新栈判断
关键观点与适用建议完成复核
对本轮新增和重写内容做二次评审,补充不同团队阶段、岗位角色和技术成熟度下的适用建议,避免只追热点。
- •Agentic Analytics 补充不同分析团队的过渡建议
- •Agentic Data Engineering 补充大厂与中小团队的落地节奏差异
- •语义层、AI-First Governance、Unity Catalog 与 Open Catalog 的判断口径更克制
5 篇核心文档完成 2026 版升级
围绕自然语言查询、上下文工程、Kafka 新范式、LLM 成本控制和 Fine-tune 决策框架,完成一组既有核心文档升级。
- •Text-to-SQL 升级到语义层 + 多 Agent 范式
- •Prompt Engineering 升级到 Context Engineering
- •新增 Diskless Kafka,扩充 LLM 成本控制,补齐 Fine-tune 决策框架
5 篇 AI 治理与可观测性专题已上线
补齐 AI 时代数据治理、血缘、非结构化数据和 Agent 可观测性能力,让数据资产治理延伸到 Prompt、Model 与 Agent 运行过程。
- •AI Lineage:从数据血缘到 Prompt / Model 血缘
- •Agent Observability:Trace、Eval、Guardrail 三件套
- •非结构化数据治理 · AI-First Governance Model · Unity Catalog vs Open Catalog
6 篇核心技术专题已上线
围绕 AI-Native Data Stack 的关键基础设施,新增 Iceberg V3、Flink Agents、语义层、Agentic Analytics、LanceDB 和非结构化数据管道等内容。
- •Apache Iceberg V3:面向 AI workload 的表格式演进
- •Flink Agents 与事件驱动 AI · 语义层工程实践 · Agentic Analytics
- •LanceDB 多模态 Lakehouse · 非结构化数据管道
3 篇学习导航与方法论内容已上线
为 AI 时代数据人补齐学习导航和方法论入口,帮助用户判断哪些能力应优先补、哪些技术值得深入。
- •2026 数据人必学 TOP 10
- •MCP Gateway 与生产部署
- •Agentic Data Engineering 方法论
知识库扩充方向升级为 AI-Native Data Stack
本轮扩充正式回应数据工作方式变化:数据消费者从人和 BI 扩展到 Agent 与 LLM,数据获取方式从 SQL 和管道代码扩展到自然语言、语义层和 Agent 编排。
- •从 Data Stack 与 AI Stack 分离,走向 AI-Native Data Stack 融合
- •数据工程师从管道实现者,进一步转向意图架构师
- •知识库将持续覆盖 MCP、Agent、语义层、向量数据库和 AI 数据治理等方向
以上仅为近期更新,知识库持续迭代。完整内容演进记录可查看知识库更新日志
USER VOICES
来自用户的真实反馈
他们在这里找到了成长的方向
1,200+
付费会员
2,215
深度文档
10+
内容板块
4.9
用户评分
李同学
数据分析师 · 互联网大厂
知识库的内容非常系统,从基础到进阶都有覆盖。特别是行业案例部分,帮我快速了解了不同业务场景下的数据分析方法,面试时派上了大用场。
王先生
数据工程师 · 金融科技
技术文档写得很清晰,Spark、Flink 这些大数据技术的讲解深入浅出。最难得的是有很多生产环境的实战经验分享,避免了很多坑。
张女士
产品经理转数据 · 电商
作为转行的人,这个知识库帮我建立了完整的数据知识体系。学习路线很清晰,不用到处找资料了。现在已经成功转型数据产品经理!
陈同学
应届生 · 数据科学硕士
求职专题太实用了!简历模板、面试题库、薪资谈判技巧都有。按照里面的方法准备,拿到了 3 个大厂 offer,最后选了字节。
刘先生
数据负责人 · 创业公司
数据治理和数据中台的内容很全面,帮我们从 0 到 1 搭建了公司的数据体系。遇到问题在社群里问,响应也很快。
赵女士
BI 分析师 · 零售行业
行业知识库太香了!零售、电商的业务指标和分析框架整理得很完整,直接拿来就能用。老板都夸我业务理解能力提升很快。



