ready
Week01
Week01|从 Demo 到上线:AI 为什么不能直接用?
为什么很多 AI 项目做得出功能,却交付不了系统?
- 学习时长
- 4 节课 + 实验 + 作业
- 前置基础
- 具备基本工程认知
- 本周产出
- 问题定义、系统蓝图、Done 边界、项目基线
ready
Week02
Week02|输入确定性保障——数据盘点与数据契约
为什么输入失控会比模型能力不足更早摧毁 AI 系统?
- 本周结构
- 5 课时 + 实验 + 作业
- 前置基础
- 建议先学 Week01
- 本周产出
- 数据资产清单 v1、四类 Data Contract v1、采集计划 v1、输入门禁最小闭环
ready
Week03
Week03|采集与入湖——Batch / CDC / Stream 的组合拳
为什么“采到数据”不等于链路可靠、更不等于系统可回放?
- 本周结构
- 5 课时 + 实验 + 作业
- 前置基础
- 建议先完成 Week01–Week02
- 本周产出
- 采集最小链路 v1、Runbook v1、完整性报告
ready
Week04
Week04|Lakehouse 底座——Iceberg 快照/演进/性能基线
为什么 AI 数据系统必须从“能查到表”升级成“有状态记忆的表”?
- 本周结构
- 5 课时 + 实验 + 作业
- 前置基础
- 建议先完成 Week01–Week03
- 本周产出
- Week04 lakehouse foundation v1、最小 4 表设计、runbook、baseline report
ready
Week05
Week 5:Transform 与语义层——把口径写进工程(给 BI 也给 Agent 用)
为什么指标口径不能停在 SQL 片段里,而要变成可测试、可审计、可被工具安全消费的工程接口?
- 本周结构
- 5 课时 + 实验 + 作业
- 前置基础
- 建议先完成 Week01–Week04
- 本周产出
- analytics dbt project、support KPI mart、metric registry、受控指标查询工具 v1、Week05 指标包
ready
Week06
Week 6:资产化数据工厂——编排、回填与可追溯
为什么脚本跑通仍然不等于数据产品可运营?
- 本周结构
- 5 课时 + 实验 + 作业
- 前置基础
- 建议先完成 Week01–Week05
- 本周产出
- asset graph、partition/backfill strategy、asset checks、run evidence、Data Factory Runbook v1
ready
Week07
Week 7:非结构化数据工程
为什么把 PDF 读成文本还远远不够,文档必须升级成带结构、证据和质量门禁的数据资产?
- 本周结构
- 5 课时 + 实验 + 作业
- 前置基础
- 建议先完成 Week01–Week06;如果 Week06 尚未接入,可先走 devbox CLI fallback
- 本周产出
- 文档资产 v1、sections/chunks/anchors、chunk_quality_report、week8_ready_gate