|
|
@@ -552,9 +552,9 @@ record_per_channel = 100000
|
|
|
|
|
|
1. **注释完整化**:40 函数全部补齐 docstring,统一 5 段模板 —— 一句话摘要 / 入参(名 · 类型 · 约束 / 可空 / 单位) / 返回(类型 · 语义 · 空值场景) / 异常与边界 / SQL 调用示例。按分类分批推进:JSON 段 → Array 段 → String 段 → Numeric-Date-Hash 段 → Cross-type 段,5 批独立 commit。
|
|
|
|
|
|
-2. **UDF 自查表**:新建 `kb/31-UDF 手册.md`(与 `30-开发规范.md` 同级独立文档;40 函数规模独立成文更稳,新增 UDF 需要稳定引用锚点)。表头 `函数名 | 分类 | 入参 | 返回 | 摘要 | 代码位置 | 补注释状态`。初版把现有 40 函数全量登记,后续新增通用 UDF(进 `common/`)必须同步登记此表;只进 `business/` 的 UDF 不走此表,在 `business/` 子目录 README 维护。
|
|
|
+2. **UDF 自查表**:新建 `kb/31-UDF手册.md`(与 `30-开发规范.md` 同级独立文档;40 函数规模独立成文更稳,新增 UDF 需要稳定引用锚点)。表头 `函数名 | 分类 | 入参 | 返回 | 摘要 | 代码位置 | 补注释状态`。初版把现有 40 函数全量登记,后续新增通用 UDF(进 `common/`)必须同步登记此表;只进 `business/` 的 UDF 不走此表,在 `business/` 子目录 README 维护。
|
|
|
|
|
|
-3. **注册准入规则**:`kb/30-开发规范.md` 新增一节或 `CLAUDE.md` 一行硬约束 —— 向 `common/` 增删 UDF 前,先读 `kb/31` 自查表;新增必须同步更新表(函数名 / 分类 / 示例),否则 commit 不过。与 `tests/unit/udf/test_spark_common_udf.py`(阶段 4 首批单测目标,见 §2.11 占位 registry)是配套的:自查表为开发者服务,单测为回归服务。
|
|
|
+3. **注册准入规则**:在 `kb/30-开发规范.md` 新增一节或 `kb/31-UDF手册.md` 内嵌一节写硬约束 —— 向 `common/` 增删 UDF 前,先读 `kb/31` 自查表;新增必须同步更新表(函数名 / 分类 / 示例),否则 commit 不过。与 `tests/unit/udf/test_spark_common_udf.py`(阶段 4 首批单测目标,见 §2.11 占位 registry)是配套的:自查表为开发者服务,单测为回归服务。
|
|
|
|
|
|
**回归检验**:
|
|
|
- 任意 SQL 文件直接 `SELECT my_udf(col)` 能跑通(common auto-load 链路未变,保留现状)
|