基于肾活检病理报告提取的结构化数据格式
由于计算资源限制,本API采用Qwen系统提供的embedding服务,而非本地Qwen模型。
重要差异: 最大向量长度为 2048 tokens,而非本地Qwen模型的4096 tokens。
因此,机器学习模型是基于 2048×4 向量 重新训练的新模型。
总特征向量维度为 2048 × 4 = 8192 维
模型: 本地Qwen模型
向量长度: 4096 tokens
总维度: 4096 × 4 = 16384 维
模型: Qwen系统embedding服务
向量长度: 2048 tokens
总维度: 2048 × 4 = 8192 维
| 字段名 | 数据类型 | 描述 |
|---|---|---|
| M | int | M分项评分 (0-1) |
| E | int | E分项评分 (0-1) |
| S | int | S分项评分 (0-1) |
| T | int | T分项评分 (0-1) |
| C | int | C分项评分 (0-1) |
| 字段名 | 数据类型 | 描述 |
|---|---|---|
| total_count | int | 肾小球总数 |
| global_sclerosis_ratio | float | 全球硬化比例(已转换为小数) |
| segmental_sclerosis_count | int | 节段性硬化数量 |
| cellular_proliferation_present | bool | 是否存在细胞增生 |
| cellular_crescents_ratio | float | 细胞性新月体比例(已转换为小数) |
| mesangial_hypercellularity_degree | str | 系膜细胞增生程度(无/轻度/中度/重度) |
| capillary_loop_abnormalities | bool | 是否存在毛细血管袢异常 |
| 字段名 | 数据类型 | 描述 |
|---|---|---|
| tubular_atrophy_degree | str | 肾小管萎缩程度(无/轻度/中度/重度) |
| tubular_atrophy_percentage | float | 肾小管萎缩比例(已转换为小数) |
| interstitial_fibrosis_degree | str | 间质纤维化程度 |
| interstitial_fibrosis_percentage | float | 间质纤维化比例 |
| inflammatory_infiltration_degree | str | 炎性浸润程度 |
| inflammatory_infiltration_distribution | str | 炎性浸润分布 |
| 字段名 | 数据类型 | 描述 |
|---|---|---|
| intimal_fibrosis_present | bool | 是否存在内膜纤维化 |
| intimal_fibrosis_severity | str | 内膜纤维化严重程度 |
| arteriolosclerosis_present | bool | 是否存在小动脉硬化 |
| 字段名 | 数据类型 | 描述 |
|---|---|---|
| IgA_intensity | str | IgA沉积强度(如"2-3+") |
| IgA_distribution | str | IgA分布模式 |
| IgG_present | bool | 是否存在IgG沉积 |
| IgG_intensity | str | IgG沉积强度 |
| IgM_present | bool | 是否存在IgM沉积 |
| IgM_intensity | str | IgM沉积强度 |
| C3_present | bool | 是否存在C3沉积 |
| C3_intensity | str | C3沉积强度 |
| C1q_present | bool | 是否存在C1q沉积 |
| fibrinogen_present | bool | 是否存在纤维蛋白原沉积 |
| 字段名 | 数据类型 | 描述 |
|---|---|---|
| key_pathology_features | list | 关键病理特征列表(字符串数组),后续会进行向量化处理 |