古脉｜医疗数据标注平台

平台定位

破解行业双重痛点

人工智能时代，数据质量决定模型性能上限。传统模式存在数据来源单一、标注专业性不足、效率低下等痛点。

PAIN · 01

有需求，无数据

大模型公司、创新药企需要与多家医院对接获取病例，数据来源单一、治理成本高，难以快速获得高质量真实世界诊疗数据。

多方医院对接治理周期长成本居高不下

PAIN · 02

有数据，难标注

传统模式往往只能找医学生进行标注，缺乏医学专业性，标注质量不足，显著影响模型训练效果与科研进展。

专业性不足质量难保障拖慢训练进度

古脉的解决方案

依托健康大脑数据采集治理，数据源覆盖全国 3070+ 医疗机构，5500 万患者+ 真实世界全病程数据。通过统一平台实现标注需求承接、任务分发、结果审核、数据产品封装，有效破解双重痛点。

核心功能

三大功能版块，全流程服务

平台主要包含"数据广场"、"工作台"、"众包空间"三大核心功能版块，覆盖数据获取、智能标注、任务分发全流程。

数据广场

一站式医疗数据资源中心

统一展示已上架的数据集资源，支持数据需求方自由检索、预览、探查并申请使用。按"一项目一治理"原则快速构建所需数据集。

数据检索与预览：自由检索已上架数据集，预览样例数据与核心特征

数据探查工具：按诊断、检验结果、药品、群体特征等标签自由组合筛选

发布探数需求：按需提报专病数据集需求，审核通过后构建

购数车管理：管理已获批的数据集字段，支持查看、整合、拆分

数据广场

全部原始素材成果作品

文本标注数据集

萧山区卫生健康局

原始素材

2型糖尿病高质量数据集

萧山区卫生健康局

成果作品

多发性骨髓瘤周围神经病变

萧山区卫生健康局

原始素材

数据性质：公共数据 / 行业数据

工作台 · 高质量数据集

50条数据【4%】本地文件

总数据填充率 (36/37) 97%

纳入筛选表一般资料骨髓检查结果

纳入条件

1、年龄≤75岁是

2、经骨髓穿刺等检查，确诊为多发性骨髓瘤患者

3、体力状况：(Ps)评分≤3分

工作台

AI预标注 + 专家校验

为医学专家提供"AI预标注+人工校验"服务，内嵌文本、影像、图片等各类AI预标注插件，让医学专家从"标注员"升级为"审核员"。

多模态AI预标注：文本实体抽取、影像三维分割、病理图像边界框标注

智能填充：自动识别并填充标注字段，大幅提升标注效率

多级质控体系：纳入筛选、一般资料、检查结果分阶段审核

批量操作支持：批量编辑标注、批量保存提交

众包空间

医学专家灵活接单平台

对所有标注任务进行统一管理，实现标注任务的统一派发、医学专家灵活接单、标注进度与质量监管，提供完善的操作培训与劳务费用发放服务。

6大类订单类型：文本实体标注、文本类型标注、图片分割标注、医学影像分割标注、高质量数据集建设、问卷调查

精准任务匹配：按科室、职称、身份要求筛选，只展示可接取订单

小脉众包推荐：智能推荐满足资质要求的优质订单

费用透明结算：按验收通过数量与标注质量综合测算，15个工作日内打款

众包空间

当前查询订单 94 个，我可接受 61 个

乳腺癌临床实践情况高质量数据集建设

¥1/份

包括流行病学、疾病诊断、治疗方案、不良反应等，梳理乳腺癌临床实践中的共性特征俞个性化经验

职称：主任医师

库存：47/50份（每份1条数据）交付期限：1天

高质量数据集订单流程高质量数据集建设

¥20/份

高质量数据集订单流程的需求说明...

身份：医生、护士、药师职称：主任医师、副主任医师、主治医师

库存：21/25份（每份2条数据）交付期限：1天

小脉众包推荐

推荐给您满足任务要求可直接接取的任务哦~

订单类型

丰富多样的众包类型

覆盖文本、影像、图片等多种数据模态，满足不同场景的数据标注需求。

文本

文本实体标注

从病历、检查报告等文本中抽取医学实体，如疾病、症状、药品、检验指标等。

文本

文本类型标注

对文本进行分类标注，如按时间、科室、正常/异常、风险等级等维度分类。

图片

图片分割标注

在病理全玻片图像等单张图片上用边界框标出病灶、器官或特定区域位置。

影像

医学影像分割标注

在CT/MR原始DICOM数据中对器官、肿瘤、血管等目标进行三维分割标注。

数据集

高质量数据集建设

构建问答对、思维链等高质量训练数据，满足大模型SFT和多模态训练需求。

问卷

问卷调查

对问卷结果进行预处理和统计分析，对文本实体进行提取和关联标注。

业务流程

七步闭环，高效协作

从需求发布到劳务支付，全流程标准化管理，确保数据标注服务的高质量交付。

1

需求发布

约 1—2 天

数据需求方完成内部立项，明确标注类型、字段要求、专家资质及验收标准，将需求发布至众包空间。

2

数据整理

一项目一治理

按“一项目一治理”原则，在健康大脑域内完成数据去标识化、转换、特征创建、清洗聚合，形成事件链数据集。

3

专家承接

实名认证

医学专家实名注册认证，平台根据专科、职称、年资自动匹配合适任务，平台审核后推送任务包。

4

AI 预标注

智能加速

内置多模态 AI 预标注插件，自动提取医学实体、分割影像病灶、分类文本属性，生成初步标注结果。

5

专家校验

一键修正

医学专家对 AI 预标注结果进行审核校验，无误直接保存，有误通过工作台手动修正并批量提交。

6

成果审核

三级质控

配置多级审核流程（一审互审→二审专家审核→终审金标准仲裁），从准确性、一致性、完整性多维度验收。

7

劳务支付

15个工作日内

按预设费用标准并依据质量报告合理扣减，平台定期打款至专家绑定银行卡，定期与需求方结算。

安全保障

数据安全与合规保障

严格遵循公共数据授权运营要求，确保"原始数据不出域，数据可用不可见"，全流程符合法律法规要求。

原始数据不出域

所有标注工作均在政务内网或卫生专网环境内完成，标注数据原材料已完成脱敏去标识化。

去标识化处理

遵循 GB/T 39725-2020 等标准，对姓名、身份证号、手机号等敏感字段实施脱敏与匿名化处理。

全程日志审计

记录用户登录、数据访问、标注操作、成果提交等全量行为日志，支持溯源查询与异常告警。

合规流通交易

最终成果为标注后的字段特征、问答对、思维链、脱敏影像，不含任何个人敏感信息。

严格符合法律法规要求

《数据安全法》《个人信息保护法》《浙江省公共数据条例》

GB/T 39725-2020 GB/T 42460-2023 SSL/TLS 加密

开启医疗数据标注服务

无论您是数据需求方还是医学专家，古脉平台都将为您提供专业、高效、安全的标注服务体验。

我是数据需求方我是医学专家

海量医疗数据 等你来选！

破解行业双重痛点

有需求，无数据

有数据，难标注

古脉的解决方案

三大功能版块，全流程服务

一站式医疗数据资源中心

AI预标注 + 专家校验

医学专家灵活接单平台

丰富多样的众包类型

文本实体标注

文本类型标注

图片分割标注

医学影像分割标注

高质量数据集建设

问卷调查

七步闭环，高效协作

需求发布

数据整理

专家承接

AI 预标注

专家校验

成果审核

劳务支付

数据安全与合规保障

原始数据不出域

去标识化处理

全程日志审计

合规流通交易

严格符合法律法规要求

开启医疗数据标注服务

海量医疗数据等你来选！