海量医疗数据 等你来选!

解锁更多数据,与我们并肩,打造高质量数据产品。连接数据需求方与医学专家,提供全流程数据标注服务体系。

古脉标注工作台
高质量数据集目标表
总数据填充率 97%
进行中
AI 智能填充
自动识别并填充标注字段
AI
通过核验
标注结果质量审核
质检
持续增长
覆盖人群
5500 万人+
日均增量
日均处理数据
20.3 亿条+
持续扩充
接入医疗机构
3070 家+
2026年+5~10
服务省份
6 省 · 浙/琼/渝/豫/川/陕
平台定位

破解行业双重痛点

人工智能时代,数据质量决定模型性能上限。传统模式存在数据来源单一、标注专业性不足、效率低下等痛点。

PAIN · 01

有需求,无数据

大模型公司、创新药企需要与多家医院对接获取病例,数据来源单一、治理成本高,难以快速获得高质量真实世界诊疗数据。

多方医院对接 治理周期长 成本居高不下
PAIN · 02

有数据,难标注

传统模式往往只能找医学生进行标注,缺乏医学专业性,标注质量不足,显著影响模型训练效果与科研进展。

专业性不足 质量难保障 拖慢训练进度

古脉的解决方案

依托健康大脑数据采集治理,数据源覆盖全国 3070+ 医疗机构,5500 万患者+ 真实世界全病程数据。通过统一平台实现标注需求承接、任务分发、结果审核、数据产品封装,有效破解双重痛点。

核心功能

三大功能版块,全流程服务

平台主要包含"数据广场"、"工作台"、"众包空间"三大核心功能版块,覆盖数据获取、智能标注、任务分发全流程。

数据广场

一站式医疗数据资源中心

统一展示已上架的数据集资源,支持数据需求方自由检索、预览、探查并申请使用。按"一项目一治理"原则快速构建所需数据集。

数据检索与预览:自由检索已上架数据集,预览样例数据与核心特征
数据探查工具:按诊断、检验结果、药品、群体特征等标签自由组合筛选
发布探数需求:按需提报专病数据集需求,审核通过后构建
购数车管理:管理已获批的数据集字段,支持查看、整合、拆分
数据广场
全部 原始素材 成果作品
文本标注数据集
萧山区卫生健康局
原始素材
2型糖尿病高质量数据集
萧山区卫生健康局
成果作品
多发性骨髓瘤周围神经病变
萧山区卫生健康局
原始素材
数据性质:公共数据 / 行业数据
工作台 · 高质量数据集
50条数据 【4%】 本地文件
总数据填充率 (36/37) 97%
纳入筛选表 一般资料 骨髓检查结果
纳入条件
1、年龄≤75岁
2、经骨髓穿刺等检查,确诊为多发性骨髓瘤患者
3、体力状况:(Ps)评分≤3分
工作台

AI预标注 + 专家校验

为医学专家提供"AI预标注+人工校验"服务,内嵌文本、影像、图片等各类AI预标注插件,让医学专家从"标注员"升级为"审核员"。

多模态AI预标注:文本实体抽取、影像三维分割、病理图像边界框标注
智能填充:自动识别并填充标注字段,大幅提升标注效率
多级质控体系:纳入筛选、一般资料、检查结果分阶段审核
批量操作支持:批量编辑标注、批量保存提交
众包空间

医学专家灵活接单平台

对所有标注任务进行统一管理,实现标注任务的统一派发、医学专家灵活接单、标注进度与质量监管,提供完善的操作培训与劳务费用发放服务。

6大类订单类型:文本实体标注、文本类型标注、图片分割标注、医学影像分割标注、高质量数据集建设、问卷调查
精准任务匹配:按科室、职称、身份要求筛选,只展示可接取订单
小脉众包推荐:智能推荐满足资质要求的优质订单
费用透明结算:按验收通过数量与标注质量综合测算,15个工作日内打款
众包空间
当前查询订单 94 个,我可接受 61
乳腺癌临床实践情况 高质量数据集建设
¥1/份
包括流行病学、疾病诊断、治疗方案、不良反应等,梳理乳腺癌临床实践中的共性特征俞个性化经验
职称:主任医师
库存:47/50份(每份1条数据) 交付期限:1天
高质量数据集订单流程 高质量数据集建设
¥20/份
高质量数据集订单流程的需求说明...
身份:医生、护士、药师 职称:主任医师、副主任医师、主治医师
库存:21/25份(每份2条数据) 交付期限:1天
小脉众包推荐
推荐给您满足任务要求可直接接取的任务哦~
订单类型

丰富多样的众包类型

覆盖文本、影像、图片等多种数据模态,满足不同场景的数据标注需求。

文本

文本实体标注

从病历、检查报告等文本中抽取医学实体,如疾病、症状、药品、检验指标等。

文本

文本类型标注

对文本进行分类标注,如按时间、科室、正常/异常、风险等级等维度分类。

图片

图片分割标注

在病理全玻片图像等单张图片上用边界框标出病灶、器官或特定区域位置。

影像

医学影像分割标注

在CT/MR原始DICOM数据中对器官、肿瘤、血管等目标进行三维分割标注。

数据集

高质量数据集建设

构建问答对、思维链等高质量训练数据,满足大模型SFT和多模态训练需求。

问卷

问卷调查

对问卷结果进行预处理和统计分析,对文本实体进行提取和关联标注。

业务流程

七步闭环,高效协作

从需求发布到劳务支付,全流程标准化管理,确保数据标注服务的高质量交付。

1

需求发布

约 1—2 天

数据需求方完成内部立项,明确标注类型、字段要求、专家资质及验收标准,将需求发布至众包空间。

2

数据整理

一项目一治理

按“一项目一治理”原则,在健康大脑域内完成数据去标识化、转换、特征创建、清洗聚合,形成事件链数据集。

3

专家承接

实名认证

医学专家实名注册认证,平台根据专科、职称、年资自动匹配合适任务,平台审核后推送任务包。

4

AI 预标注

智能加速

内置多模态 AI 预标注插件,自动提取医学实体、分割影像病灶、分类文本属性,生成初步标注结果。

5

专家校验

一键修正

医学专家对 AI 预标注结果进行审核校验,无误直接保存,有误通过工作台手动修正并批量提交。

6

成果审核

三级质控

配置多级审核流程(一审互审→二审专家审核→终审金标准仲裁),从准确性、一致性、完整性多维度验收。

7

劳务支付

15个工作日内

按预设费用标准并依据质量报告合理扣减,平台定期打款至专家绑定银行卡,定期与需求方结算。

安全保障

数据安全与合规保障

严格遵循公共数据授权运营要求,确保"原始数据不出域,数据可用不可见",全流程符合法律法规要求。

原始数据不出域

所有标注工作均在政务内网或卫生专网环境内完成,标注数据原材料已完成脱敏去标识化。

去标识化处理

遵循 GB/T 39725-2020 等标准,对姓名、身份证号、手机号等敏感字段实施脱敏与匿名化处理。

全程日志审计

记录用户登录、数据访问、标注操作、成果提交等全量行为日志,支持溯源查询与异常告警。

合规流通交易

最终成果为标注后的字段特征、问答对、思维链、脱敏影像,不含任何个人敏感信息。

严格符合法律法规要求

《数据安全法》《个人信息保护法》《浙江省公共数据条例》

GB/T 39725-2020 GB/T 42460-2023 SSL/TLS 加密

开启医疗数据标注服务

无论您是数据需求方还是医学专家,古脉平台都将为您提供专业、高效、安全的标注服务体验。