交汇点讯 在“人工智能+”行动深入推进的时代背景下,高质量数据集已成为驱动产业智能化转型、培育新质生产力的核心要素。记者日前从省相关部门了解到,苏南五市已按下高质量数据集建设“加速键”。

什么是高质量数据集?国家数据局指导编制的《高质量数据集建设指引》里明确指出,高质量数据集是:“经过采集、加工等数据处理,可直接用于开发和训练人工智能模型,能有效提升模型表现的数据的集合。”
如何构建可持续、可推广、可落地的高质量数据集发展体系,推动高质量数据集建设收获“规模红利”并向“质量红利”“生态红利”跃递?省政府近期印发苏南重点城市要素市场化配置综合改革试点通知,南京、无锡、常州、苏州、镇江五市两年行动方案同步发布。其中,围绕高质量数据集建设,苏南五市结合各自资源禀赋与产业基础,探索差异化发展路径。
南京市推动城市治理高质量数据集全省共享共用,完善物联感知相关技术规范,争取上升至省级标准。构建高质量数据集政策体系和产业生态,强化高质量数据集共建共享和应用,积极争取建成全省首家“高质量数据集产业基地”,先行先试推动医疗健康行业高质量数据集试点建设。
无锡市支持滨湖区率先开展国家高质量数据集建设项目试点。
常州市建设医疗领域数据标注平台,建设不少于150个高质量数据集,打造具有区域特色的人工智能高端数据标注基地。
苏州市支持参与数据标注、数据集相关标准的制定和验证,承接国家级高质量数据集建设先行先试任务,结合苏州产业优势,率先建成相关重点行业的高质量数据集并向全国推广。依托AI融合底座和模型测评中心等基础设施,高标准建设高质量数据集及语料库公共服务平台。加快国家数据发展研究院高质量数据集实验室(工业制造领域)等国家级平台建设。到2027年,公共数据开发利用产品达100个、重点领域高质量数据集达300个。
镇江市构建“数据集供给—标注加工—市场流通—场景应用”全链路体系,建设高质量数据集。到2027年,打造20个以上行业高质量数据集,培育60家以上数据企业,开发100个以上数据产品,高标准完成高质量数据集国家试点。
