近期,江苏省数据局明晰高质量数据集建设重点任务,以政策引领、标准指引、场景驱动、企业培育、供需协同、生态共创多措并举系统发力,全力打造标杆人工智能数据集,持续畅通AI赋能千行百业应用落地通道,以扎实数据根基助推全省人工智能产业高质量稳步前行。
数据是人工智能迭代升级的核心养分。当前,大模型技术飞速迭代,模型逻辑推演、智能识别、行业适配能力,完全依托高质量规范化数据集支撑。数据质量高低,直接决定人工智能应用精度与落地实效。截至今年一季度,全国建成高质量数据集超11.6万个,数据总量超960PB,规模约为国家图书馆数字资源的336倍。坐拥雄厚产业底盘与海量数据资源的江苏,先行夯实数据家底,在医疗、交通、工业、能源、文旅等领域累计建成高质量数据集521个,总体规模超95PB(1PB=1024TB),稳居全国第一梯队,为全省AI规模化应用抢占了先发优势。
海量数据不等于优质资产,分散杂乱、标准不一、场景脱节、供需错位,仍是人工智能落地实体经济的共性堵点。江苏紧扣产业痛点精准施策,打出数据集建设全链条组合拳,推动数据资源高效转化为发展竞争力。
政策领航定方向,规范筑基提质效。江苏出台人工智能专项扶持政策,细化发展目标、攻坚任务与保障举措,因地制宜布局特色“人工智能+”数据标注创新试验区,构建区域联动、错位发展、优势互补格局。依托专家委员会与专业标准工作组,系统化开展数据集试点应用,统一数据采集、标注、归档规范,打造质量可控、互通共享、高度复用的标准化数据集体系,从源头破解数据碎片化、低质化、难复用难题。
立足场景抓落地,供需对接促转化。江苏紧扣智能制造、医疗健康、智慧车联、智慧政务核心赛道,联动行业龙头企业、链主企业梳理标注需求与服务能力清单,深耕行业专属专家级数据集,让AI训练紧贴生产运营实际需求,杜绝数据建设与产业应用脱节。常态化开展跨区域供需精准对接,统筹全省优质数据资源匹配地方发展诉求,加速标杆数据集落地应用、迭代升级,让人工智能真正破解工业生产、民生服务、城市治理各类现实难题。
培优主体强链条,全域共筑优生态。江苏大力建设数据标注创新工厂,打造智能化专业服务场景,用心培育数据标注龙头企业、瞪羚企业、独角兽企业,壮大数字产业市场主体。充分发挥全省数据标注产业联盟纽带作用,深化政产学研用金协同联动,联动高校增设相关专业、建设产教融合实训基地,规模化培育人工智能训练师专业人才,补齐人才短板、完善产业闭环,构建长效稳定、持续创新的数据产业生态。
智以数兴,业以数强。高质量数据集建设,既是江苏抢抓人工智能发展窗口期的战略布局,也是深化“数实”融合、做强“数字经济”的必由之路。江苏以精细化建设、系统化布局、全维度协同,不断擦亮数据大省底色、锻造AI产业长板。随着标杆数据集持续落地见效,江苏必将领跑人工智能创新赛道,以优质数据赋能千行百业转型升级,为全国数字经济高质量发展贡献鲜江苏力量。(邰婧雯)
