欢迎访问南京市数据局网站

南京市数据局

当前位置:首页 > 新闻动态

【AI创想π】开学第一课,为什么我们要谈“吃”这件事?
责任编辑:  文章来源:南京市数据局  发布时间:2026-03-05 15:25  阅读次数:显示稿件总访问量

3月上旬,“数智未来”高质量数据集开发者创新大赛线上课程正式开讲。首日即有数百名来自全国各地的开发者、高校学生和企业技术人员在线学习,折射出当下的时代转折:当大模型的参数竞赛触及天花板,决定AI“智商”高低的,是它每天“吃”进去的数据质量。

1亿美金追逐的人,做对了什么?

在硅谷,现在有1亿美金去追这些人才。”线上课程第一讲中,北京大学南京校友会副会长王炜抛出这组数据。被1亿美金追逐的人才,有什么特征?答案是能构建超越别人的高质量数据集。“在AI时代,用AI驱动AI工作的人,价值会被无限放大。”王炜认为,当下最稀缺的是数据建模师、数据治理工程师、行业数据架构师这几类人才。

那么,高质量数据集到底是什么?想象一下:你要养大一个AI,它就像个孩子,你喂什么,它就长成什么样。喂它垃圾食品,即杂乱、错误、片面的数据,就长成一个“糊涂蛋”,答非所问、漏洞百出。喂它顶级食材,即干净、准确、覆盖全面的数据,就长成“学霸”,逻辑清晰、触类旁通。高质量数据集,就是AI的“顶级营养餐”,去杂质、做标注、讲逻辑,把原始数据精心“烹饪”成AI能理解的“教科书+习题集+标准答案”。有了它,AI才能真正看懂世界、解决问题、创造价值。

数据为什么突然这么“香”?

线上课程第二讲的主讲人林梓瀚,他是中国信息化百人会研究员、江苏数据交易所数据要素首席专家。他用一条时间线,讲清了数据要素的“身世”:2019年,数据首次纳入生产要素;2020年,与土地、劳动力、资本、技术并列,成为第五大生产要素;2022年,“数据二十条”出台。“数据要素是构建核心竞争力、抢占人工智能未来制高点的关键要素,高质量数据集决定了AI的‘智商上限’。”林梓瀚说。2025年底的全国数据工作会议明确,2026年要加快打造“数据标注创新工厂”,目前数字人才缺口已达千万级别。五部委近日联合发文,鼓励高校增设数据要素学科专业,和数据打交道的新专业,正在成为择业“风口”。

数据平台怎么用?一线专家手把手教。

如果说前两讲是“道”,第三讲则是“术”。中电信人工智能公司数据专家姚桂花,曾主导《重庆高速数据中台》《中航信高质量数据集》等多个国家级项目。她的课程直奔实操,将参赛门槛降至最低。这正是大赛的初衷:让更多开发者“零门槛”进入数据赛道。她参与的项目,本身就是“数据赋能产业”的案例集:高速、能源、卫健、民航……每一个领域背后,都是千亿级产业的智能化升级需求。

高质量数据集,为什么是现在?

体量大、质量低、应用难”,是产业智能化的普遍痛点。国家战略加速破局。202512月,全国数据工作会议将“高质量数据集”建设提升至国家战略核心位置。2026227日,国家数据局组织72家行业高质量数据集链主单位签署任务书。31日,江苏省数据局发布2026年高质量数据集建设项目征集令,面向工业制造、智慧能源、医疗卫生等重点领域遴选先行先试项目,入选者将享受优先推荐国家试点、政策资金倾斜等五大支持。信号明确:高质量数据集,正从AI的“辅助品”演变为核心“战力”的关键构成。

开学第一课”之后,路在脚下。

此次大赛从202511月启动筹备,由国家数据发展研究院和江苏省数据局指导和支持举办,汇聚了五大赛道的数据集,来自工程机械、能源管输、医疗健康、卫星遥感和钢铁行业。这些来自五大赛道头部企业的真实场景应用,参赛者深入产线学习,通过企业和专家培训,提交契合需求的解决方案。优质人才也将被链主企业“看见”。

王炜与江苏省人民医院联合申报的“慢病多模态高质量数据集”项目,入选国家数据局“先行先试”,江苏仅四家。“我们把临床问题转化成数据问题,又把数据问题转化回临床价值。”王炜进一步解读“高质量数据集”价值,即连接产业需求与技术能力,让AI真正“吃得好、长得壮”。“在AI时代,能构建高质量数据集的人,就是掌握底层规律的人。”王炜说。

【打印此页】 【关闭窗口】