球速体育-专业赛事直播平台

高质量数据集是什么?运营商能干嘛-球速体育平台官网
7X24小时服务热线:

0755-22671565

您的位置: 主页 > 新闻中心 > 球速动态
球速动态 行业动态

高质量数据集是什么?运营商能干嘛

发布时间:2025-06-14点击数:

  近日,在第八届数字中国建设峰会上,由国家数据局指导的全国数据标准化技术委员会提出,将强化标准引领,分三类建设高质量数据集。

高质量数据集是什么?运营商能干嘛(图1)

  具体来看:一类为“通识数据集”,包含面向社会公众、无需专业背景即可理解的通用知识,主要用于支撑通用模型落地应用。一类为“行业通识数据集”,包含面向行业从业人员、需要一定专业背景才能理解的行业领域通用知识,主要用于支撑行业模型落地应用。一类为“行业专识数据集”,包含面向特定业务场景相关人员、需要较深的专业背景才能理解的行业领域专业知识,主要用于支撑业务场景模型落地应用。

  简单举例,互联网百科、问答等为“通识数据集”;行业研究机构报告等为“行业通识数据集”;医院科室特定疾病病例等为“行业专识数据集”。

  从发展趋势来看,人工智能模型对数据集的需求正从“通用知识”向“专业知识”延伸拓展,经过专家精细化标注的数据集已成为AI价值实现过程中不可或缺的基石。也就是说,不同行业部门对模型场景数据的需求差异很大,行业应用已不满足于通用领域的数据集,对包含行业通用知识和专业知识的高质量数据集需求愈加迫切。

  数据是训练AI能力的“原料”之一。但未经筛选整合的海量数据难以通过可信利用转化形成可持续的数据价值。高质量数据集是指具有一定主题,可以标识并可以用于人工智能训练、验证及测试等处理过程的数据形式,并且在完整性、规范性、准确性、均衡性、及时性、一致性、相关性等多个方面都达到了较高标准的数据集合。

高质量数据集是什么?运营商能干嘛(图2)

  高质量数据集的建设并非一蹴而就,而是一个复杂且系统的过程。此前,在顶层设计层面,国家数据局等17部门联合印发《“数据要素×”三年行动计划(2024—2026年)》,积极推动高质量数据集建设。

  在高质量数据集的建设过程中,运营商又能干嘛?当前,运营商正凭借得天独厚的海量用户生态和数据资源优势,不断拓展业务边界,持续推进数据价值转化并取得成果,实现从“数据资源持有者”向“数据资产运营者”的转变。

  三大运营商发布的2024年财报中,都公布了各自数据资产价值情况。2024年,三大运营商数据资源总额达13.66亿元,其中,“无形资产”数据资源总计7.27亿元,“开发支出”数据资源总计6.39亿元。

  财报显示,中国移动能力中台方面,上台能力规模1348项,能力累计调用量7776亿次。中国移动构建全球规模最大的通信服务数据集群——梧桐大数据平台,汇聚沉淀数据规模超2000PB,数据服务年调用量超千亿次。中国移动推动数联网(DSSN)成为国家数据流通利用基础设施主流技术设施及实践方案,写入《国家数据基础设施建设指引》。

  球速体育平台

高质量数据集是什么?运营商能干嘛(图3)

  不过,对运营商来说,建设高质量数据集仍面临诸多挑战。数据采集时,隐私和安全问题不可忽视;数据标注方面,需确保准确性和一致性,这直接影响数据集质量;此外,高效存储和管理海量数据也是难题;同时,还需构建数据人才储备。目前运营商在顶尖AI人才及AI场景落地人才方面存在较大缺口。未来,运营商需进一步优化人才结构,加大人才培养和引进力度,为向科技服务企业转型奠定基础。

在线客服
服务热线

服务热线

0755-22671565

微信咨询
球速体育-专业赛事直播平台
返回顶部