md_1741 发表于 2024-4-2 15:45

国家数据局如何赋能AI?将开展数据标注基地试点 建设“国家级”项目

①数据标注是构建人工智能模型的数据准备和预处理工作中不可或缺的一环;
②随着大模型的海量训练数据催生出巨大的数据标注需求,数据标注也将催生新的工作机会;
③国内首个大模型数据标注基地已经落地海口。

首次全国数据工作会议于4月1日到2日在北京召开。国家数据局方面最新透露,接下来,将开展数据标注基地试点。

会上明确,探索建设国家级数据标注基地,充分发挥地方配套支撑作用,在数据标注产业的生态构建、能力提升和场景应用等方面先行先试,集聚龙头企业,促进区域人工智能产业生态发展。另外,国家数据局将开展深化数字经济创新发展试验区、数据要素综合试验区、数据基础制度试点、数据资源开发利用试点、数据基础设施建设试点等一系列试点试验工作。

数据标注,即对文本、图像、语音、视频等待标注数据进行归类、整理、编辑、纠错、标记和批注等操作。

在当前的人工智能大模型时代,数据的质量会影响大模型的“智商”。非结构化或半结构化的数据,必须经过上述清洗与标注处理,才能变成机器可理解、可学习的数据。因此数据标注是构建人工智能模型的数据准备和预处理工作中不可或缺的一环。

以对象作为分类标准,数据标注可以分为图像标注、语音标注、文本标注以及视频标注。

md_1741 发表于 2024-4-2 15:51

数据标注可以分为图像标注、语音标注、文本标注以及视频标注

1135786707 发表于 2024-4-2 16:12

谢谢分享谢谢分享
页: [1]
查看完整版本: 国家数据局如何赋能AI?将开展数据标注基地试点 建设“国家级”项目