找回密码
 立即注册

QQ登录

只需一步,快速开始

广告载入中...
查看: 346|回复: 2

国家数据局如何赋能AI?将开展数据标注基地试点 建设“国家级”项目

[复制链接]
发表于 2024-4-2 15:45 | 显示全部楼层 |阅读模式

马上注册,享用更多功能,让你轻松玩转本论坛。

您需要 登录 才可以下载或查看,没有账号?立即注册

×
①数据标注是构建人工智能模型的数据准备和预处理工作中不可或缺的一环;
②随着大模型的海量训练数据催生出巨大的数据标注需求,数据标注也将催生新的工作机会;
③国内首个大模型数据标注基地已经落地海口。

首次全国数据工作会议于4月1日到2日在北京召开。国家数据局方面最新透露,接下来,将开展数据标注基地试点。

会上明确,探索建设国家级数据标注基地,充分发挥地方配套支撑作用,在数据标注产业的生态构建、能力提升和场景应用等方面先行先试,集聚龙头企业,促进区域人工智能产业生态发展。另外,国家数据局将开展深化数字经济创新发展试验区、数据要素综合试验区、数据基础制度试点、数据资源开发利用试点、数据基础设施建设试点等一系列试点试验工作。

数据标注,即对文本、图像、语音、视频等待标注数据进行归类、整理、编辑、纠错、标记和批注等操作。

在当前的人工智能大模型时代,数据的质量会影响大模型的“智商”。非结构化或半结构化的数据,必须经过上述清洗与标注处理,才能变成机器可理解、可学习的数据。因此数据标注是构建人工智能模型的数据准备和预处理工作中不可或缺的一环。

以对象作为分类标准,数据标注可以分为图像标注、语音标注、文本标注以及视频标注。

 楼主| 发表于 2024-4-2 15:51 | 显示全部楼层
数据标注可以分为图像标注、语音标注、文本标注以及视频标注
回复

使用道具 举报

发表于 2024-4-2 16:12 | 显示全部楼层
谢谢分享谢谢分享
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|股海明灯官网 ( 京ICP备18020431号 )

GMT+8, 2024-11-11 08:15 , Processed in 0.109872 second(s), Total 12, Slave 11 queries , Gzip On, MemCached On.

Powered by Discuz! X3.5

Copyright © 2001-2024 Tencent Cloud.

快速回复 返回顶部 返回列表