自动摘要: >修订历史 |时间|版本号|修订人|主要修订内容| ||||| |2023年4月4日|1.0. ……..
修订历史
时间 | 版本号 | 修订人 | 主要修订内容 |
---|---|---|---|
2023年4月4日 | 1.0.0 | 杨新 | 初始版本 |
一、产品简介
1. 背景
AI 开发过程中经常需要处理海量数据,数据准备与标注往往耗费整体开发一半以上时间。应提供了一套高效便捷的管理和标注数据框架。不仅支持图片、文本、语音、视频、网格、点云等多种数据类型,涵盖图像分类、目标检测、音频分割、文本分类等多个标注场景,可适用于各种AI项目,如计算机视觉、自然语言处理、音视频分析等;同时提供数据筛选、数据分析、数据处理、智能标注、团队标注以及版本管理等功能,AI开发者可基于该框架实现数据标注及AI开发全流程处理。如图:
2. 功能需求
- 支持云平台多人协同标注;
- 支持半自动智能标志;
- 支持2d,2.5d,3d数据标注;
- 支持数据集管理(包含检索,预览,备注,下载);
- 提供AI算法部署插件接口;
- 提供python数据处理接口;
3. 功能构想图
4. 使用场景
- 数据标注;
- 数据管理;
- 宣传,演示;
- 接口服务;
5. 产品定位
- 主要定位于解决数据标注问题;
6. 竞品分析
- 各大厂商云标注平台;
- 缺陷:
- 缺失针对3d网格数据标注功能;
- 使用成本高;
- 缺陷:
- 开源数据平台;
- 缺陷:
- 功能单一;
- 缺失针对3d网格数据标注功能;
- 无法协同及数据管理;
- 缺陷:
7. 部署方式
- 采用高性能集群服务器web部署,保证anywhere都可以标注/检查;
二:功能说明
1.产品架构图
2.功能说明
数据集类型 | 标注类型 | 人工标注 | 智能标注 | 团队标注 |
---|---|---|---|---|
图片 | 图像分类 | 支持 | 支持 | 支持 |
物体检测 | 支持 | 支持 | ||
图像分割 | 支持 | 支持 | ||
音频 | 声音分类 | 支持 | 支持 | 支持 |
语音内容 | 支持 | 支持 | ||
语音分割 | 支持 | 支持 | ||
文本 | 文本分类 | 支持 | 支持 | 支持 |
命名实体 | 支持 | 支持 | ||
文本三元组 | 支持 | 支持 | ||
视频 | 视频标注 | 支持 | 支持 | |
点云 | 点云分类 | 支持 | 支持 | 支持 |
点云检测 | 支持 | 支持 | ||
点云分割 | 支持 | 支持 | ||
网格 | 网格分类 | 支持 | 支持 | 支持 |
网格检测 | 支持 | 支持 | ||
网格分割 | 支持 | 支持 |
三、补充说明
名词解释
术语 / 缩略词 说明 基本用语 - 人工标注:用户创建单人标注作业,对数据进行手工标注。- 智能标注:在标注一定量的数据情况下,用户可以通过启动智能标注任务对数据进行自动标注,提高标注的效率。- 团队标注:对于大批量的数据,用户可以通过创建团队标注作业,进行多人协同标注。 人工标注 - 图片 - 图像分类:识别一张图片中是否包含某种物体。 - 物体检测:识别出图片中每个物体的位置及类别。 - 图像分割:根据图片中的物体划分出不同区域。- 音频 - 声音分类:对声音进行分类。 - 语音内容:对语音内容进行标注。 - 语音分割:对语音进行分段标注。- 文本 - 文本分类:对文本的内容按照标签进行分类处理。 - 命名实体:针对文本中的实体片段进行标注,如“时间”、“地点”等。 - 文本三元组:针对文本中的实体片段和实体之间的关系进行标注。- 视频视频标注:识别出视频中每个物体的位置及分类。 智能标注 智能标注是指基于当前标注阶段的标签及图片学习训练,选中系统中已有的模型进行智能标注,快速完成剩余图片的标注操作。 团队标注 数据标注任务中,一般由一个人完成,但是针对数据集较大时,需要多人协助完成。可以由多人组成一个标注团队,针对同一个数据集进行标注管理。 参考资料
开源标注工具集锦:https://github.com/heartexlabs/awesome-data-labelinglabell studion:https://heartex.com/free-trialwebknossos: https://webknossos.org/https://towardsdatascience.com/introducing-label-studio-a-swiss-army-knife-of-data-labeling-140c1be92881百度大脑:https://ai.baidu.com/easydata/