0%

AI_Studio需求V1

自动摘要: >修订历史 |时间|版本号|修订人|主要修订内容| ||||| |2023年4月4日|1.0. ……..

修订历史

时间 版本号 修订人 主要修订内容
2023年4月4日 1.0.0 杨新 初始版本

一、产品简介

1. 背景

AI 开发过程中经常需要处理海量数据,数据准备与标注往往耗费整体开发一半以上时间。应提供了一套高效便捷的管理和标注数据框架。不仅支持图片、文本、语音、视频、网格、点云等多种数据类型,涵盖图像分类、目标检测、音频分割、文本分类等多个标注场景,可适用于各种AI项目,如计算机视觉、自然语言处理、音视频分析等;同时提供数据筛选、数据分析、数据处理、智能标注、团队标注以及版本管理等功能,AI开发者可基于该框架实现数据标注及AI开发全流程处理。如

2. 功能需求

  1. 支持云平台多人协同标注;
  2. 支持半自动智能标志;
  3. 支持2d,2.5d,3d数据标注;
  4. 支持数据集管理(包含检索,预览,备注,下载);
  5. 提供AI算法部署插件接口;
  6. 提供python数据处理接口;

3. 功能构想图




4. 使用场景

  1. 数据标注;
  2. 数据管理;
  3. 宣传,演示;
  4. 接口服务;

5. 产品定位

  1. 主要定位于解决数据标注问题;

6. 竞品分析

  1. 各大厂商云标注平台;
    1. 缺陷:
      1. 缺失针对3d网格数据标注功能;
      2. 使用成本高;
  2. 开源数据平台;
    1. 缺陷:
      1. 功能单一;
      2. 缺失针对3d网格数据标注功能;
      3. 无法协同及数据管理;

7. 部署方式

  1. 采用高性能集群服务器web部署,保证anywhere都可以标注/检查;

二:功能说明

1.产品架构图

2.功能说明

数据集类型 标注类型 人工标注 智能标注 团队标注
图片 图像分类 支持 支持 支持
物体检测 支持 支持
图像分割 支持 支持
音频 声音分类 支持 支持 支持
语音内容 支持 支持
语音分割 支持 支持
文本 文本分类 支持 支持 支持
命名实体 支持 支持
文本三元组 支持 支持
视频 视频标注 支持 支持
点云 点云分类 支持 支持 支持
点云检测 支持 支持
点云分割 支持 支持
网格 网格分类 支持 支持 支持
网格检测 支持 支持
网格分割 支持 支持

三、补充说明

  1. 名词解释

    术语 / 缩略词 说明
    基本用语 - 人工标注:用户创建单人标注作业,对数据进行手工标注。- 智能标注:在标注一定量的数据情况下,用户可以通过启动智能标注任务对数据进行自动标注,提高标注的效率。- 团队标注:对于大批量的数据,用户可以通过创建团队标注作业,进行多人协同标注。
    人工标注 - 图片 - 图像分类:识别一张图片中是否包含某种物体。 - 物体检测:识别出图片中每个物体的位置及类别。 - 图像分割:根据图片中的物体划分出不同区域。- 音频 - 声音分类:对声音进行分类。 - 语音内容:对语音内容进行标注。 - 语音分割:对语音进行分段标注。- 文本 - 文本分类:对文本的内容按照标签进行分类处理。 - 命名实体:针对文本中的实体片段进行标注,如“时间”、“地点”等。 - 文本三元组:针对文本中的实体片段和实体之间的关系进行标注。- 视频视频标注:识别出视频中每个物体的位置及分类。
    智能标注 智能标注是指基于当前标注阶段的标签及图片学习训练,选中系统中已有的模型进行智能标注,快速完成剩余图片的标注操作。
    团队标注 数据标注任务中,一般由一个人完成,但是针对数据集较大时,需要多人协助完成。可以由多人组成一个标注团队,针对同一个数据集进行标注管理。
  2. 参考资料

开源标注工具集锦:https://github.com/heartexlabs/awesome-data-labelinglabell studion:https://heartex.com/free-trialwebknossos: https://webknossos.org/https://towardsdatascience.com/introducing-label-studio-a-swiss-army-knife-of-data-labeling-140c1be92881百度大脑:https://ai.baidu.com/easydata/

欢迎关注我的其它发布渠道