0%

😎_开源数据集_V1

自动摘要: 变更记录 |版本号|作者|修订内容|发布日期| ||||| |1.0.0|[@邵巧钰(shaoqi ……..

变更记录

版本号 作者 修订内容 发布日期
1.0.0 @邵巧钰(shaoqiaoyu) 创建初始内容 2022-06-14
1.1.0 @邵巧钰(shaoqiaoyu) 修改数据目录、文档名称;增加数据数量、数据术语;增加数据链接 2022-06-16
1.2.0 @邵巧钰(shaoqiaoyu) 修改文档排版、数据样例及增加样例描述 2022-06-16
1.3.0 @邵巧钰(shaoqiaoyu) 完善数据数量,增加数据术语 2022-06-21
1.3.1 @邵巧钰(shaoqiaoyu) 修改错误内容 2022-06-21
1.3.2 @邵巧钰(shaoqiaoyu) 修改文字格式 2022-06-23
1.4.2 @邵巧钰(shaoqiaoyu) 修改数据背景 2022-07-08

1. 数据介绍

1.1 数据背景

  1. 数据来源于网上公开的数据集

1.2 应用场景

场景 场景应用
用于模型测试 预训练

2. 数据概述

2.1 数据定位

帮助了解某些数据模型

2.2 数据数量

183002个,每个数据集的各自数量如下:****pix2pix-depth.zip: 836份(testing,testing_raw,train,validation)四个文件夹3D头盖骨 工单:http://192.168.1.55/AI/knowledge_base/issues/37shapenet: 17775个
PCT_也许可以用作帖面tif: 746个文件(大约240份数据),一份数据包含三个文件(.tif/_1_masks.tif/.txt)OCR: 1805227个ModelNet40:2304个metro_files:780个文件(大约260份数据),一份数据包含三个文件(.npy/.ply/.png)龋齿分类数据集: 64个口腔CT扫描3d_dcm类型:1999份口腔全景X影像:100个病人上下颌3D模型:171个文件(51组数据)每组数据有上颌、下颌及上下颌,是 STL 格式的

2.3 命名规范

暂无

2.4 数据链接

http://192.168.1.55:9003/f/88500

2.5 数据目录

1
2
3
4
5
6
7
8
9
10
11
12
└── 开源数据集			# 网上公开的数据集
├── pix2pix-depth.zip # 用于 pix2pix 的原始数据
├── 3D头盖骨 工单#37.gz # 工单#37 纯数据集
├── shapenet # 3D 项目中常用的数据集
├── PCT_也许可以用作帖面tif # 工单#56
├── OCR # OCR 常用的数据集,主要有图片和标签
├── ModelNet40 # 3D 项目中常用的数据集
├── metro_files # 3D 项目中常用的数据集,里面包含 npy 文件
├── 龋齿分类数据集 # 龋齿图片,数量少
├── 口腔CT扫描3d_dcm类型 # 口腔断层扫描数据,是 dcm 格式的
├── 口腔全景X影像 # 口腔X光影像数据,是 png 格式的
├── 病人上下颌3D模型 # 每组数据有上颌、下颌及上下颌,是 STL 格式的

2.6 数据样例










2.7 数据制作流程

网上公开的数据集

2.8 数据术语

术语 定义
龋齿 caries,俗称蛀牙或虫牙,是牙体组织被龋蚀,逐渐毁坏崩解,形成龋洞的一种口腔疾病,是口腔的常见病和多发病。
OCR OCR英文全称是Optical Character Recognition,中文叫做光学字符识别。它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够接受、人又可以理解的格式。
口腔全景X影像 学名叫全颌曲面断层篇。口腔全景片是通过X线摄影形成的颌面部的曲面成像,显示牙齿的对应关系、牙齿的排列情况,以及上下颌骨的骨质情况。影像是二维的。
口腔CT扫描 CT的成像是断层图像,并且可以通过电脑软件对口腔颌面部进行三维重建,形成三维立体的图像,能够让口腔的各个部位得到清晰的显示,克服了普通X射线检查当中组织结构重叠的缺点。在口腔颌面部检查过程中,CT的范围比全颌曲面断层片范围更加广泛,检查费用也更高一些。
pix2pix Pix2pix是最早使用条件GAN (cGAN)框架进行图像-图像转换的工作之一,它的目的是学习一个生成器,让一个输入图像xxx(例如影像图)转换成另一个模态的输出图像yyy(例如彩色图像)。
GAN 传统GAN有一个生成器Generator和判别器Descriminator,生成器G用于生成样本,判别器D用于判断这个样本是否为真样本。G用随机噪声生成假图,D根据真假图进行二分类的训练。D根据输入的图像生成score,这个score表示G生成的图像是否成功,进而进一步的训练G生成更好的图像。

3. 现阶段问题

4. 未来计划

  1. 继续完善数据集

欢迎关注我的其它发布渠道