首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

有没有好的开源图像数据集生成软件?

是的,有一些好的开源图像数据集生成软件可供使用。这些软件可以帮助开发者生成大规模的、具有多样性的图像数据集,用于训练和测试计算机视觉模型。以下是一些常用的开源图像数据集生成软件:

  1. Imgaug:Imgaug是一个强大的图像增强库,可以用于生成多样性的图像数据集。它支持多种图像增强技术,如旋转、缩放、平移、翻转、变形等。通过组合不同的增强操作,开发者可以生成丰富多样的图像数据集。Imgaug的GitHub地址为:https://github.com/aleju/imgaug
  2. SynthText:SynthText是一个用于合成自然场景文本图像的工具。它可以根据用户提供的文字和字体信息,生成具有多样性的文本图像数据集。SynthText的GitHub地址为:https://github.com/ankush-me/SynthText
  3. GAN(Generative Adversarial Networks):GAN是一种生成对抗网络,可以用于生成逼真的图像数据集。通过训练一个生成器网络和一个判别器网络的对抗过程,GAN可以生成具有多样性的图像。常用的GAN模型包括DCGAN、WGAN、CycleGAN等。GAN的GitHub地址为:https://github.com/goodfeli/adversarial
  4. COCO-Text:COCO-Text是一个用于生成文本检测和识别数据集的工具。它提供了用于合成大规模文本图像的脚本和API。COCO-Text的GitHub地址为:https://github.com/andreasveit/coco-text
  5. labelme:labelme是一个用于图像标注和语义分割的开源工具。它可以帮助用户标注图像中的对象和区域,并生成相应的语义分割数据集。labelme的GitHub地址为:https://github.com/wkentaro/labelme

这些开源图像数据集生成软件都具有易于使用、灵活性高的特点,可以满足不同应用场景下的需求。在使用这些软件时,开发者可以根据自身项目的需求和数据集要求,选择合适的生成方法和参数,生成具有多样性和丰富性的图像数据集。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

开源软件 FFmpeg 生成模型使用图片数据

本篇文章聊聊,成就了无数视频软件公司、无数在线视频网站、无数 CDN 云服务厂商开源软件 ffmpeg。...言归正传,开始一起了解,如何使用 ffmpeg 来搞定数据生成,以及生成过程中细节。...FFmpeg 安装 FFmpeg 是全平台开源软件,所以其实在包括手机上、游戏机中都能够找到它身影,但是我们今天主要聊是转换视频为图片数据,所以就只看主流三大生产力平台就好: 在 Ubuntu...上面的日志会大量重复,但是在里面会有一些重要细节,影响着我们这个数据生成工作效率,其中之一是:speed 展示状态。...所以,提升转换性能第一个方案就是,减少不必要图片数据生成

30420

开源软件 FFmpeg 生成模型使用图片数据

本篇文章聊聊,成就了无数视频软件公司、无数在线视频网站、无数 CDN 云服务厂商开源软件 ffmpeg[1]。...言归正传,开始一起了解,如何使用 ffmpeg 来搞定数据生成,以及生成过程中细节。...FFmpeg 安装 FFmpeg 开源项目 FFmpeg 是全平台开源软件[7],所以其实在包括手机上、游戏机中都能够找到它身影,但是我们今天主要聊是转换视频为图片数据,所以就只看主流三大生产力平台就好...上面的日志会大量重复,但是在里面会有一些重要细节,影响着我们这个数据生成工作效率,其中之一是:speed 展示状态。...所以,提升转换性能第一个方案就是,减少不必要图片数据生成

22110
  • 医学图像开源数据汇总

    它还表明肝脏分割软件可能遇到主要困难是由于与邻近器官接触、肝脏非典型形状或密度,甚至图像伪影。...每个数据每个图像都有一个匹配分束分割掩码和一个可按名称识别的腱膜分割掩码。...肿瘤数据 数据链接:http://m6z.cn/5zCyGj 这一数据是通过仔细注释几名患有不同器官肿瘤并在多家医院被诊断出患者组织图像获得。...结直肠腺癌组织学图像数据 数据链接:http://m6z.cn/6axBLk 该数据包含 100 张 H&E 染色结直肠腺癌组织学图像。...淋巴结切片组织病理学数据 数据链接:http://m6z.cn/6axBNq 本数据由从淋巴结切片组织病理学扫描中提取 327.680 张彩色图像 (96 x 96px) 组成。

    1.4K10

    开源真实场景图像检测数据汇总

    我们基准测试具有以下属性: 单图像、多类分类问题 40多个分类 总共超过 50,000 张图片 逼真的大型数据库 VOC2005车辆数据 数据下载地址:http://m6z.cn/5U2X4u...坑洼检测数据 数据下载地址:http://m6z.cn/5wJJTa 本数据汇总了700个在坑洼处带有3K +注释图像,用于从道路图像中检测坑洼,检测道路地形和坑洼。...大约 70% 图像被标记为空。 水下垃圾检测数据 数据下载地址:http://m6z.cn/6nnDQK 该数据来自 J-EDI 海洋垃圾数据。...构成该数据视频在质量、深度、场景中对象和使用相机方面差异很大。它们包含许多不同类型海洋垃圾图像,这些图像是从现实世界环境中捕获,提供了处于不同衰减、遮挡和过度生长状态各种物体。...此外,水清晰度和光质量因视频而异。这些视频经过处理以提取 5,700 张图像,这些图像构成了该数据,所有图像都在垃圾实例、植物和动物等生物对象以及 ROV 上标有边界框。

    99310

    道路裂缝坑洼图像开源数据汇总

    道路裂缝坑洼图像数据 数据下载链接:http://suo.nz/3eEDlj 这个数据是一个极具挑战性集合,包含 5,000 多张野外道路上坑洼图像。...坑洼检测数据 数据下载链接:http://m6z.cn/5wJJTa 700个在坑洼处带有3K +注释图像 坑洼图像数据 数据下载链接:http://suo.nz/2vtaK6 包含 600...道路坑洼检测数据 数据下载链接:http://suo.nz/2nWXFp 包含 300 多张包含坑洼道路图像标记图像数据数据包含两个文件夹 - 正常和坑洼。...数据由两种类型数据组成,图像和注释总是成对出现。...该数据是使用 Zhang 等人 (2016) 提出方法从 458 张高分辨率图像(4032x3024 像素)生成。发现高分辨率图像在表面光洁度和照明条件方面具有高差异。

    2.1K20

    开源数据汇总 | 小目标检测、图像分类、图像识别

    猫咪数据 数据下载地址:http://m6z.cn/5TAgbw CAT 数据包括超过 9,000 张猫图像。对于每张图像,猫头部都有九个点注释,眼睛两个,嘴巴一个,耳朵六个。...CBCL 街道场景数据 数据下载地址:http://m6z.cn/5TAgeA StreetScenes Challenge Framework 是用于对象检测图像、注释、软件和性能测量集合。...小目标检测数据 数据下载地址:http://m6z.cn/616t6R 从Internet(例如YouTube或Google)上图像/视频收集四个小物体数据,包括4种类型图像,可用于小物体目标检测研究...斯坦福狗狗数据 数据下载地址:http://m6z.cn/6nF6kM 斯坦福狗数据包含来自世界各地 120 种狗图像。...该数据是使用 ImageNet 中图像和注释构建,用于细粒度图像分类任务。

    2.1K20

    图像分割】开源 | 不平衡数据后验校正

    乔治亚理工学院 论文名称:Posterior Re-calibration for Imbalanced Datasets 原文作者:Junjiao Tian 内容提要 当训练标签分布严重不平衡以及测试数据与训练分布不一致时...为了解决由测试标签分布不平衡引起偏移问题,我们从最优贝叶斯分类器角度出发,推导出一种训练后再平衡技术,该技术可以通过基于KL-divergence优化来解决。...该方法允许灵活训练后超参数在验证上有效地调整,并有效地修改分类器边缘来处理这种不平衡。...我们进一步将该方法与已有的似然偏移方法相结合,从贝叶斯角度对其进行重新解释,证明我们方法可以统一处理这两个问题。本文方法可以方便地用于底层架构不可知概率分类问题。...我们在六个不同数据和五个不同架构上进行了实验,包括大规模不平衡数据,例如用于分类iNaturalist和用于语义分割Synthia,结果证明了本文方法先进性和准确性。

    62730

    【干货】让遥感图像活起来:遥感图像描述生成模型与数据探索

    虽然遥感图像研究在场景分类和目标检测方面取得了显著进展,但是,如何用精确简洁句子来描述遥感图像内容仍然是一个很大问题。代码已开源。本文研究利用精确、灵活句子描述遥感图像。...对所提出数据进行大量实验,结果表明,生成语言描述,可以完整地描述遥感图像内容。...在过去几十年里,研究者们设计了很多方法用于自然图像描述生成。 对于自然图像描述任务,传统方法关注两个方面:图像表示和句子生成。 对于图像表示技术,深度卷积特征表示完胜传统手工表示。...但是,两种方法生成句子都是简单句子,不能很好地描述遥感影像中复杂内容。此外,遥感影像描述评估通常是在小数据上进行,有限数据不足以模拟遥感影像实际应用场景。...作者对流行图像描述方法进行全面的回顾,并在搜集数据上,评价各种(分别使用手工特征或深度特征)图像表示和句子生成方法。 ? 图1:从作者搜集到数据集中图像示例,以及每个图像对应五个句子。

    4.8K60

    【深度学习】小目标检测、图像分类、图像识别等开源数据汇总

    编辑丨极市平台 导读 本文收集整理了多个小目标检测、图像识别、图像分类等方向开源数据,本次还有猫咪、斯坦福狗狗数据以及3D MNIST数字识别等~ 宠物图像数据 数据下载地址:http://m6z.cn...猫咪数据 数据下载地址:http://m6z.cn/5TAgbw CAT 数据包括超过 9,000 张猫图像。对于每张图像,猫头部都有九个点注释,眼睛两个,嘴巴一个,耳朵六个。...CBCL 街道场景数据 数据下载地址:http://m6z.cn/5TAgeA StreetScenes Challenge Framework 是用于对象检测图像、注释、软件和性能测量集合。...小目标检测数据 数据下载地址:http://m6z.cn/616t6R 从Internet(例如YouTube或Google)上图像/视频收集四个小物体数据,包括4种类型图像,可用于小物体目标检测研究...斯坦福狗狗数据 数据下载地址:http://m6z.cn/6nF6kM 斯坦福狗数据包含来自世界各地 120 种狗图像

    1.5K20

    应用决策树生成【效果】【非过拟合】策略

    本文介绍应用决策树生成效果,非过拟合策略。 一、什么是决策树 决策树:通过对已知样本学习,一步一步将特征进行分类,从而将整个特征空间进行划分,进而区分出不同类别的算法。...三、应用决策树算法生成规则 项目背景:由于公司发展车贷业务,需要判断新进来申请人有多大概率会逾期,根据逾期概率和资金松紧程度决定是否放贷。...现在有一批历史上是否违约客户样本数据(由于数据涉及安全问题,也是职业操守要求,故此数据不是原始数据,是经过处理)。 想根据这批历史数据训练决策树,生成规则划分样本空间。...接着把规则变成数据框,代码如下: # 生成规则数据框 df = pd.DataFrame(Rules) df.columns = ['allrules'] df['Rules'] = df['allrules...8 合并训练和测试规则数据 接着定义函数,生成训练和测试组合规则合并数据,代码如下: def rule_date(df, Xtest_date): ''' df:决策树生成规则对应好坏数量及占比

    14310

    业内最大规模多标签图像数据开源 | GitHub资源

    允中 发自 凹非寺 量子位 报道 开源地址来了。 上个月,腾讯AI实验室宣布开源多标签图像数据ML-Images,以及业内目前同类深度学习模型中精度最高深度残差网络ResNet-101....现在,GitHub地址传送如下: https://github.com/Tencent/tencent-ml-images 开源内容包含3方面: ML-Images数据全部图像URLs,以及相应类别标注...ML-Images数据详细介绍,包括图像来源,图像数量,类别数量,类别的语义标签体系,标注方法,以及图像标注数量等统计量。 完整代码和模型。...该项目提供了基于小数据训练示例,以方便用户快速体验我们训练流程。...最后,关于腾讯本次开源详情解读,可移步前情报道:腾讯开源业内最大多标签图像数据,附ResNet-101模型 另外值得一提是,这已是腾讯开源第58个项目(https://github.com/Tencent

    1.7K10

    开源公告】腾讯 AI Lab 正式开源业内最大规模多标签图像数据

    2018年10月17日,深圳 - 今日,腾讯AI Lab宣布正式开源“Tencent ML-Images”项目,该项目由多标签图像数据ML-Images,以及业内目前同类深度学习模型中精度最高深度残差网络...该开源项目的主要内容包括: ML-Images数据全部图像URLs,以及相应类别标注。...ML-Images数据详细介绍,包括图像来源,图像数量,类别数量,类别的语义标签体系,标注方法,以及图像标注数量等统计量。 完整代码和模型。...该项目提供了基于小数据训练示例,以方便用户快速体验我们训练流程。该项目还提供了非常高精度ResNet-101模型(在单标签基准数据ImageNet验证top-1精度为80.73%)。...该项目的开源,是腾讯AI Lab在计算机视觉领域所累积基础能力一次释放,为人工智能领域科研人员和工程师提供了充足高质量训练数据,及简单易用、性能强大深度学习模型,为包括图像、视频等在内视觉任务提供强大支撑

    85120

    学界 | 生成图像数据效果不好?也许你需要考虑内容分布差异

    生成数据方法当然是最理想,毕竟许多任务中所有有关图像加起来也没有多少,而且生成数据同时也直接获得了真是标签。...但生成数据方法也有严重问题,那就是生成数据和真实数据数据分布之间会有差异,这些差异限制了生成数据方法效果。 ?...对生成数据和真实数据差异探究目前也有不少成果,比如学习不同任务通用图像特征、学习图像风格迁移等,这样可以让生成数据集中图像看上去更像真实图像。...以往图像生成方法只能覆盖有限场景、有限物体、有限变化,对真实世界物体多变性和属性分布刻画不足;而且作者们提出,以KITTI数据为例,它数据是在德国采集,但也许别的研究人员使用这个数据集训练系统是想要在日本使用...作者们接着用神经网络对数据生成器进行参数化,使得它能够学会修改从场景内容分布概率中获得场景结构图属性,以便减小图像引擎输出图像和目标数据分布之间差异。

    53210

    图像分割 | FCN数据制作全流程(图像标注)

    : 1.为自己数据制作label; 2.将自己数据分为train,val和test; 3.仿照voc_lyaers.py编写自己输入数据层。...其中主要是如何制作自己数据label困扰着大家。...补充:由于图像大小限制,这里给几个图像Resize脚本: (1)单张图片resize # coding = utf-8 import Image def convert(width,height...第一步:使用github开源软件进行标注 地址:https://github.com/wkentaro/labelme 第二步:为标注出来label.png进行着色 首先需要对照VOC分割颜色进行着色...第三步:最关键一步 需要注意是,label文件要是gray格式,不然会出错:scores层输出与label数据尺寸不一致,通道问题导致,看下面的输出是否与VOC输出一致。

    4.9K91

    数据开源 | 2019新型冠状病毒当前,口罩人脸基准数据,包含137,016张图像数据

    在这种情况下,人们期望有效识别系统来检查人们脸是否被掩蔽在规定区域内。为了完成这个任务,对于训练深度学习模型来检测戴面具和不戴面具的人来说,一个带面具的人脸大数据是必要。...本文中提出了三种类型口罩人脸检测数据:(1)正确佩戴口罩数据(CMFD);(2)不正确佩戴口罩数据(IMFD)及其组合;(3)用于全面佩戴口罩检测数据(MaskedFace-Net)。...MaskedFace-Net包含了137,016张高质量口罩人脸图像,可以作为一个基准数据,用于创建与口罩佩戴分析相关机器学习模型。...口罩人脸数据提出目的主要有两个方面,首先是检测人们是否戴了口罩,然后检测人们是否正确佩戴口罩(在机场入口处或人群中)。...此外,这项工作应用了mask-to-face deformable model,允许生成其他面具的人脸图像,特别是特定面具。 主要框架及实验结果 ? ? ?

    89320

    图像分类经典项目:基于开源数据Fashion-MNIST应用实践

    使用这些技巧,在开源Fashion-MNIST数据上达到了96.21%Acc,为大家提供了一个简单有效深度卷积神经网络图像分类Baseline。...目标 将得到强Baseline在开源Fashion-MNIST数据对这些技巧进行了评估,并取得了96.21%Acc。...后台回复关键词 图像分类 可打包下载baseline及数据 数据 MNIST 相信大家对经典MNIST数据都不陌生,它包含了大量手写数字,可谓是算法工作者必测数据之一。...在此过程中,将生成具有各种遮挡级别的训练图像,这会降低过度拟合风险,并使模型对遮挡具有鲁棒性。 4....数据增强方法同样重要,数据增强方法能够有效避免过拟合现象,让模型可以使用一些更强大backbone,极其推荐CutMix方法。

    2.4K30

    数据难找?GAN生成你想要数据!!!

    )和判别网络D(Discriminator)不断博弈,进而使G学习到数据分布,如果用到图片生成上,则训练完成后,G可以从一段随机数中生成逼真的图像。...G, D主要功能是: G是一个生成网络,它接收一个随机噪声z(随机数),通过这个噪声生成图像 D是一个判别网络,判别一张图片是不是“真实”。...而D目标就是尽量辨别出G生成图像和真实图像。...10.GAN经典案例:生成手写数字图片 源码和数据获取方式在下方 有py格式和ipynb格式两种(代码是一样) 代码如下: # -*- coding: utf-8 -*- """ Created...tf.keras.optimizers.Adam(1e-4)#学习速率 discriminator_opt=tf.keras.optimizers.Adam(1e-4) EPOCHS=500 noise_dim=100 #长度为100随机向量生成手写数据

    3.7K31
    领券