
分类图像数据集 (ImageNet 256×256)
数据集下载链接:http://i71i.com/15s2

该数据集由 540,000 张分辨率为 256×256 的高质量图像组成,涵盖 1,000 个独特类别,包括动物、物体、植物、车辆等;是对 ImageNet 数据集的处理版本,通过元数据对图像进行裁剪和分类,整理到具有有意义名称的文件夹中。
包含 540,000 张分辨率为 256×256 的图像文件,按 1,000 个类别分别存储在对应命名的文件夹中。
适用于图像分类任务,可用于训练和评估计算机视觉模型对各类别(动物、物体、植物、车辆等)图像的识别能力,也可支持图像检索、目标检测等计算机视觉领域的研究与应用。
野外的反欺骗多掩码数据集
数据集下载链接:http://i71i.com/15s9

该数据集是用于广义被动活体检测的高多样性 PAD(演示攻击检测)数据集,包含 8000 + 次真实演示攻击样本,涵盖 3 种真实世界场景中常见的面具类型,分别为纸板切口面具(厚纸板材质、平面印花、镂空眼睛)、纺织网面具(薄弹性网状材质、全彩面部印花、紧贴头部)、乳胶 3D 面具(全尺寸、体积感强、带 “皮肤” 纹理);样本在 100 + 个地点拍摄,具备高多样性特征,包括不同演员、大量个人面具、多种照明(室内 / 室外、自然光 / 人造光)、背景、拍摄角度与距离、相机 / 镜头及配饰(眼镜 / 头饰 / 胡须),可减少模型对特定面具纹理的依赖。
包含 8000 + 次演示攻击对应的图像或视频文件(推测为视觉类数据文件,文本未明确具体格式),样本按 3 种面具类型(纸板切口、纺织网、乳胶 3D)及不同拍摄条件(地点、照明、角度等)分类组织。
适用于广义被动活体检测模型的训练与评估,可支持演示攻击检测(PAD)任务,同时能用于攻击类型识别任务,帮助提升模型在多样化场景下对不同类型演示攻击的泛化能力,为活体检测技术研发提供数据支持。
人工智能生成Dogs.jpg VS 真实Dogs.jpg
数据集下载链接:http://i71i.com/15s1

Dogs vs. AI Dogs 数据集用于区分真实狗图像与 AI 生成狗图像,分为完整版和剪切版两个版本。完整版含约 26000 张图像(真实 + AI 生成),剪切版含约 1000 个文件(约 500 张图像 + 500 个标签),便于快速处理和 Kaggle 使用;数据集整体按 70%、20%、10% 的比例划分为训练、验证、测试三个子集,每个子集均包含 “图像” 和 “标签” 两个文件夹,标签中 0 代表真狗,1 代表 AI 生成的狗。
包含图像文件(真实狗图像与 AI 生成狗图像)和标签文件;图像文件存储于各子集的 “图像” 文件夹,标签文件存储于各子集的 “标签” 文件夹,用于标注图像类别(真狗或 AI 生成狗)。
适用于图像分类任务,可训练和评估区分真实与 AI 生成狗图像的模型;适用于 AI 生成模型的质量评估,分析两类图像的视觉质量差异以改进生成技术;适用于数据增强研究,结合真实与合成图像提升计算机视觉任务训练数据的多样性;还可支持计算机视觉研究,用于对象检测、分割、细粒度分类(如品种识别)等任务。
番茄花-3类
数据集下载链接:http://i71i.com/15sa

番茄花 3 类数据集旨在训练深度学习模型并协助自动机器人授粉系统,包含番茄花的 YOLO 格式标记图像,按生物学发育阶段分为 3 类,可支持机器人在温室或田间环境的细粒度视觉感知;3 个类别及对应实例数量分别为:花蕾(0 类,闭合或部分开放、不适合授粉,43908 个对象实例)、开花(1 类,完全开放、准备授粉,27629 个对象实例)、花后(2 类,过最佳授粉阶段、衰老,6727 个对象实例);其核心目标是帮助智能系统确定授粉最佳阶段,避免未成熟或已授粉花朵,提升机器人授粉流程的精度和有效性。
包含番茄花的图像文件,以及对应的 YOLO 格式标记文件(用于标注花朵所属的发育阶段类别及位置信息)。
适用于训练深度学习模型,为自动机器人授粉系统提供视觉支持;可助力智能系统识别番茄花的不同发育阶段,确定最佳授粉时机,进而优化温室或田间环境中的机器人授粉工作流程,也可用于相关农业机器人视觉感知技术的研究与开发。
图像网-R
数据集下载链接:http://i71i.com/15se

ImageNet-R(ImageNet-Renditions)是原始 ImageNet 数据集的变体,包含 30,000 张图像,对应 ImageNet 的 200 个类别;其图像并非自然照片,而是素描、绘画、卡通、刺绣、泥塑等再现形式,在纹理和外观上与原始训练分布差异显著;主要用于评估图像分类模型对分布外(OOD)数据的鲁棒性和泛化性,可作为相关评估基准。
包含 30,000 张再现形式(素描、绘画、卡通等)的图像文件,图像按对应 ImageNet 的 200 个类别进行分类组织。
适用于评估在标准 ImageNet 数据上训练的图像分类模型,重点检测模型暴露于域移位输入(尤其是非自然视觉风格输入)时的性能;可助力揭示深度学习模型依赖纹理而非形状线索的趋势,以及模型在现实世界部署中的潜在脆性,为提升模型鲁棒性的研究提供数据支持。
真菌分类数据集
数据集下载链接:http://i71i.com/15s8

FungiTastic 是围绕野生真菌观察构建的大规模多模态基准数据集,旨在为机器学习和生物多样性研究提供资源;包含约 350,000 次观测、超 600,000 张图像,覆盖超 5000 个物种,数据经专家标记(部分经 DNA 测序验证),收集时间超 20 年;分为三个子集,分别是含所有模态、超 346k 观测和 4500 + 物种的完整子集,含 6 个属、70k 图像及身体部位分割掩码的迷你子集(FungiTastic-M),以及含 < 5 个训练样本物种观察的少样本子集(FungiTastic-FS)。
包含多种类型文件,视觉类有真菌照片、孢子显微图像、身体部位分割掩码文件;文本类有图像标题文件、观测元数据文件;地理气候类有地理空间数据文件、气候时间序列数据文件,且所有文件按不同子集和任务需求分类组织。
适用于细粒度图像分类(封闭集、开放集)、少样本学习与稀有物种识别任务;支持多模态和多任务学习(结合视觉、表格、地理空间、文本数据)、领域适应与时间变化研究(季节、栖息地、逐年分布变化);可用于视觉语言建模(基于详细图像标题)、语义和实例分割,还能支持成本敏感分类(如有毒与可食用物种识别),为相关计算机视觉和生物多样性研究提供基准支持。
公众号后台回复“数据集”获取100+深度学习各方向资源整理

点击阅读原文进入CV社区
收获更多技术干货