球速体育-专业赛事直播平台

60+开源数据集资源大合集(医学图像、卫星图像、自动驾驶等)-球速体育平台官网
7X24小时服务热线:

0755-22671565

您的位置: 主页 > 新闻中心 > 球速动态
球速动态 行业动态

60+开源数据集资源大合集(医学图像、卫星图像、自动驾驶等)

发布时间:2025-07-19点击数:

  该数据集收集了来自不同人群的皮肤镜图像,通过不同的方式获取和存储。最终数据集包含 10015 张皮肤镜图像,可用作学术机器学习目的的训练集。案例包括色素病变领域所有重要诊断类别的代表性集合:光化性角化病和上皮内癌/鲍温氏病 (akiec)、基底细胞癌 (bcc),超过50%的病变是通过组织病理学(histo)证实的,其余病例的ground truth要么是后续检查(follow_up),要么是专家共识(consensus),要么是活体共聚焦显微镜(confocal)证实. 数据集包括具有多个图像的病变,可以通过 HAM10000_metadata 文件中的 lesion_id 列进行跟踪。

  数据集分为 3 个文件夹(train、test、val)并包含每个图像类别(肺炎/正常)的子文件夹。有 5,863 张 X 射线图像 (JPEG) 和 2 个类别(肺炎/正常)。胸部 X 光图像(前后位)选自广州市妇女儿童医疗中心 1 至 5 岁儿科患者的回顾性队列。

  该数据集包含良性皮肤痣和恶性皮肤痣图像的平衡数据集。数据由两个文件夹组成,每个文件夹包含两种痣的 1800 张图片 (224x244)。

  GID 是具有高分二号 (GF-2) 卫星图像的大型土地覆盖数据集。这个新的数据集被命名为高分影像数据集(GID),由于其覆盖面大、分布广、空间分辨率高等特点,与现有的土地覆盖数据集相比具有优势。GID 由两部分组成:大规模分类集和精细土地覆盖分类集。大规模分类集包含 150 个像素级带注释的 GF-2 图像,精细分类集由 30,000 个多尺度图像块加上 10 个像素级带注释的 GF-2 图像组成。分别基于 5 个类别的训练图像和验证图像收集并重新标记 15 个类别的训练数据和验证数据。

  DADA-seg 是一个按像素标注的事故数据集,其中包含交通事故的各种关键场景。

  Dark Zurich 是一个图像数据集,包含在夜间、黄昏和白天拍摄的总共 8779 张图像,以及每张图像的相机各自的 GPS 坐标。这些 GPS 注释用于构建一天中的跨时间对应关系,即,将每个夜间或黎明图像与其白天对应物相匹配。

  斯坦福背景数据集是 Gould 等人引入的新数据集。(ICCV 2009)用于评估几何和语义场景理解的方法。该数据集包含 715 张图像,这些图像选自现有的公共数据集:LabelMe 、 MSRC、 PASCAL VOC 和Geometric Context。我们的选择标准是图像是户外场景,像素大约为 320 x 240,至少包含一个前景物体,并且地平线位于图像内(不需要可见)。

  WoodScape 包含四个环视摄像头和九项任务,包括分割、深度估计、3D 边界框检测和新型污染检测。为超过 10,000 张图像提供实例级别的 40 个类的语义注释。

  需要高质量的水果图像来解决水果分类和识别问题。要构建机器学习模型,整洁干净的数据集是基本要求。为了这个目标,我们创建了名为“FruitNet”的六种流行印度水果的数据集。该数据集包含 6 种不同类别水果的 14700 多张经过处理的格式的高质量图像。图像分为 3 个子文件夹 1) 优质水果 2) 劣质水果和 3) 混合质量水果。每个子文件夹包含 6 个水果图像,即苹果、香蕉、番石榴、酸橙、橙子和石榴。使用具有高端分辨率相机的手机来捕捉图像。这些图像是在不同的背景和不同的光照条件下拍摄的。建议的数据集可用于训练,水果分类或重组模型的测试和验证。

  卫星图像分类数据集-RSI-CB256,该数据集有 4 个不同的类别,混合了传感器和谷歌地图快照

  Architectural Heritage Elements Dataset (AHE) 是一个图像数据集,用于开发深度学习算法和建筑遗产图像分类中的特定技术。该数据集包含 10235 张图像,分为 10 个类别:祭坛:829 张图像;后殿:514 张图片;钟楼:1059张图片;栏目:1919张图片;圆顶(内部):616 张图像;圆顶(外部):1177 张图像;飞扶壁:407张图片;Gargoyle(和 Chimera):1571 张图像;彩色玻璃:1033 幅图像;保险库:1110 张图像。

  数据集包含两个类:贝壳或卵石。该数据集可用于二元分类任务,以确定某个图像是贝壳还是鹅卵石。

  该数据集包含 4242 张花卉图像。数据收集基于数据flicr、google images、yandex images。此数据集可用于从照片中识别植物。数据图片会分为五类:洋甘菊、郁金香、玫瑰、向日葵、蒲公英。每个种类大约有800张照片。照片分辨率不高,约为 320x240 像素。照片不会缩小到单一尺寸,它们有不同的比例。

  在这个数据集中有 90 个不同类别的 5400 张动物图像。此数据集是从 Google 图片创建的:

  。所有照片将按照其所属类别存放于各自的文件夹下。动物类别包括:羚羊,獾,蝙蝠,熊,蜜蜂,甲虫,野牛,公猪,蝴蝶,猫 毛虫,黑猩猩等。该数据集中的图像大小不固定,可能需要后续的处理。

  衣服数据集总共收集了 20 种衣服的 5,000 张图像。该数据集是根据公共领域许可 (CC0) 发布的。我们使用了三种不同的方式来收集数据集:Toloka——众包平台;社交媒体上的网络众包计划;Tagias——一家专门从事数据收集的公司。标签是使用 IPython 小部件手动完成的,同时我们使用简单的神经网络纠正了标签错误。

  数据集包含 20 个类,包括T 恤(1011 件),长袖(699 件),裤子(692 件),鞋子(431 件)衬衫(378 件),连衣裙(357 件),外套(312 件),短裤(308 件),帽子(171 件),裙子(155 件),西装外套(109 件)等。

  在这项工作中,我们构建了一个大规模的 logo 数据集 Logo-2K+,它涵盖了来自真实世界 logo 图像的各种 logo 类别。我们生成的徽标数据集包含 167,140 张图像,具有 10 个根类别和 2,341 个类别。

  该数据集包含完整 food-101 数据的许多不同子集。为了给图像分析制作一个比 CIFAR10 或 MNIST 更简单的训练集,该数据包括图像的大规模缩小版本,以实现快速测试。数据已被重新格式化为 HDF5,特别是 Keras HDF5Matrix,这样可以轻松读取它们。

  这个数据集是一个极具挑战性的集合,包含从 1200 多个城市和农村地区捕获和众包的 7000 多张原始 Masks 图像,其中每张图像都由DC Labs 的计算机视觉专业人员手动审查和验证。

  数据集大小:7000+ 捕获者:超过 1200 多个众包贡献者 分辨率:99% 图像高清及以上(1920x1080 及以上) 地点:拍摄于印度 900 多个城市 多样性:各种照明条件,如白天、夜晚、不同的距离、观察点等 使用设备:2020-2021 年使用手机拍摄 用途:口罩检测、口罩隔离、垃圾口罩检测等

  该数据集由一组 2200 张合成合成的地面香烟图像组成。它专为训练 CNN(卷积神经网络)而设计。

  该数据来自 J-EDI 海洋垃圾数据集。构成该数据集的视频在质量、深度、场景中的对象和使用的相机方面差异很大。它们包含许多不同类型的海洋垃圾的图像,这些图像是从现实世界环境中捕获的,提供了处于不同衰减、遮挡和过度生长状态的各种物体。此外,水的清晰度和光的质量因视频而异。这些视频经过处理以提取 5,700 张图像,这些图像构成了该数据集,所有图像都在垃圾实例、植物和动物等生物对象以及 ROV 上标有边界框。

  该数据集包含来自 12 个不同类别的生活垃圾的 15,150 张图像;纸、纸板、生物、金属、塑料、绿色玻璃、棕色玻璃、白色玻璃、衣服、鞋子、电池和垃圾。

  该数据集是图片数据,分为训练集85%(Train)和测试集15%(Test)。其中O代表Organic(有机垃圾),R代表Recycle(可回收)

  大约9000多张独特的图片。该数据集由印度国内常见垃圾对象的图像组成。图像是在各种照明条件、天气、室内和室外条件下拍摄的。该数据集可用于制作垃圾/垃圾检测模型、环保替代建议、碳足迹生成等。

  图像中的垃圾(GINI)数据集是SpotGarbage引入的一个数据集,包含2561张图像,956张图像包含垃圾,其余的是在各种视觉属性方面与垃圾非常相似的非垃圾图像。

  本数据集包含一大组 128 种颜色序列,带有基本事实和挑战因素注释(例如,遮挡)

  第一个更高帧率的视频数据集(称为极品飞车 - NfS)和视觉对象跟踪基准。该数据集包含 100 个视频(380K 帧),这些视频是使用现在常见的更高帧率 (240 FPS) 摄像机从现实世界场景中捕获的。所有帧都用轴对齐的边界框进行注释,所有序列都用九个视觉属性手动标记——例如遮挡、快速运动、背景杂乱等。

  从监控录像中对有面具和无面具的人脸进行分类是最困难的任务之一,数据集SF-MASK来解决这些问题,该数据集适用于小尺寸人脸、部分隐藏的人脸、各种人脸方向和各种面具类型等。SF-MASK是通过收集已经发布的面具相关数据集而构建的。同时,通过分析现有数据集中缺失的数据和补充缺失的数据,使其更加完整。

  一个实时视频/图像数据集,其中包含在大学环境中行走的多个主题(带/不带面具)。每个带注释的帧都包含多个具有唯一标识、边界框和类/标签信息的实例(即人)。数据集和注释可用于训练、验证和测试基于深度学习和计算机视觉的口罩检测算法。以下是数据集的详细信息:视频总帧数:4357 边界框总数:21941 带遮罩的盒子 (MW):8306 不带遮罩的盒子 (NM):13635 图像帧:此文件夹包含 4357 个视频帧 (.png)。

  该Mask Wearing数据集是戴各种口罩的人和不戴口罩的人的物体检测数据集。这些图像最初由台湾伊甸社会福利基金会的 Cheng Hsun Teng 收集,并由 Roboflow 团队重新标记。

  MDMFR 数据集由两个主要集合组成,1) 面罩检测和 2) 蒙面面部识别。我们的 MDMFR 数据集中有 6006 张图像。面罩检测集合包含两类人脸图像,即蒙面和未蒙面。检测数据库包含 3174 个带掩码和 2832 个不带掩码(未掩码)的图像。

  Exclusively Dark (ExDARK) 数据集是 7,363 张从极低光环境到黄昏(即 10 种不同条件)的低光图像的集合,具有 12 个对象类(类似于 PASCAL VOC),在图像类级别和局部对象边界上进行了注释盒子。

  该数据集包含 11 个类别的 97,942 个标签和 15,000 张图像。有 1,720 个空样本(没有标签的图像)。

  WoodScape 包含四个环视摄像头和九项任务,包括分割、深度估计、3D 边界框检测和新型污染检测。为超过 10,000 张图像提供实例级别的 40 个类的语义注释。

  UCB的全天候全光照大型数据集,包含1,100小时的HD录像、GPS/IMU、时间戳信息,100,000张图片的2D bounding box标注,10,000张图片的语义分割和实例分割标注、驾驶决策标注和路况标注。官方推荐使用此数据集的十个自动驾驶任务:图像标注、道路检测、可行驶区域分割、交通参与物检测、语义分割、实例分割、多物体检测追踪、多物体分割追踪、域适应和模仿学习。

  该数据集已特别针对非洲地区进行了改进。两个开源数据集仅用于提取非洲地区使用的交通标志。该数据集包含来自所有类别的 76 个类,例如 监管、警告、指南和信息标志。该数据集总共包含 19,346 张图像和每个类别至少 200 个实例。

  Sentinel-2 卫星拍摄的水体图像集。每张图片都带有一个黑白mask,其中白色代表水,黑色代表除水之外的其他东西。这些掩模是通过计算 NWDI(归一化水差指数)生成的,该指数经常用于检测和测量卫星图像中的植被,但使用更大的阈值来检测水体。

  此数据集包含用于检查和准备航空影像分割数据集的脚本。该数据集包含一组不同的卫星图像,这些图像用目标城市的建筑物、道路和背景标签进行了注释。

  球速体育平台

  由于月球图像的稀缺性和缺乏注释,通常很难对其进行任何类型的机器学习实验。该数据集的目标是为公众提供人造而逼真的月球景观样本,可用于训练岩石检测算法。这些经过训练的算法可以在实际的月球图片或其他岩石地形图片上进行测试。该数据集目前包含 9,766 个岩石月球景观的真实渲染图,以及它们的分段等价物(3 类是天空、较小的岩石和较大的岩石)。还提供了所有较大岩石和经过处理、清理后的地面实况图像的边界框表。

  马萨诸塞州道路数据集由1171幅马萨诸塞州的航空图像组成。与建筑数据一样,每个图像的大小为1500×1500像素,占地2.25平方公里。

  数据集包含 17,509 张图像,这些图像捕捉了八种原产于澳大利亚的不同杂草以及邻近的植物群。选定的杂草品种是昆士兰州牧草地的本地品种。它们包括:“中国苹果”、“蛇草”、“马缨丹”、“刺金合欢”、“暹罗草”、“白花菊”、“橡胶藤”和“帕金森属植物”。这些图像是从昆士兰以下地点的杂草侵扰中收集的:“Black River”、“Charters Towers”、“Cluden”、“Douglas”、“Hervey Range”、“Kelso”、“McKinlay”和“Paluma”。

  数据集(作物图像)包含每种农业作物(玉米、小麦、黄麻、水稻和甘蔗)的 40 多张图像数据集(kag2)包含每类作物图像的 159 多张增强图像。增强包括水平翻转、旋转、水平平移、垂直平移。

  收集了部分被秋粘虫等害虫感染的玉米叶片图像。有 Healthy 和 Infected 文件夹,每个文件夹都包含各自的图像。此外,还使用 VoTT 为受感染的图像准备了注释文件。

  巴以局势·以色列媒体民调显示:超七成以民众支持全面停火换全部被扣人员。

  来源:【星沙融媒】2025年长沙县高考首批录取通知书已送达!吴承俊、雷司源、陶一轩同时收到空军航空大学的录取通知书!本文来自【星沙融媒】,仅代表作者观点。全国党媒信息公共平台提供信息发布传播服务。

  男婴医院离世获赔88万元,律师拿走代理费55万元,家长认为上当,广州律协立案一年无果

  对此,曾为韦先生代理的律师邓某说,案件起初没收费,但不是风险代理,案件按照司法鉴定,本应给次责赔偿,他们努力让韦先生获得了主责赔偿。

  2025年退休人员基本养老金继续上调2% 基本养老金≠个人养老金 这两笔钱要分清楚

  2025年退休人员基本养老金继续上调2%:基本养老金≠个人养老金,这两笔钱要分清楚。

  9岁男孩跟着亲爸后妈出远门,亲爸让他坐在后备箱几小时,亲妈: 当时7个人 ,孩子想坐后座,他们说没位置了,事发2023年夏天,已拿到孩子抚养权

  中联重科员工联系我了,我给大家读一读 你们觉得,有道理么,我觉得,挺有道理的#摩托车 #交通事故 #中联重科

  菲律宾海警高速穿航中国海警船尾证据曝光! 7月15日上午,菲海警9701船在中国黄岩岛附近海域活动,期间多次高速穿航中国海警21550艇、5009艇船尾。#南海 #菲律宾 #黄岩岛 #海警

  在阅读此文之前,麻烦您点击一下“关注”,既方便您进行讨论和分享,又能给您带来不一样的参与感,感谢您的支持文、编辑小娄生前是“布鞋企业家”,走后是三个外籍娃。近日娃哈哈创始人宗庆后有三个私生子的传闻在网上闹得是人尽皆知。

  公众号「极市平台」,为计算机视觉开发者提供全流程算法开发训练平台,以及大咖技术分享、社区交流、竞赛实践等丰富的内容与服务。

在线客服
服务热线

服务热线

0755-22671565

微信咨询
球速体育-专业赛事直播平台
返回顶部