DINO-DETR 实验与分析
创始人
2025-06-01 02:49:54
0

前言

自DETR提出之后,不计其数的DETR改进模型不断被提出,尽管如此,基于Transformer模型的速度与精度却一直被人诟病。今天学习的这个DETR的改进模型,号称SOTA模型,这便是大名鼎鼎的DINO-DETR模型。
该模型声称在COCO数据上测试的mAP值达到了0.63,可谓是不同凡响。

实验过程

博主也做了相关的实验,论文中提到DINO-DETR模型收敛极快,这个的确显而易见,考虑到COCO数据集太大,所以博主提取了bus,car,truck三个类别数据进行实验,其在训练过程中,在第一个epoch时效果还并不好,而第二个epoch时竟然mAP达到了0.26,这属实让我大为震惊,正当我以为其能够继续高歌猛进,达到其论文中的效果时,其最终的结果却让我有些失望,其最终的mAP值仅为0.28,而论文中指出其在12个epoch时便能达到0.49,在24个epoch时能到达0.52,这与我现在的结果差距属实巨大:

训练结果

博主的实验结果:

epochs=24,batch-size=2
在这里插入图片描述

在这里插入图片描述

考虑到自己的数据集在经过提取后其数量已经急剧下降,效果差些也就情有可原,但目前两者毕竟差距太过巨大。因此便打算使用完整数据集进行实验。但让我想不通的是,博主的数据集并非是直接减少,而是按照不同类别进行提取,对于某个类别而言,其不该有如此大的差距。

验证结果

因此便想到使用论文中给出的已经训练好的模型文件进行验证:
在验证的过程中,博主也发现,先前的loss值最多只能下降到6.2便不再下降,而在使用论文中提供的权重文件时,其可以下降到3.1左右,这倒是令我感到意外。
最终通过验证集最后的结果为:可以看到的确如论文中所言,其达到了0.49。

在这里插入图片描述

原因分析

数据集标注问题

目前来看,关于实验结果差距大的问题可能原因为:
1.博主的类别提取方法有问题,提取的数据集有问题(太可怕了)

关于该问题,博主考虑到可以将COCO数据集中的标注信息打印到图片上进行验证:提取代码如下:

import json
import shutil
import cv2def select(json_path, outpath, image_path):json_file = open(json_path)infos = json.load(json_file)images = infos["images"]annos = infos["annotations"]assert len(images) == len(images)for i in range(len(images)):im_id = images[i]["id"]im_path = image_path + "/" + images[i]["file_name"]img = cv2.imread(im_path)for j in range(len(annos)):if annos[j]["image_id"] == im_id:x, y, w, h = annos[j]["bbox"]x, y, w, h = int(x), int(y), int(w), int(h)x2, y2 = x + w, y + h# object_name = annos[j][""]img = cv2.rectangle(img, (x, y), (x2, y2), (255, 0, 0), thickness=2)img_name = outpath + "/" + images[i]["file_name"]cv2.imwrite(img_name, img)# continueprint(i)if __name__ == "__main__":json_path = "/data/datasets/coco_type/annotations/instances_val2017.json"#放标注json的地址out_path = "/data/datasets/coco_type/results"#结果放的地址image_path = "/data/datasets/coco_type/images/val2017/"#原图的地址select(json_path, out_path, image_path)

输出结果:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
从上面的标注结果来看,其标注的信息还是较为准确的。

数据集数量问题

2.按照目前对Transformer的研究来看,其效果一般在数据量及其庞大的情况下越好,因此博主虽然是按照类别进行提取了,但不可否认的是数据集数量大大缩水,所以导致了实验效果差。

验证时GPU使用情况

在这里插入图片描述

关于当前实验结果分析与改进,博主还在进行中,如果大家有自己的观点,望不吝赐教。感谢!

相关内容

热门资讯

壁仞科技:港股开年首股,上市涨... 【1月2日壁仞科技港交所上市,股价大涨市值破千亿】1月2日,国产GPGPU稀缺标的壁仞科技(6082...
原创 1... 1947年8月7日,延安的居民们纷纷放下手中的农活,聚集在枣园,目睹一个难得的场面: 一个身着军装、...
从企业发展看艾多美的非传销轨迹 企业的发展轨迹,是其内在基因与外部行为的综合映射。艾多美自创立以来,始终坚持产品为核心、消费者为导向...
每周股票复盘:郑州银行(002... 截至2025年12月31日收盘,郑州银行(002936)报收于1.93元,较上周的1.95元下跌1....
原创 多... 多田保中将是侵华日军的高级指挥官,他曾担任多个重要职务,参与了许多中国战场上的战斗。曾在常德会战中发...
500ML飞天上线i茅台,消费... 2026年1月1日起,到“i茅台”购买500ml飞天茅台,成为酒圈最关心的话题。在线上热卖的同时,有...
探秘千济方桑黄对子宫癌免疫调节... 探秘千济方桑黄对子宫癌免疫调节的意义 一、桑黄简介 桑黄是一种珍贵的药用真菌,在传统医学中有着悠久的...
长鑫IPO获受理,比走势更该看... 12月31日,长鑫科技科创板IPO申请正式拿到上交所受理通知,要募295亿把钱砸进DRAM存储器的技...
价稳货足,普陀商超全力保障假日... 为保障元旦假期商品稳定供应,普陀各大商超积极备货,保障生活必需品和节令食品种类丰富、供应充足,让市民...
数字人民币正式迈入“计息时代”... 2026年1月1日起,工商银行、中国银行、农业银行、建设银行、交通银行及邮储银行六家国有大行集体实施...
揽金1.98亿元丨安庆一宗住宅... 最新!安庆市宜秀区1宗住宅地块成功出让,合计96.22亩,揽金1.98亿元。 具体内容请往下瞧↓ 1...
圃美多乐活(中国)再添强援,李... 来源:市场资讯 (来源:zhixiao360) 2026 年 1 月 1 日,圃美多乐活(中国)有限...
上海首发各大商圈跨年消费“快报... 1月2日,上海市商务委首次发布各大商圈跨年消费“快报”。 第一八佰伴 本文图片均由受访者提供 跨年...
出炉!2025年全球十大航运新... 2025年全球十大航运新闻 回望2025,许多变化并非骤然降临,而如潮汐一般,表面起落有时,深处的水...
数读2025年杭州楼市:新房卖... 潮新闻客户端 记者 孙晨 吴佳怡 黄磊 制图 蓝鋆滋 随着2025年结束,杭州楼市的年度数据纷纷出炉...
栝蒌瞿麦丸的临床应用 《金匮要略·消渴小便不利淋病脉证并治第十三》记载:“小便不利者,有水气,其人若渴,栝楼瞿麦丸主之。栝...
开门红!闵行!拿下“港股GPU... “港股GPU第一股”来了! 盘中市值突破千亿港元 1月2日,闵行企业壁仞科技在港交所上市,成为港股“...
为了在美国送床垫快两天,梦百合... 出品I下海fallsea 撰文I胡不知 2025年12月30日,梦百合(603313.SH)一则增资...
高盛对冲基金负责人:2025美... 提及如何定义2025年的美股市场时,高盛全球对冲基金业务负责人Tony Pasquariello陷入...
原创 “... 当新消费品牌还在直播间烧钱抢流量、用联名款博眼球时,那个曾被唱衰“过气”的国民辣酱——老干妈,却以 ...