细粒度图像分类论文研读-2015

Bilinear CNN Models for Fine-grained Visual Recognition(by end-to-end feature encoding) 本文是单阶段法的开山之作。 Abstract 本文提出了双线性模型,由两个特征提取器组成。 其输出在图像的每个位置使用外积相乘并合并来获得图像的描述。 这样一种结构可以建模局部的、成对的特征交互(以一种平移不变的方式),这对于细粒...

【深度学习】图像分类数据集Fashion-MNIST

今天在手撸深度学习代码的时候,遇到了这个数据集,但是调用的函数的参数和功能不是很明白,因此选择写篇博客总结一下。 一、介绍 Fashion-MNIST是⼀个10类服饰分类数据集。 torchvision 包:它是服务于 PyTorch 深度学习框架的,主要⽤来构建计算机视觉模型。 torchvision 主要由以下几部分构成: torchvision.datasets : ⼀些加载数据的函数及常⽤的数据...
© 2024 LMLPHP 关于我们 联系我们 友情链接 耗时0.015065(s)
2024-05-03 20:52:41 1714740761