收录于IJCAI2022 的论文Investigating and Explaining the Frequency Bias in Image Classification (链接:https://www.aminer.cn/pub/6278861f5aee126c0f071c6c/?f=cs)探究和解释了图像分类任务中存在的频域偏见。图像分类是计算机视觉中最基础的一个任务,也是几乎所有的基准模型进行比较的任务。从最开始比较简单的10分类的灰度图像手写数字识别任务mnist,到后来更大一点的10分类的 cifar10和100分类的cifar100任务,到后来的imagenet任务,图像分类模型伴随着数据集的增长,一步一步提升到了今天的水平。现在,在imagenet这样的超过1000万图像,超过2万类的数据集中,计算机的图像分类水准已经超过了人类。
可见,图像分类在计算机视觉有着重要地位。AMiner整理了关于图像分类的论文合集,点击链接查看:https://www.aminer.cn/topic/600a813592c7f9be21328877?f=cs
以下是从论文集中挑选的几篇优质论文,供大家学习:
1.Res2Net: A New Multi-Scale Backbone Architecture “在本文中,我们提出了一种新颖的CNN构建块,即Res2Net,方法是在单个残差块中构建分层残差状连接。Res2Net 在粒度级别表示多尺度特征,并增加了每个网络层的接受字段范围…” PDF下载链接:https://www.aminer.cn/pub/5cede10fda562983788ef75c/?f=cs
2.Squeeze-and-Excitation Networks. “在这项工作中,我们转而关注通道关系,并提出了一种新颖的架构单元,我们称之为“挤压和激励”(SE)块,它通过显式建模通道之间的相互依赖性来自适应地重新校准通道方面的特征响应…” PDF下载链接:https://www.aminer.cn/pub/5a260c8117c44a4ba8a30771/?f=cs
3.Regularized Evolution for Image Classifier Architecture Search. “本研究介绍了一种流行的异步进化算法的正则化版本。我们严格地将其与非正则化形式和高度成功的强化学习基线进行比较…我们表明,正则化演化在各种上下文中始终如一地生成具有相似或更高精度的模型,而无需重新调整参数…” PDF下载链接:https://www.aminer.cn/pub/5a9cb65d17c44a376ffb820b/?f=cs
4.DARTS: Differentiable Architecture Search. “本文通过以可微分的方式制定任务来解决架构搜索的可伸缩性挑战…在CIFAR-10,ImageNet,Penn Treebank和WikiText-2上进行的大量实验表明,我们的算法在发现用于图像分类的高性能卷积架构和用于语言建模的循环架构方面表现出色,同时比最先进的不可微分技术快几个数量级…” PDF下载链接:https://www.aminer.cn/pub/5b67b4b417c44aac1c867648/?f=cs
5.Mnasnet: Platform-Aware Neural Architecture Search For Mobile “在本文中,我们提出了一种自动化移动神经架构搜索(MNAS)方法,该方法明确地将模型延迟纳入主要目标,以便搜索能够识别出在准确性和延迟之间实现良好权衡的模型…实验结果表明,我们的方法在多个视觉任务中始终优于最先进的移动CNN模型…” PDF下载链接:https://www.aminer.cn/pub/5c8f69874895d9cbc647064f/?f=cs
6.EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks. “在本文中,我们系统地研究了模型缩放,并确定仔细平衡网络深度,宽度和分辨率可以带来更好的性能。基于这一观察结果,我们提出了一种新的缩放方法,该方法使用简单但高效的复合系数均匀地缩放深度/宽度/分辨率的所有维度…”
PDF下载链接:https://www.aminer.cn/pub/5d04e8d7da56295d08daee44/?f=cs
AMiner官网:https://www.aminer.cn/?f=cs