今天总结了一些关于「卷积神经网络」的经典论文分享给大家,希望可以给大家发论文提供一些灵感。
一起来看下~
AlexNet是一种用于图像分类任务的深度卷积神经网络。它是首个成功应用于大规模视觉识别任务的深度学习模型,引领了深度学习研究的新时代。
AlexNet的网络架构非常深,在当时被认为是非常复杂的。它包含了8个可学习层,其中5个是卷积层,3个是全连接层。网络的输入是一张224×224的RGB图像。
网络的第一层是一个卷积层,使用了96个大小为11×11的滤波器,步长为4,第二层是最大池化层,步长为2。接着是第三层和第四层,都是卷积层,分别使用了256个5×5的滤波器,并且紧跟了局部响应归一化层,用于增强网络的泛化性能。第五层是最大池化层。
在卷积层和全连接层之间,AlexNet还引入了一种称为Dropout的策略,该策略可以减缓过拟合问题。在全连接层中,网络使用了两个具有4096个神经元的隐藏层,最后一个全连接层包含1000个神经元,对应于ImageNet数据集的1000个类别。
该论文的主要贡献有以下几个方面:
AmoebaNet是一种利用强化学习策略进行自动网络结构搜索的方法。其灵感来源于生物界中的变形虫,通过仿真变形虫的自适应形态来设计出具有高效性能的神经网络结构。
该方法采用了强化学习框架,通过在大规模的网络结构搜索空间中进行搜索,以找到在特定任务上表现良好的神经网络架构。AmoebaNet的搜索过程基于强化学习算法,并利用了分布式计算的优势来加速搜索过程。
AmoebaNet的主要贡献包括:
该论文提出了一种名为CR-NET的新型神经网络结构,用于场景理解。CR-NET结合了卷积神经网络(CNN)和循环神经网络(RNN)的优势,以提高对复杂场景的理解能力。其核心思想是在CNN的基础上引入了RNN模块,以更好地捕捉图像中的时空信息,并实现对场景的深层次理解。
CR-NET的主要贡献包括:
CSPDarknet53 是基于 Darknet53 的改进版本,Darknet53 是一个轻量级的神经网络结构,广泛用于计算机视觉任务中。CSPDarknet53 引入了一种新的网络结构,名为 Cross Stage Partial Network (CSPNet),旨在增强卷积神经网络的学习能力。
CSPDarknet53 的网络结构包含了一系列的残差块,其中每个残差块都被分为两个分支:主分支和支持分支。主要的创新点在于 CSP 模块的引入,它将主分支的特征图与支持分支的特征图进行融合,以促进信息的交流和整合。这种设计使得网络能够更好地利用输入特征的信息,从而提高了网络的性能。
CSPDarknet53 的主要贡献包括:
CSPDenseNet-Elastic是一种深度卷积神经网络,用于图像分类任务。该网络结合了DenseNet和Cross Stage Partial Network (CSPN)的优点,旨在提高分类准确率并降低网络的计算复杂度。通过引入CSPElasticNeck和CSPCrossBlock,在保持网络高效和灵活性的同时,实现了更好的图像分类性能。
CSPDenseNet-Elastic网络主要分为四个阶段。首先是特征提取阶段,利用多个密集连接块(Densely Connected Block)来提取输入图像的特征。然后是CSPElasticNeck阶段,该阶段通过引入弹性通道来增加网络的灵活性和表达能力。接下来是CSPCrossBlock阶段,该阶段通过嵌入跨舞台部分功能网络来增强特征传递和信息流动。最后是分类阶段,使用全局平均池化层将特征映射为类别概率,并通过softmax函数进行分类。
该研究的主要贡献包括: