首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

谷歌开源新模型EfficientNet,或成计算机视觉任务新基础

开发一个卷积神经网络(CNN)的成本通常是固定的。在获得更多资源时,我们通常会按比例进行扩展,以便获得更优的准确性。例如,ResNet可以通过增加层数从ResNet-18扩展到ResNet-200,最近,GPipe 网络通过将基准 CNN 模型扩展四倍,在 ImageNet Top-1 上获得了 84.3% 的准确度。在模型扩展方面的操作通常是任意增加 CNN 的深度或宽度,或者在更大输入图像分辨率上进行训练和评估。虽然这些方法确实提高模型了准确性,但它们通常需要繁琐的手工调整,而且还不一定能找到最优的结构。换言之,我们是否能找到一种扩展设计方法来获得更好的准确性和效率呢?

01
您找到你想要的搜索结果了吗?
是的
没有找到

CVPR 2020 | 一种频域深度学习

深度神经网络在计算机视觉任务中取得了显著的成功。对于输入图片,现有的神经网络主要在空间域中操作,具有固定的输入尺寸。然而在实际应用中,图像通常很大,必须被降采样到神经网络的预定输入尺寸。尽管降采样操作可以减少计算量和所需的通信带宽,但它会无意识地移除冗余和非冗余信息,导致准确性下降。受数字信号处理理论的启发,我们从频率的角度分析了频谱偏差,并提出了一种可学习的频率选择方法,可以在不损失准确性的情况下移除次相关的频率分量。在下游任务中,我们的模型采用与经典神经网络(如ResNet-50、MobileNetV2和Mask R-CNN)相同的结构,但接受频域信息作为输入。实验结果表明,与传统的空间降采样方法相比,基于静态通道选择的频域学习方法可以实现更高的准确性,同时能够减少输入数据的大小。具体而言,在相同的输入尺寸下,所提出的方法在ResNet-50和MobileNetV2上分别实现了1.60%和0.63%的top-1准确率提升。当输入尺寸减半时,所提出的方法仍然将ResNet-50的top-1准确率提高了1.42%。此外,我们观察到在COCO数据集上的分割任务中,Mask R-CNN的平均精度提高了0.8%。

04

用于 BCI 信号分类的深度特征的 Stockwell 变换和半监督特征选择

在过去的几年里,运动图像 (MI) 脑电图 (EEG) 信号的处理已被吸引到开发脑机接口 (BCI) 应用程序中,因为这些信号的特征提取和分类由于其固有的复杂性和倾向于人为它们的属性。BCI 系统可以提供大脑和外围设备之间的直接交互路径/通道,因此基于 MI EEG 的 BCI 系统对于控制患有运动障碍的患者的外部设备似乎至关重要。目前的研究提出了一种基于三阶段特征提取和机器学习算法的半监督模型,用于 MI EEG 信号分类,以通过更少的深度特征来提高分类精度,以区分左右手 MI 任务。在所提出的特征提取方法的第一阶段采用斯托克韦尔变换从一维 EEG 信号生成二维时频图 (TFM)。接下来,应用卷积神经网络 (CNN) 从 TFM 中寻找深度特征集。然后,使用半监督判别分析(SDA)来最小化描述符的数量。最后,五个分类器的性能,包括支持向量机、判别分析、在所提出的特征提取方法的第一阶段采用斯托克韦尔变换从一维 EEG 信号生成二维时频图 (TFM)。接下来,应用卷积神经网络 (CNN) 从 TFM 中寻找深度特征集。然后,使用半监督判别分析(SDA)来最小化描述符的数量。最后,五个分类器的性能,包括支持向量机、判别分析、在所提出的特征提取方法的第一阶段采用斯托克韦尔变换从一维 EEG 信号生成二维时频图 (TFM)。接下来,应用卷积神经网络 (CNN) 从 TFM 中寻找深度特征集。然后,使用半监督判别分析(SDA)来最小化描述符的数量。最后,五个分类器的性能,包括支持向量机、判别分析、k近邻、决策树、随机森林,以及它们的融合比较。SDA 和提到的分类器的超参数通过贝叶斯优化进行优化,以最大限度地提高准确性。所提出的模型使用 BCI 竞赛 II 数据集 III 和 BCI 竞赛 IV 数据集 2b 进行验证。所提出方法的性能指标表明其对 MI EEG 信号进行分类的效率。

02

速递:利用卷积神经网络对温带草原冠层氮浓度进行实地光谱分析

摘要:氮(N)是植物自养的重要特征,是影响陆地生态系统植物生长的主要养分,因此不仅具有根本的科学意义,而且还是作物生产力的关键因素。对冠层氮浓度(N%)进行及时的非破坏性监测需要快速且高度准确的估算,通常使用400-2500 nm光谱区域中的光谱分析法对其进行量化。然而,由于冠层结构混杂,从冠层光谱中提取一组有用的光谱吸收特征来确定N%仍然具有挑战性。深度学习是一种统计学习技术,可用于从冠层光谱中提取生化信息。我们评估了一维卷积神经网络(1D-CNN)的性能,并将其与两种最新技术进行了比较:偏最小二乘回归(PLSR)和高斯过程回归(GPR)。我们利用8年(2009年至2016年)整个新西兰的奶牛场和丘陵农场的大型,多样化的田间多季节(秋季,冬季,春季和夏季)光谱数据库(n = 7014)来开发特定季节和特定于频谱区域(VNIR和/或SWIR)的1D-CNN模型。独立验证数据集(未用于训练模型)的结果表明,一维CNN模型提供的准确度(R2 = 0.72; nRMSE%= 14)比PLSR(R2 = 0.54; nRMSE%= 19)和GPR(具有R2 = 0.62;nRMSE%= 16)。基于1D-CNN的特定季节模型显示出明显的差异(测试数据集为14≤nRMSE≤19),而测试数据集的所有季节组合模型的性能仍然更高(nRMSE%= 14)。全光谱范围模型显示出比特定光谱区域模型(仅VNIR和SWIR)更高的准确性(15.8≤nRMSE≤18.5)。此外,与PLSR(0.31)和GPR(0.16)相比,使用1D-CNN得出的预测更精确(不确定性更低),平均标准偏差(不确定区间)<0.12。这项研究证明了1D-CNN替代传统技术从冠层高光谱光谱中确定N%的潜力。

07

深度学习+EEG:一种采用单通道EEG检测被试注意力状态的卷积神经网络构架

脑机接口(BCI)系统可以记录并处理大脑信号并将其转换为输出命令,其可用于各种应用场景,如辅助技术,神经康复和认知增强等。在各种用于脑信号记录的技术中,脑电图(EEG)是BCI研究中研究最多的方法。而基于EEG的认知BCI,旨在评估和增强诸如注意力等认知功能。 之前的研究更多的关注于选取合适的特征,以将其用来对注意力程度进行分类。用于监视专注精神状态的现有技术方法主要与EEG频带中的特定频段有关。大量的研究调查了注意力引起的beta,alpha 和不同频段之间能量比值的变化。总体而言,很多研究认为像beta这样的高频段活动增加是一种注意唤醒的指标,另外一些研究表明θ和β的能量比值、α和θ能量的降低也表明较高的专注程度。 深度学习近年来在语音识别及图像识别领域取得了非常突出的表现,因其可以自动提取相关特征用于分类任务,近年来将深度学习技术应用于EEG数据的研究也逐渐增多。但是深度学习技术应用于认知BCI的研究目前还较少。近期,来自新加坡的研究团队在Journal of Neural Engineering杂志发表题目为《Inter-subject transfer learning with end-to-end deep convolutional neural network for EEG-based BCI》研究论文,其提出了一种深度学习框架,利用单通道EEG信号来检测被试的注意力状态,可以显著提高被试间注意力检测任务的准确性。 材料与方法 1.数据

00

第三章--第一篇:什么是情感分析?

情感分析是一种自然语言处理技术,旨在识别和理解文本中表达的情感、情绪和情感倾向。它利用计算机算法和模型来分析文本中的情感表达,以确定文本的情感状态,例如正面、负面或中性。情感分析可以帮助我们理解人们在文本中表达的情感态度,从而揭示用户对产品、服务、事件或主题的情感倾向和观点。 情感分析在自然语言处理领域具有重要性和广泛应用。首先,情感分析可以帮助企业了解用户对其产品和服务的情感反馈。通过分析用户在社交媒体、在线评论和调查问卷中的情感表达,企业可以了解用户对其产品的喜好、满意度和不满意度,从而进行改进和优化。 其次,情感分析在舆情监测和品牌管理中发挥关键作用。通过分析公众对特定事件、品牌或产品的情感反馈,可以及时了解公众对品牌形象的看法,从而进行舆情应对和品牌形象的管理。此外,情感分析在社交媒体挖掘、市场调研和消费者洞察方面也具有广泛的应用。通过分析用户在社交媒体平台上的情感表达,可以了解用户对不同产品、话题和事件的看法和情感态度,为市场调研和推广活动提供有价值的信息。 本文旨在介绍情感分析的概念和定义,强调情感分析在自然语言处理领域的重要性和应用广泛性。同时,我们将探讨情感分析的方法和技术,分析其在不同领域的应用,并讨论情感分析面临的挑战和未来发展方向。

03

EfficientNet解析:卷积神经网络模型规模化的反思

自从Alexnet赢得2012年的ImageNet竞赛以来,CNNs(卷积神经网络的缩写)已经成为深度学习中各种任务的事实算法,尤其是计算机视觉方面。从2012年至今,研究人员一直在试验并试图提出越来越好的体系结构,以提高模型在不同任务上的准确性。近期,谷歌提出了一项新型模型缩放方法:利用复合系数统一缩放模型的所有维度,该方法极大地提升了模型的准确率和效率。谷歌研究人员基于该模型缩放方法,提出了一种新型 CNN 网络——EfficientNet,该网络具备极高的参数效率和速度。今天,我们将深入研究最新的研究论文efficient entnet,它不仅关注提高模型的准确性,而且还关注模型的效率。

03

[Intensive Reading]目标检测(object detection)系列(六) SSD:兼顾效率和准确性

目标检测系列: 目标检测(object detection)系列(一) R-CNN:CNN目标检测的开山之作 目标检测(object detection)系列(二) SPP-Net:让卷积计算可以共享 目标检测(object detection)系列(三) Fast R-CNN:end-to-end的愉快训练 目标检测(object detection)系列(四) Faster R-CNN:有RPN的Fast R-CNN 目标检测(object detection)系列(五) YOLO:目标检测的另一种打开方式 目标检测(object detection)系列(六) SSD:兼顾效率和准确性 目标检测(object detection)系列(七) R-FCN:位置敏感的Faster R-CNN 目标检测(object detection)系列(八) YOLOv2:更好,更快,更强 目标检测(object detection)系列(九) YOLOv3:取百家所长成一家之言 目标检测(object detection)系列(十) FPN:用特征金字塔引入多尺度 目标检测(object detection)系列(十一) RetinaNet:one-stage检测器巅峰之作 目标检测(object detection)系列(十二) CornerNet:anchor free的开端 目标检测(object detection)系列(十三) CenterNet:no Anchor,no NMS 目标检测(object detection)系列(十四)FCOS:用图像分割处理目标检测

02
领券