开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

使用在不同数据集上训练的cnn模型

使用在不同数据集上训练的CNN模型是一种利用卷积神经网络（Convolutional Neural Network）进行图像分类和识别的方法。CNN模型是一种深度学习模型，通过学习图像的特征和模式，能够自动提取图像中的关键信息，并进行分类或识别。

分类：CNN模型是一种用于图像分类和识别的机器学习模型。它通过学习图像的特征和模式，将输入的图像分为不同的类别。

优势：

自动特征提取：CNN模型能够自动学习图像中的特征和模式，无需手动设计特征提取器，大大简化了图像处理的流程。
高效的参数共享：CNN模型通过使用卷积层和池化层，可以共享参数，减少了模型的参数量，提高了模型的训练效率和泛化能力。
对平移、缩放和旋转等变换具有不变性：CNN模型通过卷积和池化操作，可以对图像进行平移、缩放和旋转等变换，使得模型对这些变换具有一定的不变性。
适用于大规模数据集：CNN模型在大规模数据集上训练时，能够有效地提取图像中的特征和模式，提高了模型的分类和识别准确率。

应用场景：

图像分类：CNN模型可以应用于图像分类任务，如人脸识别、物体识别、车牌识别等。
图像检测：CNN模型可以应用于图像检测任务，如目标检测、行人检测、交通标志检测等。
图像分割：CNN模型可以应用于图像分割任务，如语义分割、实例分割等。
图像生成：CNN模型可以应用于图像生成任务，如图像风格转换、图像超分辨率等。

推荐的腾讯云相关产品和产品介绍链接地址：腾讯云AI智能图像识别：https://cloud.tencent.com/product/ai-image 腾讯云AI智能视频分析：https://cloud.tencent.com/product/ai-video 腾讯云AI智能语音识别：https://cloud.tencent.com/product/asr 腾讯云AI智能人脸识别：https://cloud.tencent.com/product/face-recognition 腾讯云AI智能图像处理：https://cloud.tencent.com/product/ai-image-process

相关搜索:如何在python中测试少于训练集的CNN模型在自己的数据集上训练MXNet Faster R-CNN 在cifar 10数据集上训练cnn时，PC死机房屋数据集的模型训练问题对于不同的数据集，相同的CNN模型需要不同的学习率吗？Python CNN模型训练中的数据规范化运行训练-测试拆分并获得不同数据集的模型精度 Tensorflow:在具有不同类别数量的新数据集上优化预训练模型 TensorFlow -如何在不同的测试数据集上使用经过训练的模型进行预测？Keras模型在训练数据集上的评估精度低于拟合精度如何同时为两个不同的训练集和不同的代价函数训练Keras模型在多个数据集上训练Google-Cloud-Automl模型在RTX3060上使用在RTX2080上训练的Pytorch模型如何在具有不同类的数据集上微调模型？在新数据集上应用CNN .h5格式模型基于更新的数据集自动重新训练分类模型如何在我的数据集上为NVIDIA Jetson Nano训练更快的R-CNN (TensorRT)如何在不同大小的图像上训练keras模型 Sigkill错误:在自定义数据集上训练Mask RCNN模型将不同类型的列作为训练数据集

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

DeepJIT：用于实时缺陷预测的端到端深度学习框架

这篇文章出现在很多JIT缺陷定位论文的baseline方法中，那说明还是有不错的参考价值。那就让我们来一探究竟！本文作者提出了一种用于JIT缺陷预测的端到端深度学习框架，从Commit消息和代码变更中提取特征，基于所提特征来识别缺陷。作者在QT和OPENSTACK上对框架性能进行了评估，在QT下的AUC有10.36-11.02%的进步，在OPENSTACK下

01

康奈尔大学CVPR论文：通过网络无标注延时摄影学习本征图像分解

本文为康奈尔大学李正奇为AI科技评论所撰写的 CVPR 2018 录用论文解读稿件。

03

详解分析 | ViT如何在医疗图像领域替代CNNs？

在自动医学图像诊断的领域中卷积神经网络(CNN)方法已经统治了将近十年之久。最近，vision transformers(ViTs)作为CNN的一个有竞争力的替代方法出现了，它具有差不多的性能，同时还具有一些有趣的特性，同时也已经被证明对医学成像任务有益。

03

详解分析 | ViT如何在医疗图像领域替代CNNs？

在自动医学图像诊断的领域中卷积神经网络(CNN)方法已经统治了将近十年之久。最近，vision transformers(ViTs)作为CNN的一个有竞争力的替代方法出现了，它具有差不多的性能，同时还具有一些有趣的特性，同时也已经被证明对医学成像任务有益。

02

【深度学习】R-CNN 论文解读及个人理解[通俗易懂]

本篇论文的题目是《Rich feature hierarchies for accurate oject detection and semantic segmentation》，翻译过来就是针对高准确度的目标检测与语义分割的多特征层级，通俗地来讲就是一个用来做目标检测和语义分割的神经网络。

01

【深度学习】R-CNN 论文解读及个人理解

本篇论文的题目是《Rich feature hierarchies for accurate oject detection and semantic segmentation》，翻译过来就是针对高准确度的目标检测与语义分割的多特征层级，通俗地来讲就是一个用来做目标检测和语义分割的神经网络。

03

超级干货 | 用万字文章总结25种正则化方法（值得收藏）

卷积神经网络已经在一些与计算机视觉相关的任务上取得了相当不错的结果，如图像分类和目标检测。这种成功可以用卷积神经元的工作原理来解释：它根据图像的空间属性来突出给定的特征。浅层网络注意是归纳一些形状或者纹理特征;然而，更深层次的网络可以检测出更复杂更抽象的特征，比如整个物体或人脸。如今，从生物识别到疾病检测，很难找到其他没有CNN的计算机视觉技术。

03

仅用200个样本就能得到当前最佳结果：手写字符识别新模型TextCaps

由于深度学习模型近期取得的进展，对于许多主流语言来说，手写字符识别已经是得到解决的问题了。但对于其它语言而言，由于缺乏足够大的、用来训练深度学习模型的标注数据集，这仍然是一个极具挑战性的问题。

01

计算机视觉面试中一些热门话题整理

通常在机器学习面试中，问完常见基础知识的技术问题之后会有具体的项目问题的讨论，所以这里准备了一些项目相关的话题，以可以帮助你准备和通过计算机视觉相关的面试。

05

仅用200个样本就能得到当前最佳结果：手写字符识别新模型TextCaps

由于深度学习模型近期取得的进展，对于许多主流语言来说，手写字符识别已经是得到解决的问题了。但对于其它语言而言，由于缺乏足够大的、用来训练深度学习模型的标注数据集，这仍然是一个极具挑战性的问题。

02

基于神经标签搜索，中科院&微软亚研零样本多语言抽取式摘要入选ACL 2022

来源：机器之心本文约2500字，建议阅读5分钟本文介绍了基于神经标签搜索情况下，中科院和微软亚研的实验进展。这项研究旨在解决零样本下法语、德语、西班牙语、俄语和土耳其语等多语种的抽取式摘要任务，并在多语言摘要数据集 MLSUM 上大幅提升了基线模型的分数。抽取式文本摘要目前在英文上已经取得了很好的性能，这主要得益于大规模预训练语言模型和丰富的标注语料。但是对于其他小语种语言，目前很难得到大规模的标注数据。中国科学院信息工程研究所和微软亚洲研究院联合提出一种是基于 Zero-Shot 的多语言抽取式文本

02

基于神经标签搜索，中科院&微软亚研零样本多语言抽取式摘要入选ACL 2022

机器之心专栏机器之心编辑部这项研究旨在解决零样本下法语、德语、西班牙语、俄语和土耳其语等多语种的抽取式摘要任务，并在多语言摘要数据集 MLSUM 上大幅提升了基线模型的分数。抽取式文本摘要目前在英文上已经取得了很好的性能，这主要得益于大规模预训练语言模型和丰富的标注语料。但是对于其他小语种语言，目前很难得到大规模的标注数据。中国科学院信息工程研究所和微软亚洲研究院联合提出一种是基于 Zero-Shot 的多语言抽取式文本摘要模型。具体方法是使用在英文上预训练好的抽取式文本摘要模型来在其他低资源语言上

02

小议如何跳出魔改网络结构的火坑

知乎上，如何设计一个网络拟合 xx 函数的讨论层出不穷（e.g. 判断一个数是奇数还是偶数、能否被 n 整除）；

01

目标检测入门（二）：模型的评测与训练技巧

文章结构检测模型的评测指标目标检测模型本源上可以用统计推断的框架描述，我们关注其犯第一类错误和第二类错误的概率，通常用准确率和召回率来描述。准确率描述了模型有多准，即在预测为正例的结果中，有多少是

06

传输丰富的特征层次结构以实现稳健的视觉跟踪

论文地址：https://arxiv.org/pdf/1501.04587.pdf

04

【TPAMI重磅综述】 SIFT与CNN的碰撞：万字长文回顾图像检索任务十年探索历程（下篇）

本文是《SIFT Meets CNN: A Decade Survey of Instance Retrieval》的下篇。在上篇中概述了图像检索任务极其发展历程，介绍了图像检索系统的基本架构和设计难点，详细展示了基于图像局部特征（以SIFT为代表）的检索流程以及关键环节的核心算法。

03

学界 | 一文概览卷积神经网络中的类别不均衡问题

选自arXiv 作者：Mateusz Buda等参与：Nurhachu Null、刘晓坤该论文的作者以两种典型的不均衡为例，系统地研究并比较了解决 CNN 中类别不均衡问题的各种方法，在三个常用

08

论文阅读：《Convolutional Neural Networks for Sentence Classification》

https://blog.csdn.net/u011239443/article/details/80094426 论文地址：http://xueshu.baidu.com/s?wd=paperu

05

使用CNN和Deep Learning Studio进行自然语言处理

当我们听说卷积神经网络（CNN）时，我们通常会想到计算机视觉。从Facebook的自动标记照片到自驾车，CNN使图像分类领域发生重大突破，它是当今大多数计算机视觉系统的核心。

04

预训练图像处理Transformer

预训练模型能否在视觉任务上复刻在自然语言任务中的成功？华为诺亚方舟实验室联合北京大学、悉尼大学、鹏城实验室提出底层视觉 Transformer，使用 ImageNet 预训练，在多项视觉任务上达到 SOTA。

02

Kaggle车辆边界识别第一名解决方案：使用预训练权重轻松改进U-Net

选自arXiv 机器之心编译本文作者之一 Vladimir Iglovikov 曾取得 Kaggle Carvana Image Masking Challenge 第一名，本文介绍了他使用的方法：使用预训练权重改进 U-Net，提升图像分割的效果。代码地址（包含预训练权重）：https://github.com/ternaus/TernausNet 随着处理密集计算的计算机硬件的发展和平民化，研究者能够处理拥有数百万参数的模型。卷积神经网络在图像分类、目标识别、场景理解等领域都取得了极大的成功。对几

08

深度学习在医学影像上的应用（一）——分类

目前人工智能是最火热的领域，而深度学习是人工智能中最璀璨的分支，已经在自然图像上取得了阶段性进展。今天我将分享深度学习在医学影像上的应用最近进展，这一篇主要说一下从2015年到现在深度学习在医学影像分类相关的情况。

04

将同构迁移学习应用于脑机接口，解决训练数据不足的问题

脑机接口 (BCI) 通过识别大脑活动并将其转化为外部命令，提供了大脑与外部设备之间的另一种通信方式。功能性近红外光谱 (fNIRS) 作为一种非侵入性的大脑活动检测方式正变得越来越流行。

01

ACL2022 | 基于神经标签搜索的零样本多语言抽取式文本摘要

每天给你送来NLP技术干货！ ---- ©作者 | 机器之心编辑部来源 | 机器之心这项研究旨在解决零样本下法语、德语、西班牙语、俄语和土耳其语等多语种的抽取式摘要任务，并在多语言摘要数据集 MLSUM 上大幅提升了基线模型的分数。抽取式文本摘要目前在英文上已经取得了很好的性能，这主要得益于大规模预训练语言模型和丰富的标注语料。但是对于其他小语种语言，目前很难得到大规模的标注数据。中国科学院信息工程研究所和微软亚洲研究院联合提出一种是基于 Zero-Shot 的多语言抽取式文本摘要模型。具体方法是使

02

十大预训练模型，助力入门深度学习（第1部分 - 计算机视觉）

对于希望运用某个现有框架来解决自己的任务的人来说，预训练模型可以帮你快速实现这一点。通常来说，由于时间限制或硬件水平限制大家往往并不会从头开始构建并训练模型，这也就是预训练模型存在的意义。大家可以使用预训练模型作为基准来改进现有模型，或者针对它测试自己的模型：

04

【谷歌ICML】简单初始化，训练10000层CNN

【新智元导读】如何快速简单地训练神经网络？谷歌大脑研究人员研究了CNN的可训练性，提出了一种简单的初始化策略，不需要使用残差连接或批标准化，就能训练10000层的原始CNN。作者表示，他们的这项工作清除了在训练任意深度的原始卷积网络时存在的所有主要的障碍。

00

Bioinformatics | DNABERT：从Transformers模型中提取的预训练解码器运用在DNA基因上

今天给大家介绍西北大学Ramana V. Davuluri教授等人在Bioinfomatics期刊上发表的文章“DNABERT: pre-trained Bidirectional Encoder Representations from Transformers model for DNA-language in genome”。为了解决传统语言难以捕捉DNA语义之间信息的问题，作者提出了一个新颖的预训练双向编码表示DNABERT来通过上下文信息对DNA序列进行全局或者迁移分析。通过实验表明，作者的模型能够在众多下游任务上达到SOTA水平，并且，DNABERT可以直接对核苷酸分子的重要性进行排名和分析输入序列上下文之间的关系，从而获得更好的可视化信息和精确的motifs提取。

02

使用Keras进行深度学习：（三）使用text-CNN处理自然语言（上）

上一篇文章中一直围绕着CNN处理图像数据进行讲解，而CNN除了处理图像数据之外，还适用于文本分类。CNN模型首次使用在文本分类，是Yoon Kim发表的“Convolutional Neural Networks for Sentence Classification”论文中。在讲解text-CNN之前，先介绍自然语言处理和Keras对自然语言的预处理。自然语言处理就是通过对文本进行分析，从文本中提取关键词来让计算机处理或理解自然语言，完成一些有用的应用，如：情感分析，问答系统等。比如在情感分析中，其本

08

【前沿】何恺明大神ICCV2017最佳论文Mask R-CNN的Keras/TensorFlow/Pytorch 代码实现

摘要我们提出了一个概念上简单、灵活和通用的用于目标实例分割（object instance segmentation）的框架。我们的方法能够有效地检测图像中的目标，同时还能为每个实例生成一个高质量的

09

独家 | 为什么在CV（视觉识别）领域，Transformers正在缓慢逐步替代CNN？

作者：Pranoy Radhakrishnan 翻译：wwl校对：王可汗本文约3000字，建议阅读10分钟本文讨论了Transformer模型应用在计算机视觉领域中和CNN的比较。在认识Transformers之前，思考一下，为什么已经有了MLP、CNN、RNN，研究者还会对Transformers产生研究的兴趣。 Transformers起初是用于语言翻译。相比于循环神经网络（比如LSTM），Transformers支持模拟输入序列元素中的长依赖，并且支持并行处理序列。 Transformers利用

03

深入浅出——搞懂卷积神经网络的过拟合、梯度弥散、batchsize的影响的问题（二）

本文主要探讨了深度学习中的正则化方法、数据集扩增以及深度学习模型的优化技巧等方面的内容。通过介绍Batch_Size、L1和L2正则化、数据集扩增以及Dropout等技术，旨在帮助读者深入了解深度学习中的正则化技巧，提高模型的泛化能力。

09

Yann LeCun等最新研究：如何对未来实例分割进行预测？

翻译 | 王柯凝编辑 | 阿司匹林出品 | 人工智能头条（公众号ID：AI_Thinker）【人工智能头条导读】近日，Yann LeCun 等人发表了一篇针对未来实例分割预测的论文。该论文提出了一种预测模型，可通过预测卷积特征来对未来实例分割进行预测。该算法有以下几大优势：可以处理模型输出大小不固定的情况，如对象检测和实例分割；不需要使用带有标记的视频序列进行训练，可以直接从未标记的数据中计算出中间的 CNN 特征映射图；支持可生成多个场景解释的模型，如曲面法线、对象边界框和人体部分标签，而不

07

PyTorch实例：用ResNet进行交通标志分类

【导读】本文是机器学习工程师Pavel Surmenok撰写的一篇技术博客，用Pytorch实现ResNet网络，并用德国交通标志识别基准数据集进行实验。文中分别介绍了数据集、实验方法、代码、准备工作，并对图像增强、学习率、模型微调、误差分析等步骤进行详细介绍。文章中给出了GitHub代码，本文是一篇学习PyTorch和ResNet的很好的实例教程。

01

【干货】PyTorch实例：用ResNet进行交通标志分类

【导读】本文是机器学习工程师Pavel Surmenok撰写的一篇技术博客，用Pytorch实现ResNet网络，并用德国交通标志识别基准数据集进行实验。文中分别介绍了数据集、实验方法、代码、准备工作

09

Google新作 | 详细解读 Transformer那些有趣的特性（建议全文背诵）

近期Vision Transformer（ViT）在各个垂直任务上均表现出非常不错的性能。这些模型基于multi-head自注意力机制，该机制可以灵活地处理一系列图像patches以对上下文cues进行编码。

05

目标检测-Training with Online Hard Example Mining

图像分类和目标检测是计算视觉领域的两个基础任务，Region-based ConvNet将目标检测问题转化为图像分类问题，使得目标检测领域出现了巨大的技术突破，同时也引入了难以处理的heuristics和hyperparameters问题。OHEM(Online Hard Example Mining)算法的思想很简单：在训练数据集中往往存在大量的简单样本(easy examples)和少量的困难样本(hard examples)，easy examples对于模型的训练贡献较小，hard examples更加有助于提升模型训练的效率和效果，OHEM算法将hard examples自动化的筛选出来运用到模型训练中去，从而获得较好的模型效果。

03

面试宝典之深度学习面试题(下)

身边最近也有好多朋友打算换工作，和他们交流了许多，都在说今年的就业市场没有之前那么好，以往简历投出去，马上就能收到好几个面试机会，而现在隔几天才能收到一个面试。确实是这样，毕竟今年是资本寒冬，大环境都不行，许多企业都已经开始裁员了，直接导致就业需求和往年相比大大降低，再加上被裁人员的再就业竞争，想要再寻求一份称心如意的工作就难上加难了。所以建议大家要是目前工作还是可以的话，最好是先干着，更不建议裸辞找工作。

03

arxiv | Swin Transformer:使用移动窗口的分层Vision Transformer

今天给大家介绍的是微软亚洲研究院的一篇文章”Swin Transformer: Hierarchical Vision Transformer using Shifted Windows”。从语言到视觉应用Transformer的挑战来源于两个领域的差异，例如和文本字词相比视觉实体的复杂变化以及图像像素的高分辨率两方面的差异。为了解决这样的问题，作者在这篇文章中提出一种称为Swin Transformer新型Vision Transformer。Swin Transformer使用允许跨窗口连接的移动窗口将自注意力限制在不重叠的局部窗口上计算表示，其提出的层次结构具有不同尺度上图像上建模的灵活性，在各种视觉任务上取得优秀的结果，有望在计算机视觉领域取代CNN成为一种通用框架。

04

盘点 | 对比图像分类五大方法：KNN、SVM、BPNN、CNN和迁移学习

选自Medium 机器之心编译参与：蒋思源、黄小天、吴攀图像分类是人工智能领域的基本研究主题之一，研究者也已经开发了大量用于图像分类的算法。近日，Shiyu Mou 在 Medium 上发表了一篇文章，对五种用于图像分类的方法（KNN、SVM、BP 神经网络、CNN 和迁移学习）进行了实验比较，该研究的相关数据集和代码也已经被发布在了 GitHub 上。项目地址：https://github.com/Fdevmsy/Image_Classification_with_5_methods 图像分类，顾名

Enhanced-RCNN: 一种高效的比较句子相似性的方法｜WWW 2020

国际顶级会议WWW2020将于4月20日至24日举行。始于1994年的WWW会议，主要讨论有关Web的发展，其相关技术的标准化以及这些技术对社会和文化的影响，每年有大批的学者、研究人员、技术专家、政策制定者等参与。以下是蚂蚁金服的技术专家对入选论文《Enhanced-RCNN: 一种高效的比较句子相似性的方法》做出的深度解读。

01

重磅 | 周志华最新论文：首个基于决策树集成的自动编码器，表现优于DNN

向AI转型的程序员都关注了这个号☝☝☝ 翻译 | AI科技大本营（rgznai100）参与 | 周翔、reason_W成龙，Shawn 今年 2 月，南京大学的周志华教授和他的学生 Ji Feng

04

【前沿】何恺明大神ICCV2017最佳论文Mask R-CNN的Keras/TensorFlow/Pytorch 代码实现

导读何恺明大神的论文Mask R-CNN 获得ICCV最佳论文，而关于这篇论文的TensorFlow\Pytorch\Keras实现相继开源出来，让我们来看下。摘要我们提出了一个概念上简单、灵

09

CVPR 2022 | TransGeo：第一种用于交叉视图图像地理定位的纯Transformer方法

标题：TransGeo: Transformer Is All You Need for Cross-view Image Geo-localization

04

使用LIME解释CNN

我们已经介绍过很多解析机器学习模型的方法，例如如pdp、LIME和SHAP，但是这些方法都是用在表格数据的，他们能不能用在神经网络模型呢？今天我们来LIME解释CNN。

02

【前沿】FAIR何恺明等人与UC伯克利最新论文提出分割利器(Learning to Segment Every Thing)

【导读】Facebook FAIR实验室与UC伯克利大学合作提出《Learning to Segment Every Thing》在ICCV 2017 最佳论文 mask R-CNN的基础上引入weight transfer function应用在分割的任务中，使得分割模型的训练不再仅仅局限于具有mask标注信息的类别，而是可以扩展至上千类。本文为后续分割算法的设计提供了一个崭新的思路。 ▌作者 ---- 1. Ronghang Hu 胡戎航： 2015年清华大学本科毕业，伯克利大学博士在读，导师Trev

07

计算机视觉之ShuffleNet图像分类

ShuffleNetV1是一种计算高效的CNN模型，旨在在移动端利用有限的计算资源达到最佳的模型精度。其设计核心是引入了Pointwise Group Convolution和Channel Shuffle两种操作，以降低模型的计算量并保持精度。与MobileNet类似，ShuffleNetV1通过设计更高效的网络结构来实现模型的压缩和加速。通过几乎将参数量降低到最小，ShuffleNet在保持较高准确率的前提下具有较快的运算速度，单位参数量对模型准确率的贡献非常高。

01

从三大神经网络，测试对比TensorFlow、MXNet、CNTK、Theano四个框架

选自data science central 机器之心编译参与：蒋思源本文比较了 Keras 支持的主流深度学习框架性能，包括 TensorFlow、CNTK、MXNet 和 Theano，作者希望通过使用同一模型和不同的 Keras 后端，而测试不同框架在不同类型任务中的性能。本文通过五个任务分别测试了 MLP、CNN 和 RNN 模型，机器之心不仅对该试验进行了介绍，同时还使用 Keras（TensorFlow 后端）在 MNIST 数据集上试运行了 CNN。如果我们对 Keras 在数据科学和深

07

2014-NIPS-Two-Stream Convolutional Networks for Action Recognition in Videos

这篇文章[1]主要研究了如何有效地将深度学习用在动作识别领域。作者提出，这个任务的主要挑战在于如何让神经网络同时捕获到两种信息：一种是 appearance 信息（比如物体的大小、形状等静态信息），另一种是 motion 信息（即物体的运动信息）。这篇文章的主要贡献有三点，第一是提出了一个基于 CNN 的双流网络，它同时结合了时空间信息；第二，作者展示了即使只有少量训练数据，基于 CNN 的神经网络在视频帧的光流信息上进行训练能取得很好的性能；最后，作者展示了双流网络在多任务学习上的潜力，作者在两个数据集上同时训练一个双流骨干网络，相比于使用单一数据集，训练后的网络在两个数据集上都有性能提升。作者在 UCF-101 和 HMDB-51 数据集上进行了实验，效果能和当时的 SOTA 方法（当时还是非深度的方法）性能相当，比之前使用神经网络的方法要好很多。

01

干货 | 2019 Kaggle Freesound 音频标注挑战赛结果出炉，这是一份排名前 2 %的解决方案！

AI 科技评论按：日前，2019 年 Kaggle Freesound 音频标注挑战赛宣告完结，比赛结果也终于出炉。参赛者之一 Eric BOUTEILLON 是全球无缝支付解决方案提供商银捷尼科集团（Ingenico Group）的一位产品负责人，他提交的解决方案在本次比赛中进入前 2% 排名，取得了第 8 名的成绩，日前，他将解决方案分享在了 Github 上，详细地介绍了该方案的复现步骤。

02

目标检测101：一文带你读懂深度学习框架下的目标检测

大数据文摘作品编译：及子龙，张礼俊余志文，钱天培从简单的图像分类到3D位置估算，在机器视觉领域里从来都不乏有趣的问题。其中我们最感兴趣的问题之一就是目标检测。如同其他的机器视觉问题一样，目标检测目前为止还没有公认最好的解决方法。在了解目标检测之前，让我们先快速地了解一下这个领域里普遍存在的一些问题。目标检测 vs 其他计算机视觉问题图像分类在计算机视觉领域中，最为人所知的问题便是图像分类问题。图像分类是把一幅图片分成多种类别中的一类。 ImageNet是在学术界使用的最受欢迎的数据集之一

04

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭