首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    广告行业中那些趣事系列39:实战广告场景中的图片相似度识别任务

    摘要:本篇从理论到实践介绍了广告场景中的图片相似度识别任务。首先介绍了背景,通过用户连续曝光相似广告素材图片的广告会影响用户体验引出图片相似度任务,同时介绍了google提供的“相似图片搜索”服务;然后介绍了基于phash算法的图片相似度识别,包括当前的基于phash算法获取图片素材指纹、phash算法实现流程、phash算法效果展示图以及源码实践、phash算法的优点和不足和通过聚类解决部分素材图片裁剪相似度低的问题;最后介绍了微软开源的cv-recipes项目实现图片相似度识别,作为图像类任务的百宝箱开源项目可以解决各类图像机器学习问题,重点介绍了其中的图片相似度识别子模块。对于希望解决图片相似度识别任务的小伙伴可能有所帮助。

    03

    AI办公自动化:相似照片批量智能删除

    电脑中有大量手机照片,要批量删除其中相似度高的,首先得有一个分析照片相似度的算法和模型。CLIP(Contrastive Language-Image Pre-Training)模型是由OpenAI在2021年发布的一种多模态预训练神经网络,旨在通过对比学习方法将图像和文本进行联合训练,从而实现对图像和文本之间关联性的理解和匹配。CLIP模型的核心思想是通过对比学习(Contrastive Learning)来学习大量的图像和对应的文本描述,形成一个能够理解两者之间关联的通用模型。具体来说,CLIP采用了两个独立的编码器:一个用于处理文本,另一个用于处理图像。这两个编码器分别提取文本和图像特征,并基于比对学习让模型学习到文本-图像的匹配关系。

    01

    【计算机视觉——RCNN目标检测系列】一、选择性搜索详解

    在刚刚过去的一个学期里,基本水逆了一整个学期,这学期基本没干什么活,就跟RCNN杠上了。首先是看论文,然后是网上找tensorflow写好的源码。但是,可惜的是网上给出的源码基本上是RCNN的主要作者Ross Girshick大神的代码,不同数据集换了下。因此为了理解源码,RCNN的处理过程,费劲去装了个ubuntu和win10的双系统并在Ubuntu上安装caffe,这就花费了近2周的时间。快速研究完RCNN的caffe源码之后,才转过来手写Fast RCNN的tensorflow版本的代码,这也花费了大量的时间,从踩坑到填坑再到踩坑。RCNN不是很好实现,SVM至今还没怎么看懂。接下来将会陆续更新RCNN->Fast RCNN->Faster RCNN系列的文章。在这篇文章中,主要讲解RCNN与Fast RCNN中获取图片中物体真实目标检测框的算法——选择性搜索算法。

    01

    AI综述专栏| 大数据近似最近邻搜索哈希方法综述(下)

    最近邻搜索(Nearest Neighbor Search)也称作最近点搜索,是指在一个尺度空间中搜索与查询点最近点的优化问题。最近邻搜索在很多领域中都有广泛应用,如:计算机视觉、信息检索、数据挖掘、机器学习,大规模学习等。其中在计算机视觉领域中应用最广,如:计算机图形学、图像检索、复本检索、物体识别、场景识别、场景分类、姿势评估,特征匹配等。由于哈希方法可以在保证正确率的前提下减少检索时间,如今哈希编码被广泛应用在各个领域。本文是关于大数据近似最近邻搜索问题中应用哈希方法的综述。文章分为两部分,本篇为第二部分。

    02

    一篇文章搞懂人脸识别的十个概念

    作者:汪铖杰 首发于 腾讯云技术社区 量子位 已获授权编辑发布 优图实验室研究人脸技术多年,不仅在技术方面有很好的积累,而且在公司内外的业务中有众多应用。笔者作为优图实验室人脸研究组的一员,在与产品、商务、工程开发同事交流过程中发现:不管是“从图中找到人脸的位置”,或是“识别出这个人脸对应的身份”,亦或是其他,大家都会把这些不同的人脸技术统称为“人脸识别技术”。 因此,笔者整理了一些常见人脸技术的基本概念,主要用于帮助非基础研究同事对人脸相关技术有一个更深入的了解,方便后续的交流与合作。 人脸技术基本概念介

    010

    Python 实现三维姿态估计遮挡匹配预测

    引言:随着计算机技术的飞速发展以及人们对智能化设备需求的提高,人体行为识别已经成为计算机视觉领域热门研究方向之一,其广泛应用于公共安防、人机交互、虚拟现实、体育运动和医疗健康等领域,具有极高的理论研究价值。早期的方法主要针对于 RGB 视频图像,由于易受复杂背景、光照强度的影响,很难达到理想效果。但随着深度传感器技术的发展,高精度获取三维骨架关节点信息变得方便可行。对比传统 RGB 视频图像数据,骨架姿势信息对行为的描述有其内在优势,它不仅能够更准确地描述人体姿态和运动状态而且不受背景复杂度及光照强度等因素的影响,同时骨架信息也可以被广泛应用于行为识别。

    01
    领券