首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

图像序列中快速地点识别的二进制词袋方法

摘要 本文提出了一种使用FAST+BRIEF特征的二进制词袋进行视觉地点识别的新方法,首次构建了一个离散化二进制描述子空间的词袋树,并使用该树加速对几何验证的对应关系。...在非常不同的数据集中呈现了无误报的良好结果,使用完全相同的词袋和配置。整个技术,包括特征提取,在一个包含26300张图像的序列中每帧需要22ms,比以前的方法快一个数量级。...主要贡献 本文提出了一种新颖的算法,可以使用传统的CPU和单个相机实时检测循环并建立图像之间的点对应关系,该方法基于词袋和几何验证,具有几个重要的新颖性,使其比当前的方法快得多。...同时引入了一个离散化二进制空间的词袋,并增加了一个直接索引,除了通常的反向索引,据我们所知,这是首次使用二进制词袋表进行回环检测,反向索引用于快速检索与给定图像可能相似的图像,展示了一种新颖的使用直接索引来有效地获取图像之间的点对应关系的方法...,有几种方法可以执行此比较,最简单且最慢的方法是穷举搜索,它包括在描述子空间中测量值的每个特征与候选帧的特征的距离,然后根据最近邻距离比策略选择对应点。

27030

机器学习中的距离计算方法

设平面上两个点为(x1,y1)(x2,y2) 一、欧式距离 欧氏距离是一个通常采用的距离定义,指两个点之间的真实距离 二、曼哈顿距离 我们可以定义曼哈顿距离的正式意义为L1-距离或城市区块距离,也就是在欧几里德空间的固定直角坐标系上两点所形成的线段对轴产生的投影的距离总和...例如在平面上,坐标(x1,y1)的i点与坐标(x2,y2)的j点的曼哈顿距离为: d(i,j)=|X1-X2|+|Y1-Y2|....三、余弦距离 一个向量空间中两个向量夹角间的余弦值作为衡量两个个体之间差异的大小,余弦值接近1,夹角趋于0,表明两个向量越相似,余弦值接近于0,夹角趋于90度,表明两个向量越不相似。...cos= 四、切比雪夫距离 切比雪夫距离是向量空间中的一种度量,二个点之间的距离定义是其各坐标数值差绝对值的最大值。...下图是棋盘上所有位置距f6位置的切比雪夫距离。

68020
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    你在小程序中怎么计算两个经纬度的距离?

    你还在为小程序中计算两个经纬度之间的距离发愁吗? 你还在为小程序中地址逆向解析发愁吗? 你还在为小程序中路线规划,地点搜索发愁吗? 好消息!好消息!...图1 腾讯地图的webservice api 接口 要想获得两个经纬度点时,你可以手动自己写一个获取经纬度距离的函数,代码如下: // 方法定义 lat,lng function GetDistance...如图2 腾讯地图webservice API 计算两个经纬度的距离 2 有了官方支持时的调用 最近需要做小程序的地址解析和计算距离,查看 腾讯地图开放平台时,发现平台已经支持小程序中的使用了,如图3。...图 3 腾讯位置服务支持在小程序中使用 而且调用非常简单:只需要引入他的一个JS 文件,就可以使用了,如图4腾讯位置在小程序中的应用。 ?...图4 腾讯位置服务在小程序中的应用 具体调用实例如下: var QQMapWX = require('../..

    3K20

    文本在计算机中的表示方法总结

    ; 该编码只能反映某个词是否在句中出现,无法衡量不同词的重要程度; 使用One-Hot 对文本进行编码后得到的是高维稀疏矩阵,会浪费计算和存储资源; 2.2 词袋模型(Bag Of Word,BOW...在词袋模型中不考虑语序和词法的信息,每个单词都是相互独立的,将词语放入一个“袋子”里,统计每个单词出现的频率。...: 词袋模型是对文本(而不是字或词)进行编码; 编码后的向量长度是词典的长度; 该编码忽略词出现的次序; 在向量中,该单词的索引位置的值为单词在文本中出现的次数;如果索引位置的单词没有在文本中出现,则该值为...优点 实现简单,算法容易理解且解释性较强; 从IDF 的计算方法可以看出常用词(如:“我”、“是”、“的”等)在语料库中的很多文章都会出现,故IDF的值会很小;而关键词(如:“自然语言处理”、“NLP...语言模型中的概率计算: ? n-gram模型中的概率计算: n-gram 是对语言模型的一个简化(马尔科夫假设 Markov Assumption):一个词的出现仅与它之前出现的若干(n)个词有关。

    3.1K20

    【NLP-词向量】词向量的由来及本质

    例如,根据语料库的分词结果,建立一个词典,每个词用一个向量来表示,这样就可以将文本向量化了。 最早的文本向量化方法是词袋模型,我们先来看看词袋模型。...经过训练之后的词向量,能够表征词语之间的关系。例如,“香蕉”和“苹果”之间的距离,会比“香蕉”和“茄子”之间的距离要近。 通过多维向量表示,也能更为方便的进行计算。...Yoshua Bengio在2003年《A Neural Probabilistic Language Model》一文中提出了一种神经网络的方法,用于语言模型的计算。 ?...最后,接一个softmax函数,预测出下一个词是目标词的概率。 ? 训练时,会设计损失函数,用梯度下降的方法,优化参数。 在训练过程中,我们优化了如下的参数: ?...5 总结 上面详细介绍了词向量的来历和作用,并介绍了一种词向量的训练方法。 在实际过程中,并不是用上述神经网络来训练词向量的因为词向量是如此的重要,NLP工作者们设计了专门的网络来训练词向量。

    1.6K20

    基于WMD(词移距离)的句子相似度分析简介

    word2vec详解 NLP之word2vec简介 词袋模型(Bag of Words) 词袋模型(Bag-of-words model)是个在自然语言处理和信息检索(IR)下被简化的表达模型。...此模型下,像是句子或是文件这样的文字可以用一个袋子装着这些词的方式表现,这种表现方式不考虑文法以及词的顺序。最近词袋模型也被应用在计算机视觉领域。...词袋模型被广泛应用在文件分类,词出现的频率可以用来当作训练分类器的特征。关于”词袋”这个用字的由来可追溯到泽里格·哈里斯于1954年在Distributional Structure的文章。...需要有一种约束,将文档1中的每个词,以不同的权重强制地分配到文档2的所有词上去。 WMD的优化 现在计算两个文档之间的 WMD 距离,如果用 k-NN来计算距离就非常耗时。...Word Centroid Distance(WCD,定义在最后一个等号处,公式中的X是词向量, X是词向量组成的矩阵): ? 注意上述公式只需要用绝对值不等式与WMD约束定义计算即可。

    1K40

    【NLP-语义匹配】详解深度语义匹配模型DSSM

    所谓语义匹配,就是在语义上衡量文本的相似度,在产业界有很多的应用需求。例如,在FAQ场景中需要计算用户输入与标问之间的相似度来寻找合适的答案。...】词向量的由来及本质 总的来说词袋模型就是把文本看成是一个装着词的袋子,记录一个文本中,有这个词几个,那个词几个。...其实很简单,在单纯的DSSM模型中,中文是按照“字袋模型”来处理的,参考词袋模型,也就是将文本转化成,有几个某某字,有几个某某字。...通过计算各个Q及D的特征表征,得到了一些128维的特征向量。随后在DSSM中,通过计算Q和D之间的余弦距离来评价他们之间相似度,计算公式如下图所示: ?...上述公式,计算一个样本空间内正样本的平滑概率,R(Q,D)为两个文本之间余弦距离。 在训练阶段,通过极大似然估计,最小化损失函数为: ?

    2.8K10

    Bags of Binary Words | 词袋模型解析

    最近几年,很多算法都利用这个方法实现[2][3][4][5][6],即基于图像匹配,将它们作为词袋空间中的数值向量进行比较.词袋模型可以进行非常有效和快速的图像匹配,但是它们并不是闭环检测的完美解决方案...本文的方法基于词袋模型和几何检测(有几个重要的新特性使它比目前的方法快得多)。最重要的速度改善的原因是因为利用了版本修改后的BRIEF描述子和FAST。...词袋是一种使用视觉词汇表将图像转换成稀疏的数字向量的技术,允许我们管理大量的图像。视觉词袋是通过离线的将描述符空间离散成W个视觉单词生成的。通过离散化二进制描述子空间,可以创建了更紧凑的词袋。...然后为了转换一个在t时刻得到的 ? 两个结构(词袋和反向索引)通常是单词包方法中用于搜索图像的惟一结构。但是作为一种新颖的通用方法,我们还利用直接索引存储每个图像的特征。...为了在I_t和I_t'获得对应点,直接查找I_t'帧的直接索引,仅对在词袋中l级的相同节点中的特征进行比较。这个条件加快了特征匹配的计算速度。

    1K20

    如何对非结构化文本数据进行特征工程操作?这里有妙招!

    词袋模型将每个文本文档表示为数值向量,其中维度是来自语料库的一个特定的词,而该维度的值可以用来表示这个词在文档中的出现频率、是否出现(由 0 和 1 表示),或者加权值。...N 元词袋模型是普通词袋模型的一种拓展,使得我们可以利用基于 N 元的特征。下面的示例展示了文档中二元的特征向量。...使用二元词袋模型的特征向量 在上面的例子中,每个二元特征由两个单词组成,其中的值表示这个二元词组在文档中出现的次数。 TF-IDF 模型 在大型语料库中使用词袋模型可能会出现一些潜在的问题。...在这里,tfidf(w, D)表示单词 w 在文档 D 中的 TF-IDF 分数。Tf(w,D)项表示单词 w 在文档 D 中的词频,这个值可以从词袋模型中获得。...文档相似性 文档相似性是使用从词袋模型或者 tf-idf 模型中提取出的特征,基于距离或者相似度度量判断两个文档相似程度的过程。

    2.3K60

    在小程序中实现视频通话及互动直播的一种方法

    在直播行业如火如荼的当下,越来越多的企业选择发展自己的直播平台,或者希望在原有的app中上架音视频、直播功能。开发一个直播功能难易程度如何呢?...直播难:要想把直播从零开始做出来,技术难度还是很高的,因为直播中运用到的技术难点非常之多,视频/音频处理,图形处理,视频/音频压缩,CDN分发,即时通讯等技术,每一项技术都非常专业。...以下用开发者在 FinClip 小程序中实现视频通话及互动直播等功能举例:准备开发环境1、请确保本地已安装微信开发者工具2、请确保有一个支持 live-pusher 和 live-player 组件的微信公众平台账号...详情查看FinClip文档中心:https://www.finclip.com/mop/document/develop/component/media.html#live-pusher3、请确保在微信公众平台账号的开发设置中...如需获取 Token 或 Channel Key,请启用 App Certificate下载本页示例程序打开 utils 文件夹,在 config.js 文件中填入获取到的 App ID: const

    1.7K00

    AAAI 2020 | 计算所&微信AI:改进训练目标,提升非自回归模型翻译质量(已开源)

    方 法 针对交叉熵损失不准确的问题,本文为非自回归模型提出了一种基于n元组袋(Bag-of-Ngrams, BoN)的训练目标,希望能最小化模型与参考译文间n元组袋的差异。...距离的定义和计算和训练方法。...图四:对2元组(‘get’, ‘up’) 的期望出现次数的计算 BoN距离的定义和计算 在完成对参考译文和模型的BoN定义后,我们可以选择一种距离指标来衡量两者BoN的差距,常用的距离指标有L1距离、...因此,我们希望选择一种合适的距离指标,使我们不需要计算整个BoNθ向量,进一步简化计算。...训练方法 上文中,我们给出了BoN的定义和快速计算BoN间L1距离的方法。在本节,我们将对用BoN距离训练非自回归模型的方法做具体介绍。

    82710

    ​综述 | SLAM回环检测方法

    词袋模型(Bag Of Words,BOW) 原理 简介:现有的SLAM系统中比较流行的回环检测方法是特征点结合词袋的方法(如ORB-SLAM,VINS-Mono)等。...基于词袋的方法是预先加载一个词袋字典树,通知这个预加载的字典树将图像中的每一局部特征点的描述子转换为一个单词,字典里包含着所有的单词,通过对整张图像的单词统计一个词袋向量,词袋向量间的距离即代表了两张图像之间的差异性...在图像检索的过程中,会利用倒排索引的方法,先找出与当前帧拥有相同单词的关键帧,并根据它们的词袋向量计算与当前帧的相似度,剔除相似度不够高的图像帧,将剩下的关键帧作为候选关键帧,按照词袋向量距离由近到远排序...Kmeans 算法中中心点初始化的流程如下: 1.从n个样本中随机选取一个点作为第一个中心点; 2.计算样本中每个点和距离它最近的中心点之间的距离DiD_{i}Di​,根据策略选择新的中心点 3.重复...词袋向量 关键帧和查询帧的相似度是通过词袋向量之间的距离来衡量的。

    3.1K30

    NLP系列学习:文本聚类

    聚类分析以相似性为基础,在一个聚类中的模式之间比不在同一聚类中的模式之间具有更多的相似性。(以上来自百度百科)....再说到文本聚类,文本聚类其实也就是在文本方向上的应用,首先我们要把一个个文档的自然语言转换成数学信息,这样形成高维空间点之后再去计算点与点之间的距离,然后将这些距离比较近的聚成一个簇,这些簇的中心成为簇心...,但是对于文章的分类结构起不到太大的意义,比如”的”,”了”,”么””应该”,这些词去计算他们既浪费空间又浪费时间,出于+1s的因素,我们也要节约时间啊,首先我们就加入一个停用词表,在进行分词的时候进行去掉...第二部分:分词后将分词转换为词向量 关于词向量我们有一些比较常用的模型,比如one-hotm,BOW词袋模型,连续词袋模型(CBOW)和Skip-Gram模型和Word2vec模型,在这次任务中我是用的是...BOW词袋模型,在转换为词向量值我们要将其转换成tfidf矩阵,tfidf其实可以看作是提取的特征的一次加权,是根据一个单词在当前文章中出现的频率和该单词在所有语料中出现的频率评估一个单词的重要性,当一个单词在这篇文章中出现的次数很多的时候

    1.6K00

    10.HanLP实现k均值--文本聚类

    10.2 文档的特征提取 1.词袋模型 词袋(bag-of-words )是信息检索与自然语言处理中最常用的文档表示模型,它将文档想象为一个装有词语的袋子, 通过袋子中每种词语的计数等统计量将文档表示为向量...则任何一个文档都可以通过这种方法转换为一个N维向量。词袋模型不考虑词序,也正因为这个原因,词袋模型损失了词序中蕴含的语义,比如,对于词袋模型来讲,“人吃鱼”和“鱼吃人”是一样的,这就不对了。...不过目前工业界已经发展出很好的词向量表示方法了: word2vec/bert 模型等。 2.词袋中的统计指标 词袋模型并非只是选取词频作为统计指标,而是存在许多选项。...一种更高效的方法是, 将质心的选取也视作准则函数进行迭代式优化的过程。其具体做法是,先随机选择第一个数据点作为质心,视作只有一个簇计算准则函数。...在重复二分聚类算法中,有一种变通的方法,那就是通过给准则函数的增幅设定阈值 β 来自动判断 k。

    1.3K10

    用于3D激光雷达SLAM回环检测的实时词袋模型BoW3D

    为了解决这个问题,我们提出了一种用于3D LiDAR SLAM中实时闭环的词袋模型BoW3D。我们的方法不仅有效地识别了重访的回环位置,而且实时地修正了完整的6-DoF回环位姿。...BoW3D基于三维LiDAR特征LinK3D构建词袋,该词袋高效、姿态不变,可用于精确的点对点匹配。我们进一步将提出的方法嵌入到3D LiDAR里程计系统中评估闭环性能。...首先字典占用空间大,在SLAM系统运行时需要先加载一个几百兆的大字典。同时词袋模型对于重复纹理可能不是那么鲁棒。 前面说到,词袋向量中存储的是单词权重。那么这个权重值具体如何计算呢?...词频TF是在计算图像词袋向量时实时得到的。IDF指的是逆向文本频率,也就是说一个单词在字典中出现的频率越低,那么它区分度也就越高。逆向文本频率IDF是在字典训练阶段就已经确定。...显然,计算机无法轻易理解单纯的文字描述。所以我们可以将上述位置信息进行向量化表达: 注意,实际应用过程中,很有可能会出现一种情况。也就是两个人位于同一位置,但是朝向不同。

    72120

    文本相似度算法小结

    词袋模型和LSI模型 参考文章:python文本相似度计算 当然,将一个文本向量化的方式有很多,TF-IDF只是其中的一种。...LSI是概率主题模型的一种,基于统计学和概率论方法实现,类似的模型有LDA等,具体的理论学术性太强,需要专门的数学证明来说明,这里只展开一下核心思想: 每篇文本中有多个概率分布不同的主题,每个主题中都包含所有已知词...,但是这些词在不同主题中的概率分布不同,LSI通过奇异值分解的方法,计算文本中的各个主题的概率分布。...欧式距离 就是计算欧式几何坐标系中两个点的距离(当然也需要向量化),距离越大说明相似度越低: [13199763.jpg]汉明距离 2....汉明距离 这个在计算图片相似度的时候会用到(可见本博客相关文章),汉明距离只是简单的计算两个序列中,有多少位是不一样的,一般用于哈希的对比。 3.

    5.2K100

    SLAM中的二进制词袋生成过程和工作原理

    用于环路检测的相同方法可用于机器人在轨迹丢失后的重新定位,例如由于突然运动,严重闭塞或运动模糊。词袋的基本技术包括从机器人在线收集的图像中建立一个数据库,以便在获取新图像时检索最相似的图像。...传统的文本分类主要采用基于词袋(bag of words)模型的方法。但BoW模型存在一个重要问题,即数据稀疏性。...二进制词袋是一种特征表示方法,将文本中的词映射为有限长度的二进制向量。具体而言:首先,为文本设定一个词表,将文本中出现的所有不重复单词作为词表中的单词。...给出patch大小 和元素数 , 和 在离线阶段随机选择。两个BRIEF描述子之间的距离使用汉明距离计算。...如下图所示:在时间耗时方面,完整算法只需22ms,比SURF慢一个数量级。提取特征花费时间最多。使用大型词汇表虽花更多时间转换,但查询更快。04  结论二进制特征在词袋方法中是非常有效和极其高效的。

    31200

    如何去实践一个完整的数据挖掘项目

    d 去停用词:停用词一般指对文本特征没有任何贡献作用的字词,比如标点符号、语气、人称等一些词。所以在一般性的文本处理中,分词之后,接下来一步就是去停用词。...特征工程 做完语料预处理之后,接下来需要考虑如何把分词之后的字和词语表示成计算机能够计算的类型。把中文分词的字符串转换成数字,有两种常用的表示模型分别是词袋模型和词向量。...词袋模型(Bag of Word, BOW),即不考虑词语原本在句子中的顺序,统计词频这只是最基本的方式,TF-IDF 是词袋模型的一个经典用法。 词向量是将字、词语转换成向量矩阵的计算模型。...高维度对距离衡量的影响:众所周知当变量数越多,欧式距离的区分能力就越差。 变量值域对距离的影响:值域越大的变量常常会在距离计算中占据主导作用,因此应先对变量进行标准化。 4 训练样本是否要一视同仁?...kNN是一种懒惰算法,平时不好好学习,考试(对测试样本分类)时才临阵磨枪(临时去找k个近邻)。懒惰的后果:构造模型很简单,但在对测试样本分类地的系统开销大,因为要扫描全部训练样本并计算距离。

    62160
    领券