codebook - 腾讯云开发者社区

文章/答案/技术大牛

发布

MemoNet：用codebook记住所有的交叉特征来做CTR估计

标题：MemoNet: Memorizing All Cross Features’ Representations Efficiently via Multi-Hash Codebook Network...本文提出多哈希codebook网络HCNet进行交叉特征表征的记忆。 HCNet使用多哈希codebook作为主存储位置，整个存储过程包括三个阶段：多哈希寻址、记忆恢复和特征压缩。...；其次，同一个桶中的所有元素共享相同的表征多哈希codebook将交叉特征的表征划分为m块，而交叉特征的表征由m个emb组合得到，这有助于减少不同交叉特征出现相同的表征的情况。...WHAT 一个二维矩阵 codebook的作用是存储记忆交叉特征表征，codebook定义为参数矩阵 C\in \mathbb{R}^{n\times l} ，每一行是一个codeword，一个codeword...表示如下，其中 \|C\| 为n，即codebook的大小， a^{(i,j)} 是codeword对应的地址。

9634 1

蛋白质结构tokenization新进展：基准评估框架与优化方法的探索

表征效率低下：例如，ESM3模型中超过70%的codebook向量未被有效利用，存在“codebook坍塌”问题。...余弦相似度分布 ESM3codebook冗余显著效率 codebook利用率（UR/Perplexity） FoldSeek利用率达99%，但表征能力较弱主要发现重构质量与codebook质量无必然联系...：高质量的重构并不保证codebook能有效捕捉生物学信息。...AminoAseed：codebook优化的新方法在评估现有方法时，研究者发现“codebook坍塌”是普遍存在的问题，即大量codebook向量未被充分利用。...Codebook重参数化技术设计原理：将codebook表示为Q=Linear(C)，其中C为一组固定正交基向量，通过可学习的线性变换动态调整codebook。

3411 0

您找到你想要的搜索结果了吗？

是的

没有找到

ICLR24 | VQGraph: 重新审视图表示学习，将Graph空间Token化

如下图所示这些token构成了一个代码簿（codebook），作为一个新的图表示空间，能够识别具有相应代码索引的节点的不同局部图结构。...然后，基于学习的codebook，我们提出了一种新的蒸馏目标，即soft code assignments，以直接将每个节点的结构知识从GNN传输到MLP。...VQGraph的训练流程： VQGraph的训练流程包含两个阶段：首先是Graph Tokenizer Training，该阶段是为了在graph空间里学习一个包含不同局部字结构信息的codebook...第一阶段训练目标函数：第二部分是基于学习得到的teacher GNN和codebook，进行GNN-to-MLP训练。...总结在这篇论文中，我们通过为节点的多样化局部子结构学习新的图表征空间-codebook，以及利用codebook促进结构感知的 GNN 到 MLP 蒸馏，改进了现有图表示空间的表达能力。

9971 0

匹配追踪算法进行图像重建

Python代码实现（针对二维图像）： import numpy as np def bmp(mtx, codebook, threshold): """ :param mtx: 原始图像...（mxn） :param codebook: 字典（mxk） :param threshold: 非零元素个数的最大值 :return: 稀疏编码系数 3 """...n = mtx.shape[1] if len(mtx.shape) > 1 else 1 # 原始图像mtx中向量的个数 k = codebook.shape[1] # 字典dictionary..., threshold): blocks = im2col(image, block_size) return mp.mpalg.bmp(blocks, codebook, threshold...) def sparse_decode(coefficients, codebook, image_size, block_size): blocks = np.dot(codebook,

2.7K1 1

Transformers 4.37 中文文档（八十六）

: 1> codebook_do_center_crop: bool = True codebook_crop_size: int = None codebook_do_rescale: bool =...codebook_do_normalize (bool, optional, 默认为 True) — 是否对用于 codebook 的输入进行规范化，使用 codebook_image_mean 和 codebook_image_std...return_codebook_pixels (bool, optional, 默认为 self.return_codebook_pixels) — 是否返回 codebook 像素。...codebook_do_resize (bool, optional, 默认为 self.codebook_do_resize) — 是否调整 codebook 像素的大小。...codebook_size (Dict[str, int], optional, 默认为 self.codebook_size) — codebook 像素的大小。

4841 0

FaissPQ索引简介

就是将由连续值构成的向量xx从欧式空间映射到一个由有限离散值构成的集合C={c_i, i \in [1,l]}C=ci,i∈[1,l]中,定义该映射为qq,则q(x) \in Cq(x)∈C,这里CC也成为codebook...,xD∗i],对应的codebook为C_iCi。在索引训练完成后，全局的codebook表示为各个分段量化结果的乘积C=C_1*C_2*...*C_mC=C1∗C2∗......3.3 空间占用对比假设向量维度为D,向量量化的codebook大小为kk,存储codebook需要kDkD的空间;乘积量化每个分段只需要k^*k∗的codebook大小,存储codebook需要k^*...可以发现，分段量化后可以在空间占用更小的情况下达到一样大的codebook规模。...构建第一层的量化器q_cqc,codebook C_cCc,得到每个向量X的向量量化结果x_c=q_c(x)xc=qc(x) 2.

7311 0

像素矢量量化

=original_shape=tuple(img.shape) assert d==3 image_array=np.reshape(img,(w*h,d)) def recreate_image(codebook...,labels,w,h): d=codebook.shape[1] image=np.zeros((w,h,d)) label_idx=0 for i in range...(w): for j in range(h): image[i][j]=codebook[labels[label_idx]] label_idx...) plt.clf() i=1 for k in [64,32,16,4]: t0=time() plt.subplot(2,2,i) plt.axis('off') codebook_random...color indices on the full image (random)") t0=time() labels_random=pairwise_distances_argmin(codebook_random

6642 0

ACL2022 | 跨模态离散化表示学习：让不同的模态共享相同的词表

作者会引入一个离散化词表称为 codebook，codebook 记录了每个词的 embedding。...以向量举例：一条路径上它仍会被表征连续表征，本质还是利用一个深层 encoder 来把继续抽取成深度信息，得到向量；另一条路径上它会被投影到离散词表 codebook 的空间上，并用 codebook...作者在附录里的实验说明了Cross-Modal Code Matching显著地提升了codebook跨模态的能力。...具体的实验结果不赘述了，这里讲讲有意思的发现： 1. codebook 解释性上，作者发现了 codebook 可以自主地学会表示内容，譬如在 video-audio 任务上，#201 单词就学到了...▲作者列出的高频词的词表表编号即其学到的信息 2. codebook 的检索也更精确，如下图所示，在语音读到“basketball”或者视频正在投篮时，单词 #664 会被更显著的激活：一方面提升检索精确度

1.3K1 0

KMeans聚类图像分割

sklearn.datasets import load_sample_image from sklearn.metrics import pairwise_distances_argmin def recreate_image(codebook...,labels,w,h): #定义图像压缩函数 d=codebook.shape[1] image=np.zeros((w,h,d)) label_idx=0 for i...in range(w): for j in range(h): image[i][j]=codebook[labels[label_idx]]...) plt.clf() i=1 for k in [64,32,16,4]: t0=time() plt.subplot(2,2,i) plt.axis('off') codebook_random...color indices on the full image (random)") t0=time() labels_random=pairwise_distances_argmin(codebook_random

7823 1

深度学习时代工业界最常用的检索算法？

接下来，在每一段内部通过Kmeans聚类的方式得到K个质心（如256个），这样就得到一个codebook，代表了每段内每个cluster_id和向量的对应关系。...在还原阶段，也可以使用codebook对压缩的向量进行还原，还原前后向量的欧式距离即为压缩带来的失真度，可以表示为如下公式，其中i表示量化过程（encoder），c表示还原过程（decoder）。...非参数方法交替优化R矩阵和codebook，固定R使用基础PQ方法优化codebook，再固定codebook使用SVD方法优化R矩阵。...首先将原始的embedding table利用一个Key Matrix进行离散化生成codebook，再使用一个Value Matrix进行逆向操作生成重构的embedding表。...在实际使用的时候，只保留中间产出的codebook和value matrix。

1.7K2 0

基追踪及其实现

imgrey); title('原始灰度图像'); bsize = 8; imcols = im2col(im2double(imgrey), [bsize, bsize], 'distinct'); codebook...size(imcols, 2); sparse = zeros(size(imcols)); for i = 1 : cols sparse(:, i) = bpalg(imcols(:, i), codebook...); end % 图像重建 imrecons = codebook * sparse; imrecons = col2im(imrecons, [bsize bsize], size(imgrey),

1.2K3 0

ICCV 2023 | 在离散潜在空间中以优先级为中心的人体运动生成

此外，还应用了一个正则化项，以增加 codebook 中标记的使用。我们为离散潜在空间中的人类动作生成设计了一个以优先级为中心的方案。...方法动作令牌化动作令牌化器旨在学习一个 codebook，可以以具备动作标记优先级的方式表示各种各样的动作序列。...为了实现这一目标，我们提出了一种基于 Transformer 的 VQ-VAE，利用自注意机制捕捉动作帧之间的长程依赖关系，并学习一个稳定且多样化的 codebook。...Z=\left\{z_k\right\}_{k=1}^K ，其中 K 表示 codebook中的条目数。...然后，对于每个特征 b_t ，我们通过测量特征 b_t 和 codebook Z 中每个条目之间的距离来查询 codebook Z 。

8317 0

字节多模态大模型PixelLM：高效像素级推理，无需依赖SAM

背后原理如论文中的框架图所示，PixelLM架构十分简洁，包括四个主要部分，后两者是PixelLM的核心：预训练的CLIP-ViT视觉编码器大语言模型轻量级像素解码器分割码表 Seg Codebook...Seg codebook包含可学习的tokens，它们用于编码CLIP-ViT不同尺度上的目标信息。...根据研究人员的描述，Seg codebook内的tokens可分为L组，每一组包含N个token，每个组对应于来自CLIP-ViT视觉特征的一个尺度。...Seg codebook的tokens将会与文本指令及最后一层图像特征一起输入LLM中，以自回归的形式产生输出。...而输出中也将包含经过LLM处理后的Seg codebook tokens，它们将与L个尺度的CLIP-ViT特征一起输入到像素解码器中产生最终的分割结果。那么为什么还要设置每组包含N个token呢？

1.5K1 0

通过k-means进行图像量化压缩--python实现

RGB值转化为图像 def recreate_image(codebook, labels, w, h): d = codebook.shape[1] image = np.zeros(..., d)) label_idx = 0 for i in range(w): for j in range(h): image[i][j] = codebook

1.7K4 0

基因表达聚类分析之初探SOM - 自组织特征图

与其它类型的中心点聚类算法如K-means等相似，SOM也是找到一组中心点 (又称为codebook vector)，然后根据最相似原则把数据集的每个对象映射到对应的中心点。...计量SOM中心点的内敛性和质量 # map quality # shows the mean distance of objects mapped to a unit to # the codebook...vector of that unit. # The smaller the distances, the better the objects are # represented by the codebook...# Form clusters on grid ## use hierarchical clustering to cluster the codebook vectors som_cluster <-

1.5K2 0

Transformer变革3D建模，MeshGPT生成效果惊动专业建模师，网友：革命性idea

这些特征通过残差量化被量化为 codebook 中的 Embedding，从而有效减少了网格表示的序列长度。这些内嵌信息在排序后，在重建损失的指导下，由一维 ResNet 进行解码。...给定从网格三角形中提取的几何嵌入序列，训练 transformer 来预测序列中下一个嵌入的 codebook 索引。...MeshGPT 采用图卷积编码器处理网格面，利用几何邻域信息捕捉表征 3D 形状复杂细节的强特征，然后利用残差量化方法将这些特征量化成 codebook 嵌入。...该研究使用 Transformer 从预先学习的 codebook 词汇中生成网格序列作为 token 索引。在训练过程中，图形编码器会从网格面提取特征，并将其量化为一组面嵌入。...该解码器通过交叉熵损失进行优化，预测每个嵌入的后续 codebook 索引。

7521 0

个性化推荐沙龙 | 跨领域推荐，实现个性化服务的技术途径

特别是其中引入了“密码书（Codebook）”的概念，即用户-物品领域的评分矩阵是有其特性的，用户和用户，物品和物品可以进行聚类，类与类之间有着较大的差异，而类内部的成员则较为相似。...Codebook就是一个聚类后的“浓缩矩阵”，对于场景1，用户-电影评分矩阵是一个的矩阵，用户可以聚成k类，电影可以聚成l类，那么Codebook矩阵就是一个的矩阵。...这种Codebook矩阵，对于不同领域来说是可迁移的。用户-书本领域通过聚类得到的Codebook矩阵，可以直接迁移到用户-电影领域，即可认为两个领域的Codebook矩阵是相同的。...基于这样的Codebook迁移性，文中提出了如下跨领域的协同过滤方法。...基于迁移学习的跨领域推荐方法有个不能回避的问题，就是Codebook的迁移缺乏直接依据，这种强硬的“迁移”对于某些强相关领域可能有好的效果，但换做一些相关性不是那么强的领域可能就没有效果甚至是反作用了。

2.2K5 0

窥一斑而知全豹，三篇论文遍历ICLR 2020新型表征方式

在训练的时候，从 codebook 中选取对应的变量 \ hat{z}=e_i，从而最终的损失函数变成了： ? 这里 sg(x) \equiv x, 而其导数恒等于 0。...这里括号中的前半部分是为了让 codebook 中的表征与编码器的输出更接近，而后半部分则是为了让编码器的输出能够与 codebook 中的中心点更近。...其中 V 表示该特定组的可能变量数，每个元素 i_j 对应一个固定的 codebook 向量。对于每一个组，我们使用两种 VQ 方法中的一种。...codebook 本身可以通过两种可能的方式进行初始化：可以在组之间共享 codebook 变量，即索引也将共享。相反，不共享 codebook 变量，索引的大小就会变大一些。。...在实践中，我们观察到共享 codebook 变量通常会比非共享表征的效果要好。

7003 0

Transformer又来搞事情！百万像素高清图轻松合成，效果迷人

因此，本文不是用像素来表示图像，而是将其表示为codebook的感知丰富的图像成分的合成。...这些思想综合起来就是，卷积和Transformer架构可以共同用于建模视觉世界的组成性质：我们使用卷积方法高效地学习上下文丰富的视觉部分的codebook，然后学习其全局组成的模型。...作者使用卷积VQGAN来学习上下文丰富的视觉部分的codebook，codebook的组件随后用自回归transformer 架构来建模。...离散的codebook提供了这些架构之间的接口，基于patch的判别器实现了强大的压缩能力，同时保持了较高的感知质量。该方法引入了卷积方法在基于transformer的高分辨率图像合成中的有效性。...实验证明，本文的方法保留了Transformers的优点，并优于以前基于卷积结构和codebook的SOTA方法。

2.2K1 0

CVPR2024 | ProbTalk：变化且协调的整体语音运动生成

经典的VQ-VAE包括一个自动编码器和一个离散codebook，后者学习捕捉自动编码器的潜在空间中的数据模式。...由于codebook组合的限制，VQ-VAE表示多样化数据模式的能力受到了相当大的量化误差的限制。受之前研究的启发，我们引入了一种PQ方法来解决这一挑战。...具体来说，PQ将潜在空间划分为 G 个单独的子空间，每个子空间由一个单独的子codebook表示。...我们将第 g 个子codebook表示为 C^g=\left\{c_k^g\right\}_{k=1}^K 。...类似地，潜在特征 z_n 被划分为 G 个子特征 \left\{z_n^g\right\}_{g=1}^G ，然后与其相应的codebook独立量化： \widehat{z}_n^g=\arg \min

5301 0

点击加载更多

MemoNet：用codebook记住所有的交叉特征来做CTR估计

蛋白质结构tokenization新进展：基准评估框架与优化方法的探索

ICLR24 | VQGraph: 重新审视图表示学习，将Graph空间Token化

匹配追踪算法进行图像重建

Transformers 4.37 中文文档（八十六）

FaissPQ索引简介

像素矢量量化

ACL2022 | 跨模态离散化表示学习：让不同的模态共享相同的词表

KMeans聚类图像分割

深度学习时代工业界最常用的检索算法？

基追踪及其实现

ICCV 2023 | 在离散潜在空间中以优先级为中心的人体运动生成

字节多模态大模型PixelLM：高效像素级推理，无需依赖SAM

通过k-means进行图像量化压缩--python实现

基因表达聚类分析之初探SOM - 自组织特征图

Transformer变革3D建模，MeshGPT生成效果惊动专业建模师，网友：革命性idea

个性化推荐沙龙 | 跨领域推荐，实现个性化服务的技术途径

窥一斑而知全豹，三篇论文遍历ICLR 2020新型表征方式

Transformer又来搞事情！百万像素高清图轻松合成，效果迷人

CVPR2024 | ProbTalk：变化且协调的整体语音运动生成

相关资讯

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐