首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

#量化

goldfish loss:减少训练数据泄漏,提高大语言模型输出的多样性

deephub

LLMs(大型语言模型)能够记忆并重复它们的训练数据,这可能会带来隐私和版权风险。为了减轻记忆现象,论文作者引入了一种名为"goldfish loss"的微妙修...

300

CARE2024——真实世界医学图像的综合分析与计算之MyoPS++

医学处理分析专家

许多用于医学图像分析的基础模型,例如分段任意模型(SAM),已经发布并被证明在多种任务中是有用的。然而,它们对现实世界医学成像数据的有效性尚未得到探索。例如,针...

100

CARE2024——真实世界医学图像的综合分析与计算之WHS++

医学处理分析专家

许多用于医学图像分析的基础模型,例如分段任意模型(SAM),已经发布并被证明在多种任务中是有用的。然而,它们对现实世界医学成像数据的有效性尚未得到探索。例如,针...

400

CARE2024——真实世界医学图像的综合分析与计算之LAScarQS++

医学处理分析专家

许多用于医学图像分析的基础模型,例如分段任意模型(SAM),已经发布并被证明在多种任务中是有用的。然而,它们对现实世界医学成像数据的有效性尚未得到探索。例如,针...

600

《书生·浦语大模型实战营》第5课 学习笔记:LMDeploy 量化部署 LLM 实践

流川疯

神州信息集团 · 高级算法工程师 (已认证)

这种说法是片面的,虽然计算机计算定点数和整数比计算浮点数快,但是模型的参数仅仅是以定点或者整数的方式存储,在实际计算时,还需要把定点数和整数反量化为浮点数进行数...

1500

60min!极速竞答!2024春百亿量化私募研究类笔试0521

量化投资和人工智能公众号

面向研究类的笔试题目,主要是数理统计和编程题,限时60min,一共6个题,下面给出其中的四题,更全的试题在知识星球中获取.整体难度不大,和之前发布的题目有相似的...

5310

CVPR 2024 Highlight | 北航等发布「时间特征维护」:无需训练,极致压缩加速Diffusion

新智元

基于时间特征维护的校准量化可确保 Diffusion的量化参数准确保留原始时间信息。广泛的实验证明,TFMQ-DM 在 DDIM、LDM及Stable-Diff...

8110

大模型压缩量化方案怎么选?无问芯穹Qllm-Eval量化方案全面评估:多模型、多参数、多维度

机器之心

最近,来自清华大学电子工程系、无问芯穹和上海交通大学的研究团队展开了一次量化方案的“大摸底”,在《Evaluating Quantized Large Lang...

6510

Spark向量化计算在美团生产环境的实践

美团技术团队

Apache Spark是一个优秀的计算引擎,广泛应用于数据工程、机器学习等领域。向量化执行技术在不升级硬件的情况下,既可获得资源节省,又能加速作业执行。Glu...

11310

Transformers 4.37 中文文档(十八)

ApacheCN_飞龙

量化技术通过使用低精度数据类型(如 8 位整数(int8))表示权重和激活来减少内存和计算成本。这使得您可以加载通常无法放入内存的更大模型,并加快推理速度。Tr...

10610

Transformers 4.37 中文文档(十二)

ApacheCN_飞龙

还要注意,与 8 位量化相比,这里的推理速度再次稍慢一些,这是因为 4 位量化使用了更激进的量化方法,导致在推理过程中量化和反量化过程需要更长的时间。

10410

Kallisto — 基于伪比对的转录本定量

生信菜鸟团

Kallisto是由Nicolas Bray主导开发的一款专门用于从 RNA-Seq 数据中量化转录本的表达丰度的工具。发表于 2016 年的《Nature B...

9210

人类淋巴器官中的B细胞亚群分群-1

生信技能树jimmy

为了更直接地量化MZB-1和MZB-2之间的丰度差异,使用viSNE和SPADE将B细胞亚群识别并分组为气泡,并基于CCR7表达对MZB亚群进行了细分。

11110

实用指南|如何使用 Milvus 将 JSON 数据向量化并进行相似性搜索

Zilliz RDS

本文将介绍 Milvus 向量数据库如何有效简化 JSON 数据的向量化处理、数据摄取和相似性检索流程。同时,本文还将提供一份详细的操作指南,详解如何使用 Mi...

30910

何凯明入职 MIT 首次带队提出Diffusion Loss,借鉴扩散模型思想让自回归模型抛弃矢量量化 !

公众号-arXiv每日学术速递

自回归模型目前是自然语言处理中生成模型的实际解决方案。这些模型基于前面的词作为输入来预测序列中的下一个词或标记。由于语言的离散性质,这些模型的输入和输出处于分类...

20510

最新!Citadel datathon OA题目20240330

量化投资和人工智能公众号

量化策略:深入量化交易的世界,学习如何从零开始设计、测试和优化你的量化策略。提供丰富的案例和实践指导,帮助你打造出稳健的交易模型

9210

稳博投资开发类笔试题目0329

量化投资和人工智能公众号

量化开发类笔试题目,开卷 48h。第一题倾向于逻辑题和算法题相结合的形式。第二题是项目题,考察候选人对C++编写项目和回测系统的理解和认识,可以看出系统设计能力...

12310

个人理财与资产管理:开源的个人财务操作系统 | 开源日报 No.284

小柒

mistral.rs 是一个极速的 LLM 推断平台。 这个项目主要解决的问题是:提供一个快速的 LLM 推断平台,支持在各种设备上进行推断,量化和易于使用的应...

15210

零代码量化投资:用ChatGPT获取新浪财经上的股票实时行情

AIGC部落

现在很多免费的股票数据库,比如akshare,其实是从新浪财经或者东方财富网站上爬取下来的。如果能直接从新浪财经或者东方财富网站上爬取数据,可以获取更全面更即时...

8810

零代码量化投资:用ChatGPT获取个股的日线行情

AIGC部落

Tushare是一个免费开源的金融数据集,包含股票、基金、期货、债券、外汇、行业大数据,同时包括了数字货币行情等区块链数据的全数据品类。注册地址:https:/...

7810
领券