首页
学习
活动
专区
圈层
工具
发布

#量化

【三桥君】QLoRA究竟如何从LoRA进化而来并成为AI工程师的必备技能?

三桥君

双重量化技术进一步压缩了量化常数,通过将量化常数再次量化,减少了存储和计算的开销。这一技术不仅降低了显存占用,还提高了模型的推理速度。

6610

Python流程控制:让代码按你的节奏跳舞

富贵软件

想象你正在指挥一支交响乐团,每个乐手都技艺高超,但如果没有指挥棒的引导,音乐就会变成杂乱无章的噪音。编程也是如此,Python的流程控制就是那根神奇的指挥棒,它...

7310

Python循环进阶:嵌套与控制的深度解析

富贵软件

在Python编程中,循环结构是处理重复性任务的基石。当基础循环语法无法满足复杂需求时,掌握嵌套循环与精细控制技巧将成为开发者突破瓶颈的关键。本文将从工程实践...

10610

量化交易背后的算法问题与技术实现方案

富贵软件

量化交易作为金融市场中的一个重要领域,通过计算机技术和数学模型实现自动化的交易决策。它不仅依赖于历史数据和实时市场信息,还通过复杂的算法和统计分析方法,自动生...

11010

【三桥君】如何在字节跳动的marscode上部署AI API,却意外地将功能搞废了?——分享踩坑经历

三桥君

最近我尝试用字节跳动的marscode来部署一个AI API,不得不说,字节的产品做得是真不错,用户体验超级棒,方方面面都考虑得很周到。用这个工具来做轻量级AI...

10210

100天跟着CP学PostgreSQL+AI,第21天 : 模型压缩与存储:在 PostgreSQL 中高效保存千亿参数

用户8465142

作者介绍:崔鹏,计算机学博士,专注 AI 与大数据管理领域研究,拥有十五年数据库、操作系统及存储领域实战经验,兼具 ORACLE OCM、MySQL OCP 等...

6110

谷歌开源Gemma 3 270M,性能超越Qwen 2.5同级模型

机器之心

Gemma 3 270M 是一款紧凑型、拥有 2.7 亿个参数的小体量语言模型,专为特定任务的微调而设计,具备强大的指令跟踪和文本结构化能力。

10410

自定义开发哪家强?腾讯云TCHouse-X零门槛上手指南

gavin1024

12410

数据湖原生集成谁最强?腾讯云TCHouse-X深度解析

gavin1024

13810

MXFP4量化:如何在80GB GPU上运行1200亿参数的GPT-OSS模型

deephub

面对这一技术瓶颈,GPT-OSS通过创新的量化技术实现了突破性进展。该系统能够在单个80GB GPU上运行1200亿参数模型,同时保持竞争性的基准测试性能。其核...

18110

普通电脑也能跑AI:10个8GB内存的小型本地LLM模型推荐

deephub

传统观念中,大语言模型(LLM)的部署通常需要大规模云计算资源和高昂的运营成本。随着模型量化技术和优化算法的快速发展,现在可以在配置有限的个人计算设备上部署强大...

31510

量化交易隐藏模式识别方法:用潜在高斯混合模型识别交易机会

deephub

本文将从技术实现角度阐述LGMM相对于传统方法的优势,通过图表对比分析展示其效果,并详细说明量化分析师和技术分析师如何应用此方法优化投资决策。LGMM的实现原理...

8210

面向概念漂移的动态自组织映射(SOM)及其在金融风险预警中的效能评估

deephub

金融数据分析面临实时处理、高频采集和非结构化特性的多重挑战。传统的使用自组织映射(SOM)进行异常检测存在几个关键性局限:

9110

Python实现时间序列动量策略:波动率标准化让量化交易收益更平稳

deephub

时间序列动量策略(Time-Series Momentum, TSMOM)作为量化交易领域中最为持久且被深入研究的策略类型之一,其核心理念相对简明:对于显示上升...

11910

机制粒化范式:地表复合臭氧和热量(SCOH)潜在风险的时空机制

一个有趣的灵魂W

The spatiotemporal mechanism of surface compound ozone and heat (SCOH) potential...

7810

Python量化交易:结合爬虫与TA-Lib技术指标分析

小白学大数据

引言量化交易(Quantitative Trading)是利用数学模型和计算机程序进行金融投资决策的方法。Python凭借其丰富的数据分析和机器学习库,已成为量...

23710

AI-Compass 强化学习模块:理论到实战完整RL技术生态,涵盖10+主流框架、多智能体算法、游戏AI与金融量化应用

汀丶人工智能

AI-Compass 致力于构建最全面、最实用、最前沿的AI技术学习和实践生态,通过六大核心模块的系统化组织,为不同层次的学习者和开发者提供从完整学习路径。

23710

RAG原理总结

码农编程进阶笔记

所以RAG要做的事情就是将知识库分割,然后利用向量模型做向量化,存入向量数据库,然后查询的时候去检索:

18910

NVIDIA TensorRT-LLM 赋能!OpenAI 开源 GPT-OSS 模型,INT8/FP8 量化让推理更快更省

GPUS Lady

更值得关注的是,TensorRT-LLM 支援多种量化技术,如 INT8 和 FP8 量化,这些技术能够在保持模型精度的同时显著减小模型规模并加速推论过程。对于...

18110

ollama v0.11.2版本深度解析:优化kv缓存量化修复及全新gpt-oss模型支持详解

福大大架构师每日一题

尽管量化带来诸多好处,但在特定架构(如gpt-oss)上,kv缓存的量化可能导致运行时内存错乱或数据不一致。v0.11.2版本选择禁止该模型启用kv缓存量化,取...

50520
领券