原文链接指路:https://mp.weixin.qq.com/s/XXz7_6EdqmNuApRPBs85Hg?mpshare=1&scene=1&srcid=0306vpUSv5Xx0VkCNrsQnsUQ&sharer_shareinfo=90b383790082953b986b9ca4bbb4db2a&sharer_shareinfo_first=90b383790082953b986b9ca4bbb4db2a&version=4.1.33.99589&platform=mac#rd
昨夜,阿里低调开源了推理领域的新晋王者——QwQ-32B。这款仅有32.5B参数的模型,在LiveBench、IFEval等权威榜单上竟超越DeepSeek-R1-671B,更支持131K超长上下文与自主Agent推理能力。更令人兴奋的是,经过量化后的模型可直接运行在消费级显卡上!
今天我们将手把手教你,如何通过腾讯云免费GPU资源,在10分钟内完成QwQ-32B的云端部署。
在进入部署教程前,先看三个震撼数据:
根据最新信息,腾讯云 Cloud Studio 的高性能免费工作空间已全面集成 ollama 和 DeepSeek-R1 系列模型(1.5B、7B、8B、14B、32B),用户无需手动配置环境即可直接调用。
# 查看默认集成的 `ollama` 和多款 `DeepSeek-R1` 模型
(base) root@VM-0-80-ubuntu:/workspace# ollama ls
NAME ID SIZE MODIFIED
deepseek-r1:14b ea35dfe18182 9.0 GB 3 weeks ago
deepseek-r1:32b 38056bbcbb2d 19 GB 3 weeks ago
deepseek-r1:8b 28f8fd6cdc67 4.9 GB 3 weeks ago
deepseek-r1:1.5b a42b25d8c10a 1.1 GB 4 weeks ago
deepseek-r1:7b 0a8c26691023 4.7 GB 4 weeks ago
(base) root@VM-0-80-ubuntu:/workspace#
注:QwQ-32B已同步上线HuggingFace、ModelScope,建议优先选择镜像源
实话实说,这波腾讯优化的那是相当给力了,这是「高性能免费工作空间」的拉取速度,另外我还测试了一下普通主机的拉取速度更是碉堡了!
下面这是不带显卡的那种免费主机:
简单对话一下:
新开了一个窗口,看一下显存情况:
简直毫无压力!!!
这部分留给感兴趣的同学自己搞一下。
任务类型 | 测试案例 | QwQ-32B表现 |
---|---|---|
数学推理 | 证明哥德巴赫猜想弱版本 | 生成严谨数学归纳框架 |
代码生成 | 实现分布式共识算法Raft | 通过全部测试用例 |
Agent决策 | 股票投资组合动态调整 | 调用财经API+自主风险评估 |
QwQ-32B的强势表现源于三大创新:
❓Q:免费GPU能否支持长时间运行?
✅ 建议完成部署后立即执行nvidia-smi
监控显存,闲置时通过Cloud Studio控制台关机保时长
❓Q:如何实现本地化部署? ✅ 参考[阿里官方教程](https://qwenlm.github.io/blog/qwq-32b),4090显卡+4bit量化可流畅运行
本文系转载,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文系转载,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有