首页
学习
活动
专区
圈层
工具
发布

#glm

lmdeploy v0.10.1 发布:新增 ROCm 支持、GLM-4.5 兼容,以及众多优化与修复

福大大架构师每日一题

2025年9月26日,lmdeploy v0.10.1 正式发布。本次更新为开发者带来了包括 ROCm 支持、FP8(B)F16 GEMM、GLM-4.5 兼容...

5210

lmdeploy v0.10.0版本发布:新增Turbomind权重与KV缓存卸载、GLM-4.1支持、性能优化与大量Bug修复

福大大架构师每日一题

2025 年 9 月 9 日,lmdeploy v0.10.0 正式发布,本次更新带来了多项重要功能增强,涵盖 推理性能优化、新模型支持、后端增强以及大量 Bu...

8910

智谱开源autoGLM:AI手机操作系统之战正式打响

谢强byron

这两天AI行业最大的新闻,就是智谱突然又开源了autoGLM,为手机端提供了一个开放式的、谁都可以利用的agent平台。

54400

Anthropic发布Claude青春版Haiku4.5

AgenticAI

今日凌晨敌对Anthropic发布他们的Sonnet 4.5青春版haiku 4.5,性能相当于Sonnet 4,但是价格只有1/3,并且速度更快!

7910

GLM-4.6、Claude Sonnet 4.5和DeepSeek V3.2-Exp开发能力对比

白德鑫

YunADX | CTO (已认证)

按照春季的惯例,一过节日各个模型就发版本,这个十一假期也没例外,开发者CLI 工具几个模型都发布了新版本,GLM-4.5升级到了GLM-4.6、Claude S...

52710

【CodeBuddy + GLM-4.6】超强联合打造一个梦幻搭子Agent

LucianaiB

腾讯云TDP | 宣传大使 (已认证)

之前写过 CodeBuddy 和 GLM-4.6 的不少文章,感兴趣的可以了解一下。GLM-4.6的编程能力很强,但是由于 CodeBuddy国内模型不支持GL...

28320

模型即Agent,智谱新发的GLM-4.5模型和Claude Code结合使用好香啊

1987786399

昨天刚写完Claude Code,然后就收到了粉丝评论:GLM-4.5+Claude Code也很强!

38910

9B小模型也能打,智谱GLM-4.1V-Thinking让我的抖音助手直接起飞

1987786399

智谱作为AI六小龙领头羊,前阵子又放了一个大招:发布GLM-4.1V-9B-Thinking模型。不仅完全开源,还引入了"思考范式",通过课程采样强化学习(RL...

25410

智谱GLM-4.5-Air量化大模型,本地部署,实测

Ai学习的老章

之前偶尔关注智谱,是看到美国商务部把它列为实体清单,还有 OpenAI 点名它是全球战略的竞争对手

1.1K10

AI Compass前沿速览:可灵创意工坊、字节Coze Studio&Coze Loop、通义万相2.2 、智谱GLM-4.5、腾讯混元3D世界模型开源

汀丶人工智能

AI-Compass 致力于构建最全面、最实用、最前沿的AI技术学习和实践生态,通过六大核心模块的系统化组织,为不同层次的学习者和开发者提供从完整学习路径。

80310

GPT-5 在 Lovable/Vibecode 中氛围编码,附 GLM-4.5 对比 (反向搜索引擎、吵架的俄罗斯方块)

AI进修生

在 WebDev Arena 中,GPT-5 创下了新纪录: 比 Gemini 75 Pro +2.5 分 +100 分,高于 Claude Opus 4 ...

47110

GLM-4.5原生推理、代码、Agentic能力究竟怎么样,实测来了!

AIGC新知

昨天晚上智谱发布开源了他们家新的旗舰模型GLM4.5,一款专为智能体应用打造的智能体基座模型。

58410

[大模型]GLM-4-9B-Chat vLLM 部署调用

云未归来

vLLM 框架是一个高效的大型语言模型(LLM)推理和部署服务系统,具备以下特性:

83120

[大模型]GLM-4-9B-Chat WebDemo 部署

云未归来

在autodl平台中租一个4090等24G显存的显卡机器,如下图所示镜像选择PyTorch–>2.1.0–>3.10(ubuntu22.04)–>12.1 接...

20210

[大模型]GLM-4-9b-Chat 接入 LangChain

云未归来

在 01-ChatGLM4-9B-chat FastApi 部署调用 的 环境准备和模型下载基础上,我们还需要安装 langchain 包。如果不需要使用fas...

24210

[大模型]GLM-4-9B-chat FastApi 部署调用

云未归来

在 AutoDL 平台中租一个 3090 等 24G 显存的显卡机器,如下图所示镜像选择 PyTorch–>2.1.0–>3.10(ubuntu22.04)–>...

37210

本地分析视频有救了?我劝你先别太乐观

大风写全栈

vLLM同等显存,推理速度为60-70 Tokens/s(不得不说,vLLM是真快)。

14000

transformers v4.51.3 版本更新:GLM-4 强势融合,性能飞跃!

福大大架构师每日一题

亲爱的AI开发者们,我们激动地宣布huggingface/transformers库的最新版本——transformers v4.51.3已经发布!这次更新,不...

59000

智谱 GLM 新成员开源:高性能、推理快,体验入口“z.ai”免费开放

AIGC新知

继智谱在上个月发布了他们的AutoGLM沉思全新智能体,在AI圈子引起广泛的反向,很多人纷纷使用AutoGLM沉思去完成自己工作中的一些任务,如写研究报告、行业...

86410

智谱AI深夜上线全新Agent GLM-PC,再见仍是巅峰。

数字生命卡兹克

2024年10月25日,智谱在CNCC发布了第一款手机自主人工智能,AutoGLM,直接在行业内和金融市场上掀起了风暴。

20800
领券