首页
学习
活动
专区
圈层
工具
发布
首页标签大模型部署

#大模型部署

Mac本地模型接入MLX怎么测

用户3825620

这次更新真正解决的麻烦,是 Mac 用户本地跑大模型时经常遇到的三件事:回答慢、内存吃紧、输出质量不稳定。本地模型运行工具这次在 Apple Silicon 上...

500

ChatGPT怎么使用?2026从入门到精通实操指南

霖川

本文面向刚接触 ChatGPT 或一直停留在"问一句答一句"阶段的用户,结合 2026 年 6 月最新版本的核心能力,系统拆解从注册上手到深度使用的完整路径。 ...

2910

如何评价月之暗面新发布并开源 Kimi K2.7 Code 编程大模型?

鱼片粥来碗豆腐

上周五深夜,正当我坐在电脑前,对着手里一个历史遗留的分布式事务系统架构抓耳挠腮的时候,科技圈的一条消息瞬间把我们技术群给炸醒了。

3100

周一上线|瑞幸把咖啡做进 CLI,Fable 5 短暂登场,Stonk Rider 骑上 K 线图

七牛开发者

这期的「周一上线」有点像“AI 工具继续长手长脚”和“社区整活继续上强度”一起上线。

8010

面向 DeepSeek-V4 的 FlashMemory:长上下文 KV Cache 如何压到约十分之一

七牛开发者

长上下文模型的能力越来越强,能读的内容也越来越长。但一到真实推理服务里,问题很快就会落到显存上。更准确地说,是 KV Cache。

8300

万米地下打响“计算战”,HPC与大模型解放石油人的“铁脚板”

Alter聊科技

许多人在讨论“养虾”时,在荒凉的戈壁滩上,一场关乎能源命脉的技术革命正在悄然发生。

4100

接手老项目后,我用大模型啃完了 300 页技术文档:长上下文实践笔记

用户3993654

上个月接手一个交接质量很差的老项目:接口文档、设计文档、会议纪要散落在几十个 Markdown 文件里,加起来 300 多页。新人问我「token 过期策略是什...

6010

ChatGPT到底有多厉害?

鱼片粥来碗豆腐

十年前,如果有人对我说:“未来你会把一个聊天框当作自己最重要的工作伙伴、智囊和创意导师。”我一定会觉得他科幻电影看多了。那时的语音助手和聊天机器人,大多还停留在...

5500

写一个抗抖动的大模型调用层:超时、退避重试与故障转移实战

用户3993654

晚高峰排查线上告警,十有八九是这两种情况:上游偶发 429 限流,或者一个请求挂在那里六十秒不返回。GPT、Claude 这类接口链路长、上游负载不受你控制,裸...

6000

Claude Code强大是因为模型强还是agent实现细节?

鱼片粥来碗豆腐

在写下这篇文章之前,我刚刚关闭终端里运行着的 Claude Code。它刚刚在不到两分钟的时间里,跨越了 7 个文件,帮我重构了一个历史遗留的异步状态机,顺便补...

4800
领券