暂无搜索历史
季度复盘会上,老板给我派了个活:把模型调用成本降 30%。我一开始以为就是换个便宜入口的事,真动手算账才发现,API 单价只是冰山露出水面的部分。这篇把我们核算...
上个月接手一个交接质量很差的老项目:接口文档、设计文档、会议纪要散落在几十个 Markdown 文件里,加起来 300 多页。新人问我「token 过期策略是什...
晚高峰排查线上告警,十有八九是这两种情况:上游偶发 429 限流,或者一个请求挂在那里六十秒不返回。GPT、Claude 这类接口链路长、上游负载不受你控制,裸...
一直想把 Claude Code 用顺,但国内直连官方总是不稳,要么超时要么要折腾网络。前阵子试了用中转的方式接进来,意外地省心,记录一下,纯分享。
国内做 AI 应用,调 GPT、Claude 这步我前前后后踩了不少坑。记录下来,给同样卡在这儿的人省点时间。
给项目选大模型 API,最纠结的就是“便宜”和“稳定”常常顾此失彼。前阵子我把主流方案试了一圈,复盘下来分享给同样在选的人。
暂未填写公司和职称
暂未填写个人简介
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市