首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Codex、Claude、Gemini 发力争抢桌面端

Codex、Claude、Gemini 发力争抢桌面端

作者头像
Ai学习的老章
发布2026-05-08 12:25:19
发布2026-05-08 12:25:19
50
举报

CLI 是程序员们的最爱

但是要再扩大市场份额,还是要去抢占比较亲民的桌面客户端

Claude、Gemini、Codex 都有自己的 App 了

Claude 我没有订阅,免费版都小心翼翼的用着,使用总体比较少

Codex 我倒是最常用,也写过几篇文章

  • OpenAI Codex 使用教程
  • Codex Windows 客户端来了,深读官方文档后我有 5 个判断

本文先简单介绍 Gemini 的客户端,然后再介绍 Codex 后面出的几个功能!

Gemini

这个我主要即使提问和搜集信息,这方面 Gemini 还是过关的

最大优点,太特别特别小

200M 不到,我的 256G M4 无法承受豆包,只用网页豆包了

日常使用是快捷键唤醒 Mini Chat 模式

然后问过之后就叉掉

几个好用的点

1、打通整个 Google 生态,我是全家桶用户,这一点很方便,尤其是 Notebook LM 的无缝衔接

2、分享屏幕,正在查看的文件,网页,任何东西,都可以快速唤醒 Mini Chat 后就这个屏幕内容对话

3、虽然 OpenAI 家的 Image 2 很能打,但是 Nano Banana 也不是软蛋,也是一流水平,可以快速生图,还是视频和音乐

Codex

Codex 做的越来越好用了,之前的很多痛点问题都解决了

比如更快捷滴打开中间或最终产物

比如之前很难用的文件树,现在可以很方便的浏览项目文件,还可以快速将文件或文件夹添加到对话中

还有预览功能,不但可以预览各种类型的文件(PDF、电子表格、演示文稿、文档、图片)

还能直接打开网站,它有一个内置浏览器,你可以直接在页面上标注,把具体指令给 agent,页面本身就开始变成指令界面

Codex 已经能调用 gpt-image-1.5生成和迭代图像

我没尝试

功能上,它现在支持语音输入

还有浏览器使用,这不用过多解释,可以直接弹出浏览器自动操作

电脑操控我很期待

Codex 可以通过视觉识别、点击、输入,去操作你电脑上的应用

而且可以多个 agent 在 Mac 上并行跑,不打断你手头别的工作

但是我的 ip 不支持

有个不起眼,但是也很有用的功能——对话

临时的对话不会污染项目

还有个 Pro 用户才有的新功能 Chronicle,我是 Plus 也无法使用它

用你的屏幕上下文来帮 Codex 建立记忆

开启之后,Chronicle 会在后台静默运行,定期截取屏幕内容,提炼成记忆条目。下次你开一个新线程跟 Codex 说话时,它已经大致知道你最近在看什么、用哪些工具、项目卡在哪了——不需要你重新解释一遍

缺点:

  • 会快速消耗 rate limit(后台 agent 持续跑)
  • 屏幕截图只临时存本地,超过 6 小时自动清除
  • 记忆文件是未加密的 markdown,存在 ~/.codex/memories_extensions/chronicle/
  • 存在 prompt injection 风险(如果你打开了某个带恶意指令的网页)

之前没注意它还有个 funny 的外观主题,名叫 Absolutely,很明显是在影射 Claude

它的插件系统也越来越强大了,应该有超过 100 个不同功能的插件了

也可以自己创建插件

管理起来也很方便

我已经很久没有用Claude Code了 Copilot 中的 Claude Opus 4.7 拉的一批,越用越气 Codex 桌面端越用越顺心,模型能力也很强,十分建议大家感受一下

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-04-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器学习与统计学 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Gemini
  • Codex
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档