首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >全面解读:OpenAI GPT-4o模型及其获取与使用方法

全面解读:OpenAI GPT-4o模型及其获取与使用方法

作者头像
攻坚克难的那份表
修改于 2024-07-01 09:42:03
修改于 2024-07-01 09:42:03
1.1K0
举报
文章被收录于专栏:AI资讯AI资讯

OpenAI 在「春季新品发布会」上搬出了新一代旗舰生成模型 GPT-4o、桌面 App,并展示了一系列新能力。这一次,技术颠覆了产品形态,OpenAI 发布 GPT-4o全能模型 实时语音和视觉能力 再次刷新ai科技业界。

什么是 GPT-4o?

1.GPT-4o 是 OpenAI 的新旗舰模型,可以实时跨音频、视觉和文本进行推理。

2.GPT-4o 最初将在 ChatGPT 和 API 中作为文本和视觉模型提供(ChatGPT 将继续通过预先存在的语音模式功能支持语音)。具体来说,GPT-4o 将在 ChatGPT Free、Plus 和 Team(即将推出 Enterprise)以及 Chat Completions API、Assistants API 和 Batch API 中提供。

3.GPT-4o(“o”代表“omni”)是迈向更自然的人机交互的一步——它接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像的任意组合输出。它可以在短至 232 毫秒的时间内响应音频输入,平均为 320 毫秒,与人类的响应时间相似(在新窗口中打开)在一次谈话中。它在英语文本和代码上的性能与 GPT-4 Turbo 的性能相匹配,在非英语文本上的性能显着提高,同时 API 的速度也更快,成本降低了 50%。与现有模型相比,GPT-4o 在视觉和音频理解方面尤其出色。

在 OpenAI API 中访问 GPT-4、GPT-4 Turbo 和 GPT-4o

GPT-4 Turbo 与 GPT-4o

GPT-4o 具有相同的高智能性,但比 GPT-4 Turbo 更快、更便宜,并且具有更高的速率限制。具体来说:

1.定价:GPT-4o 比 GPT-4 Turbo 便宜 50%,输入代币为 5 美元/M,输出代币为 15 美元/M。

2.速率限制:GPT-4o 的速率限制比 GPT-4 Turbo 高 5 倍——每分钟最多 1000 万个代币。

3.速度:GPT-4o 的速度是 GPT-4 Turbo 的 2 倍。

4.视觉:在与视觉能力相关的评估中,GPT-4o 的视觉能力表现优于 GPT-4 Turbo。

5.多语言:GPT-4o 比 GPT-4 Turbo 改进了对非英语语言的支持。

6.GPT-4o 目前的上下文窗口为 128k,知识截止日期为 2023 年 10 月。

GPT-4o更灵活的语音交互功能提升

在 GPT-4o 之前,您可以使用语音模式与 ChatGPT 对话,平均延迟为 2.8 秒 (GPT-3.5) 和 5.4 秒 (GPT-4)。为了实现这一目标,语音模式是由三个独立模型组成的管道:一个简单模型将音频转录为文本,GPT-3.5 或 GPT-4 接收文本并输出文本,第三个简单模型将该文本转换回音频。这个过程意味着主要智能来源GPT-4丢失了大量信息——它无法直接观察音调、多个说话者或背景噪音,也无法输出笑声、歌唱或表达情感。

借助 GPT-4o,我们跨文本、视觉和音频端到端地训练了一个新模型,这意味着所有输入和输出都由同一神经网络处理。由于 GPT-4o 是我们第一个结合了所有这些模式的模型,因此我们仍然只是浅尝辄止地探索该模型的功能及其局限性。

图像视觉能力

此外,GPT-4o 在理解和生成图像方面的能力比任何现有模型都要好得多,此前很多不可能的任务都变得「易如反掌」。

1.比如,你可以让它帮忙把 OpenAI 的 logo 印到杯垫上:

scrnli_2024_5_14 15-40-33.png
scrnli_2024_5_14 15-40-33.png

经过这段时间的技术攻关,OpenAI 应该已经完美解决了 ChatGPT 生成字体的问题。

2.同时,GPT-4o 还拥有 3D 视觉内容生成的能力,能够从 6 个生成的图像进行 3D 重建:

3.这是一首诗,GPT-4o 可以将其排版为手写样式:

image.png
image.png

4.更复杂的排版样式也能搞定:

image.png
image.png

5.与 GPT-4o 合作,你只需要输入几段文字,就能得到一组连续的漫画分镜:

image.png
image.png

6.而下面这些玩法,应该会让很多设计师有点惊讶:

image.png
image.png

7.这是一张由两张生活照演变而来的风格化海报:

image.png
image.png

8.多线渲染 - 机器人发短信视角:

image.png
image.png

模型评估

根据传统基准测试,GPT-4o 在文本、推理和编码智能方面实现了 GPT-4 Turbo 级别的性能,同时在多语言、音频和视觉功能上设置了新的高水位线

image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png

API 中的可用性

GPT-4o 可供拥有 OpenAI API 帐户的任何人使用,您可以在Chat Completions API、 Assistants APIBatch API中使用此模型。该模型还支持函数调用和JSON模式。您还可以通过Playground开始。

成功支付 5 美元或更多(使用级别 1)后,您将能够通过 OpenAI API访问GPT-4、GPT-4 Turbo 和 GPT-4o模型。

了解有关为您的 OpenAI 帐户添加积分的更多信息。

API 中当前的 GPT-4o 定价可在我们的API 定价页面上找到。

获取 API Key

要使用 ChatGPT-4o API,需要先注册一个 OpenAI 账号并获取 API Key。以下是具体步骤:

访问 OpenAI 官网 并注册账号。

登录后,在账户设置中找到 API Keys 部分。

创建新的 API Key 并保存好,切勿泄露。

预充值,在“Anthropic”中选择“API keys”输入预充值金额,最低为5美元。

API 请求限制

请注意,ChatGPT 速率限制独立于 API 速率限制。您可以在此处了解有关 API 速率限制的更多信息。

您可以在API 平台的限制部分查看您的 API 速率限制。

但请耐心等待——我们预计会有大量需求,并将在未来几个月内扩大和优化我们的系统。

我们如何处理发送到 OpenAI API 的数据

与我们平台的其他部分一样,传递到 OpenAI API 的数据和文件绝不会用于训练我们的模型,除非您明确选择参加训练。您可以在此处详细了解我们的数据保留和合规性标准。

使用 ChatGPT 访问 GPT-4o

ChatGPT 免费套餐

免费套餐的用户将默认使用 GPT-4o,并且使用 GPT-4o 可以发送的消息数量受到限制,这将根据当前的使用情况和需求而有所不同。当不可用时,免费层用户将切换回 GPT-3.5。

免费用户还可以使用高级工具对消息进行有限的访问,例如:

GPT-4o 具有先进的视觉功能,可提高理解您共享的图像的准确性。

GPT-4o这么强,全都免费开放了,这是劝大家不续订ChatGPT Plus了的意思吗?

那肯定不是啊~免费套餐的用户将默认使用 GPT-4o,并且使用 GPT-4o 可以发送的消息数量受到限制;

获取试用:实测把梯子切换到日本IP就可以用gpt-4o,切换回美国IP就消失了。根据IP给的GPT-4o,还有其他部分地区应该也会给

普号GPT-4o和付费有以下比较大的区别:

1.普号GPT-4o不可以画图,传文件(有的可以传)。付费可以

2.普号的GPT-4o限制10条/3小时

3.ChatGPT Plus限制GPT-4o消息80条/3小时,GPT-4仍然是40条,GPT-4用完后可以用GPT-4o,但是GPT-4o的80条用完后不能用GPT-4。

4.team限制100条/3小时,和4共享额度

5.普号的GPT-4o是8k,付费的是32k

6.能力测试不及gpt-4 turbo系列

总结:GPT-4o新模型免费体验有限制,Plus 用户将能够在 GPT-4o 上每 3 小时最多发送 80 条消息,在 GPT-4 上每 3 小时最多发送 40 条消息,team限制100条/3小时,和4共享额度。

4o14160720.png
4o14160720.png

免费套餐用户可以随时点击 ChatGPT 升级到 Plus:

ChatGPT Plus 和团队

ChatGPT Plus 和 Team 订阅者可以在chatgpt.com上访问 GPT-4 和 GPT-4o ,并具有更大的使用上限。

ChatGPT Plus 和 Team 用户将能够从页面顶部的下拉菜单中选择 GPT-4o:

截至 2024 年 5 月 13 日,Plus 用户将能够在 GPT-4o 上每 3 小时最多发送 80 条消息,在 GPT-4 上每 3 小时最多发送 40 条消息。我们可能会减少高峰时段的限制,以使 GPT-4 和 GPT-4o 可供最广泛的人使用。

ChatGPT Team 工作区中用户的 GPT-4 和 GPT-4o 消息上限高于 ChatGPT Plus。

请注意,未使用的消息不会累积(即,如果您等待 6 小时,则在接下来的 3 小时内 GPT-4 上将没有 80 条消息可供使用)。

聊天GPT企业

ChatGPT Enterprise 客户很快就能访问 GPT-4o。

ChatGPT Enterprise 计划专为满足大型企业的需求而设计,可无限制、高速访问 GPT-4o 和 GPT-4。

ChatGPT Enterprise 帐户上的新对话将默认为 GPT-4o。 ChatGPT Enterprise 用户将能够从页面顶部的下拉菜单中选择其他型号:

ChatGPT Enterprise 还提供企业级安全和隐私、用于处理较长输入的较长上下文窗口、对数据分析、自定义选项等高级工具的无限制高速访问。

新的桌面 app 简化用户工作流程

对于免费和付费用户,OpenAI 还推出了适用于 macOS 的新 ChatGPT 桌面应用程序。通过简单的键盘快捷键(Option + Space),用户可以立即向 ChatGPT 提问,此外,用户还可以直接在应用程序中截取屏幕截图并进行讨论。

现在,用户还可以直接从计算机与 ChatGPT 进行语音对话,GPT-4o 的音频和视频功能将在未来推出,通过点击桌面应用程序右下角的耳机图标来开始语音对话。

从今天开始,OpenAI 将向 Plus 用户推出 macOS 应用程序,并将在未来几周内更广泛地提供该应用程序。此外今年晚些时候 OpenAI 会推出 Windows 版本。

文章由-uiuihao博客网整理发布

本文系转载,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文系转载,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
作者已关闭评论
暂无评论
推荐阅读
编辑精选文章
换一批
LivePortrait V2版:新增动物模式,支持动物表情迁移。一张照片生成生动视频,精准操控眼睛和嘴唇动作 本地一键整合包下载
LivePortrait,这个名字听起来就像是魔法,但它其实是现实世界中的黑科技。想象一下,你那尘封已久的相册里,那些定格在时间里的笑脸,突然间动了起来,眨眼、微笑、甚至说话,这不再是电影里的场景,LivePortrait让它变成了现实。
AI人工智能影像
2024/08/05
4860
LivePortrait V2版:新增动物模式,支持动物表情迁移。一张照片生成生动视频,精准操控眼睛和嘴唇动作 本地一键整合包下载
Al 技术在快手短视频创作与理解的应用
在 AICon 全球人工智能与机器学习技术大会(2021)北京站上,快手技术 VP 王仲远带来了主题为《Al 技术在快手短视频创作与理解的应用》的演讲,分享了快手在 AI 技术领域的实践与探索成果。本文由 InfoQ 根据王仲远的演讲内容整理,希望对你有所启发。作为国内短视频行业头部平台之一,快手有 3.2 亿日活用户,月活达 5.7 亿,此外还有 1.8 亿海外月活用户,存量短视频已达数百亿量级。在快手平台上,用户每天会花超过 100 分钟观看短视频及直播内容,用户相互关注数也超过 140 亿。
深度学习与Python
2021/12/16
1.3K0
感觉身体被掏空?你需要这 5 个「吸猫/狗」小程序来补一补
现在,微博上最受欢迎的网红已经不是漂亮的小姐姐们了,取而代之而是各种各样可爱的小动物们。
知晓君
2018/07/27
6700
混元语音数字人模型,开源!
这一能力来自5月28日腾讯混元发布并开源的语音数字人模型HunyuanVideo-Avatar,由腾讯混元视频大模型(HunyuanVideo)及腾讯音乐天琴实验室MuseV技术联合研发,支持头肩、半身与全身景别,以及多风格、多物种与双人场景,面向视频创作者提供高一致性、高动态性的视频生成能力。
腾讯开源
2025/06/10
2230
混元语音数字人模型,开源!
10分钟搞定!AI表情包自由,白嫖GPT-4o,让你在群里横着走!
嘿!还在用那些糊掉渣、传了N代的“祖传”表情包?朋友,你out辣!现在AI画图都卷成麻花了,尤其是那个GPT-4o,简直是表情包界的“外挂”,图像的一致性稳得一批不说,还能直接吐透明背景的图,简直是表情包界的“天选之子”!
LeonAlgo
2025/04/30
3600
10分钟搞定!AI表情包自由,白嫖GPT-4o,让你在群里横着走!
怎样用GAN生成各种胖吉猫?谷歌大脑程序员教你撩妹神技
Facebook聊天框里出道的灰色短毛猫Pusheen,是柔软的微胖界宠儿,中文名字叫胖吉。
量子位
2018/07/20
1.1K0
Neurons字幕组 | 2分钟带你了解如何把人类表情迁移到大猩猩上
Neurons字幕组出品 翻译 | IrisW 校对 | 云舟 后期 | 郭丽(终结者字幕) 项目管理 | 大力 Neurons字幕组 第三期作品震撼来袭! Neurons字幕组源自英文单词Neuron,一个个独立的神经元,汇聚千万,成就了四通八达,传递最in最酷炫信息的神经网络。 来吧,和Neurons一起,玩点不一样的AI! 亲爱的小伙伴们,今天我们的2分钟小视频,将会为大家介绍一个非常有趣的算法,这个算法可以将某个人的表情迁移至另一个人的脸上。是不是很神奇叻?然后,一直关注我们Neurons节目的小伙
大数据文摘
2018/05/24
1.1K0
短短五一假期,小红书被一个"黏土AI"攻陷了
小红书上几个大的词条,比如#黏土、#我的黏土世界 啥的,也哐哐的全被这种风格攻占。
数字生命卡兹克
2025/04/14
1230
短短五一假期,小红书被一个"黏土AI"攻陷了
1 分钟,教你做出火爆全网的动物奥运会视频!附 AI 提示词
大家好,我是程序员鱼皮。上期给大家分享了 如何利用 AI 生成 ASMR 视频,虽然效果很好,但我也提到使用 Veo 3 每天只能生成 3 个视频,这个限制太坑了,根本不够用!
程序员鱼皮
2025/06/30
1890
1 分钟,教你做出火爆全网的动物奥运会视频!附 AI 提示词
腾讯混元说:公主请画画
小腾资讯君
2023/10/27
3160
腾讯混元说:公主请画画
AI进了直播间,这画风666
科技时代,我们更加怀念温暖邂逅的时光 这一次IBMWatson为大家带来了Spotify 全球榜 Top 2 的单曲,Watson 学习了 26000 首流行歌曲,帮助主唱Alex Da kid创作了这首《Not Easy》。 全文共2641字,预计阅读时长3分钟 这年头,直播已经不新鲜了,网红们陪聊卖笑,辣眼睛玩心跳,或者博眼球求关注,宛如一股洪流泛滥成灾。 9个机器人组成的首个机器人主播天团 相比之下,(当红炸子鸡TFboys的孪生兄弟)TLboys天团更像是一股网红界的“清流”——由9个机器人组成
企鹅号小编
2018/01/18
2.5K0
AI进了直播间,这画风666
快手「可灵」再进化!视频续写可达3分钟让全球网友炸锅
事情是这样的,这位网友的父亲需要做搭桥手术,为了给父亲鼓舞,他便试着用可灵AI把爷爷的两张老照片还原成了视频。
新智元
2024/06/27
3710
快手「可灵」再进化!视频续写可达3分钟让全球网友炸锅
现在,你可以撸机器猫了
谁不喜欢小喵? 如今,吸猫都成了一种潮水的方向。但朋友,除了可爱小喵还可能带来一些困扰:例如掉毛季节来临,手术(以及不做手术),铲屎(以及喂饭),一切行动不听指挥。 更重要的是,你妈、你男/女朋友(如
量子位
2018/03/20
1.1K0
现在,你可以撸机器猫了
火爆的老照片动起来、唱歌,微视把AI视频特效打包「一键」实现了
这几年,AI 模型在特效方向的技能似乎已被拉满。因此,我们在有生之年见到了会说话的蒙娜丽莎、cos 油画的周杰伦以及可以让人一秒变秃的「东升发型生成器」。但是,这些技术似乎在使用层面都不太「接地气」,很少有人将其做成「一键生成」类应用放到手机上,实时类应用就更少了。
机器之心
2021/03/15
1.8K0
火爆的老照片动起来、唱歌,微视把AI视频特效打包「一键」实现了
万圣节定制「丧尸生成器」,编辑部亲测,效果鬼畜
机器之心报道 作者:张倩、魔王 get 了这个网站,今年万圣节 C 位就是你的! AI 是一个盛产阴间产品的领域,这一点似乎已经毋庸置疑。前不久,有人做了个用来生成「大眼萌」漫画形象的网站「Toonify」,但很快就有人走向了另一个极端:用类似技术做一个丧尸生成器! 利用 Toonify 生成的威尔 · 史密斯漫画形象。 利用「丧尸生成器」生成的威尔 · 斯密斯丧尸形象。 被玩坏的两位美国总统候选人。 这种搞笑又惊悚的风格似乎和即将到来的万圣节很般配。 为了让大家都用上这个效果,作者还专门做了一个名
机器之心
2023/03/29
5290
万圣节定制「丧尸生成器」,编辑部亲测,效果鬼畜
人脸表情识别实战:你的喜怒哀乐飞桨统统get!
【飞桨开发者说】李增保,2019年于安徽工业大学取得学士学位,目前在东南大学攻读硕士研究生学位,主要的研究方向为分布式无人机集群协同控制、算法设计与优化等。
用户1386409
2020/06/10
2.8K0
学界 | 教你一个简单的深度学习方法检测人脸面部特征
AI 科技评论按:你可能在一些手机软件上已经看到了给人脸增加特效的app,它们将一些可爱有趣的物体添加到自拍视频中,有些更有趣的还能检测表情自动选择相应的物体。这篇文章将会科普一种使用深度学习进行人脸
AI科技评论
2018/03/13
1.4K0
学界 | 教你一个简单的深度学习方法检测人脸面部特征
不能管家的AI机器狗不是好宠物?
近日,波士顿动力的网红大黄狗Spot因为学会“做家务”而登上了微博热搜。继跨年夜的芭蕾小碎步之后,再次引起全网热议。
用户2908108
2021/03/03
5070
不能管家的AI机器狗不是好宠物?
你还说这是AI?我们体验了一波生成亚洲人最好看的文生图大模型
点开几个 Demo,确实惊艳。下方视频是一位海外网友自制的穿搭合辑,你能分得清这是 AI 还是真人吗?
机器之心
2025/02/15
3410
你还说这是AI?我们体验了一波生成亚洲人最好看的文生图大模型
AI一分钟|AI聊机器人“Shibuyu Mirai”获日本居住权,传今日头条3亿美元收购Faceu激萌
一分钟AI 继Sophia获得公民权后,AI聊机器人“Shibuyu Mirai”获日本居住权 今日头条收购相机拍照工具Faceu激萌,据传交易总价约为3亿美元 “谷歌自动驾驶汽车之父”的Sebastian Thrun宣称:飞行汽车或将于5年内上市 迪拜道路与交通管理局与HERE签订合作协议,双方针对自动驾驶将开展长期合作 全国首个跨境电商智能机器人仓库建成,京东、网易考拉等受益 嘀!恭喜你,《AI一分钟》打卡成功! 没看够,以下两分钟看详细新闻 1. 全球首例:AI聊机器人“Shibuyu
AI科技大本营
2018/04/26
7640
AI一分钟|AI聊机器人“Shibuyu Mirai”获日本居住权,传今日头条3亿美元收购Faceu激萌
推荐阅读
相关推荐
LivePortrait V2版:新增动物模式,支持动物表情迁移。一张照片生成生动视频,精准操控眼睛和嘴唇动作 本地一键整合包下载
更多 >
LV.0
这个人很懒,什么都没有留下~
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档