首页
学习
活动
专区
圈层
工具
发布

API降到每分钟0.3美分

跟昨天的o1-pro API的天价token相比,语音模型的API真可谓是良心价了。...在多种语言上,有更低的词错误率(WER)。...最新语音转文本STT模型,减少了在FLEURS上的转录错误率WER 其中,语音转文本GPT-4o-Transcribe在API中可用,每分钟仅0.6美分,与Whisper价格相同,而GPT-4o-Mini-Transcribe...这些新模型能更好地理解人说话的细节,减少错误,特别是在有口音、很吵或者说话很快的情况下。 现在,这些模型已经可以在OpenAI的语音转文本API中使用了。...顶级模型在FLEURS上,不同语言的的WER比较 如图所示,新模型在大多数主要语言上的表现都优于其他领先的模型。 这意味着OpenAI的语音识别技术,在全球范围内都是领先的。

39210

服务器500错误又来了?别慌!这份排查指南让你秒变故障终结者

说起500错误,我想每个做运维的朋友都有一肚子苦水要倒。昨天晚上11点多,我正准备洗洗睡了,手机突然疯狂震动——客户问题又来了。打开一看,果然是熟悉的HTTP 500错误,用户访问网站直接白屏。...我就遇到过因为某个日志文件疯狂增长,把磁盘空间占满了,导致应用无法写入临时文件而报500错误。 不同应用类型的专项排查 根据我这些年的经验,不同技术栈的应用出现500错误时,排查重点还是有些区别的。...如果这些API出问题了,也可能导致应用报500错误。...案例三:Python应用模块导入失败 有一次客户的一个Django应用突然开始500,但是重启后又正常了,过一段时间又开始500。 最后发现是某个Python包的版本有问题,在特定条件下会导入失败。...Skywalking 数据库监控 • pt-query-digest: MySQL慢查询分析 • pgbadger: PostgreSQL日志分析 • Redis监控: redis-cli --latency 这些工具都是我在实际工作中用过的

1.4K10
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    首个AI软件工程师上线!已通过公司面试抢程序员饭碗,华人创始团队手握10块IOI金牌

    官方发的推特说,Devin 不仅通过了一家业内领先的人工智能公司的面试,在自由职业平台 Upwork 上也能成功接单,完成单主要求的工作。...直到昨天,他给 Devin 了一个简单的 HTML 页面,让它提取选择器,这个 GPT-4-turbo 、Claude、Groq 、LLama2 都没完成的任务,Devin 只用了大约 10 秒就搞定了...例如请它在几个不同的 API 上对 Llama 的表现进行基础测试,它首先制定了一个逐步解决问题的计划: 在完成项目的过程中,它使用了浏览器为 API 留档,以便它可以阅读并学习如何插入这些 API:...AI 在长期推理和规划方面的进展,这使它能够在每一步回忆相关的上下文,随时间学习,并修复错误。...Walden Yan 在哈佛就读期间,曾在一年级时获得第 32 届 IOI 金牌 除了这三位核心成员,还有一位 Neal Wu,他是 Scott Wu 的兄弟,他也在 Cognition AI 工作。

    30110

    构建下一代 HTTP API - 测试

    比如一个函数在字符串长度超过 140 时会出错,生成式测试使用 1000 字符的字符串找到了这个问题,之后它会一路缩小,直到找到问题的边界 141。...我们需要验证正确的输入会导致正确的 response,比如 200 OK,而不是 500 Internal error 什么的 如何通过 JSON schema 生成错误的数据?...因而,我们用 Quenya 生成的测试,测试了 Quenya 生成的 API 代码,证明了 API 代码至少在 happy path 上没有问题。...而 Quenya 生成的测试代码和 API 代码都正常工作,说明了至少 Quenya builder 和 Quenya 本身的主流程没有问题。 以己之矛攻己之盾,真是妙不可言。...所以我们要允许开发者去扩展这些测试,在执行 API 请求的上下文中进行必要的 mocking。具体思路如下: ?

    63320

    速率限制

    例如,恶意行为者可能会通过大量请求来试图使API超载或导致服务中断。通过设置速率限制,OpenAI可以阻止这种活动发生。速率限制有助于确保每个人都公平地访问API。...其他值得注意的重要事项:速率限制在组织级别和项目级别定义,而不是用户级别。速率限制根据所使用的模型而异。还对组织每月可在 API 上花费的总金额进行了限制。这些也称为“使用限制”。...OpenAI Cookbook 提供了一个 Python 笔记本,解释了如何避免速率限制错误,并提供了一个示例 Python 脚本,用于在批量处理 API 请求时保持在速率限制之下。...这种方法有很多好处:自动重试意味着您可以在不崩溃或丢失数据的情况下从速率限制错误中恢复指数退避意味着您的第一次重试可以快速尝试,同时如果您的前几次重试失败,则仍然可以获得更长的延迟将随机抖动添加到延迟中有助于避免所有重试同时发生...达到最大重试次数或引发异常 while True: try: return func(*args, **kwargs) # 在特定错误上重试

    1.6K10

    DartVM服务器开发(第十一天)--Jaguar处理请求

    上一篇:DartVM服务器开发(第十天)--Jaguar环境搭建 我们昨天学会了如何搭建jaguar这个框架,并且成功的返回了一个html页面,可以知道,Jaguar框架真的是十分的方便好用,如果大家都感觉好用可以多多到.../doJson', (ctx)=>'{"id":123}') ..serve(logRequests: true); 上面就是Jaguar处理请求的所有方法,我们来分析一下这些方法吧!...path 请求的相对地址 RouteHandle handle 路由处理使用为(ctx){}这里含有一个Context(ctx)参数 Map pathRegEx 请求路径上使用正则例如...List after 拦截器列表,在处理请求之后拦截 List onException 异常处理列表,在请求发生异常时处理 使用...请求.png 可以看到,我没有出现异常,按照正常的来走,先运行before后是responseProcessor,最后是after 那么我们制造一个异常看看有没有捕获到 ? 页面输出.png ?

    92720

    为什么开发者需要自己的可观测性

    是他们引入了一个错误吗?是同事做了什么改变吗?还是在前端和后端之间出现了某种基础设施问题? 在不好的、过去的瀑布模型时代,开发人员各自独立工作。...在今天的分布式、云原生世界中,每个软件组件都与许多其他组件交织在复杂的依赖关系网络中,工作在这些组件上的团队也是如此。...而为了获得这些答案,他们需要可观测性。 并非你所想的可观测性 在运维领域,可观测性正在风靡一时。...这样的代码存在也会暴露出一些逻辑错误,阻止代码的运行。 对预发布和发布后行为的可见性:开发人员通常在预发布环境中编码和测试。他们需要预发布的可观测性来确保应用程序在此环境中正常工作。...##Intellyx 观点 我们都遇到过加载缓慢的页面和其他性能问题,以及可怕的 HTTP 500 内部服务器错误——一个指示出现了问题的空白网页。 没有人希望看到这样的错误——尤其是开发人员。

    23710

    刚刚,OpenAI最强编程智能体上线ChatGPT

    昨天,OpenAI CEO 奥特曼预告了一项新研究,吊足了所有人的胃口。 就在刚刚,谜底揭晓!OpenAI 宣布,在 ChatGPT 中引入了 Codex 的研究预览版。...它使用强化学习在各种环境中针对真实编程任务进行训练,生成的代码能够高度反映人类的风格和 PR 偏好,精确遵循指令,并可以迭代运行测试,直到获得合格结果。...也有人认为,Codex 这个云原生的智能体实际上可以自行构建、修复并交付功能,感觉就像软件开始了大规模自我编写。...还有人现身说法,在经过对 Codex 大量测试后发现,当它正常运作时,几乎更擅长「模拟」代码正在做什么以及看起来是什么样子。.../diff 错误: 创建并使用 DEFAULT_ALCATRAZ_TIMEOUT 常量: Codex 工作原理 从今天开始,用户可以通过 ChatGPT 侧边栏访问 Codex,输入 prompt 并点击

    37610

    CTP接口入门

    注: 行情接口登录不需要提供任何信息,调用Api::ReqUserLogin即可,这里贴的代码是演示正常登录用的。...确认结算 CTP有个特别的要求,就是在交易之前,必须确认一下昨天的结算结果。 就像是在说:“嘿,你昨天输了好多钱,不要赖账,先算清楚今天再继续!”...意思是,也许在真实环境中这些就不是坑了... Api使用频率限制 Api在本地有使用频率限制,似乎是1次/秒(在doc中有说明,4.14.1)。超过这个频率的请求都会被拒绝。...考虑到接口内部实现精度可能不高,最好是认为频率被限制在了n次/秒(n小于1且无限接近于1)。 一些永远用不到的参数 一些Api参数在结构体中有,看起来好像很重要,但是其实设置成什么都无所谓。...截止目前,vn.py项目在Github上的Star已经达到5563,量化交易类开源项目第1,量化类项目第3(1、2依旧分别是Zipline和TuShare)。

    9.4K32

    13 个设计 REST API 的最佳实践

    在响应中返回错误详情 当 API 服务器处理错误时,如果能够在返回的 JSON body 中包含错误信息,对于接口调用者来说,会一定程度上帮助他们完成调试。...某天,我在将某个 API 端点集成到项目中,但是我总是收到 500 Internal Error 的错误,我调用的端点差不多看起来这样: POST: /entities ``` 调试一段时间之后...,我几乎崩溃了,因为我根本不知道我哪里做错了,直到我发现服务器之所以报 500 的错误,是因为我粗心丢掉了尾部斜杠(注:这种经历人人都会遇到,我在 SF 上遇过无数次类似的问题),当我把 URI 改成:...在各种语言中,许多专门用于构建 REST API 服务的新框架已经出现了,它们可以帮助你在不牺牲生产力的情况下,轻松地完成工作,同时遵循最佳实践。...在 NodeJS 中,Restify 似乎也是一个不错的选择,尽管我还没有尝试过。我强烈建议你给这些框架一个机会!它们将帮助你构建规范,优雅且设计良好的 REST API 服务。

    4.3K20

    难解?SAP云平台集成前路何方?

    直到最近,SAP云平台与非SAP源的产品/系统的集成工作都不是很好。 实际上,连SAP全球云平台产品营销VP Dan Lahl都表示,这是SAP的一个弱点。...除了提供这些API, SAP还发布了关于其不同应用程序的元数据。这包括它的业务合作伙伴API,它使来自SAP Ariba云采购平台的业务合作伙伴数据在S/4HANA ERP系统中可用。...“与通用数据库适配器相比,它在集成任务中节省了时间,在通用数据库适配器中,需要做更多的工作来创建特定的集成链接。”...“SAP提供连接器,即标准的API,而今天,我会说有足够多的标准API可供客户端启动。而且,每个月我们都从SAP那里获得额外的API,”Schoklitsch说到。...比如,现在有一个API对接到ServiceNow的服务管理和工作流平台,允许公司把他们所有的工单系统数据从ServiceNow转移到SAP云平台,并对进一步使用SAP生态系统的功能比如工作流、待办事项列表和连接

    1.1K20

    网传服务器被盗微软在追回

    GitHub昨天又Error 500了。 GitHub这宕机的频率,比我在GitHub上的活跃度都高了!...在故障记录网站我们可以看到,基本上每个月GitHub都有至少一起事故。 巧合的是,去年7月,GitHub也经过了Error 500,只不过当时是40多分钟,这次是30分钟。...我们的初步调查表明,我们的部署管道中引入了一个逻辑错误,表现在GitHub.com网站的后续和无关的部署中。这一系列事件破坏了一些内部系统的稳定性,使我们的恢复工作变得复杂,并导致服务中断。...所有GitHub服务已恢复正常,没有数据丢失。我们非常重视可靠性,并对此次中断事件表示诚挚的歉意。数百万人和企业依赖GitHub,我们知道我们的社区对我们可用性问题的影响感受深刻。...无论如何,还是希望GitHub能够摆脱500魔咒。毕竟越来越多的开发者将项目放在GitHub上,无论对网站本身还是开发者自己,都是无价之宝!

    86210

    在hadoop2.0上实现深度学习

    主机使用NMClient API从主机程序接收到的容器中运行命令 ? 一旦主机程序启动其需要的工作容器,它就设置一个端口与工作者进行通信。...错误率通过计算错误分类图像的总数与测试集上的图像的总数之间的比率获得。...当在每个RBM中使用每个都具有500-500-2000个隐藏单元的RBM并使用10节点分布式集群系统时,我们能够实现最佳分类错误率是1.66%。...误差率与原始算法的作者(具有500-500-2000个隐藏单位)报告的1.2%的误差率相当。我们注意到,原始实现是在单个机器上,我们的是实现在分布式系统。...参数平均步骤会使得性能的轻微降低,尽管在多个机器上分布算法的好处远远超过性能减少。下表总结了在10节点集群上运行时每个层中隐藏单元数的错误率变化。 ?

    1.2K20

    Android Q AMA: Everything we learned from Google

    在Android Q中运行的文件管理器应用程序必须使用名为Storage Access Framework的API才能继续正常工作,但是一些开发人员认为此API不如以前可用。...Stephanie Saad Cuthbertson表示,该团队正在考虑“我们如何才能在昨天最好的屏幕录制需求上做得更好。”...这是因为最近的应用程序用户界面包含在原生的启动器应用程序中,谷歌还没有找到一种方法来获得与使用Pixel Launcher库存时手势相同的无缝转换。亚当科恩肯定了谷歌计划“在发布后尽快解决这些问题。”...可以动态调整这些分区的大小。这种变化已经证明在使root访问工作方面具有挑战性,并且一些开发人员担心定制ROM正在成为目标。Iliyan Malchev向我们保证,目的不是限制自定义ROM。...该库旨在使开发人员更容易支持Android的Camera2 API,同时保持兼容性,一直到Android Lollipop。

    1.2K10

    落地k8s容易出现13个实践错误

    1 简介 在我们多年使用kubernetes的经验中,我们有幸看到了很多集群(在GCP,AWS和Azure上都是托管的和非托管的),并且我们看到一些错误在不断重复。...在需求旺盛的时间,节点的CPU被充分利用,我们的工作负载仅获得“所申请的资源”,并且受到CPU throttled,从而导致应用程序延迟,超时等增加。...但是您最终想及时查看这些使用情况指标(以回答诸如:高峰,昨天早晨等情况下的cpu使用情况之类的问题)。为此,您可以使用Prometheus,DataDog等。...在内部,我们以这种方式使用应用程序请求;我们依据应用程序在正常工作负载下的实际需求估计来设置 Pod 请求。这样,调度程序能够根据实际放置节点。...这意味着NodePort在群集中的每个节点上都打开,因此您可以使用它们中的任何一个与所需的服务(一组Pod)进行通信。

    2.3K20

    11 个常见 K8S 避雷指南详解

    在需求量大的时候,节点的 CPU 会被充分利用,而我们的工作负载只能获得 “它所要求的”,因此 CPU 会被节流,导致应用程序延迟增加、超时等。...虽然可以大致了解数字,但您最终还是希望及时看到这些使用指标(比如助于解决以下问题:在高峰期、昨天早上等时间段的 CPU 使用率是多少)。...为防止未经身份验证的用户访问这些数据,您需要使用用户名/密码或基于令牌的身份验证等支持的方法为 API 服务器配置身份验证。 这不仅关系到集群本身的安全,还关系到集群上的机密和配置的安全。...缺少 poddisruptionbudget 您在 kubernetes 上运行生产工作负载。您的节点和集群时常需要升级或退役。...通过避免这些错误,您可以高效地进行 Kubernetes 部署,并提高 Kubernetes 环境的稳定性、性能和安全性。

    63210

    零成本异步 IO (下)

    同时它还能够使我们在程序的不同部分之间建立真正清晰的抽象边界,大多数 Future 库都带有事件循环(event loop),这也是调度你的 Future 执行 I/O 的方法,但你实际上对此没有任何控制权...其次,人们遇到的大多数错误实际上是因为他们被一个晦涩难解的问题卡住了——借用问题。正是因为 Future 的设计方式存在着这种根本的局限性,导致一些很普通的编程范式都无法表达。...所以如果我们能够使这种借用被允许,那么大多数这些错误将消失,一切都将变得更易于使用,你可以使用 async 和 await 编写普通的 Rust 代码,并且一切都会正常进行。...如果我们能够表达这一点,我们就可以允许 Future 中出现自引用,进而就可以在异步函数中真正使用这些引用,并且一切都会正常工作。因此我们研究了这个问题,最终开发出了被称为 Pin 的新 API 。...而做了这个修改之后,第一个示例(详见 零成本异步 I/O (上) 的开头)的写法就能正常工作了。

    1.3K10

    API自动化测试指南

    API快速反馈 在这些情况下,需要更快的反馈。发现错误的时间越早越好,因为开发人员会立即知道他们所做的代码更改已破坏了构建,因此需要进行检查。...API负载测试 API测试的另一个好处是,您可以利用相同的功能性API自动测试来在性能测试工作中使用。很多公司使用JMeter进行负载测试,而这些测试用例都是基于API功能测试。...基本思想是,您正在使用工具进行性能测试,但是在针对您的API运行例如负载测试之前,需要确保它实际上可以正常工作。因此,您想先进行功能测试,然后可以利用功能测试脚本完成性能测试。...5xx – 500-599范围内的响应表示服务器遇到错误。 什么是REST API?...JSON无疑变得越来越流行,并且在某些情况下正在取代XML进行API数据交换。www.json.org网站描述了如何在两种结构上构建JSON: “ 名称/值对的集合。

    2.3K00

    有时 events 比 Webhooks 更好用

    这些协议很健壮,并且减轻了管理密码的负担。但一般的开发人员并不熟悉这种协议,因此更容易出现混乱和错误。(我认为 HTTP 请求签名和验证就是那种人们很难搞明白,于是永远没法完全记住的任务。)...因此,Webhooks 不仅会让你面临最终不一致的情况,而且每个人都需要为此做更多的工作。 那么我们还能用什么来保持两个系统的同步呢?...每个嵌入的对象都包含一个 object 字段,因此我们可以轻松地提取和解析它们。 事件对象自由嵌入了子对象,让我们无需轮询 API 即可全面了解发生更改的所有内容。...我们每个帐户每 500 毫秒 轮询 一次 Stripe/events 端点。 这些请求是轻量级的,除了最活跃的 Stripe 帐户之外,其他响应通常都是空的。...大多数集成无论如何都涉及某种形式的轮询,无论你是回填数据还是重放错误处理的事件。通过单个参数就能从回填切换到实时侦听新事件这样的能力是很大的优势。 3我该如何选择?

    1.7K10
    领券