产业资讯
斯坦福研究人员称GPT-4能力下降
斯坦福大学和加利福尼亚大学的研究人员发表的一篇论文显示,GPT-4的输出质量在过去几个月中有所下降。尽管一些专家对该论文表示怀疑,但关于GPT-4质量是否下降的不确定性指向了OpenAI在处理其模型发布时面临的更大问题。关于GPT-4性能下降的普遍理论包括OpenAI减少计算开销、微调产生意外影响以及OpenAI降低其功能以便更多人支付GitHub Copilot的费用。OpenAI一直否认其模型的能力下降。
理解GPT-4思维的变化
该研究探讨了对流行的 AI 语言模型GPT-3.5和GPT-4的更新如何改变它们在数学问题求解、回答棘手问题、编写代码和视觉思维等任务中的表现。
Llama 2是真正的东西,RLHF是关键
HuggingFace的RLHF负责人:虽然增加训练语料库确实有所帮助,但Meta的人员声称奖励模型和RLHF过程是Llama 2发布的安全和有用模型的关键。
为什么Meta开源了Llama 2?
Meta开源Llama 2的主要原因有两个:它减少了拥有专有模型的竞争对手的优势,并提供了Meta自己商业产品的免费层或补充。
工程研究
多模态学习的一种新方法
本文的作者提出了一种名为SHARCS的系统,它可以同时从文本、图片和声音等不同类型的数据中学习。它通过找到这些不同数据类型中的共同概念,并以易于理解的方式将它们联系在一起,从而帮助改进预测和找到丢失的数据。
视频对象跟踪:基于点的分割方法
该研究介绍了SAM-PT,这是一个利用Segment Anything Model(SAM)改进视频中对象跟踪和分割的新系统。SAM-PT在多个视频分割基准测试中表现出卓越的性能。
RepViT:用于图像识别的高效架构
研究人员通过结合轻量级Vision Transformers和传统卷积神经网络的高效设计元素,开发了一种名为RepViT的新型轻量级神经网络。
指代视频对象分割
该存储库介绍了一种用于指代视频对象分割的高效在线模型,即OnlineRefer。指代视频对象分割是一种根据人类指令在视频中识别和分割对象的技术。
令人印象深刻的手物体接触估计数据集
估计手何时与物体接触是增强现实/虚拟现实和机器人技术的关键挑战。在深度学习中,数据至关重要。这个新的大规模数据集包含了数百万个标注帧,用于各种任务,如手部重建、合成物体运动等。
为什么要使用计算机生成的数据来训练AI模型
AI 公司正在探索一种获取用于开发强大的生成模型所需的海量数据的新途径:从零开始创建信息。
效率资源
Keras Core发布了!
Keras Core是Keras 3.0秋季版本的预览。Keras Core是对Keras代码库的全面重新构想,建立在模块化后端架构之上,使得Keras工作流程可以在任何框架上运行,最初包括TensorFlow、JAX和PyTorch。
Superhuman AI
受欢迎的电子邮件客户端Superhuman刚刚推出了一套AI功能。
Retake
Retake提供了用于向量数据流的基础架构。它具有开箱即用的数据同步、实时更新和可扩展的Python开发工具包。Retake稳定高效,可在任何地方部署。它确保输入、真实数据源和向量之间的一致性,无需维护管道的时间、复杂性和成本。
领取专属 10元无门槛券
私享最新 技术干货