首页
学习
活动
专区
工具
TVP
发布

DeepHub IMBA

不可错过的AI方向干货分享,赶紧关注吧 internet + machine learning +big data +architecture = IMBA
专栏成员
1466
文章
1604849
阅读量
67
订阅数
DeepMind的新论文,长上下文的大语言模型能否取代RAG或者SQL这样的传统技术呢?
长上下文大型语言模型(LCLLMs)确实引起了一些关注。这类模型可能使某些任务的解决更加高效。例如理论上可以用来对整本书进行总结。有人认为,LCLLMs不需要像RAG这样的外部工具,这有助于优化并避免级联错误。但是也有许多人对此持怀疑态度,并且后来的研究表明,这些模型并没有真正利用长上下文。还有人声称,LCLLMs会产生幻觉错误,而其他研究则表明,较小的模型也能高效解决这些任务。
deephub
2024-07-01
60
MOFA-Video:可以为图片中的物体添加运动效果,还可以通过简单的箭头指示来控制物体的运动方向
腾讯最近推出了一个开源项目,名为MOFA-Video,这是一款具有突破性的视频控制技术,它允许用户通过简单的箭头指示来控制视频中的运动方向。这项技术的推出,不仅表明了腾讯在人工智能领域的持续创新,也预示着视频生产与动画制作将迎来一场革命。
deephub
2024-07-01
70
深入解析高斯过程:数学理论、重要概念和直观可视化全解
与其他算法相比,高斯过程不那么流行,但是如果你只有少量的数据,那么可以首先高斯过程。在这篇文章中,我将详细介绍高斯过程。并可视化和Python实现来解释高斯过程的数学理论。
deephub
2024-07-01
50
Meta发布基于大语言模型的编译器LLM Compiler,不仅可以编译成汇编代码,还可以进行反编译
LLM Compiler是一个开源模型,旨在优化代码并彻底改变编译器设计。通过在庞大的语料库上训练,包括5460亿个LLVM-IR和汇编代码标记,Meta的研究团队使模型能够深入理解编译器中间表示、汇编语言和优化技术。这种理解的增强使得LLM Compiler能够执行以前仅限于人类专家或专业工具的任务,如代码大小优化、反汇编等。
deephub
2024-07-01
30
Transformer 能代替图神经网络吗?
当Transformer模型发布时,它彻底革新了机器翻译领域。虽然最初是为特定任务设计的,但这种革命性的架构显示出它可以轻松适应不同的任务。随后成为了Transformer一个标准,甚至用于它最初设计之外的数据(如图像和其他序列数据)。
deephub
2024-07-01
20
谷歌发布新一代大语言模型Gemma 2,重新设计了整体架构有9B和27B两种版本
近日,谷歌公司发布了其最新的大语言模型Gemma 2,向全球研究人员和开发人员开放。新发布的Gemma 2模型有90亿参数(9B)和270亿参数(27B)两种版本。相比于第一代模型,Gemma 2在推理性能和效率方面有了显著提升,同时在安全性上也取得了重要进展。
deephub
2024-07-01
100
RAG流程优化(微调)的4个基本策略
在本文中,我们将介绍使用私有数据优化检索增强生成(RAG)的四种策略,可以提升生成任务的质量和准确性。通过使用一些优化策略,可以有效提升检索增强生成系统的性能和输出质量,使其在实际应用中能够更好地满足需求。
deephub
2024-07-01
50
Yann LeCun团队发布以视觉为中心方法设计的开源多模态大模型 Cambrian-1
纽约大学的谢赛宁教授和Yann LeCun团队最近发布了一种开源的多模态大型语言模型(MLLM),名为“Cambrian-1”。这一研究重点探讨了视觉表征学习对于理解语言的重要性,并提出了一种以视觉为中心的方法来设计多模态模型。该团队全面开源了模型权重、代码、数据集以及详细的指令微调和评估方法,这一举措在学术界和工业界均引起了广泛关注。
deephub
2024-07-01
80
Theta方法:一种时间序列分解与预测的简化方法
Theta方法整合了两个基本概念:分解时间序列和利用基本预测技术来估计未来的价值。
deephub
2024-07-01
60
一个简单的解决办法解决 OpenAI 封锁非支持地区 API 使用
OpenAI即将对不支持地区的API用户进行封禁,从7月9日起生效。这一变化引发了开发者和企业客户的广泛关注,尤其是那些依赖OpenAI API进行应用开发和服务的公司。此次封禁不仅影响到位于服务范围之外的用户,甚至一些位于支持国家的用户也报告说收到了警告邮件。这表明OpenAI在加强其服务的合法性和区域限制。
deephub
2024-07-01
40
精选:15款顶尖Python知识图谱(关系网络)绘制工具,数据分析的强力助手
知识图谱(关系网络)可以用简单的形状和线条显示复杂的系统,帮助我们理解数据之间的联系。我们今天将介绍15个很好用的免费工具,可以帮助我们绘制网络图。
deephub
2024-07-01
50
苹果和洛桑联邦理工学院发布全新视觉模型4M-21,单模型可以处理21种模态任务
苹果公司与瑞士洛桑联邦理工学院(EPFL)联手打造了一款前沿的全能视觉模型4M-21,该模型通过跨模态的大规模协同训练,实现了在21种不同模态下的优异表现。4M-21模型的推出,标志着从传统单模态优化模型向多模态综合处理能力的重大转变。
deephub
2024-07-01
100
2024年6月上半月30篇大语言模型的论文推荐
大语言模型(LLMs)在近年来取得了快速发展。本文总结了2024年6月上半月发布的一些最重要的LLM论文,可以让你及时了解最新进展。
deephub
2024-07-01
80
特征工程与数据预处理全解析:基础技术和代码示例
在机器学习和数据科学的世界里,数据的质量是建模成功与否的关键所在。这就是特征工程和数据预处理发挥作用的地方。本文总结的这些关键步骤可以显著提高模型的性能,获得更准确的预测,我们将深入研究处理异常值、缺失值、编码、特征缩放和特征提取的各种技术。
deephub
2024-07-01
50
Claude 3.5 Sonnet 超越 GPT-4o成为最智能的模型,新功能artifacts可以实时查看和迭代生成的代码
Anthropic 最新的 AI 模型,Claude 3.5 Sonnet,已成为业界的热点。这款模型被认为是目前最先进的,超越了市场上所有其他 AI 模型。让我们来详细了解一下。
deephub
2024-07-01
60
2024年6月计算机视觉论文推荐:扩散模型、视觉语言模型、视频生成等
6月还有一周就要结束了,我们今天来总结2024年6月上半月发表的最重要的论文,重点介绍了计算机视觉领域的最新研究和进展。
deephub
2024-07-01
130
免费商用!混元文生图大模型全面开源,不仅包括训练的全部过程和文档,附带的插件还可以使用一张图生成定制的专属的模型
近日,腾讯的混元文生图大模型宣布全面开源训练代码,并对外发布了混元 DiT LoRA 小规模数据集训练方案与可控制插件ControlNet。这标志着全球的企业与个人开发者、创作者们可以基于混元DiT训练代码进行精调,创建更具个性化的专属模型,进而进行更大自由度的创作;或基于混元DiT的代码进行修改和优化,基于此构建自身应用,推动技术的快速迭代和创新。
deephub
2024-07-01
40
使用粒子滤波(particle filter)进行视频目标跟踪
虽然有许多用于目标跟踪的算法,包括较新的基于深度学习的算法,但对于这项任务,粒子滤波仍然是一个有趣的算法。所以在这篇文章中,我们将介绍视频中的目标跟踪:预测下一帧中物体的位置。在粒子滤波以及许多其他经典跟踪算法的情况下,我们根据估计的动态进行预测,然后使用一些测量值更新预测。
deephub
2024-07-01
80
Meta一口气开源了4个模型和1个数据集和1个评估方法:包括对标GPT4o的多模态模型,多词预测模型,音乐生成模型,音频水印等
Chameleon模型是一种早期融合的基于令牌的混合模态模型家族,能够以任意顺序理解和生成图像与文本。该模型由研究团队提出,包含了从模型初始训练到对齐和架构参数设置的稳定方法,特别适用于早期融合的混合模态环境。
deephub
2024-07-01
40
HUSKY:一个优化大语言模型多步推理的新代理框架
推理被高度认可为生成人工智能的下一个前沿领域。通过推理,我们可以将任务分解为更小的子集并单独解决这些子集。例如以前的论文:思维链、思维树、思维骨架和反射,都是最近解决LLM推理能力的一些技术。此外推理还涉及一些外围功能,例如访问外部数据或工具。在最近的几年里,我们已经看到模型在特定的推理技术中表现得非常好,但它们无法跨领域推广。这是Meta AI、Allen Institute of AI和University of Washington的研究人员在最近一篇论文中所要解决的问题。
deephub
2024-07-01
80
点击加载更多
社区活动
AI代码助手快速上手训练营
鹅厂大牛带你玩转AI智能结对编程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档