首页
学习
活动
专区
圈层
工具
发布

深度强化学习智能交通 (IV) : 自动驾驶、能源管理与道路控制

在这项研究中,自主车辆协同学习如何在高速公路场景中表现。研究了基于身份的动态协调和基于位置的动态协调两种不同的协调图模型。...Sharifzadeh 等人使用逆 deep RL 方法[114]提出了一种在具有连续轨迹的自编程交通模拟器上实现无碰撞换道的驾驶模型。模型包含两个独立的智能体。...将分层控制技术实现为离散域的变道模块和连续域的间隙调整模块,并分别采用 deep RL 智能体。与其他文献类似,[119]提出了一种基于规则的 DQN 方法来解决自主车辆的换道问题。...Flow 的用户可以通过 Python 创建一个自定义网络来测试复杂的控制问题,如匝道表控制、自适应交通信号化和具有自主车辆的流量控制。...然而,与文献中的其他多智能体方法,如分布式控制、协调控制等相比,应该更具代表性。

2K10
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    ICLR 2026 | AIDD方向全景扫描

    三、技术趋势:扩散模型一统江湖,Flow Matching 异军突起 3.1 扩散模型(Diffusion Models):绝对主力 约 40% 的论文采用了扩散模型,覆盖: 分子生成:FragFM,...3.2 Flow Matching:新兴替代方案 Flow Matching 作为扩散模型的“近亲”,在本届 ICLR 有 15+ 篇论文采用: MarS-FM:分子动力学的马尔可夫状态建模 La-Proteina...值得关注的是,SE(3) 等变网络(如 E(3)NN、EGNN)在分子建模中已成为标配,几乎所有涉及 3D 结构的工作都采用了等变架构。...4.4 分子动力学 Top 5 论文 亮点 ATOM 多任务分子动力学预训练神经算子 MarS-FM 马尔可夫状态模型 + Flow Matching BioMD 全原子生物分子动力学生成模型 Geometric...预训练 + 微调:大模型范式进入分子领域 等变网络:SE(3) 等变已成为 3D 分子建模的标配 6.2 未来值得关注的方向 蛋白质-配体共设计:同时优化蛋白质和配体 多模态分子表征:结合序列、结构、

    14411

    南洋理工&普渡大学提出CFG-Zero*:在Flow Matching模型中实现更稳健的无分类器引导方法

    近年来,Flow Matching 作为一种更具可解释性、收敛速度更快的生成范式,正在逐步取代传统的基于随机微分方程(SDE)的扩散方法,成为主流模型(如 Lumina-Next、Stable Diffusion...然而,在这一技术迭代过程中,一个关键问题依然存在:如何在推理阶段更好地引导生成过程,使模型输出更加符合用户提供的文本描述。...然而在 Flow Matching 模型中,推理过程是通过解常微分方程(ODE)进行的,其每一步依赖于前一步的速度估计。...在视频生成任务中,研究者将 CFG-Zero* 集成到 Wan2.1 模型中,评估标准采用 VBench 基准套件。...CFG-Zero* 有效减少了图像跳变与不自然的位移问题。 实际测试 CFG-Zero* 在开源社区中实现了快速落地。

    51410

    Free-form Flows比扩散模型提升两个数量级

    Flow是直接最大化似然的生成模型。...在附录A.2中,我们提供了一个论点,即它可以,但它具有非常灵活的后验分布,与VAE后验中通常使用的简单分布(如高斯分布)形成对比。...在附录B.4中,我们提供了如何在实践中选择β的指导。 图2提供了一个启发性的例子。在这里,数据和潜在空间是一维的,f和g是每个只有一个参数的简单线性函数。因此,我们可以在2D图中可视化梯度景观。...其次,在两个分子生成基准测试中,我们展示了可以在正规化流中使用专门的网络。特别是,我们采用了等变图神经网络E(n)-GNN(Satorras等人,2021b)。...在表1中,我们将我们的模型与(i)基于最大似然训练的等变ODE正规化流E(n)-NF(Satorras等人,2021a),以及(ii)通过最优运输(等变)流匹配训练的两个等变ODE(Klein等人,2023

    45310

    无痛提升文本对齐!无分类引导新范式CFG-Zero*火了,支持DiffusersComfyUI

    近年来,Flow Matching作为一种更具可解释性、收敛速度更快的生成范式,正在逐步取代传统的基于随机微分方程(SDE)的扩散方法,成为主流模型(如Lumina-Next、Stable Diffusion...然而,在这一技术迭代过程中,一个关键问题依然没有被解决:如何在推理阶段更好地引导生成过程,使模型输出更加符合用户提供的文本描述。...传统的CFG策略通过对有条件与无条件预测结果进行插值来实现引导,然而在Flow Matching模型中,推理过程是通过解常微分方程(ODE)进行的,其每一步依赖于前一步的速度估计。...研究者对比原始CFG,与仅使用零初始化的CFG,发现随着模型的收敛,零初始化的收益逐渐变小,在160轮训练后出现拐点,与多元高斯实验结果吻合。...结果表明,改进后的模型在Aesthetic Quality、Imaging Quality、Motion Smoothness等方面均有所提升,呈现出更连贯、结构更稳定的视频内容,有效减少了图像跳变与不自然的位移问题

    50610

    GNN for Science: 腾讯AI Lab、清华共同发文综述等变图神经网络

    在物理领域的研究中,非常多的物理问题都会涉及建模物体的的一些几何特征,例如空间位置,速度,加速度等。这种特征往往可以使用几何图这一形式来表示。...等变图神经网络基础框架 在实际应用中,我们需要处理的图不仅包含拓扑连接和节点特征,同时也会包含一些几何特征。在使用图神经网络处理这些数据的时候,不同的特征需要满足不同的性质。...在 EGNN 基础上,GMN 扩展了模型可以描述的几何特征维度,在建模坐标信息的同时也可以同时引入更多的几何信息(如速度、加速度、角速度等)并保证等变性。...以下是对等变图神经网络模型的一个总结梳理: 等变图神经网络应用 因为可以更好的建模几何信息,等变图神经网络在从物理系统到化学物质的各种类型的现实世界几何数据中具有广泛的应用。...等变流(Equivariant Flow)验证了基于等变核的标准化流(Normalizing Flow)的可行性。  对于点云的建模 点云是对象的一种表示格式,它通过一组分配有坐标的点来描述形状。

    1.5K40

    一文通解:VAE、Diffusion 与 Flow 模型原理与联系

    借此机会,我对从 VAE、扩散模型、Flow Matching 到 MeanFlow 的技术思路进行了梳理,整理成技术文档。...MeanFlowFlow Matching论文:FLOW MATCHING FOR GENERATIVE MODELING上面介绍的去噪扩散概率模型DDPM,从标准高斯分布中采样,然后再逐步去噪生成一个目标分布的样本...r \neq t训练过程中,通过采样不同时间点对 ,网络被强制学习如何在不同时间间隔内预测平均速度,以及这些平均速度与瞬时速度之间的关系。...Unsupervised Learning - Deep Generative Model (Part II)一文理清 VAE 变分自编码器 | 原理图解+公式推导Diffusion Model 原理剖析生成扩散模型漫谈...(一)别“扩”了,我直接“流”了,Flow Matching太狠了通俗易懂的Flow Matching原理解读MeanFlow:何恺明新作,「一步到位」的生成模型

    2.5K13

    Google 推荐在 MVVM 架构中使用 Kotlin Flow

    Kotlin Flow 是什么? Kotlin Flow 解决了什么问题? Kotlin Flow 如何在 MVVM 中使用?...Google 推荐在 MVVM 中 使用 Kotlin Flow Google 推荐在 MVVM 中使用 Kotlin Flow我相信如今几乎所有的 Android 开发者至少都听过 MVVM 架构,在...有以下优点: Flow 支持线程切换、背压 Flow 入门的门槛很低,没有那么多傻傻分不清楚的操作符 简单的数据转换与操作符,如 map 等等 Flow 是对 Kotlin 协程的扩展,让我们可以像运行同步代码一样运行异步代码...,使得代码更加简洁,提高了代码的可读性 易于做单元测试 Kotlin Flow 如何在 MVVM 中使用 Jetpack 的视图模型 MVVM 架构由 View + DataBinding + ViewModel...Kotlin Flow 在 Repositories 中的使用 如果我们想在 Flow 中使用 Retrofit 或者 Room 进行网络请求或者查询数据库的操作,我们需要将使用 suspend 修饰符的操作放到

    5.7K21

    自动驾驶VLA的过去、现在和未来

    DriveMLM和DriveGPT4等早期工作采用了这种设计,模型输出如"减速并准备停车"或"向左变道"这样的高层指令,然后由下游模块将其转化为具体的控制信号。...元动作是离散的、语义化的驾驶决策,如"加速"、"减速"、"保持当前速度"、"向左变道"、"在路口右转"等。这些高层指令构成了VLM推理输出与下游控制系统之间的可解释接口。...不同于抽象的"向左变道",这类方法直接在语言空间中预测未来的坐标序列,如"在接下来的3秒内,依次到达位置(2.1, 0.3)、(4.5, 0.8)、(7.2, 1.5)"。...VLM分析场景后输出两类决策:横向决策(保持车道、左变道、右变道)和纵向决策(加速、保持、减速)。这些离散决策被编码为one-hot向量,然后注入到一个基于扩散模型的轨迹规划器中。...在扩散生成过程中,这些先验向量调制去噪网络的行为,引导轨迹朝着与VLM决策一致的方向生成。例如,当VLM决定"左变道"时,扩散模型会更倾向于生成向左偏移的轨迹样本。

    36210

    AI+Drug 文献速递 | ICLR 2025 药物设计系列 | 蛋白结构预测与建模

    (如ESM2),解决了传统序列模型缺乏结构上下文的问题。...方法以ESM3为基础,通过掩码扩散微调提出ESMDiff模型,实现序列到结构的条件生成,并利用变分下界优化潜变量分布。...通过400M参数非等变Transformer架构,结合2100万合成结构数据集(D₂₁M)和分层折叠类条件(CATH标签),实现对蛋白质 backbone 的长序列生成(最长800残基)和语义控制(如β...模型利用曲线坐标参数化分子骨架,通过反射等变图神经网络预测流场,并引入基于贪心搜索的最优传输对齐噪声与数据样本,提升生成效率。...用户可通过手绘、拖拽等操作生成新型拓扑结构,如铰链蛋白和纳米材料支架,展示了其在复杂结构设计中的灵活性。该研究为蛋白质设计提供了直观的拓扑控制工具,推动生成模型在功能蛋白和分子组装中的应用。 15.

    30310

    AI+Drug 文献速递 | 非等变 3D 分子生成新突破:旋转对齐让模型性能媲美 SOTA 且更高效

    ,旨在突破现有等变扩散模型在三维分子生成任务中面临的效率和架构复杂性问题。...该研究表明,在适当的旋转对齐机制辅助下,非等变扩散模型也能在三维分子生成任务中取得与等变模型相当的表现,打破了长期以来对等变性的依赖假设。 2....与以往方法固定前向过程不同,END 使用时间和数据依赖的神经变换来学习该过程,从而增强生成模型的表达能力。...该模型基于神经流扩散模型(Neural Flow Diffusion Models, NFDM)理论,结合等变性扩散模型(Equivariant Diffusion Models, EDM)的结构,确保生成分布对刚体变换不变...在不同任务中,模型在Tox21等分类任务上的表现优于如LD50、DILI等机制复杂的任务。此外,研究指出毒性瓶颈仍是修复失败的主要原因,而药物相似性则是次要限制因素。

    8510

    「流匹配」成ICML 2025超热门主题!网友:都说了学物理的不准转计算机

    这直接建立了物理概念与生成模型中概率分布的直接联系。...流匹配有一个对偶视角,称为 变分流匹配(Variational Flow Matching, VFM)。...当变分后验为高斯分布时,流匹配与变分流匹配是等价的。 我们从数据分布中采样一个数据点 x_1,从噪声分布中采样一个噪声点 x_0,并在它们之间插值得到某个中间点 x_t。...这是一个好消息,这意味着你可以互换使用这两个框架。 关于扩散模型与流匹配的训练过程: 权重函数的一致性:训练中使用的权重函数十分关键,它决定了模型如何平衡感知数据中不同频率成分的重要性。...在使用高阶采样器时,这种输出形式可能带来性能差异,并可能影响训练过程中的动态行为。 采样噪声调度:流匹配使用了一种简单的采样噪声调度策略,其更新规则与 DDIM 相同。

    45510

    BLIP3-o:一系列完全开源的统一多模态模型——开源架构、训练与数据集

    推理与指令遵循  将图像生成能力集成到自回归模型(如多模态大语言模型(MLLMs))中,有望继承这些模型的预训练知识、推理能力和指令遵循能力。...首先,什么应作为真实嵌入(ground-truth embeddings):我们应该使用变分自编码器(VAE)还是对比语言-图像预训练模型(CLIP)将图像编码为连续特征?...变分自编码器 变分自编码器(Variational Autoencoders,VAEs)[12, 27] 是一类生成模型,它们学习将图像编码到一个结构化的连续潜在空间中。...在本节中,我们将总结并分析不同编码器类型(例如,变分自编码器(VAEs)与CLIP编码器)和损失函数(例如,均方误差(MSE)与流匹配(Flow Matching))所带来的权衡。...同时期的工作MetaQuery [23]也使用可学习的查询来桥接冻结的预训练MLLM和预训练的扩散模型,但扩散模型采用的是变分自编码器(VAE)+流匹配(Flow Matching)策略,而不是我们BLIP3

    73810

    IJCAI 2025 | 文本到时序:用扩散模型生成高分辨率时间序列

    ,一个仅使用文本场景描述生成任意长度时间序列的多模态时间序列生成模型。...尽管扩散模型在 Text-to- X 范式(如视觉和音频数据)生成方面取得了显著成功,但其在时间序列生成中的应用仍处于非常初步的阶段。...此外,T2S 通过 Flow Matching 对齐文本嵌入与潜在时序嵌入,并使用 Diffusion Transformer 作为去噪器。...基于条件扩散模型的时间序列生成:相比之下,生成建模,如变分自编码器(VAEs)、扩散模型(diffusion models)和大型语言模型(LLMs)为基于文本描述生成时间序列提供了更通用的框架。...Flow Matching:相关理论2210.02747以及系列Text-X的应用如Movie GenStable Diffusion 3MusicFlow和本文的实验经验发现,flow matching

    1.1K20

    医学图像配准 | Voxelmorph 微分同胚 | MICCAI2019

    2 模型结构 ? 2.1 简单 模型结构不复杂: 两个图片先做concatenate,然后输入到Unet中,然后Unet输出一个从moving到fixed图片的速度场。...Default is False. ''' # 先把fixed和moving两个图片拼接起来,放到Unet模型中,提取中一个特征 x = torch.cat...self.resize(pos_flow) preint_flow = pos_flow # 这个是如果使用了双向配准的话 neg_flow = -pos_flow...= self.fullsize(neg_flow) if self.bidir else None # 计算这个速度场作用在moving上的结果,如果使用了双向配准,则还需要把速度场反向作用在...整个网络也不难理解,其实这个voxelmorph代码中已经使用了微分同胚和双向配准的方案,目前使用变分推断的prob-voxelmorph模型github仓库中作者还没有提供torch的代码,所以目前还没有这个部分

    3K40

    Flow Matching生成模型:从理论基础到Pytorch代码实现

    去噪扩散隐式模型(DDIM)通过消除微分方程中的随机性,实现了扩散过程的确定性版本。这些扩散ODE方法使用确定性求解器实现更快的逆向计算。...Flow Matching理论基础 问题定义与数学描述 图像生成任务的核心在于建模样本如何从简单的初始分布(如高斯噪声)移动到复杂的数据分布(如自然图像)。...在每个训练步骤中,我们在[0,1]范围内选择随机时间,计算Flow Matching损失,并使用Adam优化器更新参数。随着训练进行,模型逐渐学会连接两个分布的速度场。...,我们从噪声分布中的一个点开始,使用学习的速度场f(x,t)向前推动它。...带分数模型的Flow Matching方法开始结合两种模型的优势,使用基于分数的目标来训练Flow Matching模型。

    89211

    56倍加速生成式策略:西交大提出EfficientFlow,迈向高效具身智能

    该方法通过将等变建模与高效流匹配(Flow Matching)深度融合,在显著提升数据效率的同时,大幅压缩推理所需的迭代步数,在多个机器人操作基准上实现了 SOTA 的性能,并将推理速度提升一个数量级以上...等变网络:让模型学会「举一反三」 EfficientFlow 等变设计的核心逻辑非常直观:如果输入的视觉场景旋转了一定角度,那么机器人输出的动作自然也该跟随旋转相同的角度。...模型将等变群设定为一个有限循环子群 ,使用一个等变观测编码器将观测 映射为嵌入 ,使用一个等变动作编码器将动作序列 映射为嵌入 ,编码后的嵌入 , 与时间 t 一起被输入到等变神经网络中。...得益于各部件的等变设计,模型实现了从原始输入到预测动作的全流程 等变性。 3....为了保持模型探索多样化行为的能力,模型引入了周期性重置:每 10 个预测周期,从批次中随机选择一条轨迹进行执行,而不是选择最小化重叠距离的那一条。

    19710

    ICLR2020 | GraphAF:基于FLOW的分子图自回归生成模型

    受深度生成模型最新进展的启发,本文提出了一种基于Flow的图生成自回归模型,称为GraphAF。...目前出现的先进的机器学习算法包括变分自编码器,生成对抗网络与循环神经网络等,图1中展示了以前最先进的分子图生成模型。其中训练过程的比较只在自回归模型之间进行。 ? 图1....分子图生成模型 最近,除了上述三种生成模型外,Flow已经取得了显著进展,并成功应用于密度估计、变分推理和图像生成。基于Flow的方法定义了潜在分布(例如高斯分布)和真实世界的高维数据之间的可逆变换。...同时,通过使用隐空间和观测空间之间的多层非线性变换,Flow对数据密度的建模能力很高。此外,根据不同应用场景的要求,可以设计不同的架构来促进快速训练或快速采样。...在训练过程中,作者通过使用掩蔽来定义输入分子图G和输出隐变量之间的前馈神经网络来进行并行计算。为了进一步加快训练过程,训练图的节点和边缘根据广度优先搜索(BFS)顺序进行重新排序。

    1.7K40
    领券