Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >java防止接口重复请求_前端防止重复提交

java防止接口重复请求_前端防止重复提交

作者头像
全栈程序员站长
发布于 2022-09-27 04:42:19
发布于 2022-09-27 04:42:19
2.1K00
代码可运行
举报
运行总次数:0
代码可运行

大家好,又见面了,我是你们的朋友全栈君。

Popular MVC框架接口防重复提交功能使用示例

简介

1、简介

此项目用于演示如何使用popularmvc提供的接口防重复提交功能。使用防重提交功能,只需要在需要防重的接口上添加@RequiredNoRepeatSubmit注解即可。主要有以下内容:

  1. 防重复提交码模式
    • 自定义防重复提交码 自定义防重复提交码需要调用者保证防重复提交码的全局唯一性,推荐结构:userId+timestamp

    timestamp在数据更新后才允许更新

    • 使用sign作为防重码 如果接口开启了数字签名,则可以直接使用数字签名值sign作为防重复提交码,sign的算法自然就保证了防重码的唯一性
  2. 开启接口防重提交功能,避免因用户误操作重复提交而导致的多次相同的脏数据

对于一些新增数据的接口通常需要进行接口的防重复提交保护,如:用户账号注册、用户下单、用户发帖等等类似的应用场景。 防重复提交主要应用场景是避免用户短时间内由于误操作导致同一份数据被保存多次所带来的问题,如果被保存的数据内容存在唯一标识限制则可以选择不使用防重复提交,在业务侧保证数据的唯一性即可。 注意:防重复提交只能防止短时间内用户的误操作导致插入重复数据的问题,如果需要数据的唯一性还是需要在业务中自行处理。

项目示例

1 项目结构

项目结构

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
│  pom.xml
│  README.md
│      
└─src
    ├─main
    │  ├─java
    │  │  └─com
    │  │      └─danyuanblog
    │  │          └─framework
    │  │              └─demo
    │  │                  └─popularmvc
    │  │                      │  StartDemoApplication.java
    │  │                      │  
    │  │                      └─controller
    │  │                          │  TestDenyRepeatSubmitController.java
    │  │                          │  
    │  │                          └─dto
    │  │                                  UserInfoDto.java
    │  │                                  
    │  └─resources
    │          application.yml
    │          
    └─test
        └─java
            └─com
                └─danyuanblog
                    └─framework
                        └─popular
                            └─mvc

引入模块依赖,在pom.xml添加

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
	<dependency>
		<groupId>com.danyuanblog.framework</groupId>
		<artifactId>popular-web-mvc</artifactId>
		<version>${popular-web-mvc.version}</version>
	</dependency>

2 启用PopularMvc框架

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
/** * Title StartDemoApplication.java * Description * @author danyuan * @date Oct 31, 2020 * @version 1.0.0 * site: www.danyuanblog.com */ 
package com.danyuanblog.framework.demo.popularmvc;

import org.springframework.boot.SpringApplication;
import org.springframework.boot.autoconfigure.SpringBootApplication;
import com.danyuanblog.framework.popularmvc.annotation.EnablePopularMvc;

@SpringBootApplication
@EnablePopularMvc
public class StartDemoApplication { 
   

	public static void main(String[] args) { 
   
		SpringApplication.run(StartDemoApplication.class, args);
	}
}

3 配置信息

错误码配置信息如下application.yml

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
popularmvc:
  #防重复提交码过期时间,开启防重的接口默认为2分钟内不允许提交相同的数据,这里我们可以修改为3分钟
  noSubmitRepeatTimeoutSeconds: 180
  api: 
    channels:
      default: #用于不区分渠道信息的应用
        default: #默认的秘钥信息
          enable: true
          #用于对称加解密、生成数字签名、验证数字签名的秘钥
          secret: "123456"
          keyPair: #用于非对称加解密的秘钥对
            privateSecret: ""
            publicSecret: ""
        appId1: #某个应用下的秘钥信息
          enable: true
          #用于对称加解密、生成数字签名、验证数字签名的秘钥
          secret: "123456"
          keyPair: #用于非对称加解密的秘钥对
            privateSecret: ""
            publicSecret: ""
      android:
        default:
          enable: true
          #用于对称加解密、生成数字签名、验证数字签名的秘钥
          secret: "123456"
          keyPair: #用于非对称加解密的秘钥对
            privateSecret: ""
            publicSecret: ""
      ios: 
        default: 
          enable: true
          secret: "12345678"  
          keyPair:
            privateSecret: ""
            publicSecret: ""  

4 演示代码解析

4.1 接口防重提交使用示例

业务异常的使用主要分两种应用场景:

  1. 开启验证请求数据数字签名的接口,再开启防重复提交可以选择使用数字签名sign作为防重码
  2. 未开启数字签名的接口,需要调用者自己生成一个全局唯一的防重码

示例代码如下所示。

接口源码TestDenyRepeatSubmitController.java

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
/** * Title TestDenyRepeatSubmitController.java * Description * @author danyuan * @date Jan 5, 2021 * @version 1.0.0 * site: www.danyuanblog.com */ 
package com.danyuanblog.framework.demo.popularmvc.controller;

import lombok.extern.slf4j.Slf4j;
import io.swagger.annotations.Api;
import io.swagger.annotations.ApiOperation;

import org.springframework.web.bind.annotation.PostMapping;
import org.springframework.web.bind.annotation.RequestBody;
import org.springframework.web.bind.annotation.RestController;

import com.danyuanblog.framework.demo.popularmvc.controller.dto.UserInfoDto;
import com.danyuanblog.framework.popularmvc.annotation.RequiredNoRepeatSubmit;
import com.danyuanblog.framework.popularmvc.annotation.RequiredSign;
import com.danyuanblog.framework.popularmvc.consts.DenyRepeatSubmitType;
import com.danyuanblog.framework.popularmvc.utils.IOUtils;

@Api(tags = "测试接口防重复提交相关接口列表")
@RestController
@Slf4j
public class TestDenyRepeatSubmitController { 
     
	
	@PostMapping(value="testUserAccountRegistNoRepeatSubmit",
			name="测试注册用户账号接口防重复提交功能")
	@ApiOperation(value="测试注册用户账号接口防重复提交功能", notes="防重复提交码由客户端生成,防止同一用户重复注册!")
	@RequiredNoRepeatSubmit(mode = DenyRepeatSubmitType.GENERATE_TOKEN)
	public void testUserAccountRegistNoRepeatSubmit(@RequestBody UserInfoDto userInfo){ 
     
		try { 
     
			//模拟业务执行需要的耗时
			Thread.sleep(3000);
		} catch (InterruptedException e) { 
     
			log.error(IOUtils.getThrowableInfo(e));
		}
		log.info("保存用户信息成功[{}]!",userInfo.toString());		
	}
	
	@PostMapping(value="testUserAccountRegistNoRepeatSubmitBySign",
			name="测试注册用户账号接口防重复提交功能数字签名模式")
	@ApiOperation(value="测试注册用户账号接口防重复提交功能数字签名模式", notes="使用数字签名,防止同一用户重复注册!")
	@RequiredNoRepeatSubmit(mode = DenyRepeatSubmitType.USE_SIGN)
	@RequiredSign
	public void testUserAccountRegistNoRepeatSubmitBySign(@RequestBody UserInfoDto userInfo){ 
     
		try { 
     
			//模拟业务执行需要的耗时
			Thread.sleep(3000);
		} catch (InterruptedException e) { 
     
			log.error(IOUtils.getThrowableInfo(e));
		}
		log.info("保存用户信息成功[{}]!",userInfo.toString());
	}
}

DTO UserInfoDto.java

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
/** * Title UserInfoDto.java * Description * @author danyuan * @date Nov 29, 2020 * @version 1.0.0 * site: www.danyuanblog.com */ 
package com.danyuanblog.framework.demo.popularmvc.controller.dto;

import java.io.Serializable;
import java.util.List;

import com.danyuanblog.framework.popularmvc.annotation.Encrypt;
import com.danyuanblog.framework.popularmvc.annotation.IgnoreSign;

import lombok.Data;

@Data
public class UserInfoDto implements Serializable{ 
     /** *serialVersionUID */
	private static final long serialVersionUID = 1L;

	private String username;
	@IgnoreSign
	private Integer age;
	@Encrypt
	private String desc;
	
	private List<UserInfoDto> friends;
}

4.2 结果演示

使用数字签名的方式

请求

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
curl -X POST -H  "Accept:*/*" -H  "Request-Origion:Knife4j" -H  "Content-Type:application/json" -d "{\"age\":22,\"desc\":\"sdfsdfsd\",\"friends\":[{\"age\":13,\"desc\":\"sfsdfds\",\"friends\":[],\"username\":\"sdfsd\"}],\"username\":\"fghhfghgf\"}" "http://localhost:8080/testUserAccountRegistNoRepeatSubmitBySign?sign=BAEADE359BE6DB2BDC3E04DBEAEFA363ACE63541&timestamp=235353453"

同时发起两个相同接口调用A和B (A稍微先于B一点),调用结束后再发起一个C接口调用

结果

A请求的结果:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
{ 

"code": 0
}
 

B请求的结果:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
{ 

"msg": "您提交的请求正在处理,请耐心等待!",
"code": 130006
} 

C请求的结果:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
{ 

"msg": "你的请求数据已提交成功,请勿重复提交!",
"code": 130007
} 

自定义防重码方式

与数字签名模式不同的地方就是需要客户端定义防重复提交码的值,请求内容如下:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
curl -X POST -H  "Accept:*/*" -H  "Request-Origion:Knife4j" -H  "Content-Type:application/json" -d "{\"age\":22,\"desc\":\"sdfsdfsd\",\"friends\":[{\"age\":13,\"desc\":\"sfsdfds\",\"friends\":[],\"username\":\"sdfsd\"}],\"username\":\"fghhfghgf\"}" "http://localhost:8080/testUserAccountRegistNoRepeatSubmit?repeatCode=555123234234&timestamp=123234234"

测试方式和结果和数字签名模式相同

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/188536.html原文链接:https://javaforall.cn

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
中科院/中科大/芝加哥大学创新动态Token合并框架,无需微调,依然强大,零样本视频理解的突破性进展!
最近多模态大型语言模型(MLLMs)的先进发展,为视频理解开辟了新的途径。然而,在零样本视频任务中实现高保真度仍然具有挑战性。
AIGC 先锋科技
2025/01/07
2760
中科院/中科大/芝加哥大学创新动态Token合并框架,无需微调,依然强大,零样本视频理解的突破性进展!
字节提出 MammothModa | 超越 LLaVA,集成视觉能力的多模态大型语言模型 !
近期,多模态大型语言模型(MLLMs)因其能够理解和生成受视觉输入影响的语言而受到了广泛关注。这些模型融合了视觉和文本数据,使得应用范围涵盖了图像字幕生成、视觉问答和视频分析等众多领域。尽管取得了进展,但许多MLLM在有效结合高分辨率和长时程视觉输入与复杂的语言理解方面,同时保持简洁和高效性方面仍面临挑战。
AIGC 先锋科技
2024/07/11
2920
字节提出 MammothModa | 超越 LLaVA,集成视觉能力的多模态大型语言模型 !
​中科大 & 腾讯微信 & 新加坡国立大学 & 复旦等 将视觉特征与 LLM 的参数空间对齐,LoRA 再升级, 效率更上一层!
大型语言模型(LLM)在大多数自然语言任务上取得了令人鼓舞的性能,并在解决现实世界问题中展现出了强大的泛化能力。从LLM派生出的多模态大型语言模型(MLLM)通过感知现实世界的视觉信息,向人工通用智能(AGI)迈出了一步。因此,感知视觉信息的方式是从LLM向MLLM转变的关键。
AIGC 先锋科技
2024/07/08
2890
​中科大 & 腾讯微信 & 新加坡国立大学 & 复旦等 将视觉特征与 LLM 的参数空间对齐,LoRA 再升级, 效率更上一层!
港中文提出少即是多,高效多模LLMs的简单但有效的令牌减少方法 !
随着大规模语言模型(MLLM)的快速发展,它们在各种领域展现出优越甚至超人的性能。然而,这种进步伴随着这些模型消耗资源的显著增加。因此,研究社区开始更加关注开发高效的大型语言模型。
AIGC 先锋科技
2024/10/12
1820
港中文提出少即是多,高效多模LLMs的简单但有效的令牌减少方法 !
轻量级视频压缩(LVC):以最小成本迁移长视频理解能力,解决VLMs采样问题并提升多模型性能 !
大语言模型(LLMs)的快速发展推动了视频理解研究范式的转变,从传统的以视觉为中心的方法转向利用跨模态对齐能力的基于LLM的框架。这种由LLM驱动的革命体现在两种主要架构中:在视频-文本对齐数据上预训练的视频LLMs[3, 16, 23]和以图像-文本对齐[19, 25]为核心的视觉语言模型(VLMs)。
AIGC 先锋科技
2025/05/14
860
轻量级视频压缩(LVC):以最小成本迁移长视频理解能力,解决VLMs采样问题并提升多模型性能 !
颜水成挂帅,奠定「通用视觉多模态大模型」终极形态!一统理解/生成/分割/编辑
这是一款重磅的通用视觉多模态大模型,支持从视觉理解到视觉生成、从低层次到高层次的一系列视觉任务,解决了困扰大语言模型产业已久的图像/视频模型割裂问题,提供了一个全面统一静态图像与动态视频内容的理解、生成、分割、编辑等任务的像素级通用视觉多模态大模型,为下一代通用视觉大模型的终极形态奠定了基础,也标志着大模型迈向通用人工智能(AGI)的又一大步。
新智元
2024/04/26
6480
颜水成挂帅,奠定「通用视觉多模态大模型」终极形态!一统理解/生成/分割/编辑
MLLM首篇综述 | 一文全览多模态大模型的前世、今生和未来
近年来,大型语言模型取得了显著进展。通过扩大数据大小和模型大小,这些LLM提高了惊人的涌现能力,通常包括上下文学习(ICL)、指令跟随和思想链(CoT)。尽管LLM在大多数自然语言处理(NLP)任务中表现出了令人惊讶的Zero/Few-Shot推理性能,但它们天生对视觉“视而不见”,因为它们只能理解离散文本。
集智书童公众号
2023/09/04
13.4K0
MLLM首篇综述 | 一文全览多模态大模型的前世、今生和未来
视觉语言模型导论:这篇论文能成为你进军VLM的第一步
近些年,语言建模领域进展非凡。Llama 或 ChatGPT 等许多大型语言模型(LLM)有能力解决多种不同的任务,它们也正在成为越来越常用的工具。
机器之心
2024/06/17
7460
视觉语言模型导论:这篇论文能成为你进军VLM的第一步
西湖大学 & 苏大提出 PiTe | 大型视频语言模型的空间与时间维度下的精细对齐研究 !
大型语言模型(LLMs)在AI领域迅速获得了 popularity ,展示了惊人的在各种自然语言任务上的能力。LLMs 强大的语言理解能力促使研究行人探索其在解决更广泛跨领域的任务中的实用性。因此,越来越多的研究专注于开发全面的 Large Visual-Language Models(LVLMs)以解决零样本设置下的视觉相关任务,特别是在视频理解方面。通用 Large Video-Language Models(LVidLMs)的追求将面临长期挑战。在此过程中,实现 LLMs 中固有的杰出理解、推理和生成能力的有效利用至关重要。
AIGC 先锋科技
2024/11/19
1720
西湖大学 & 苏大提出 PiTe  | 大型视频语言模型的空间与时间维度下的精细对齐研究 !
Y-MoD:探索深度混合适应性,适用于多模式大语言模型 !
近年来,自然语言处理(NLP)领域大型语言模型(LLMs)取得了巨大成功,这吸引了越来越多的关注,以将其扩展到视觉语言(VL)任务。尽管取得了进步,但最近的多模态大型语言模型(MLLMs)往往受到其昂贵的计算成本的批评。例如,现有 MLLMs 的推理速度仍远低于实际需求,例如每秒4.7个样本。受NLP进步的推动,最近的技术进步采用了混合专家(MoEs)来减少MLLMs的“激活参数”,从而在效率和性能之间实现了权衡。
AIGC 先锋科技
2024/11/06
1550
Y-MoD:探索深度混合适应性,适用于多模式大语言模型 !
清华 & 港中文 & 香港科技 深入探究 LLM, 利用大型语言模型理解视频和动作序列的多模态人类行为!
理解人类行为,如细粒度标注和分析,在以人为中心的多模态智能领域[21, 25, 93]至关重要,并且可以从人机交互和机器人技术到医疗保健和安保的具身智能中受益。
AIGC 先锋科技
2024/07/08
5350
清华 &  港中文 & 香港科技 深入探究 LLM, 利用大型语言模型理解视频和动作序列的多模态人类行为!
VG4D | 突破4D点云识别局限,融合视觉-语言模型实现动作识别新高度!
近期,机器人技术和自动驾驶系统利用实时的深度传感器,如激光雷达(LiDARs),来实现三维感知。激光雷达产生的点云可以提供丰富的几何信息,并帮助机器理解环境感知。早期方法集中于从静态点云中解析现实世界,忽略了时间变化。为了更好地理解时间变化的世界,近期研究更专注于在4D空间理解点云视频,包括三个空间维度和一个时间维度。已有几项工作在4D点云建模方面取得进展。这些方法要么旨在设计改进的网络来建模4D点云,要么采用自监督方法来提高4D点云表示的效率。
AIGC 先锋科技
2024/07/08
4390
VG4D | 突破4D点云识别局限,融合视觉-语言模型实现动作识别新高度!
北大等提出Video-LLaVA视觉语言大模型,在多个评估榜单中名列前茅
北京大学和其他机构的研究人员近期提出了一种名为Video-LLaVA的视觉语言大模型。该模型的创新之处在于能够同时处理图片和视频作为输入。
CV君
2023/11/27
4090
北大等提出Video-LLaVA视觉语言大模型,在多个评估榜单中名列前茅
利用大型语言模型和扩散模型大规模生成视觉最小变化数据,提升VLMs的细粒度理解能力 !
细粒度地理解目标、属性及其关系对于视觉-语言模型(VLMs)有效泛化到新的、未见过的场景和构图至关重要。以往的研究如ARO [40] 和 Sugarcrepe [8],强调了VLMs在这一领域的不足,主要关注于理解两个非常相似的标题之间的细粒度差异——一个人工编写的标题和自动生成的硬负例2标题,其中硬负例标题与原标题仅在目标、属性或两个目标之间的关系上有所不同。虽然可以通过基于规则的方法合成标题的硬负例,但为图像合成这样的硬负例则非常具有挑战性。
AIGC 先锋科技
2024/07/31
3340
利用大型语言模型和扩散模型大规模生成视觉最小变化数据,提升VLMs的细粒度理解能力 !
斯坦福利用视觉表示法则优化多模态语言模型,计算成本降低 99.7% !
当前的多模态大型语言模型(MLLM)通过将预训练的视觉编码器与强大的语言模型(Touvron等人,2023;Zheng等人,2023)整合,已经取得了显著的进展。作为通用的MLLM的一个核心组成部分,视觉表示至关重要。许多研究行人使用了CLIP 作为主要的图像特征编码器,但其局限性逐渐显现出来。因此,正在积极探讨替代的视觉表示和视觉编码器的组合。
AIGC 先锋科技
2024/09/10
1590
斯坦福利用视觉表示法则优化多模态语言模型,计算成本降低 99.7% !
浙大 & 西湖 | 提出Cobra多模态大模型,整合Mamba,计算效率大幅提升!
近年来,多模态大型语言模型(MLLM)在多个领域上取得了成功,但现有MLLM主要是基于Transformer训练得到,计算效率较低。为此,本文作者提出了Cobra,一个具有线性计算复杂度的MLLM,它将Mamba语言模型整合到了视觉模态中。实验结果显示,Cobra在性能上与最先进的方法相当,速度更快,尤其在处理视觉错觉和空间关系判断方面表现突出。Cobra的参数量只有LLaVA的43%,但性能相当。
ShuYini
2024/03/27
8380
浙大 & 西湖 | 提出Cobra多模态大模型,整合Mamba,计算效率大幅提升!
哈工程大学提出参数高效精调多模式大语言模型,用于医学视觉落地!
医学视觉定位通过分析医学影像,将感兴趣区域(ROIs)与相应的文本描述关联起来。这是一个需要全面理解和精确对齐视觉和文本的任务。将此技术整合到临床工作流程中,可以增强图像内医疗发现的解释,帮助医生迅速识别关键信息,准确定位疾病,并促进精确的临床决策。
未来先知
2024/11/27
1540
哈工程大学提出参数高效精调多模式大语言模型,用于医学视觉落地!
加利福尼亚大学提出 EM-VLM4AD | 轻量级、多帧的视觉-语言模型,减少10倍的内存和浮点运算!
视觉-语言模型(VLMs)已经成为一种强大的工具,它们具备整体知识,能够解决视觉和语言交叉领域的问题。这使得它们在自动驾驶(AD)中具有巨大的潜力,允许驾驶员与VLM互动,VLM能够提供各种驾驶安全任务的易于理解的语言表示。此外,VLM可以作为端到端的自动驾驶系统,消除了在自动驾驶特定子任务(如感知和轨迹规划)的单独模型之间的集成和传播错误。这些潜在的好处推动了许多为自动驾驶应用量身定制的视觉-语言模型和多模态语言模型的发展。这些模型涵盖了自动驾驶的各个方面,包括闭环控制、感知任务和交通代理行为分析。
AIGC 先锋科技
2024/07/08
3300
加利福尼亚大学提出 EM-VLM4AD | 轻量级、多帧的视觉-语言模型,减少10倍的内存和浮点运算!
中科大 & 腾讯微信提出 EE-MLLM,一种数据高效和计算高效的多模大型语言模型!
近年来,由于在各种自然语言任务上的惊人表现,大型语言模型(LLM)受到了广泛关注。然而,实际场景往往涉及不仅仅是语言模态,因此将LLM扩展到多模态LLM至关重要。拓展的关键在于进行模态对齐,即学习将剩余模态以相同语义映射到预训练LLM特征空间的对应语言模态。
AIGC 先锋科技
2024/08/30
2760
中科大 & 腾讯微信提出 EE-MLLM,一种数据高效和计算高效的多模大型语言模型!
清华提出 VoCo-LLaMA | 使用LLMs 进行视觉压缩,FLOPs 减少 94.8%,推理时间加快 69.6% !
视觉语言模型的出现导致了视觉理解的显著进步。特别是,高分辨率图像编码[7; 8]和更多视频帧的融合[9; 10]分别提高了大型视觉语言模型和大型视频语言模型的能力。然而,大量的视觉标记占据了大型语言模型宝贵的上下文窗口的大部分,导致了高昂的计算成本,如图1(a)所示。例如,在使用LLaVA-1.6[7]中的高分辨率图像输入时,一个分辨率为672×672的单个图像被划分为四个较小的块,每个块以336×336的分辨率进行编码。这个过程产生了包含2304个视觉标记的图像表示,占据了超过一半的上下文长度。此外,随着输入图像数量的增加,文本的上下文窗口将进一步受限。例如,Vicuna-1.5[11]在其4k上下文长度内只能处理大约7帧(7×576=4032个标记),考虑到文本输入。[9, 10]研究了将上下文长度扩展到百万级以缓解这个问题的影响,但这需要昂贵的计算资源(例如,[9]需要超过1000个v4 TPU)以及数据准备和框架开发方面的工程努力。
AIGC 先锋科技
2024/07/08
3730
清华提出 VoCo-LLaMA | 使用LLMs 进行视觉压缩,FLOPs 减少 94.8%,推理时间加快 69.6% !
推荐阅读
中科院/中科大/芝加哥大学创新动态Token合并框架,无需微调,依然强大,零样本视频理解的突破性进展!
2760
字节提出 MammothModa | 超越 LLaVA,集成视觉能力的多模态大型语言模型 !
2920
​中科大 & 腾讯微信 & 新加坡国立大学 & 复旦等 将视觉特征与 LLM 的参数空间对齐,LoRA 再升级, 效率更上一层!
2890
港中文提出少即是多,高效多模LLMs的简单但有效的令牌减少方法 !
1820
轻量级视频压缩(LVC):以最小成本迁移长视频理解能力,解决VLMs采样问题并提升多模型性能 !
860
颜水成挂帅,奠定「通用视觉多模态大模型」终极形态!一统理解/生成/分割/编辑
6480
MLLM首篇综述 | 一文全览多模态大模型的前世、今生和未来
13.4K0
视觉语言模型导论:这篇论文能成为你进军VLM的第一步
7460
西湖大学 & 苏大提出 PiTe | 大型视频语言模型的空间与时间维度下的精细对齐研究 !
1720
Y-MoD:探索深度混合适应性,适用于多模式大语言模型 !
1550
清华 & 港中文 & 香港科技 深入探究 LLM, 利用大型语言模型理解视频和动作序列的多模态人类行为!
5350
VG4D | 突破4D点云识别局限,融合视觉-语言模型实现动作识别新高度!
4390
北大等提出Video-LLaVA视觉语言大模型,在多个评估榜单中名列前茅
4090
利用大型语言模型和扩散模型大规模生成视觉最小变化数据,提升VLMs的细粒度理解能力 !
3340
斯坦福利用视觉表示法则优化多模态语言模型,计算成本降低 99.7% !
1590
浙大 & 西湖 | 提出Cobra多模态大模型,整合Mamba,计算效率大幅提升!
8380
哈工程大学提出参数高效精调多模式大语言模型,用于医学视觉落地!
1540
加利福尼亚大学提出 EM-VLM4AD | 轻量级、多帧的视觉-语言模型,减少10倍的内存和浮点运算!
3300
中科大 & 腾讯微信提出 EE-MLLM,一种数据高效和计算高效的多模大型语言模型!
2760
清华提出 VoCo-LLaMA | 使用LLMs 进行视觉压缩,FLOPs 减少 94.8%,推理时间加快 69.6% !
3730
相关推荐
中科院/中科大/芝加哥大学创新动态Token合并框架,无需微调,依然强大,零样本视频理解的突破性进展!
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验