首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Inner Error! atten mask dim should be 2 or 4, but got 3

Inner Error! atten mask dim should be 2 or 4, but got 3

原创
作者头像
happywei
修改于 2025-05-22 07:08:05
修改于 2025-05-22 07:08:05
20400
代码可运行
举报
运行总次数:0
代码可运行

部署QW2.5-VL-7B-Instruct之后

在运行下面代码

代码语言:python
代码运行次数:0
运行
AI代码解释
复制
import gradio as gr
from transformers import Qwen2_5_VLForConditionalGeneration, AutoProcessor
from qwen_vl_utils import process_vision_info
import torch

# 加载模型和处理器
model = Qwen2_5_VLForConditionalGeneration.from_pretrained(
 "Qwen/Qwen2.5-VL-7B-Instruct",
 torch_dtype="auto",
 device_map="auto"
)
processor = AutoProcessor.from_pretrained("Qwen/Qwen2.5-VL-7B-Instruct")


def process_image_and_text(image, text_prompt):
 if image is None:
 return "请上传一张图片。"

 # 构建消息格式
 messages = [
        {
 "role": "user",
 "content": [
                {
 "type": "image",
 "image": image,  # Gradio将自动处理图片路径
 },
                {"type": "text", "text": text_prompt if text_prompt else "Describe this image."},
            ],
        }
    ]

 try:
 # 准备推理输入
 text = processor.apply_chat_template(
            messages, tokenize=False, add_generation_prompt=True
 )
        image_inputs, video_inputs = process_vision_info(messages)
        inputs = processor(
 text=[text],
 images=image_inputs,
 videos=video_inputs,
 padding=True,
 return_tensors="pt",
        )
        inputs = inputs.to(model.device)

 # 生成输出
 with torch.no_grad():
            generated_ids = model.generate(**inputs, max_new_tokens=128)
            generated_ids_trimmed = [
                out_ids[len(in_ids):] for in_ids, out_ids in zip(inputs.input_ids, generated_ids)
            ]
            output_text = processor.batch_decode(
                generated_ids_trimmed,
 skip_special_tokens=True,
 clean_up_tokenization_spaces=False
 )

 return output_text[0]

 except Exception as e:
 return f"处理过程中出现错误: {str(e)}"


# 创建Gradio界面
with gr.Blocks() as demo:
    gr.Markdown("# Qwen2.5-VL 图像理解演示")

 with gr.Row():
 with gr.Column():
            image_input = gr.Image(type="filepath", label="上传图片")
            text_input = gr.Textbox(
 placeholder="请输入提示语(如不输入,默认描述图片)",
 label="提示语"
 )
            submit_btn = gr.Button("提交")

 with gr.Column():
            output = gr.Textbox(label="输出结果")

    submit_btn.click(
 fn=process_image_and_text,
 inputs=[image_input, text_input],
 outputs=output
    )

    gr.Examples(
 examples=[
            ["path/to/example1.jpg", "这张图片里有什么?"],
            ["path/to/example2.jpg", "描述图中的场景"],
        ],
 inputs=[image_input, text_input],
    )

# 启动应用
if __name__ == "__main__":
    demo.launch(share=True)

执行上述代码后,在gradio输入图片报错:

代码语言:batch
AI代码解释
复制
call aclnnFlashAttentionScore failed, detail:EZ9999: 
Inner Error!  EZ9999: [PID: 542574] 2025-05-21-10:00:28.225.210 atten mask dim should be 2 or 4, but got 3
[FUNC:AnalyzeOptionalInput][FILE:flash_attention_score_tiling_general.cpp][LINE:1473]

可能原因:

Qwen2.5-VL 在处理图文时会构造 image embedding + text embedding 的组合,而 attention mask 通常变成三维,形如:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
attention_mask.shape == (batch, total_seq_len, total_seq_len)

这在昇腾的 aclnnFlashAttentionScore不被支持,因为华为当前 FlashAttention 实现只支持:

  • [batch, seq_len](2D)
  • [batch, 1, seq_len, seq_len](4D)

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
[大模型]LLaMA3-8B-Instruct Lora 微调
本节我们简要介绍如何基于 transformers、peft 等框架,对 LLaMA3-8B-Instruct 模型进行 Lora 微调。Lora 是一种高效微调方法,深入了解其原理可参见博客:知乎|深入浅出 Lora。
云未归来
2025/07/21
870
[大模型]LLaMA3-8B-Instruct Lora 微调
[大模型]Phi-3-mini-4k-Instruct Lora 微调
本节我们简要介绍如何基于 transformers、peft 等框架,对 Phi-3-mini-4k-Instruct 模型进行 Lora 微调。Lora 是一种高效微调方法,深入了解其原理可参见博客:知乎|深入浅出 Lora。
云未归来
2025/07/21
970
[大模型]Phi-3-mini-4k-Instruct Lora 微调
Gradio入门到进阶全网最详细教程一:快速搭建AI算法可视化部署演示(侧重项目搭建和案例分享)
运行程序后,打开 http://localhost:7860 即可看到网页效果。左边是文本输入框,右边是结果展示框。Clear按钮用于重置网页状态,Submit按钮用于执行处理程序,Flag按钮用于保存结果到本地。
汀丶人工智能
2023/04/25
12.6K0
Gradio入门到进阶全网最详细教程一:快速搭建AI算法可视化部署演示(侧重项目搭建和案例分享)
Gradio入门到进阶全网最详细教程[二]:快速搭建AI算法可视化部署演示(侧重参数详解和案例实践)
相关文章:Gradio入门到进阶全网最详细教程[一]:快速搭建AI算法可视化部署演示(侧重项目搭建和案例分享)
汀丶人工智能
2023/05/01
2.3K0
Gradio入门到进阶全网最详细教程[二]:快速搭建AI算法可视化部署演示(侧重参数详解和案例实践)
Qwen2大模型微调入门实战(完整代码)
Qwen2是一个开源大语言模型。以Qwen2作为基座大模型,通过指令微调的方式实现高准确率的文本分类,是学习大语言模型微调的入门任务。
用户9029617
2024/06/09
3.6K1
Qwen2大模型微调入门实战(完整代码)
NL2SQL实践系列(1):深入解析Prompt工程在text2sql中的应用技巧
NL2SQL基础系列(1):业界顶尖排行榜、权威测评数据集及LLM大模型(Spider vs BIRD)全面对比优劣分析[Text2SQL、Text2DSL]
汀丶人工智能
2024/04/18
5380
NL2SQL实践系列(1):深入解析Prompt工程在text2sql中的应用技巧
【多模态大模型实战】 搭建DeepSeek Janus-Pro 7B 多模态模型,以及推理微调,推理后的模型融合
Janus-Pro是DeepSeek最新开源的多模态模型,是一种新颖的自回归框架,统一了多模态理解和生成。通过将视觉编码解耦为独立的路径,同时仍然使用单一的、统一的变压器架构进行处理,该框架解决了先前方法的局限性。这种解耦不仅缓解了视觉编码器在理解和生成中的角色冲突,还增强了框架的灵活性。Janus-Pro 超过了以前的统一模型,并且匹配或超过了特定任务模型的性能。
AI浩
2025/02/08
2.9K1
【多模态大模型实战】 搭建DeepSeek Janus-Pro 7B 多模态模型,以及推理微调,推理后的模型融合
在Gradio实现分栏、分页的效果(二)
分页的效果实现,主要依靠mount_gradio_app,启发于:Support multiple pages in a gradio app
悟乙己
2023/11/09
3.9K0
在Gradio实现分栏、分页的效果(二)
Qwen2大模型微调入门实战-命名实体识别(NER)任务
以Qwen2作为基座大模型,通过指令微调的方式做高精度的命名实体识别(NER),是学习入门LLM微调、建立大模型认知的非常好的任务。
zenRRan
2024/07/04
2.3K0
Qwen2大模型微调入门实战-命名实体识别(NER)任务
【Datawhale AI 夏令营】Intel LLM Hackathon 天池挑战赛 本地环境搭建
IT蜗壳-Tango
2024/07/15
3660
NL2SQL实践系列(1):深入解析Prompt工程在text2sql中的应用技巧
NL2SQL基础系列(1):业界顶尖排行榜、权威测评数据集及LLM大模型(Spider vs BIRD)全面对比优劣分析[Text2SQL、Text2DSL]
汀丶人工智能
2024/04/20
3.1K0
NL2SQL实践系列(1):深入解析Prompt工程在text2sql中的应用技巧
Gradio入门到进阶全网最详细教程[二]:快速搭建AI算法可视化部署演示(侧重参数详解和案例实践)
相关文章:Gradio入门到进阶全网最详细教程[一]:快速搭建AI算法可视化部署演示(侧重项目搭建和案例分享)
汀丶人工智能
2023/04/26
1.7K0
Gradio入门到进阶全网最详细教程[二]:快速搭建AI算法可视化部署演示(侧重参数详解和案例实践)
揭秘SmolVLM——小巧高效的视觉语言模型
随着人工智能(AI)技术的飞速发展,视觉语言模型(Vision Language Model, VLM)正在逐渐改变我们与世界交互的方式。无论是自动驾驶、图像搜索还是智能家居,这些应用都离不开VLM的强大支持。然而,传统的VLM往往依赖大规模计算资源,难以部署在本地设备上。而SmolVLM的诞生,则打破了这一局面!
GPUS Lady
2024/12/05
9220
揭秘SmolVLM——小巧高效的视觉语言模型
【DeepLearning.AI】吴恩达系列课程——使用Gradio构建AI应用
小栗子:将会在浏览器自动弹出(地址: http://localhost:7860)
Alice师傅的好宝宝
2025/02/10
1.2K2
[大模型]Qwen1.5-7B-Chat FastApi 部署调用
在 Autodl 平台中租赁一个 3090 等 24G 显存的显卡机器,如下图所示镜像选择 PyTorch–>2.0.0–>3.8(ubuntu20.04)–>11.8(11.3 版本以上的都可以)。 接下来打开刚刚租用服务器的 JupyterLab,并且打开其中的终端开始环境配置、模型下载和运行演示。
云未归来
2025/07/17
1130
[大模型]Qwen1.5-7B-Chat FastApi 部署调用
2025年最值得关注的AI开源项目盘点
在AI技术飞速发展的今天,开源项目成为了推动创新和应用落地的重要力量。2025年,随着大模型的持续演进和各类AI技术的不断成熟,众多优秀的AI开源项目涌现出来。这些项目不仅在技术上具有前沿性,还涵盖了从AI Agent到知识增强生成(RAG)、从大模型到多模态应用等多个热门领域,为开发者提供了丰富的工具和解决方案。本文将为您详细介绍2025年最值得关注的AI开源项目,并通过代码示例展示它们的实际应用。
江南清风起
2025/03/27
5020
【机器学习】Qwen2大模型原理、训练及推理部署实战
刚刚写完【机器学习】Qwen1.5-14B-Chat大模型训练与推理实战 ,阿里Qwen就推出了Qwen2,相较于Qwen1.5中0.5B、1.8B、4B、7B、14B、32B、72B、110B等8个Dense模型以及1个14B(A2.7B)MoE模型共计9个模型,Qwen2包含了0.5B、1.5B、7B、57B-A14B和72B共计5个尺寸模型。从尺寸上来讲,最关键的就是推出了57B-A14B这个更大尺寸的MoE模型,有人问为什么删除了14B这个针对32G显存的常用尺寸,其实对于57B-A14B剪枝一下就可以得到。
LDG_AGI
2024/08/13
3K0
【机器学习】Qwen2大模型原理、训练及推理部署实战
叫板GPT-4的Gemini,我做了一个聊天网页,可图片输入,附教程
Gemini 是谷歌研发的最新一代大语言模型,目前有三个版本,被称为中杯、大杯、超大杯,Gemini Ultra 号称可与GPT-4一较高低:
Ai学习的老章
2023/12/19
1.5K1
叫板GPT-4的Gemini,我做了一个聊天网页,可图片输入,附教程
Qwen2大模型微调入门实战-命名实体识别(NER)任务
以Qwen2作为基座大模型,通过指令微调的方式做高精度的命名实体识别(NER),是学习入门LLM微调、建立大模型认知的非常好的任务。
用户9029617
2024/06/20
1.2K0
Qwen2大模型微调入门实战-命名实体识别(NER)任务
Java开发者的Python快速实战指南:探索向量数据库之图像相似搜索-文字版
首先,我要向大家道个歉。原本我计划今天向大家展示如何将图片和视频等形式转换为向量并存储在向量数据库中,但是当我查看文档时才发现,腾讯的向量数据库尚未完全开发完成。因此,今天我将用文本形式来演示相似图片搜索。如果您对腾讯的产品动态不太了解,可以查看官方网址:https://cloud.tencent.com/document/product/1709/95477
努力的小雨
2023/12/05
5372
推荐阅读
[大模型]LLaMA3-8B-Instruct Lora 微调
870
[大模型]Phi-3-mini-4k-Instruct Lora 微调
970
Gradio入门到进阶全网最详细教程一:快速搭建AI算法可视化部署演示(侧重项目搭建和案例分享)
12.6K0
Gradio入门到进阶全网最详细教程[二]:快速搭建AI算法可视化部署演示(侧重参数详解和案例实践)
2.3K0
Qwen2大模型微调入门实战(完整代码)
3.6K1
NL2SQL实践系列(1):深入解析Prompt工程在text2sql中的应用技巧
5380
【多模态大模型实战】 搭建DeepSeek Janus-Pro 7B 多模态模型,以及推理微调,推理后的模型融合
2.9K1
在Gradio实现分栏、分页的效果(二)
3.9K0
Qwen2大模型微调入门实战-命名实体识别(NER)任务
2.3K0
【Datawhale AI 夏令营】Intel LLM Hackathon 天池挑战赛 本地环境搭建
3660
NL2SQL实践系列(1):深入解析Prompt工程在text2sql中的应用技巧
3.1K0
Gradio入门到进阶全网最详细教程[二]:快速搭建AI算法可视化部署演示(侧重参数详解和案例实践)
1.7K0
揭秘SmolVLM——小巧高效的视觉语言模型
9220
【DeepLearning.AI】吴恩达系列课程——使用Gradio构建AI应用
1.2K2
[大模型]Qwen1.5-7B-Chat FastApi 部署调用
1130
2025年最值得关注的AI开源项目盘点
5020
【机器学习】Qwen2大模型原理、训练及推理部署实战
3K0
叫板GPT-4的Gemini,我做了一个聊天网页,可图片输入,附教程
1.5K1
Qwen2大模型微调入门实战-命名实体识别(NER)任务
1.2K0
Java开发者的Python快速实战指南:探索向量数据库之图像相似搜索-文字版
5372
相关推荐
[大模型]LLaMA3-8B-Instruct Lora 微调
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验