技术百科

搜索技术百科

技术百科

发布

技术百科首页 >大模型Web应用防火墙

大模型Web应用防火墙

修改于 2025-11-24 11:18:00

269

概述

大模型Web应用防火墙（LLM Web Application Firewall）是腾讯云 WAF 针对大模型应用场景推出的安全防护产品，主要提供算力滥用防护、提示词攻击拦截、涉敏信息防护及敏感个人信息识别，助力企业构建可信、稳定、可持续的大模型服务。

大模型Web应用防火墙有什么产品特性？

提示词攻击防护

识别与拦截提示词注入、越狱攻击等模型操控风险，防止利用模型生成违规或恶意内容。

内容安全

支持实时监控与过滤涉敏内容，提供风险代答片段；支持按业务、模型、场景分级配置策略。

算力消耗防护

支持识别、控制大模型业务资源滥用、Token 消耗异常、恶意调用等行为，保障后端算力安全。

数据安全与隐私保护

支持识别个人隐私信息等指定数据类型；支持标准隐私数据格式及自定义数据格式配置。

灵活接入

兼容主流云端和本地自建大模型，支持通过SaaS和CLB接入，可灵活满足多种业务部署场景。

完整日志记录与溯源

支持完整审计日志（按需）与攻击溯源机制，落实合规要求，辅助安全团队事后分析。

大模型Web应用防火墙能防护哪些风险？

覆盖OWASP LLM Top 10的输入和输出层威胁，包括：

输入层：提示词注入、越狱攻击。
输出层：涉敏内容生成、系统提示词泄漏、隐私信息泄漏。

大模型Web应用防火墙如何检测提示词注入攻击？

通过以下技术组合：

语义分析：基于Transformer模型理解上下文，识别隐含恶意意图（如诱导模型突破安全限制）。
对抗样本检测：针对编码混淆、特殊字符绕过等高级攻击进行防御。

大模型Web应用防火墙是否支持隐私数据识别？识别规则如何配置？

支持。可自动识别33类个人隐私信息（如身份证号、手机号、银行卡），同时提供：

预置规则：开箱即用。
自定义规则：企业可自主配置关键词、正则表达式或业务专属隐私信息字段。

大模型Web应用防火墙有什么应用场景？

智能体防护

AI智能客服系统保护

快速接入安全防护，拦截输入侧针对客服系统进行的提示词注入攻击。

检测及拦截客服系统输入、输出侧敏感信息，防止AI被用户恶意诱导输出风险内容。

针对输出内容进行敏感个人信息及系统提示关键词泄露拦截，防止AI被攻击后泄露用户关键信息。

AI智能体平台保护

快速接入安全防护，拦截针输入侧对前端AI智能体的提示词注入攻击。

针对输入、输出侧启动敏感信息检测及拦截，防止智能体平台被用户恶意诱导输出风险内容。

后端智能体平台可能对接多个内部关键业务系统，企业可对输出内容指定数据格式检测和拦截，防止关键信息泄露。

AI智能助手防护

快速接入安全防护，拦截输入侧针对AI智能助手的提示词注入攻击。

针对输入、输出侧启动涉敏信息检测及拦截，防止AI被用户恶意诱导输出风险内容。

检测算力消耗行为，限制请求频次和Token 消耗，防止算力被滥用消耗。

大模型专项保护

快速接入安全防护，拦截输入侧针对AI业务的提示词注入攻击。
针对输入、输出侧启动涉敏信息检测及拦截，防止AI业务被用户恶意诱导输出风险内容。
全链路日志留痕，辅助AI业务安全运营，落实合规要求。

词条知识树 (5个知识点)