识别与拦截提示词注入、越狱攻击等模型操控风险,防止利用模型生成违规或恶意内容。
支持实时监控与过滤涉敏内容,提供风险代答片段;支持按业务、模型、场景分级配置策略。
支持识别、控制大模型业务资源滥用、Token 消耗异常、恶意调用等行为,保障后端算力安全。
支持识别个人隐私信息等指定数据类型;支持标准隐私数据格式及自定义数据格式配置。
兼容主流云端和本地自建大模型,支持通过SaaS和CLB接入,可灵活满足多种业务部署场景。
支持完整审计日志(按需)与攻击溯源机制,落实合规要求,辅助安全团队事后分析。
覆盖OWASP LLM Top 10的输入和输出层威胁,包括:
通过以下技术组合:
支持。可自动识别33类个人隐私信息(如身份证号、手机号、银行卡),同时提供:
快速接入安全防护,拦截输入侧针对客服系统进行的提示词注入攻击。
检测及拦截客服系统输入、输出侧敏感信息,防止AI被用户恶意诱导输出风险内容。
针对输出内容进行敏感个人信息及系统提示关键词泄露拦截,防止AI被攻击后泄露用户关键信息。
快速接入安全防护,拦截针输入侧对前端AI智能体的提示词注入攻击。
针对输入、输出侧启动敏感信息检测及拦截,防止智能体平台被用户恶意诱导输出风险内容。
后端智能体平台可能对接多个内部关键业务系统,企业可对输出内容指定数据格式检测和拦截,防止关键信息泄露。
快速接入安全防护,拦截输入侧针对AI智能助手的提示词注入攻击。
针对输入、输出侧启动涉敏信息检测及拦截,防止AI被用户恶意诱导输出风险内容。
检测算力消耗行为,限制请求频次和Token 消耗,防止算力被滥用消耗。