模型测试 - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签模型测试

#模型测试

qModel 算法模型平台开源版 v1.3.0 新增模型审批能力，完善算法模型从接入到上线的治理流程

吴同 2天前2026-07-27 16:14:41

但随着模型类型增多、使用人员扩大，仅依靠人工确认或直接发布的方式，容易出现：模型上线缺少统一审核节点；发布申请信息不完整；模型变更过程难以追踪；审核结果缺少记...

300

开源多模态视觉模型图像地理推理驱动定向社会工程攻击研究

芦笛

中国互联网络信息中心｜工程师 (已认证)

13天前2026-07-16 15:28:48

针对 2026 年 7 月 McAfee 与 KnowBe4 披露的新型网络威胁，本文系统研究开源视觉语言模型（VLM）基于社交平台公开旅游照片实现无元数据地理...

10610

2026 技术观察：MLOps 进入模型治理阶段，版本管理、漂移监测和灰度回滚成为 AI 生产新底座

用户12583401 21天前2026-07-08 09:55:43

过去，很多团队更关注模型能不能训练出来、指标是否足够高、能不能部署到线上。但当模型真正进入生产环境后，新的问题会持续出现。

22510

大语言模型幻觉驱动幻影域名抢注（Phantom Squatting）攻击机理与分层防御技术研究

芦笛

中国互联网络信息中心｜工程师 (已认证)

26天前2026-07-03 10:56:53

生成式大语言模型（LLM）普遍存在事实幻觉缺陷，模型会自主生成不存在、符合语义逻辑的域名地址。攻击者利用该稳定幻觉特征，提前注册此类虚构域名并部署仿冒站点实施钓...

16810

2026技术观察：AI 服务网关加速普及，多模型调用开始进入统一路由时代

用户12583401 2026-06-282026-06-28 13:25:41

2026 年，AI 应用不再只依赖单一模型。一个真实系统里，可能同时使用大语言模型、Embedding 模型、图像模型、语音模型和本地小模型。不同模型有不同价格...

16510

WorkBuddy 全模型使用指南：31 条管线的高效驾驭

nexlo 2026-06-192026-06-19 14:25:26

五渠道、三阵营、一张表。从如何选到如何配，本文是 WorkBuddy 模型体系的完整索引。

2.1K10

大模型测试常见误区，90%测试专家都踩过

顾翔 2026-06-152026-06-15 15:46:46

引言随着ChatGLM、Qwen、DeepSeek及Claude等大语言模型（LLM）加速落地，金融、政务、医疗、客服等关键领域正大规模引入AI能力。然而，当...

16610

大模型测试：技术深度解析

顾翔 2026-06-152026-06-15 15:41:40

2024年，大语言模型（LLM）正加速从API服务演进为嵌入式智能体、自主工作流与多模态决策中枢。与此同时，传统软件测试范式——基于明确输入/输出断言、覆盖路径...

24500

2026大模型测试：成本与效益的临界点

顾翔 2026-06-152026-06-15 15:40:53

2025年Q3，某头部金融AI平台在上线新一代风控大模型（128B参数、多模态推理）后72小时内触发3起生产级幻觉事件——非敏感信息泄露、监管合规条款误判、实时...

28300

为什么Analytics Agent 总答错？来自 Anthropic 的数据分析最佳实践

七牛开发者 2026-06-102026-06-10 17:05:32

在 Anthropic 内部，大约 95% 的业务分析请求已经由 Claude 自动完成，且整体准确率高达 95% 左右。

29310

11美金替代上万刀：小模型微调重写AI创业规则

加致 2026-06-092026-06-09 16:29:16

2026年的AI行业有个怪现象。所有巨头都在卷万亿参数大模型，OpenAI、Google、Anthropic 你追我赶，发布会一场比一场热闹，参数数字后面加的零...

29100

大模型测试落地实践深度解读

顾翔 2026-06-082026-06-08 12:41:37

2024年，国内超73%的头部科技企业已将大模型集成至核心业务系统——客服对话引擎、金融风控决策链、医疗报告生成平台……然而，Gartner最新调研显示，其中近...

25210

PCMag 杀毒与安全软件测试体系研究及技术实践分析

芦笛

中国互联网络信息中心｜工程师 (已认证)

2026-06-072026-06-07 19:06:06

摘要：网络安全威胁形态持续迭代，恶意软件、钓鱼攻击、勒索软件、系统漏洞利用等风险对终端设备与用户数据安全构成严重威胁，标准化、科学化的安全软件测试体系成为衡量防...

18910

#模型测试

qModel 算法模型平台开源版 v1.3.0 新增模型审批能力，完善算法模型从接入到上线的治理流程

开源多模态视觉模型图像地理推理驱动定向社会工程攻击研究

2026 技术观察：MLOps 进入模型治理阶段，版本管理、漂移监测和灰度回滚成为 AI 生产新底座

大语言模型幻觉驱动幻影域名抢注（Phantom Squatting）攻击机理与分层防御技术研究

2026技术观察：AI 服务网关加速普及，多模型调用开始进入统一路由时代

WorkBuddy 全模型使用指南：31 条管线的高效驾驭

大模型测试常见误区，90%测试专家都踩过

大模型测试：技术深度解析

2026大模型测试：成本与效益的临界点

为什么Analytics Agent 总答错？来自 Anthropic 的数据分析最佳实践

11美金替代上万刀：小模型微调重写AI创业规则

大模型测试落地实践深度解读

PCMag 杀毒与安全软件测试体系研究及技术实践分析

热门专栏

PingCAP的专栏

AI科技大本营的专栏

素质云笔记

小鹏的专栏

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐