用户4176869 - 个人中心 - 腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

用户4176869

LV0

全部文章

AI落地实战：非遗AI品牌故事生成器
非物质文化遗产作为中华民族的文化瑰宝，承载着千年历史积淀与深厚民族情感。然而在现代化浪潮中，诸多传统工艺陷入传承断层、市场认知薄弱、品牌叙事缺失的困境——非遗产...
用户4176869 12小时前2026-06-22 16:56:59
设计、系统、产品、服务、模型
从 Hugging Face 模型到 Ollama 模型的转换和量化
在本地部署大语言模型时，Ollama 凭借简洁的交互体验成为热门选择，但它主要支持 GGUF 格式模型；而 Hugging Face 平台的模型多为 PyTor...
用户4176869 12小时前2026-06-22 16:56:34
模型、配置、性能、工具、量化
一行代码，让我的SFT模型泛化能力飙升
最近在使用 llama-factory 做模型微调，除了常规的SFT（监督微调），也花了不少时间折腾DPO、PPO这类强化学习算法。
用户4176869 12小时前2026-06-22 16:55:22
模型、数据、数学、算法、性能
真正的创新，始于对“众人皆错”的追问
在一场浓缩了人工智能前沿议题的对话之后，上海人工智能实验室主任周伯文教授将舞台的聚光灯引向未来——那些平均年龄仅有30岁的年轻研究者，Geoffrey Hint...
用户4176869 12小时前2026-06-22 16:54:14
模型、优化、人工智能、工作、基础
AI Agent的“记忆力”与“工具箱”
AI Agent作为人工智能领域的前沿方向，正逐步从概念走向实际应用。不同于传统的问答系统，AI Agent具备自主思考、规划、执行并与外部环境交互的能力，其应...
用户4176869 12小时前2026-06-22 16:50:57
系统、缓存、agent、工具、模型
BookWorld如何让虚拟世界拥有自己的“生命”？
每一个小说爱好者或许都曾有过这样的幻想：当合上书本的最后一页，那些鲜活的角色们是否也拥有了超越作者设定的“自由意志”？他们的人生轨迹，是否还能在那个虚构的世界里...
用户4176869 12小时前2026-06-22 16:50:15
游戏、论文、事件、数据、系统
Day 3/5：MiniMax Agent，最大的智慧是“靠谱”
第三天，我们来介绍 MiniMax Agent，一个能完成长程（Long Horizon）复杂任务的通用智能体，也就是能多步规划出专家级解决方案、能灵活拆解任务...
用户4176869 12小时前2026-06-22 16:49:50
产品、模型、研发、音频、agent
RAG学习笔记（二）数据导入
在检索增强生成（RAG）的世界里，大模型不再是孤立的知识孤岛，而是能够与外部世界实时互动的智能体。这种互动的基础，便是高效、精准地将海量异构数据转化为可供大模型...
用户4176869 12小时前2026-06-22 16:47:25
工具、数据、系统、学习笔记、对象
Day 1/5：MiniMax-M1，全球首个开源大规模混合架构的推理模型
介绍下我们的新模型，MiniMax-M1，世界上第一个开源的大规模混合架构的推理模型。M1在面向生产力的复杂场景中能力是开源模型中的最好一档，超过国内的闭源模型...
用户4176869 12小时前2026-06-22 16:47:04
架构、模型、算法、开源、强化学习
RAG学习笔记（一）
大型语言模型（LLMs）以其卓越的文本生成、理解和推理能力，正在深刻改变我们与信息交互的方式。然而，LLMs并非没有局限。它们在面对特定领域知识、实时信息或需要...
用户4176869 12小时前2026-06-22 16:44:06
模型、数据、索引、系统、学习笔记
大模型微调：业务数据驱动的实践
最近大模型（LLMs）确实火得一塌糊涂，它们在文本生成、问答、翻译这些通用任务上表现得相当惊艳。但咱们搞技术的都清楚，这些通用模型一旦要深入到某个特定行业或企业...
用户4176869 12小时前2026-06-22 16:43:50
数据库、开发、模型、实践、数据
GLM-4.5发布，全网最全测评和使用教程来了！
就在刚刚，智谱正式发布新一代旗舰模型 GLM-4.5，专为智能体应用打造的基础模型。Hugging Face 与 ModelScope 平台同步开源，模型权重遵...
用户4176869 12小时前2026-06-22 16:36:04
glm、测试、脚本、教程、模型
拨云见日：Native Sparse Attention 如何重塑长上下文大模型效率边界
2025年计算语言学协会年会（ACL）的年度最佳论文奖项，DeepSeek与北京大学等机构联合呈现的《Native Sparse Attention: Hard...
用户4176869 13小时前2026-06-22 16:22:14
效率、硬件、native、模型、设计
Kimi K2 技术报告解读：Agentic AI 时代的万亿参数开源模型，究竟强在何处？
在当前大模型技术日新月异的浪潮中，仅仅依靠参数规模的膨胀或在各类基准测试中拔得头筹，已不足以定义一个模型的真正价值。业界同仁的目光，正从被动的“能力”展示，转向...
用户4176869 13小时前2026-06-22 16:19:20
开源、工具、模型、数据、效率
飘摇风雨中：Anthropic的六个月激荡史
当旧金山的晨雾还未散尽，这家估值1830亿美元的AI巨头已在政治风暴中摇摇欲坠。前脚以国家安全之名对中国竖起高墙，后脚就被特朗普政府列为国家安全供应链风险——命...
用户4176869 13小时前2026-06-22 16:04:08
芯片、安全、供应链、模型、数据
DeepSeek V4 转向国产供应链：技术自主与地缘博弈的新阶段
今日，路透社报道确认，DeepSeek 未按行业惯例向英伟达、AMD 等美国芯片制造商提供即将发布的旗舰模型 V4 的早期测试版本。X 平台技术爆料账号 Leg...
用户4176869 13小时前2026-06-22 16:03:30
DeepSeek、供应链、模型、芯片、性能
Claude告密记
2月24日凌晨，Anthropic在X平台上发布的那条帖子获得了1845万次查看。他们措辞精准得像一份起诉书：DeepSeek、Moonshot、MiniMax...
用户4176869 13小时前2026-06-22 16:03:02
模型、数据、芯片、安全、监控
这个春节，硅谷最狂的赌徒又拿了两亿美金
硅谷传来消息，Taalas完成1.69亿美元新一轮融资，总融资额冲到2.19亿。这家公司只有25个人，却拿着比大多数百人团队都多的现金。而他们的产品HC1，正躺...
用户4176869 13小时前2026-06-22 15:57:40
硬件、地图、模型、软件、芯片
最会谈恋爱的那25个AI，帮创始人拿到了1亿美元
2023年春天，斯坦福的Smallville还在GitHub上扮演着学术圈的像素风奇观。25个基于GPT的智能体在虚拟咖啡馆里传八卦、谈恋爱、为了情人节派对该穿...
用户4176869 13小时前2026-06-22 15:51:17
数据、系统、架构、镜像、模型
Gemini 3.1 Pro来了：深度思考正式降价
凌晨三点的 IDE 界面依然亮着，你正在调试那个需要跨五个文件追踪数据流的 Bug。这不是一个能被简单检索解决的问题，它需要模型在上下文里同时记住日志格式、业务...
用户4176869 13小时前2026-06-22 15:45:26
模型、数据、游戏、工具、架构

个人简介

暂未填写公司和职称
暂未填写个人简介
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市
加入社区时间：2018-12-11

个人成就

文章被阅读 676 次

关注了：0关注者：13