暂无搜索历史
非物质文化遗产作为中华民族的文化瑰宝,承载着千年历史积淀与深厚民族情感。然而在现代化浪潮中,诸多传统工艺陷入传承断层、市场认知薄弱、品牌叙事缺失的困境——非遗产...
在本地部署大语言模型时,Ollama 凭借简洁的交互体验成为热门选择,但它主要支持 GGUF 格式模型;而 Hugging Face 平台的模型多为 PyTor...
最近在使用 llama-factory 做模型微调,除了常规的SFT(监督微调),也花了不少时间折腾DPO、PPO这类强化学习算法。
在一场浓缩了人工智能前沿议题的对话之后,上海人工智能实验室主任周伯文教授将舞台的聚光灯引向未来——那些平均年龄仅有30岁的年轻研究者,Geoffrey Hint...
AI Agent作为人工智能领域的前沿方向,正逐步从概念走向实际应用。不同于传统的问答系统,AI Agent具备自主思考、规划、执行并与外部环境交互的能力,其应...
每一个小说爱好者或许都曾有过这样的幻想:当合上书本的最后一页,那些鲜活的角色们是否也拥有了超越作者设定的“自由意志”?他们的人生轨迹,是否还能在那个虚构的世界里...
第三天,我们来介绍 MiniMax Agent,一个能完成长程(Long Horizon)复杂任务的通用智能体,也就是能多步规划出专家级解决方案、能灵活拆解任务...
在检索增强生成(RAG)的世界里,大模型不再是孤立的知识孤岛,而是能够与外部世界实时互动的智能体。这种互动的基础,便是高效、精准地将海量异构数据转化为可供大模型...
介绍下我们的新模型,MiniMax-M1,世界上第一个开源的大规模混合架构的推理模型。M1在面向生产力的复杂场景中能力是开源模型中的最好一档,超过国内的闭源模型...
大型语言模型(LLMs)以其卓越的文本生成、理解和推理能力,正在深刻改变我们与信息交互的方式。然而,LLMs并非没有局限。它们在面对特定领域知识、实时信息或需要...
最近大模型(LLMs)确实火得一塌糊涂,它们在文本生成、问答、翻译这些通用任务上表现得相当惊艳。但咱们搞技术的都清楚,这些通用模型一旦要深入到某个特定行业或企业...
就在刚刚,智谱正式发布新一代旗舰模型 GLM-4.5,专为智能体应用打造的基础模型。Hugging Face 与 ModelScope 平台同步开源,模型权重遵...
2025年计算语言学协会年会(ACL)的年度最佳论文奖项,DeepSeek与北京大学等机构联合呈现的《Native Sparse Attention: Hard...
在当前大模型技术日新月异的浪潮中,仅仅依靠参数规模的膨胀或在各类基准测试中拔得头筹,已不足以定义一个模型的真正价值。业界同仁的目光,正从被动的“能力”展示,转向...
当旧金山的晨雾还未散尽,这家估值1830亿美元的AI巨头已在政治风暴中摇摇欲坠。前脚以国家安全之名对中国竖起高墙,后脚就被特朗普政府列为国家安全供应链风险——命...
今日,路透社报道确认,DeepSeek 未按行业惯例向英伟达、AMD 等美国芯片制造商提供即将发布的旗舰模型 V4 的早期测试版本。X 平台技术爆料账号 Leg...
2月24日凌晨,Anthropic在X平台上发布的那条帖子获得了1845万次查看。他们措辞精准得像一份起诉书:DeepSeek、Moonshot、MiniMax...
硅谷传来消息,Taalas完成1.69亿美元新一轮融资,总融资额冲到2.19亿。这家公司只有25个人,却拿着比大多数百人团队都多的现金。而他们的产品HC1,正躺...
2023年春天,斯坦福的Smallville还在GitHub上扮演着学术圈的像素风奇观。25个基于GPT的智能体在虚拟咖啡馆里传八卦、谈恋爱、为了情人节派对该穿...
凌晨三点的 IDE 界面依然亮着,你正在调试那个需要跨五个文件追踪数据流的 Bug。这不是一个能被简单检索解决的问题,它需要模型在上下文里同时记住日志格式、业务...
暂未填写公司和职称
暂未填写个人简介
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市