架构师李哲

文章/答案/技术大牛

发布

LV1

发表了文章 2026-04-202026-04-20 11:30:21

AI当审稿人，得分比人类还高？AAAI-26的22,977篇论文实验

这不是科幻小说。2026年4月15日，AAAI（人工智能促进协会）年会发布了一份重磅研究报告：AAAI-26首次大规模部署AI辅助审稿，22,977篇投稿论文，...

架构师李哲 2026-04-202026-04-20 11:30:21

人工智能

发表了文章 2026-04-202026-04-20 10:30:59

平台上新！Gemma 4 全系模型正式上线：不止于迭代，更是架构新探索

本次上新的 Gemma 4 模型如下（型号已按平台规范命名，与官方规格一一对应）：

架构师李哲 2026-04-202026-04-20 10:30:59

人工智能

发表了文章 2026-04-142026-04-14 21:29:54

中国AI音乐，全球登顶！Mureka V8击败Suno、Udio，拿下权威榜单双料冠军

那些听起来与真人演唱无异、连气息和换气声都拿捏得恰到好处的歌曲，出自中国AI音乐大模型——Mureka V8之手。

架构师李哲 2026-04-142026-04-14 21:29:54

人工智能

发表了文章 2026-04-082026-04-08 19:20:53

别再死磕SFT了！用KTO微调Qwen3-14B，数据减半效果翻倍

如果你已经用LlamaFactory Online微调过模型，大概率接触过SFT（监督微调）和RLHF（基于人类反馈的强化学习）。前者需要精心构造“问题-答案...

架构师李哲 2026-04-082026-04-08 19:20:53

人工智能

发表了文章 2026-04-082026-04-08 15:00:16

告别“令牌”与“智元”之争，“词元”定名背后的140万亿经济账

Token—这个曾只在技术圈流传的词汇，如今频繁进入大众视野：以它计费的AI应用火热出圈，云厂商更新计费体系，海外热议“中国Token”。

架构师李哲 2026-04-082026-04-08 15:00:16

人工智能

发表了文章 2026-04-012026-04-01 07:39:08

英伟达用AI智能体7天自主优化GPU内核，超越人类专家

“这或许是超人类智能在软件领域的真正首次展露。”英伟达研究员许冰刚刚在X上发出了如此断言。他所评论的，正是他与Terry Chen和Zhifan Ye为共同一作...

架构师李哲 2026-04-012026-04-01 07:39:08

人工智能

发表了文章 2026-03-292026-03-29 22:01:55

阿里云突然宣布：最高涨34%！告别“价格战”，AI算力正式进入稀缺时代

当云计算行业持续十几年的低价内卷成为过去式，一场由AI需求引爆的算力涨价潮，正彻底改写行业规则。

架构师李哲 2026-03-292026-03-29 22:01:55

人工智能

发表了文章 2026-03-242026-03-24 17:22:05

让AI学会“讨人喜欢”：用PPO-RW给Qwen3-1.7B装上“审美神经”

你有没有遇到过这样的情况：问AI一个问题，它确实回答了，但总感觉少了点什么——逻辑是通的，道理是对的，但就是不够“懂你”。

架构师李哲 2026-03-242026-03-24 17:22:05

人工智能

发表了文章 2026-03-242026-03-24 12:57:38

MiniMax M2.7开启“自我进化”：AI正从“被训练”走向“自己长大”

“龙虾”还在增强基座模型，“悟空”刚刚成立事业部，而在刚刚过去的一周，一个看似低调却极具颠覆性的名词悄然浮出水面——AI自我进化。

架构师李哲 2026-03-242026-03-24 12:57:38

人工智能

发表了文章 2026-03-162026-03-16 11:36:46

把历史模型当“乐高”拼：一种新的微调加速范式

那些被你扔在硬盘角落的老模型，可能是新任务最快的起跑线每个算法工程师的硬盘里，都躺着成百上千个历史checkpoint——上周跑的法律问答模型、上个月做的金融...

架构师李哲 2026-03-162026-03-16 11:36:46

人工智能

发表了文章 2026-03-132026-03-13 14:56:21

全民都在“养龙虾”，但你真的会“喂”吗？OpenClaw爆火背后的微调玄机

2026年的春天，科技圈最火的话题不再是哪家的大模型参数又刷新了纪录，而是一只“小龙虾”。

架构师李哲 2026-03-132026-03-13 14:56:21

人工智能

发表了文章 2026-03-102026-03-10 09:56:38

港科大这个AI突破，让大模型学会“偷懒”了

跳过88%的专家，保住97%的性能，推理速度翻倍——这项研究刚刚被CVPR接收你有没有这种感觉：现在的AI越来越聪明，但也越来越“能吃”？一个能看图能聊天的...

架构师李哲 2026-03-102026-03-10 09:56:38

科技

发表了文章 2026-03-092026-03-09 18:10:21

从“脸盲”到“火眼金睛”：我用Qwen3.5教会AI看懂春晚同款机器人

2026年开年，春晚舞台上，一群中国自主研发的人形机器人成为全场焦点。它们灵活起舞、精准互动，不仅引爆了国内社交媒体，更在全球科技圈掀起热议。这背后，正是人工智...

架构师李哲 2026-03-092026-03-09 18:10:21

最佳实践

发表了文章 2026-03-032026-03-03 11:38:49

只有2B参数，中文能力也能打架？手把手教你调教出更懂中文的“小钢炮”模型

在中文大模型的世界里，一个尴尬的现状长期存在：绝大多数模型的训练以英语为核心，中文语料往往只是“配料”。这就好比请了一位精通西餐的大厨来做中餐——食材认识，火候...

架构师李哲 2026-03-032026-03-03 11:38:49

最佳实践

发表了文章 2026-03-022026-03-02 10:42:55

阿里除夕开源千问3.5：3970亿参数但只激活170亿，大模型部署成本砍半怎么做到的？

当 AI 落地到了“深水区”：到底是模型不够强、算力太昂贵，还是该换条技术路线了？

架构师李哲 2026-03-022026-03-02 10:42:55

模型

发表了文章 2026-02-022026-02-02 18:52:20

让AI听懂“宫商角徵羽”：基于Qwen2-Audio的传统音乐语义解析系统实战

当传统五声音阶遇上现代大模型，AI不仅“听见”了音乐，更“听懂”了千年的文化密码。

架构师李哲 2026-02-022026-02-02 18:52:20

最佳实践

发表了文章 2026-02-022026-02-02 17:51:30

深度复盘：Qwen3-4B-Instruct-2507微调实战——打造“快思考、强执行”的 ReAct IoT Agent

本文内容来自—— 百大垂类模型生态支持计划获奖作品，作者闫露为Foresee AI核心技术负责人，深耕AIoT与大模型融合领域多年，专注智能空间管理场景的技术落...

架构师李哲 2026-02-022026-02-02 17:51:30

最佳实践

发表了文章 2026-01-262026-01-26 17:10:34

告别“大模型恐惧症”：如何用1/10的成本，跑出企业级AI的顶级效果？

今天，我们将通过一场实战，展示如何将80亿参数的Qwen3-8B模型与LightLLM高效推理框架相结合，在LLaMA-Factory Online上，打造一个...

架构师李哲 2026-01-302026-01-30 15:24:04

深度学习

发表了文章 2026-01-262026-01-26 11:15:23

DeepSeek V4全网猜测汇总：四大焦点浮出水面

恰逢DeepSeek-R1发布一周年，官方GitHub代码库中突然曝光的“MODEL1”标识，瞬间点燃全网讨论热情。开发者拆解代码、外媒爆料动态、行业人士解读技...

架构师李哲 2026-01-302026-01-30 11:57:05

DeepSeek

发表了文章 2026-01-082026-01-08 16:38:03

还在做93道MBTI选择题？我们训了个AI，聊8句就能看透你

在上一篇《受够93道MBTI选择题？我调了一个测MBTI的专属AI》发出后，我们收到了不少用户的测试反馈，并在评论区看到了各式各样的回答。许多人感到好奇：为什么...

架构师李哲 2026-01-082026-01-08 16:38:03

AIGC、大模型部署、深度学习

12 下一页

个人简介

九章云极 | 技术架构师
资深架构师 | 985硕士，聚焦大模型微调与AI基建，在此记录实战思考，分享LLM落地“最后一公里”。
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
北京
加入社区时间：2025-10-16

个人成就

获得 37 次赞同
文章被阅读 30.6K 次

关注了：0关注者：18