

2025 年 9 月 25 日,Ollama 发布了 v0.12.2 版本,这是一次对底层引擎和模型支持进行重要优化的更新。该版本不仅提升了对 Qwen3 架构(包括 MoE 混合专家模型)的运行支持,还在分词器、内置工具渲染、张量加载等方面做出重大调整。本文将详细解析本次更新的技术细节和影响。
此前的 NewBytePairEncoding 方法只接受一个 regex 作为预分词器,这在实际应用中不足以应对多语言和特殊字符的组合处理。本次更新:
.
func NewBytePairEncoding(vocab *Vocabulary, pretokenizers ...string) BytePairEncoding关键变化:
split() 实现链式 regex 切分,确保各类特殊序列被精确识别。测试示例:
Hello, WORLD!! How's it going? 123 一二三[一-龥],数字分割为整体或单个数字。123 切为 1, 2, 3。这意味着 Ollama 在文本预处理环节获得更高的灵活度,尤其在多语言 NLP 场景中表现更佳。
模型权重文件在加载时通常通过 Tag 名匹配张量,v0.12.2 新增了 pre: 与 suf: 标签支持: .
type Tag struct {
name string
prefix string
suffix string
alternatives []string
}功能说明:
pre: 指定在张量名匹配前插入的前缀,例如 b_。suf: 指定附加到张量名的后缀,例如 _c。alt: 提供备用名称,并在无主名时自动提升为主名。应用场景: 例如,模型结构中有以下权重名: .
blk.0.a.weight
blk.0.b_weight
blk.0.weight_c
blk.0.x_weight_y通过 Tag 配置可以快速映射到对应结构体字段,减少硬编码。
在 Harmony 解析器中,确认以下内置工具名称保持原样: .
browser.open
browser.search
browser.find
python这解决了 v0.12.1 中用户报告的 调用工具名被改写 问题,确保工具调用的稳定性和兼容性,尤其是与外部插件交互时。
为了适配 Multi-Regex 方案和新引擎,本次更新重构了多个模型的加载方法,包括:
对模型作者:
pre: / suf:,可以更精准地映射复杂张量名。对推理系统维护者:
ollama v0.12.2 是一次针对核心引擎、分词器、模型加载逻辑的全面升级,尤其是:
这些改动不仅提升了模型运行的稳定性和灵活性,也为未来多语言 NLP 和复杂模型加载奠定了基础。
我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。 欢迎关注“福大大架构师每日一题”,发消息可获得面试资料,让AI助力您的未来发展。