首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >ollama v0.13.3 最新发布:新增模型与功能优化详细解读

ollama v0.13.3 最新发布:新增模型与功能优化详细解读

作者头像
福大大架构师每日一题
发布2025-12-19 10:10:27
发布2025-12-19 10:10:27
110
举报
在这里插入图片描述
在这里插入图片描述

2025年12月12日,ollama v0.13.3 版本正式发布。本次更新引入了多款全新模型,并对现有功能进行了优化与修复,为开发者在代码分析、多语言检索以及软件工程领域提供了更高效的支持。

一、全新模型

  1. 1. Devstral-Small-2
    • • 24B 参数模型
    • • 擅长使用工具探索代码库
    • • 支持多文件编辑
    • • 为软件工程类智能代理提供强大能力支持
  2. 2. rnj-1
    • • 8B 参数开源权重、稠密模型
    • • 由 Essential AI 从零开始训练
    • • 针对代码及 STEM(科学、技术、工程、数学)领域优化
    • • 性能可与当前开源权重领域的先进模型媲美
  3. 3. nomic-embed-text-v2
    • • 多语言 MoE(混合专家)文本嵌入模型
    • • 出色的多语言检索能力

二、功能优化与改进

  1. 1. 嵌入接口优化
    • • 改进了 /api/embed/v1/embeddings 在使用时的截断逻辑
  2. 2. 架构扩展
    • • 在 Gemma 3 架构基础上扩展,支持 rnj-1 模型
  3. 3. 模型输入修复
    • • 修复了使用 qwen2.5vl 进行图像输入时出现的报错问题

三、近期更新的具体改动

  • 截断逻辑优化:修正运行时截断逻辑,并移除服务器端截断
  • rope 重构:提升模型在长上下文处理中的性能稳定性
  • rnj-1 推理支持:新增对 rnj-1 模型的推理支持
  • qwen2.5vl metal argsort 修复
  • nomic-embed-text-v2 模型实现完善
  • UI优化
    • • 修复模型下载完成后能力不更新的问题
    • • 使用 Ollama 接口进行用户认证与健康检查
    • • 使用 requestAnimationFrame 防止文本底部被截断
  • 性能提升:升级 llama.cpp(17f7f4)版本,提升 SSM 性能
  • 命令行工具修复
    • • 修正 cmd/bench 下 README 中的选项表与二进制文件名
  • 路由优化:在工具调用中增加 logprobs 输出
  • 模型调整:更新 ministral 与 devstral 的转换与超参数设置
  • 模板功能增强:新增 yesterdayDate 辅助函数
  • 嵌入性能优化:调整 embeddings 的批量大小
  • API扩展:新增 v1/responses 接口支持
  • rotary embeddings 修复:解决 ministral 3 在旋转嵌入上的问题
  • 文档更新:调整 README 内容

四、更新总结

代码地址:github.com/ollama/ollama

本次 ollama v0.13.3 发布,不仅带来了三款定位不同的新模型,覆盖了代码分析、科学工程以及多语言检索等多领域,同时对嵌入接口、模型架构、性能以及开发者工具进行了广泛优化,进一步提高了使用体验与运行稳定性。

我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。 欢迎关注“福大大架构师每日一题”,发消息可获得面试资料,让AI助力您的未来发展。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-12-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 福大大架构师每日一题 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、全新模型
  • 二、功能优化与改进
  • 三、近期更新的具体改动
  • 四、更新总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档