首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >ollama v0.13.0 发布:DeepSeek-OCR、Cogito-V2.1 全新支持,性能工具 Bench 正式上线

ollama v0.13.0 发布:DeepSeek-OCR、Cogito-V2.1 全新支持,性能工具 Bench 正式上线

作者头像
福大大架构师每日一题
发布2025-12-19 09:17:15
发布2025-12-19 09:17:15
80
举报

2025 年 11 月 19 日,Ollama 发布了 v0.13.0 版本,本次更新带来了多个重要的新特性与性能优化,包括全新的 DeepSeek-OCR 模型支持、Cogito-V2.1 模型上线、全新的性能基准测试工具 Bench,以及一系列引擎与系统优化。以下是详细更新内容介绍。

一、新增模型

1. DeepSeek-OCR

DeepSeek-OCR 使用 光学二维映射 (optical 2D mapping) 技术压缩长上下文,在减少视觉 token 的同时,提升 OCR 精度,特别适合文档处理场景,实用价值显著。

该模型已在 Ollama 上支持,可通过以下示例调用:

代码语言:javascript
复制
ollama run deepseek-ocr "/path/to/image\n<|grounding|>Given the layout of the image."
ollama run deepseek-ocr "/path/to/image\nFree OCR."
ollama run deepseek-ocr "/path/to/image\nParse the figure."
ollama run deepseek-ocr "/path/to/image\nExtract the text in the image."
ollama run deepseek-ocr "/path/to/image\n<|grounding|>Convert the document to markdown."
2. Cogito-V2.1

这是当前美国公司发布的最佳 开源权重指令调优生成模型之一,专注于高质量指令跟随与文本生成。


二、基准测试工具(Bench Tool)

Ollama 的 GitHub 仓库新增了 Bench 工具,用于测试模型性能。该工具基于 Go 语言构建,支持可配置参数与多种输出格式。

构建方式

安装 Go 后,在 Ollama 仓库根目录执行:

代码语言:javascript
复制
go build -o ollama-bench bench.go
./bench -model gpt-oss:20b -epochs 6 -format csv

无需构建可直接运行:

代码语言:javascript
复制
go run bench.go -model gpt-oss:20b -epochs 3
功能特点
  • • 支持单次运行基准测试多个模型
  • • 支持文本与图片 Prompt
  • • 可配置生成参数(temperature、max tokens、seed 等)
  • • 输出格式支持 benchstatCSV
  • • 提供详细性能指标,包括 prefillgenerateloadtotal 四类耗时
命令示例
  • • 基本测试:
代码语言:javascript
复制
./bench -model gemma3 -epochs 6
  • • 多模型测试:
代码语言:javascript
复制
./bench -model gemma3,gemma3n -epochs 6 -max-tokens 100 -p "Write me a short story" | tee gemma.bench
benchstat -col /name gemma.bench
  • • 图片 Prompt:
代码语言:javascript
复制
./bench -model qwen3-vl -image photo.jpg -epochs 6 -max-tokens 100 -p "Describe this image"
  • • 高级测试:
代码语言:javascript
复制
./bench -model llama3 -epochs 10 -temperature 0.7 -max-tokens 500 -seed 42 -format csv -output results.csv
性能数据示例(Markdown 格式)

Model

Step

Count

Duration

nsPerToken

tokensPerSec

gpt-oss:20b

prefill

124

30.006458ms

241987.56

4132.44

gpt-oss:20b

generate

200

2.646843954s

13234219.77

75.56

gpt-oss:20b

load

1

121.674208ms

-

-

gpt-oss:20b

total

1

2.861047625s

-

-


三、引擎与系统优化更新

  1. 1. DeepSeek-OCR 支持
  2. 2. DeepSeek-V3.1 架构支持于 Ollama 引擎
  3. 3. 修复 Ollama 0.12.11 在 CUDA 上的性能问题
  4. 4. 修复 Linux 安装包缺失 Vulkan 库的问题
  5. 5. 提升容器 / cgroups 环境下的 CPU 与内存检测精度
  6. 6. 改进 AMD GPU VRAM 信息检测方式
  7. 7. 优化 KV Cache 性能,不再需要碎片化整理

四、版本变更概要

  • • 引入 DeepSeek-OCR 模型及相关架构支持
  • • 上线 Cogito-V2.1 模型
  • • 新增 Bench 基准测试工具,支持多模型与多格式性能输出
  • • 多项引擎优化(CUDA、Vulkan、GPU、KV Cache 等)
  • • 系统检测能力增强(VRAM、CPU、内存)

总结

Ollama v0.13.0 在模型多样化、性能评测、底层优化等方面都有大幅提升,其中 DeepSeek-OCR 为文档和图像处理带来更高效的解决方案,Bench 工具让开发者能够科学评估模型表现。对于需要高精度 OCR、跨模态输入、多环境部署的用户来说,这次更新值得关注与升级。

我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。 欢迎关注“福大大架构师每日一题”,发消息可获得面试资料,让AI助力您的未来发展。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-11-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 福大大架构师每日一题 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、新增模型
    • 1. DeepSeek-OCR
    • 2. Cogito-V2.1
  • 二、基准测试工具(Bench Tool)
    • 构建方式
    • 功能特点
    • 命令示例
    • 性能数据示例(Markdown 格式)
  • 三、引擎与系统优化更新
  • 四、版本变更概要
  • 总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档