



2025 年 11 月 19 日,Ollama 发布了 v0.13.0 版本,本次更新带来了多个重要的新特性与性能优化,包括全新的 DeepSeek-OCR 模型支持、Cogito-V2.1 模型上线、全新的性能基准测试工具 Bench,以及一系列引擎与系统优化。以下是详细更新内容介绍。
DeepSeek-OCR 使用 光学二维映射 (optical 2D mapping) 技术压缩长上下文,在减少视觉 token 的同时,提升 OCR 精度,特别适合文档处理场景,实用价值显著。
该模型已在 Ollama 上支持,可通过以下示例调用:
ollama run deepseek-ocr "/path/to/image\n<|grounding|>Given the layout of the image."
ollama run deepseek-ocr "/path/to/image\nFree OCR."
ollama run deepseek-ocr "/path/to/image\nParse the figure."
ollama run deepseek-ocr "/path/to/image\nExtract the text in the image."
ollama run deepseek-ocr "/path/to/image\n<|grounding|>Convert the document to markdown."这是当前美国公司发布的最佳 开源权重指令调优生成模型之一,专注于高质量指令跟随与文本生成。
Ollama 的 GitHub 仓库新增了 Bench 工具,用于测试模型性能。该工具基于 Go 语言构建,支持可配置参数与多种输出格式。
安装 Go 后,在 Ollama 仓库根目录执行:
go build -o ollama-bench bench.go
./bench -model gpt-oss:20b -epochs 6 -format csv无需构建可直接运行:
go run bench.go -model gpt-oss:20b -epochs 3prefill、generate、load、total 四类耗时./bench -model gemma3 -epochs 6./bench -model gemma3,gemma3n -epochs 6 -max-tokens 100 -p "Write me a short story" | tee gemma.bench
benchstat -col /name gemma.bench./bench -model qwen3-vl -image photo.jpg -epochs 6 -max-tokens 100 -p "Describe this image"./bench -model llama3 -epochs 10 -temperature 0.7 -max-tokens 500 -seed 42 -format csv -output results.csvModel | Step | Count | Duration | nsPerToken | tokensPerSec |
|---|---|---|---|---|---|
gpt-oss:20b | prefill | 124 | 30.006458ms | 241987.56 | 4132.44 |
gpt-oss:20b | generate | 200 | 2.646843954s | 13234219.77 | 75.56 |
gpt-oss:20b | load | 1 | 121.674208ms | - | - |
gpt-oss:20b | total | 1 | 2.861047625s | - | - |
Ollama v0.13.0 在模型多样化、性能评测、底层优化等方面都有大幅提升,其中 DeepSeek-OCR 为文档和图像处理带来更高效的解决方案,Bench 工具让开发者能够科学评估模型表现。对于需要高精度 OCR、跨模态输入、多环境部署的用户来说,这次更新值得关注与升级。
我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。 欢迎关注“福大大架构师每日一题”,发消息可获得面试资料,让AI助力您的未来发展。