首页
学习
活动
专区
圈层
工具
发布

#模型

llama.cpp Server 引入路由模式:多模型热切换与进程隔离机制详解

deephub

llama.cpp server在 2025年12月11日发布的版本中正式引入了 router mode(路由模式),如果你习惯了 Ollama 那种处理多模型...

700

基于强化学习的量化交易框架 TensorTrade

deephub

打开交易图表,堆上十个技术指标,然后对着屏幕发呆不知道下一步怎么操作——这场景对交易员来说太熟悉了。如果把历史数据丢给计算机,告诉它“去试错”。赚了有奖励,亏了...

800

DeepSeek-R1 与 o3 的启示:Test-Time Compute 技术不再迷信参数堆叠

deephub

过去2年,整个行业仿佛陷入了一场参数竞赛,每一次模型发布的叙事如出一辙:“我们堆了更多 GPU,用了更多数据,现在的模型是 1750 亿参数,而不是之前的 10...

1400

PyCausalSim:基于模拟的因果发现的Python框架

deephub

传统的分析手段和机器学习擅长告诉你什么能预测结果,但预测不等于因果。而在做决策,不管是干预、优化还是调整业务逻辑时,我们需要的是因果关系。

2300

别只会One-Hot了!20种分类编码技巧让你的特征工程更专业

deephub

机器学习模型处理不了原始文本。无论是线性回归、XGBoost还是神经网络,遇到 "red"、"medium"、"CA" 这类分类变量都没法直接处理。所以必须把它...

500

畅谈GPT-5

禁默

GPT-3(Generative Pre-trained Transformer 3)是由OpenAI开发的一个巨大的自然语言处理模型,它是基于Transfor...

700

天哪,谁教教我,晋升述职,评委到底关注什么?(站在评委的角度,突然通透了!)

架构师之路

我之前没有想的问题。一个对我职业发展影响很大的问题,晋升述职过程中,评委到底关注什么?

3700

营销系统中不可逆的熵增困境:从有序到无序的本质衰变

jack.yang

在经典营销理论中,市场被假定为可通过策略精准控制的系统。然而,当我们引入热力学第二定律——熵增原理的视角,一个更深刻的现实浮现:所有营销成果都是暂时从混沌中夺取...

2600

UGC、PGC、OGC:数字内容生态的三元动力模型

jack.yang

在印刷媒体时代,内容生产是少数人的特权;在电视广播时代,内容是专业机构的专利;而在数字网络时代,内容生产的权力完成了人类历史上最大规模的扩散。这场革命的本质,是...

2400

vLLM 0.12.0 重磅更新:whisper终于支持verbose_json 时间戳了

井九

vLLM 0.12.0 发布了。这次更新堪称一次“地基级”升级:从执行引擎到推理并行、从推理加速到多模态支持,全线都有显著改动。

4100

ollama v0.13.4 发布——全新模型与性能优化详解

福大大架构师每日一题

2025年12月13日,ollama v0.13.4版本预发布,随后于2025年12月16日正式发布。本次更新是一次重要的版本迭代,包含新模型的推出、引擎默认设...

2200

DeepSpeed v0.18.3 发布:优化性能与稳定性,增强兼容性与调试体验

福大大架构师每日一题

DeepSpeed 正式发布了 v0.18.3 版本,本次更新重点围绕性能优化、调试工具增强、兼容性改进以及优化器与硬件支持拓展展开。该版本包含多个细节更新,进...

2100

ollama v0.13.3 最新发布:新增模型与功能优化详细解读

福大大架构师每日一题

本次 ollama v0.13.3 发布,不仅带来了三款定位不同的新模型,覆盖了代码分析、科学工程以及多语言检索等多领域,同时对嵌入接口、模型架构、性能以及开发...

3300

多通道钓鱼攻击的演化与行为安全防御模型研究

草竹道人

中国互联网络信息中心 | 工程师 (已认证)

Cyvore 提出的模型将“人类通信”视为安全域,其核心假设是:正常通信具有稳定的行为模式,而钓鱼攻击必然引入模式偏移。该模型不关注单条消息内容,而是分析:

1400

agno v2.3.8 版本发布:引入模型级重试机制与多线程上下文变量传递优化

福大大架构师每日一题

近日,agno 正式发布了 v2.3.8 版本(2025 年 12 月 5 日),本次更新在功能、性能及稳定性方面均有显著提升。以下是本版本的详细更新内容。

2300

lmdeploy v0.11.0 发布:功能增强、性能优化与Bug修复详解

福大大架构师每日一题

lmdeploy v0.11.0 在功能支持、性能优化与错误修复方面都进行了大规模更新,尤其是在多模态输入支持、MoE模型优化、推测式解码等方面有显著进展,同时...

2200

ollama v0.13.1 发布:全新 Ministral-3 与 Mistral-Large-3 模型,增强工具调用与GPU

福大大架构师每日一题

Ollama 2025年12月3日发布了 v0.13.1 版本更新,本次更新重点引入了两个新的模型家族,并带来了多项功能增强、错误修复及底层改进,进一步提升了模...

3400

transformers v4.57.3 更新说明:修复本地模型加载隐藏问题并撤回上版本

福大大架构师每日一题

transformers v4.57.3 的更新重点在于解决本地加载模型时的隐藏 bug,并修正补丁代码的拼写问题,同时撤回上版本以确保用户的正常使用。建议升级...

2900

ollama v0.13.0 发布:DeepSeek-OCR、Cogito-V2.1 全新支持,性能工具 Bench 正式上线

福大大架构师每日一题

2025 年 11 月 19 日,Ollama 发布了 v0.13.0 版本,本次更新带来了多个重要的新特性与性能优化,包括全新的 DeepSeek-OCR 模...

3000

dify 1.10.0 Event-Driven Workflows 版本发布:全新 Trigger 触发器与升级指南详解

福大大架构师每日一题

dify 在 2025 年 11 月发布了 1.10.0 版本,这是一次重量级更新,其中最核心的亮点是正式推出了 Event-Driven Workflows ...

5500
领券