2026年4月24日,DeepSeek正式推出了全新一代模型DeepSeek-V4预览版,这是继上一代V3系列之后时隔15个月的重磅更新。新模型不仅全面开源权重...
手机厂商的发布会上,像素数字越来越大,从 5000 万到 1 亿,再到 2 亿。每一次发布,都会有一段措辞相近的描述:
我在南开读软件工程硕士的时候,第一次认真推 Transformer 的注意力公式,盯着看了半天,心想这也太朴素了吧,就是矩阵乘法加一个归一化。但越往后学越觉得不...
在企业微信ipad协议的日常使用中,图像消息占据着相当大的带宽与存储比例。一张未经压缩的原图可能高达数MB,在群发场景下会对服务器和客户端造成双重压力。企业微信...
自定义CoordinatorLayout的行为原文链接:CustomizingCoordinatorLayout'sBehavior原文作者:ChrisStew...
如果汽车只向一个方向行驶,没有后退的话,那么距离就是位移的绝对值。为什么?如果因为朝不同方向,可能为负数,绝对值就不对了吧?
思考: 将复杂的商业逻辑,翻译成AI可以理解和计算的数学语言,这是量化研究员的核心工作。
今天晚上有同学问我有没有有写止盈止损策略, 个人想了想貌似之前没写过。这里简单写一写大概的方式。 这里结合一下AI的回答,并增加自己的个人理解。
近日,数学领域四大顶尖期刊之一的 Inventiones Mathematicae(数学新进展) 在线发表了东南大学与香港大学的合作研究成果——“The lin...
模拟信号链研究到现在,我只想说,什么电压,什么基准,其实背后的大 Boss 是阻抗,是的,就是阻抗,影响频率的最大“黑粉头子”。前几天的徐老师电桥大家感兴趣的也...
论文标题:MLOW: Interpretable Low-Rank Frequency Magnitude Decomposition of Multiple ...
Part A Expected Free Energy as a Structural Architecture of Individual Choice
我们说"北京"这个词时,脑子里会想到:城市、首都、政治中心、文化古都。这些概念连在一起,构成我们对"北京"的理解。Embedding做的,就是把这种理解映射到数...
哈希表作为数据结构中的“性能王者”,是HashMap、ConcurrentHashMap、Redis哈希类型等核心组件的底层基石。其O(1)的平均查找复杂度让它...
在去年之前,深度学习领域的主流范式是「固定计算」。无论问题是简单(例如「加州的首府是哪里?」)还是复杂(例如一道高难度的数学竞赛题),模型在推理时消耗的计算资源...
这些我们亲手创造出来的「数学有机体」,其内部的运作方式在很大程度上仍然是一个深不可测的黑箱。它们为何会「一本正经地胡说八道」(幻觉)?为何有时像个极力讨好你的「...
国际数学奥林匹克(IMO),被誉为中学生数学竞赛的「世界杯」,是全球公认的衡量顶尖数学解题能力的巅峰舞台。其试题以极高的难度、深度和对创造性思维的要求而闻名。
除了矩阵乘法,AlphaEvolve 还在更广泛的数学领域展现了其「科研助理」的潜力。研究人员将其应用于数学分析、几何、组合数学和数论等领域的超过 50 个开放...
以前我们总觉得,模型遗忘无非就是“新权重覆盖了旧权重”。但近期的理论物理和高维空间研究无情地戳破了这个简单的假设。在109B到1.5T参数规模的大模型(如Lla...
大家好,我是赛博解生酱,今天带来一篇关于大语言模型(LLM)底层机理的硬核论文,但它探讨的话题却充满了浪漫主义色彩——“类比推理”(Analogical Rea...