首页
学习
活动
专区
圈层
工具
发布

AI时代的“原子级”真相:最聪明的脑子,往往由最笨的零件拼成

大家总觉得大模型深不可测,其实它的最小单元——感知机,简单到只需要一行公式。输入、权重、偏置,再加一个判断,这就是全部。很多人不理解为什么要“偏置”,用大白话讲,权重决定了尺度的斜率,偏置则是把决策边界左右移动的那个轴。没有偏置,你的决策永远被死死锁在零点。

真正有意思的是,上世纪60年代我们就有了运行多层网络和早期Transformer的算力,但当时由于权威学者的唱衰,整个行业硬生生倒退了二十年。这说明科技的停滞往往不是因为硬件不够,而是我们的想象力被过早设限。

今天的万亿参数大模型,无非是把这些简单的“小脑子”疯狂堆叠。底层逻辑从未改变,最伟大的涌现,往往来自最朴素的重复。

ranpara.net/posts/perceptron-explained-from-scratch/

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OV87-30kMcPsIbAjOALTL-dQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。
领券