首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

深入解析 BasedAI:隐私和效率并重的大语言模型运行网络,AI 赛道的下一个Bittensor?

作者:深潮 TechFlow

AI赛道持续火热。

不少项目都在试图让自己AI化,冠以“帮助AI做的更好”的新主张,以期顺着AI的风飞的更高。

但其中大部分老项目在过往的周期中已经价值发现,而类似Bittensor等新项目已经不再“新”,我们仍需要寻找尚未兑现价值,且具有叙事潜力的项目。

在加密项目“帮助AI做的更好”中,改进隐私性一直都是个具有吸引力的方向:

其一是因为保护隐私天然与去中心化中的平权概念有内在共鸣,其二要保护隐私,不可避免的要用上zk和同态加密等技术。

理念正确的叙事加上高深的技术,一个AI项目的发展大概率不会差。

而如果这样一个严肃的项目还能加上Meme币的玩法,会不会更有趣了?

3月伊始,一个名为 BasedAI 的项目在推特上悄然注册账号,但转帖之外也才正儿八经的发了2条推文;同时其官网看上去极其简陋 ---- 除了一篇高大上的论文版白皮书之外。

而某些外网KOL已经先人一步开启了分析,并感言该项目可能是下一个Bittensor。

同时,其同名代币$basedAI 自2月底开始一路高歌猛进,涨幅超过了夸张的40倍。

在仔细研读了该项目的论文白皮书后,我们发现BasedAI是一个集大语言模型、ZK、同态加密和 Meme 币于一体的AI项目;

在认可其叙事方向的同时,我们更感叹于其精妙的经济设计,将计算资源的调度和其他Meme币的使用,很自然地联系在了一起。

考虑到该项目尚处在非常早期的阶段,因此本期内容我们将对其进行解读,看其是否有成为下一个 Bittensor 的潜力。

当严肃的科学和Meme结合

BasedAI 到底在干啥?

在回答这个问题之前,不妨先看看这个BasedAI是谁做的。

公开资料显示,BasedAI 由一个名为 Based Labs 的组织和 Pepecoin 创始团队联合开发,试图解决当前AI领域大语言模型使用时的隐私问题。

前者 Based Labs 的公开资料并不多,其官网非常神秘,仅有一串由黑客帝国风格组成的技术关键词(点此访问);而组织中的研究员 Sean Wellington, 正是 BasedAI 公开的论文白皮书作者:

同时,谷歌学术资料显示,Sean 于UC伯克利毕业,自06年起还发表了多篇与清算系统、分布式数据相关的论文,擅长AI和分布式网络研究,看上去是一位在技术领域颇有研究的大佬。

而另一边,pepecoin 并不是目前大热的那个PEPE币,而是最初源于16年就启动的一个meme,当时还有自己的主网L1,目前已经迁移到以太坊上。

你可以说这是个OG Meme,也懂L1的开发。

但一边是严肃的AI科学论文大佬,另一边是Meme 团队;看似业务不相关的两拨人,如何在 Based AI中擦出火花?

ZK和FHE,兼顾AI计算效率和隐私

如果把 Meme 成分放在一边,BasedAI 的推特简介其实很直接的点出了项目的叙事价值:

“Your prompts are your prompts.” (你的提示词就是你的)

这实际上在强调隐私和数据主权的重要性:当你使用 GPT 等AI大语言模型时,你输入的任何提示词和信息实际上都会被对面的服务器接收,本质上你的数据隐私暴露给了OpenAI或其他模型提供方。

虽然这样看上去无伤大雅,但终归是有隐私问题,而你只能无条件信任AI模型提供方不会滥用你的对话记录。

刨去 BasedAI 白皮书中晦涩的数学公式和技术设计,你可以简单把 BasedAI 要做的事理解成:

将你与大语言模型对话的任何内容加密,在不暴露明文的情况下,还能让模型完成计算,并最终返还只有你才能解密的结果。

你一定会预感到,要实现这种效果,又轮到ZK(零知识证明)和FHE(全同态加密)这两个隐私技术登场了。

ZK允许你在不暴露明文的情况下,证实一件事的真假;

FHE允许你在加密的情况下, 对加密数据进行计算。

两者一结合,就能实现--- 你的提示词以加密形式提交给AI模型,模型返回给你回答,但中间的相关方都不知道你问的问题是什么,以及回答的结果是什么。

这听起来不错,但有个关键问题 --- 执行FHE技术上需要消耗大量计算资源和等待时间,效率较低。

而诸如GPT等LLM大模型面向用户,又要求快速显示结果,如何处理计算效率和隐私保护之间的矛盾呢?

BasedAI 在其论文中专门强调了其提出的“Cerberus Squeezing”技术,并以复杂的数学公式进行论证:

我们无从专业的评估这个技术的数学实现,但其要做的事可以被简单理解成:

优化FHE(全同态加密)中处理加密数据的效率,有选择地将计算资源集中在最有影响力的地方,快速完成计算以显示结果。

同时论文也用数据实证了这个优化所带来的效率提升:

在使用了Cerberus Squeezing 的情况下,全同态加密所需要的计算步骤可以被近乎缩短一半。

至此,我们可以快速的模拟出一个用户在使用BasedAI时的全流程:

用户输入提示词,要求分析某人对话记录中展现的情感,但希望保护记录隐私。

通过BasedAI平台以加密形式提交这些数据,同时指定需要使用的AI模型(比如情感分析模型)。

BasedAI 网络中的矿工接收到这个任务,使用自己的计算资源来执行指定的AI模型,处理这批加密数据。

网络节点在不解密数据的情况下完成计算任务,将加密的处理结果返回给用户。

用户收到加密结果,使用自己的密钥解密,得到了自己需要的数据分析结果。

“大脑”、矿工和验证者

在技术之外,BasedAI这个网络中具体有哪些角色,来执行技术并满足用户需求呢?

首先需要介绍的,是其自创的“大脑”概念。

A “Brain” from Based Labs

一般对AI加密项目来说,逃不脱的几个要素是:

矿工:负责执行计算任务,消耗计算资源

验证者:验证矿工完成的工作的正确性,并确保网络中的交易和计算任务的有效性

区块链:将执行的计算和验证任务的结果写在账本上保存,并通过链所自带的原生代币激励不同角色的行为。

BasedAI 在这3要素的基础上,还套了一层“大脑”的概念:

你必须有一个大脑,来装进矿工和验证者的计算资源,让这些资源为不同的AI模型进行计算并完成任务”。

说白了,这些"大脑"作为特定计算任务的分布式容器,用于运行修改过的大型语言模型(LLMs)。每个"大脑"可以选择它希望其关联的矿工和验证者。

如果你觉得这个解释很抽象,可以将拥有一个大脑理解成拥有一个“开展云服务的许可证”:

你想拉一批矿工和验证者来做大语言模型的加密计算,那你必须要持有一个经营许可证,证上写着:

你营业的地址在哪(编号)

你的营业范围是啥(用AI做情感分析,文生图,医疗助手..)

你的计算资源有多少,能力有多大

你具体拉了哪些人进来

你干这这件事能获得多少奖励

从Based AI 的论文中可以看到,BasedAI的每个"大脑"都能容纳多达256个验证者和1792个矿工,而系统一共只有1024个大脑,这又无形增加了大脑的稀缺性。

而矿工和验证者要加入某个大脑,需要这么做:

矿工:连入该平台,决定要分配的GPU资源(更适合计算),可存入$BASED代币,开始计算工作

验证者:连入该平台,决定要分配的CPU资源(更适合验证),可存入$BASED代币,开始验证工作

存入的$BASED代币越多,矿工和验证者在大脑上运行的效率越高,他们获得的 $BASED 奖励就越多。

显然,一个大脑代表了一定的权力和组织关系,这也为代币和激励设计打开了空间(后文详细介绍)。

不过这个大脑的设计,是不是有点眼熟?

不同的大脑,在 Bittensor 中有点类似不同的子网subnet,执行不同特定的任务,使用不同的AI模型;

而在上个周期流行的Polkadot中,不同的大脑又像不同的“卡槽”,来运行一个个平行链,执行不同的任务。

BasedAI 官方也给出了一个“医疗大脑”执行任务的示意:

病患医疗记录被加密提交到医疗大脑,生成提示词来询问合适的诊断意见;

BasedAI网络中合适的大语言模型在ZK和FHE的帮助下,无需解密敏感的病患数据即可生成回答,该步骤调用矿工和验证者的计算资源;

医疗保健提供者从 BasedAI 网络接收加密输出。只有提交用户才能解密其结果,获得治疗建议,而在此过程中数据不会被暴露或泄露。

玩出花的“大脑”权限售卖,利好 Pepecoin

那么, 怎么获得一个大脑,拿到AI模型加密计算的“开工许可证”权限呢?

BasedAI 联合 Pepecoin,将这个权限的售卖玩出了花,并赋予了Pepecoin这个MEME代币使用价值。

由于大脑只有1024个,项目方很自然的利用了NFT的Mint --- 每售出一个大脑,都会生成一个对应的ERC-721代币,你可以将其看成一个许可证。

而要Mint这个大脑NFT,需要2种与Pepecoin相关的动作才能解锁:燃烧或质押 Pepecoin。

燃烧方面,第一个大脑需要用户花费1000个Pepecoin才能Mint;

每Mint一个大脑,下一次Mint的成本增加200 Pepecoin;

通过这种方式生成的大脑可转让交易;

如果所有Brains都是通过Burn燃烧方法获取,则会有107,563,530 Pepecoin将被永久销毁。(CMC数据显示,当前流通量为133M,若这个燃烧全部实现,几乎减少了80%的代币供应量)

而在质押方面:

要求用户质押 100,000 Pepecoin,为期 90 天;

Brain 的ERC-721 NFT在质押后立即发行;

通过这种方式生成的大脑不可转让,但会被逐渐奖励$BASED项目原生代币

90天后可以解除质押

无论采用哪种方式,随着更多的大脑被创建,相应数量的 Pepecoin 要么被烧毁,要么被锁定,具体取决于两种方法的参与比例。

很显然,与其说这是AI资源的分配,不如说是加密资产的分配。

由于大脑的稀缺性和其开工带来的代币奖励,生成大脑时对 Pepecoin 的需求将显著增加;质押也好,燃烧也罢, 都会减少流通中Pepecoin的供应量,对于代币的二级市场价格来说当然是理论上的利好。

同时,只要 ERC-721 合约中发行并活跃的 Brain 数量少于 1024 个,BasedAI Portal 将继续发行 Brain。

如果 1024 个 Brain 全部发放完毕,BasedAI Portal 将不允许创建新的 Brain。

一个以太坊地址可以持有多个 Brain NFT。 BasedAI 门户将允许用户管理从与连接的 ETH 钱包相关的所有拥有的 Brain 中获得的奖励。活跃的大脑拥有者预计每个大脑每年可赚取 30,000 至 80,000 美元(官方论文数据)。

在这个经济激励的引导下,加上AI和隐私的叙事,可以预见Brain正式上线之后的火爆程度。

总结

在加密项目里,技术本身并不是目的,技术的作用在于引导注意力,进而引导资产分配和流动。

从BasedAI 的大脑设计中可以明显看到,项目把“如何促进资产分配”这件事玩明白了: 在数据隐私的叙事正确下,把涉及到AI因素计算所需的资源整合成一种权限,制造这种权限的稀缺性,进而引导资产流入到权限中,推高另一个MEME代币的消耗。

计算资源得到了正确配置并能获取激励,项目的“大脑”资产赚到了稀缺度和声量,Meme币减少了流通供应...

从造资产层面看,BasedAI的设计相当老道,也十分精妙。

但如果真要回答那些心照不宣、避而不谈、揣着明白装糊涂的问题:

有多少人会因此使用这个隐私保护的大语言模型?有多少AI巨头公司又愿意与这样不利己的隐私保护技术合作?

答案恐怕依然难以乐观。

不过,叙事乘风起,炒作正当时。

有时我们需要的不是质疑是否真的有路可走,而是应当顺风而行。

参考资料

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OXaIJ2lCMOyqUhQkm8UPaW_g0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券