00:00
我来请哪位嘉宾提问,哪位教练回答,那第一个问题啊,因为我们今天主要是一个向量数据库发布,所以那我就问,那向量数据库我们刚才谈到在这个大模型时代之前已经被广泛使用了,那么在大模型时代呢,他现在又突然就爆火了啊,那最近呢,Bill gas他也发文提到啊,说未来的这个智能体验数据交互也离不开向量数据库,那你能展望一下向量数据库未来它的发展前景吗?我们刚才有一位嘉宾分享的时候也提到,向量数据库更多是在弥补现在大模型的缺陷,那么在未来呢,如果大模型做的更好,还需要向量数据库吗?那么向量数库在未来在哪些领域会比较有前途呢?啊,那我们来看一看啊,我们这个向阳数据库的问题,要不我们先请王萌教授来给我们分享一下您的观点,感谢啊,我第一个发言啊,很荣幸就是,呃,我觉得这个问题特别好,就是我个人从学术的角度来来。呃,从三个方面来回答这个问题吧,首先就是我们刚才你也提到了,就是向量数据库,其实它诞生的也比较早,对吧?所以说我我把它概括为三点,就向量数据库for大模型,大模型for向量数据库以及向量数据库加大模型。那么具体来说的话就是向量数据库放大模型,我觉得刚才也提到,就是我们其实在大模型走向深水区,落向垂欲的过程中,呃,伴随着提到的时效啊,然后幻觉问题啊,甚至偏见啊,对齐的一些场景,那么我们不得不引入更多的呃,外部多模特的数据,那么在这个过程中,其实向阳数据库呃是为大模型在落地过程中提供了很好的助力,或者是是引擎吧,那么在这个过程中其实有很多研究的点,或者是不管是垂欲的还是通用的,对,然后嗯,包括我们很好的如何能够根据大模型自身的特点来设计刚才提到的。
01:55
不管是优化啊,策略啊,索引方面是一方面,另外一个就是呃,大模型负向量数据库对吧?就如果我们真正目前已经垂育的LR,或者检索系统已经比较精准或者是比较成熟的前提下,我们并不是说是完全推翻,然后去做一个以大模型为中心的,而是说我们如何思考,刚才也提到就是那向量数据库本身向量从何而来,对吧?它其实的现在才我我我目前看到了所有的引半模型,其实和大模型本身生成式的这个inbing其实是两个完全不同的语义空间,如果我们能够用大模型自身的一些比如说编码in扣de的方式,而不是只用它的生成的抵扣的方式去帮助我们适配在向量数据过程中做更好的引板底,甚至是一些索引的学习,我这是我觉得是另外一方面,嗯,最后一点的话,就是我个人认为,其实我特别赞同啊,今天呃罗云罗总说的,也就是说就是呃,我们可能是一。
02:55
这个最终形态是一个向量数据库加大模型这样的一个,打造一个完美的一个framework级别的一个,可能是未来一个非常重要的一块平台吧,因为这一点的话,其实是不是说彼此取代或者是彼此助力,而是我最后也也也在思考这个问题,比如说其实我们现在的搜索引擎,其实IR已经做的足够好了,那为什么我们不直接外挂一个搜索引擎去做这件事情,而去谈向量数据库呢?那么我想我相信可能会在向量数据库加大模型,这个两者都平衡的角度可能会有答案,那个看起来各取所需对吧?对对对的,各取所长。好,那我们接下来请贺清贺总吧,刚才也听到您这块有很多呃呃,实践经验的分享。
03:41
您来谈一谈啊,我我也有个看法哈,就是这个大模型,我觉得大模型是离不开这个向量数据库的啊呃,但是像那个在gpt他们open AI吧,前几天发布了这个GPTS啊,实际上他其实是可以理解为是一个整合型的产品,他呢就用户用的时候不用关心相关数据库了啊,它是整合提供服务的,那么我觉得这也是腾讯云。
04:10
未来要要支持的一种模式啊,那什么时候不需要向量数据库了呢?啊,可能是下一代的AJ产生啊,A实现啊,大模型这这个我觉得它这个原理上决定了这个销量数据还离不开的。了解,那可能就是AJ已经把向量数据库融合在里面了,向量数据成为AJ的一部分。那我们请王朝辉,呃,王总也给大家分享一下。我觉得。喂喂喂,我结合我的这个技术感受吧,我觉得这个,呃,大部分型对象的数据库是共存的,互相之间不能取代。我举两个例子,一个按人来举,就没有任何人是靠死记硬背去解决智能这个问题的,对吧?就一个好记性不如一个烂笔头,就你有再高的智商的话,你有家里都需要有一个书柜,你需要有图书馆,对不对?所以一个是智能,一个是数据,然后站在这个大部经的技术上来讲的话,大部经整个训练过程之中,它解决的是抽象的问题,所以它的数据是压缩的,也就是意味着大部星不能重现数据,所以你必须要基另外一个系统,然后给他补充技术细节,特别是那种快速变化的数据的话,你必须要去通过另外一个下面数据库去给大模型去做补充,所以的话,你会发现这个人跟机器都是一样的,只有智力的话,他就有抽象,他就有压缩,它就有损耗。
05:31
然后如果你要死记硬背的话,他就没有治理,就这两个东西的话,未来肯定是两套系统之间不能取代,但有可能的话,比如说像CEE做一个平台出来,然后屏蔽底层的所有细节,然后上层的话是一个应用。那在这应用这一端的话,你就甭管下面是什么技术细节了,反正上面这个应用展现出来的话,就是它既有高智商,然后又能实时变化数据,这样的话就可以把整个技术站合并了。
06:00
它是一个互补的关系,对吗?哎,会长期共存,那好,那我们请罗云,罗总本身您是开发云数据,呃,那个向量数据库的,然后您可以来分享一下您的观点,我自己的大的观点啊,我觉得和王昌辉王总的逻辑是一致的啊,我觉得人类社会和我们将要走向的AG的时代其实是逐步演进的,也就说我们其实是通过数字化的方式去模拟人类的世界,然后去达到AJ,那我们人类的分为我的脑子的智能计算,也会有很多在物理世界的记忆体,它的存储体,我认为这两者它的模型和技术眼镜是不一样的,所以我认为大模型它可能解决的是一个计算问题,而基于向量数据库,这种向量格式解决的是我们人类数据的存储问。
07:00
那这是在技术层面,技术层面是这样子,不影响说我们有一个大的平台,例如openi这样的平台,会去把下面的计算和下面的存储它隐藏在后面,让我们的用户更好的去用,但是并不代表说这个时候像数据库它本身就不存在了,只是说我们通过平台化的方式去把它隐藏掉了,让这个东西应用性更好,这个是在技术层面的,那在商业层面,我自己的看法啊,像open AI也好,像呃百川也好,这种大的大模型的平台,他们最后会朝着演进为新的计算平台的方式,就是说他们可能是新时代的,像我们现在腾讯云也好,阿里云也好,这样大的一些计算和存储的平台,他们会有自己的计算产品,会有自己的存储产品,那多家不同的。
08:00
计算平台会去瓜分不同的市场,当产生多家市场之后,就会像现在的云计算市场一样,也会有芒DV啊,像ES啊,像斯菲这种第三方中立的数据厂商也会出来说这个中间一定是你中有我,我中有你,然后持续去演进的一个过程,我自己看的是这样啊,这个我觉得罗总发现很棒,从产业的一个高度,产业的这个发展趋势给到我们很好的解读,好,那我们进入到下一个问题啊,那我们知道现在这个大模型这么火爆啊,各个方面现在都在大模型领域,AI领域进行投资,来寻找自己的这种机遇,那么我看今天我们的嘉宾也来自于不同的背景啊,有这种大模型厂商的,然后也有这种算力的,对吧,也有做算力,也有做垂直行业的,还有,呃,学术界的,那么我们纵观全球啊,现在整个大模型来看,现在来看啊,就是提供算力的公司,他的这种传。
09:00
前的呃呃,路径还是非常清晰的,确定性是很高的,那除此之外呢,其他你不管是做大模型的厂商啊,做垂直领域的,还是反正各个方面,其实目前还是在一个投入的阶段,还没有说能够清晰的看到他怎么样去赚钱,所以呢,我抛出一个比较有呃开放性的问题,就在下一个阶段,那大家呃谈一谈嗯,到底投入AI大模型的这个产业,哪一方可能率先能赚到钱呢?是比如说做大模型的平台的,做垂直应用的,还是做消费品的呢?那么这个问题呢,我先请我们做投资的嘉宾陈超,陈总,然后您来谈谈好不好。好,感谢主持人的提问,感谢腾讯的邀请,嗯。就谁来谁先赚到钱这个问题,呃,就是刚才说到的这个英伟达,对吧,现在已经是赚的钵满钵满,呃但是TOC的行业其实也有这个open AI的China GT等,就是GBT为代表的也赚了不少钱,虽然可能目前还没有盈亏的平衡,但未来可能会盈亏平衡。呃我跟大家想去就是探讨这么一个行业规律,比如说我们回到100年前电力革命的一个时代,呃,他更多的是从底层架构的重构开始,也就是确定了交流电,直流电啊,应用的不同的场景和应用的不同的范围,才能在上面去打造不同的应用,就是家用电器啊等等,才能基于加交流电这种确定的底层架构的这种呃形式来去,呃蓬勃的以后春笋般它发展起来,我认为这个行业规律,呃,对于我们这次的呃,人工智能革命其实同样适用,呃,我更认为是一个基础架构级的这样的一个革命先行,这里包括了呃,底层的这个呃。
10:46
呃,算力,微架构啊等等这样的,包括HBM等等,这这种包括芯片之间的互联,甚至是光IO,再包括上层的数据库,大模型的一定的呃达到一定的强的一个能力,动模态的一个能力之后,才能在上面之上去被方这个呃不同的应用,所以我更认为是呃先有这样的一个技术架构级的一个变革,再有应用变革,但是我观察到就是说越来越这个window这个窗口在缩短,呃不会说我这个技术架构变革五年之后才会具有应用上的一个变革,这个缩短可能可能也就两年甚至不到,这是可能更多的是创新也好,就迭代也好的这个加速好,谢谢他的就是像当年这种电力革命,它的整个产业的呃完全成熟可能要很多年,几十年的时间发展,那现在可能就缩短到几年的时间,整个产业就能够清晰的看出来了,对吗?对的是好好好,非常感谢,那我们我们做算力的刘文卓刘总,您来谈一下您的看法。
11:42
呃,我们这波这个没有那么像英伟达那么挣,挣到那个钱,当然那位呃这个呃呃这个呃我是这样想啊,就是刚才这个呃贺总讲的挺对,就是最早的时候计算机出来,为什么我们现在有AI,就是因为你算了已经到了很便宜的程度,对才可以使得大家呢,能够呃有这种大数据啊AI的呃出来,那你到十几年前,20几年前,你说你可其实神经网络很很长时间就出来了,为什么不不流行,就算你不够嘛,你问一个问题,你你你你半小时才回答,这不可能的事情啊,所以呢,AMD呢,从这个,从我们自身呢,还在这个致力于这个,这个生产出更便宜的,效率更高的算利平民化,到这个时候呢,而且我相信大概嗯就像刚才这位呃呃呃呃这个呃。
12:38
陈超陈总啊,陈陈总讲的啊。当你的,因为现在确实GPU太贵啊,但如果你GPU是特别便宜的时候,那AI就非常快的普及出来了,所以我觉得两到三年,根据摩尔定律的这种发展啊,啊这个我觉得还是我还挺赞同你的这个看法,对,并且还有贺总讲的挺对的,就是那个那个这样的一定要大家都能用啊,就是这个,就像为什么在讲一些,就是呃,这个微信出来以后,互联网这种或者手机互联网才真正的得到了这个普遍也是大概是这个意思,先底层算理平民化,后面应用才能够普及化,对,非常感谢,那我们请百川的李总,然后您作为大模型的一个厂商谈谈您对这个到底谁先能赚钱,可以聊一聊,特别听说你们要做好像明年要发布什么超级应用,C端的超级应用,其实我们一直在思考这个问题,对,所以我们那个从大模型,四月份那个成立公司,然后那个智立表彰公司啊,六月份上第一个大模型,我们一直在思。
13:41
好在迭代把我们传统想的是说,呃,要推出自己的迷点,推出自己的超级应用,那么谁挣到钱,其实我们目前的思考来说,我觉得应该是说,第一离用户最近的应该是第一波能赚到钱的啊,这是从C端来说,第二呢是说在B端来说,离价值最近的肯定是第一波能赚到钱的啊,就是离用户最近,就是说你确实帮助用户解决他实际中的问题,他愿意为这个问题来买单啊,他一定会为此来付费,所以你就能够赚到钱,那么你价值最近也是一样的,可能现在有很多企业可能在观望状态,或者在试用状态,他他们也想不到这个东西能对他带来核心的指标,关注什么啊,比如说他能的企业能给他带来实际的收入,能帮他增加他的开源,带来更好的营销效果,他肯定是愿意买单的,对吧,如果能你能证明他能帮他去节约成本,人力成本,这之后他也能创造价值,他一定能够去买单的,我觉得这两个一定是最先挣到钱的,嗯,好吧,我觉得您这句话总结的很好,这两句话我觉得我要重点的再复述一下,就是做TOC的应用是离用户最近的,最。
14:41
先赚到钱就To B应用呢,是离客户价值最近的,最先赚到钱啊,我这这这两句话我我觉得我要记下来,非常感谢啊,那我觉得今天时间关系我们的语文桌呢,就到此结束啊,但是呢,我们各位嘉宾请留步啊,好吧,我们接下来呢,还要邀请两位嘉宾上场,一位是腾讯云副总裁陈平,陈总,还有一位呢是腾讯云标准副总裁戴威,戴总请上台,我们接下来呢,有一个AJ技术生态联盟的发布仪式,哎,大家站起来共同向前站,哎,各位有请,对对对,大家在前排,前排这个对啊,我作为主持人,我就在边上,对你们往中间站,往中间站。
15:38
好,大家正好啊,让我们一起面向前方,邀请大家一同伸出我们的大拇指啊,对对对,伸出大拇指,伸出大拇指,好的。一起倒计时,准备好了吗?321启动,恭喜我们的AI技术生态联盟正式成立。
我来说两句