网友一:
估计象谷歌,youtube这样的网站,他们自己人也搞不清楚自己有多少台服务器,多少G硬盘,据说谷歌全球有几百万台服务器,每台服务器按1TB的硬盘,就是上百亿G的存储容量了,谷歌一刻不停的把全球的网站收录到自己的服务器,youtube每分钟都有大量的视频上传,说是数百小时的视频,差不多是百G大小,形象来说普通家庭能用十年的硬盘,它们分分钟就满了。当然对这样的大公司来说,硬盘不值什么,每天用坏的都不知道多少,据说美国有个云服企业,在因为天灾硬盘供货不足,到处买硬盘,加钱扫货。所以,说上千亿G,也不是什么事。
网友二:
本人工作在存储阵列厂商,简单说下视频存储公司的解决方案
存储选用上主要使用分布式存储加分布式文件系统,保证高并发高带宽,存储底层会一定选用分层技术,怎么说呢,很多视频点击量爆高,当然会存储到大容量缓存中,外加外置UPS保护,那么当视频没人看的时候,就自动迁移到便宜的7200转或5400转的HDD存储层中。现在的硬盘最大做到60TB了,企业级大容量氦气盘已经有10TB,12TB了。特别老的视频文件且为普通用户上传的会被后台分析平台筛选出来删除来释放空间。尽量说的直白一点,有什么疑问欢迎留言讨论。
网友三:
数据说话太枯燥,为了更直观,我讲一个故事。我几年前在新疆,有人说Baidu准备在新疆背部建一个数据中心存储它的数据,因为那儿气温低,可以节约不少电费。你大概估计一下这是多大的数据量,让一个千亿级的企业冒着民分的危险,跑那么远去建一个数据中心就为了节省电费。
下图是数据中心概念图,里面大部分是存储介质,你大概感受下,什么是海量信息。
网友四:
首先说下
YouTube和youku就是不断的加硬盘存起来。花好多钱。
UGC永远是有热点的,热点会在内存里,甚至分发到离你家很近很近的机房,这样速度会很快。
冷数据不会删,硬盘不读其实成本不高,瓶颈是同时读很多数据。
在CDN上缓存热点数据,方便分发。
网友五:
储存这些的机房都是阵列,像youtobe, youku这些允许用户上传视频的网站机房都很大。并且不止一个机房,现在大容量储存硬盘价格并不贵,倒是运营视频网站需要提供的带宽费用贵。
网友六:
分为好多中,一种是服务商自己建立储存服务器,一种是服务商租用存储服务器,一种是服务商将用户的PC和自己的服务器合并当做存储服务器,说说第三种吧,第三种是新式的组合,比如一部大话西游,最开始服务商是存储在自己的服务器的,当10个用户下载后,服务商将用户的资源建立成链接库,其他用户再下载的时候服务商软件直接优选宽带从空闲用户PC端下载,这样服务商的存储就节省下来了,当然这种模式并不成熟,目前已知360在这样做。
领取专属 10元无门槛券
私享最新 技术干货