当前互联网的通信模式以主机为中心,大多数用户主要对访问信息本身感兴趣,而对信息实际位于何处不感兴趣。为了适应互联网应用由发送者驱动的端到端通信模式向接收者驱动的海量内容获取模式的转变,并从网络体系架构层面提供对可扩展和高效内容获取的原生支持,研究界近年来提出以信息为中心的新型网络体系架构ICN(Information-Centric Networking),其中最具代表性的有CCN(Content-Centric Networking),NDN(Named Data Networking),PSIRP(Publish-Subscribe Internet Routing Paradigm)。ICN网络最主要的特点之一是网络内置缓存,由于名字的命名特征,ICN缓存路由器可以识别内容并对其进行标识和转发等操作,因此,部分内容可缓存在网络中的路由器上,而不仅仅缓存于服务器,这将加快信息的发送速率,减轻服务器负载。
近年来,ICN领域中的内容缓存问题引起了国内外的广泛关注,大多数缓存方案针对固定网络,即只考虑有线场景下的内容缓存。据Cisco公司统计,2016年全球移动设备比2015年增加了近五十亿台,其中智能手机增长比例最大。在2016年,全球移动数据流量较2015年增长了63%,其中移动视频流量占移动数据流量总量的60%,并且移动数据流量和移动视频流量在未来几年内还将呈现持续增长趋势。同样地,ICN网络也将面临着大量移动用户接入的问题。当移动设备对内容发出请求,但是在接收所请求的数据之前断开或移动到新的附接点时,将会增加接收数据的时延,这对于具有严格时延要求的应用可能是至关重要的,并且用户的移动可能会对内容流行度造成影响,流行度的动态性将导致缓存内容的动态性。因此,ICN缓存方案的研究应该考虑移动性对内容缓存造成的影响,从而设计出合理的缓存方案有效地提供移动性支持。但是目前的缓存方案很少考虑移动性对内容缓存造成的影响,本文正是以此为背景,对现有的移动性缓存方案的研究成果进行归纳评述,并与ICN网络中没有考虑移动性的缓存方案进行比较,指出移动性缓存未来的研究方向。
1
移动性缓存概述
随着Wi-Fi和4G、5G技术的快速发展,智能手机、平板电脑等移动设备已被广泛使用。在ICN网络中,用户既是内容请求方也是内容提供方,用户移动性的加入将带来内容请求时延、内容流行度变化等方面的影响,给ICN业务提供带来新的挑战。如图1所示,当用户从4G网络移动到Wi-Fi热点(如user4),或者从一个Wi-Fi热点移动到另一个Wi-Fi热点(如user5),或者当用户作为内容源移动(如user6)等情况出现时,用户如何在新接入的无线访问点更快地请求到所需内容,以及移动性的加入会对ICN网络的缓存带来怎样的影响等都与ICN网络中移动性缓存策略密切相关。
目前,现有工作主要侧重于在ICN网络中提供有良好高速缓存命中率的缓存方案,或者探索移动网络中的用户移动性和内容源的移动性,部分工作考虑了ICN网络缓存方案中的用户移动性和内容提供方移动性对内容缓存的影响。本文对近年来关于支持用户移动性和内容提供方移动性的缓存方案进行了概述及归纳。
1.1 ICN网络中的移动性情况
在ICN网络中,移动性主要包括两种,分别是用户移动性、内容提供方移动性。
1.1.1 用户移动性
当用户移动时,用户在当前站点的下载将中断,由于用户移动位置的不确定性,导致用户在到达下一个站点时,该站点可能没有缓存用户请求的内容,为了保证更高的缓存命中率,前期的缓存应该考虑用户的移动性,但是用户的移动的位置不确定也导致前期缓存位置的不确定性,这样就导致内容提供商在前期缓存内容时的复杂性。
1.1.2 内容提供方移动性
在ICN网络当中,具有缓存功能的移动设备也可充当内容提供方,来提高内容分发的效率。当用户在移动性内容提供方处下载内容时,内容提供方可能会发生移动,如果内容提供方附近的站点没有缓存用户请求的内容,此时用户正在进行的下载将会中断,为了保证更高的缓存命中率,前期的缓存应该考虑内容源移动。
1.2 移动性缓存的方法
目前在ICN网络中对用户移动性的研究相对较多,对内容提供方的研究相对较少。接下来将分别从用户移动性、内容提供方移动性两部分来对移动性缓存方法进行归纳评述。
1.2.1 用户移动性缓存方法的研究
用户移动性缓存方法的研究可以广泛地分为四种:(1)反应型:用户离开时,旧连接点继续缓存用户所请求的内容,在用户重新连接到新连接点后,新连接点请求来自旧连接点所缓存的内容,过程如图2(a)。反应型存在明显缺点,旧连接点到新连接点的转发过程增加了传输时延。(2)持久订阅:代理维护移动用户的订阅,并且缓存与订阅匹配的项目,即使移动用户处于离线状态,过程如图2(b)。持久订阅必须支付内存使用中的显著成本。(3)主动型:内容被主动缓存在新连接点,使用户在重新连接到新连接点时立即获得内容,过程如图2(c)。主动解决方案的关键问题首先是缓存,其次是在哪些邻居缓存。(4)启发型:移动用户在移动过程中将对缓存策略产生影响,启发型方法通过启发原有的缓存策略来根据这种影响动态调整缓存内容,借以提高本地网络的缓存命中率,过程如图2(d)。
反应型:文献[11]中在客户端离开之前会提前发送分离请求给代理,其中包含客户端的“id”,客户端请求的内容将继续在该代理缓存,当客户端重新连接到网络时,需要从新接入的代理发出请求消息,找到移动之前连接代理的“id”获得内容,但是寻找以前代理的开销较大并且可能会产生较长的时延。文献[12]对移动性支持基于移动服务代理实现的,当客户端到达其目的地时,它使用移动接口与本地代理联系,与其分离的远程代理进行交互,将所有订阅和所有缓存的消息从远程站点传输到本地站点,然后传送到由客户端库,该方案需要对客户端进行设计,并不具有普适性,并且整个方案需要大量服务代理,将进一步加大开销。文献[13]方案引入地理位置,即基于用户当前位置提供相关的内容服务。文献[14]提出一种跨层网络来辅助无缝移动性方案,总体设计目标是切换场景下最小化一段时间内的兴趣包和数据包的丢失,但是方案中的控制开销和转发开销是巨大的,需要进一步优化。
持久订阅:文献[15]详细研究了发布/订阅中间件性能,文中的试验评估表明,中间件级切换可以使持久订阅在无线环境中工作,但它们的吞吐量非常低。即使在固定网络中,持久订阅的吞吐量也低于不可持续订阅。使用持久订阅,代理维护移动设备的订阅和与这些订阅匹配的缓存项目,而与移动设备是否连接到代理无关,这导致巨大的存储成本。
主动型:文献[16]将基础问题建模和公式化为一个整数线性规划问题,旨在获得内容缓存和重定向之间的最佳平衡。文中未考虑基站相邻而其相连的路由器不相邻的情况,即切换之后无法使用所谓的邻居代理。文献[17]提出一种选择性邻居缓存方法,主动将请求的内容缓存在距离当前代理一跳的邻居节点子集中,文中通过时延和缓存成本两者的折中来选出合适的邻居子集。文献[18]采用位置和数据模式预测来主动支持消费者在网络中的移动,该方案最优地高速缓存接近消费者的预测内容,使其将在切换之前得到满足并避免兴趣重传,但是文中并没有对位置和数据模式预测进行相应数学模型的建立和相关方法的设计。
在主动型的缓存方案中,用户的运动行为很难预测,文献[19]利用一种称为邻居图的数据结构,动态捕获移动用户的潜在移动性图。随着时间推移,每位代理都会了解到其近邻,使这些邻居代理在发生切换之前缓存用户请求的内容。该方法对于准确预测用户移动性的依赖性较高,并且如何平衡代理之间的负担也是一个需要考虑的问题。文献[20]提出一种分布式主动缓存方法来支持用户无缝移动,并且方案中采用拥塞定价方案来有效利用本地路由器的缓存空间,该方法会在满足用户的移动请求之后会马上删除本地的内容,可能会造成内容的重复利用率不高。
启发型:文献[21]提出一种移动性/流行度的缓存策略,根据移动性动态调整内容流行度,即在原有流行度的基础上加上从别处转移过来的请求对应的流行度,构成新的流行度,依据新的流行度缓存内容。方案将网络划分为不同站点,用户切换于不同的站点之间,但是文中并没有考虑数据重传的持续开销。文献[22]提出一种基于分类的智能缓存方案,来动态适应用户需求的变化。方案根据不同地区用户的需要合理组织缓存内容,来提高对用户的移动性支持。方案中需要对用户数据和内容数据进行整合分析,但是文中并没有具体给出相关的算法,只是简要提到需要用到聚类分析。
1.2.2 内容提供方移动性缓存方法的研究
从查阅的国内外文献来看,目前内容提供方移动性缓存方法的研究较少。其中,文献[23]提出了向邻居主动推送内容的方法,当提供商将要移动并且消费者请求内容时,内容将被传送到相邻节点,并且提供商会根据周边条件和内容受欢迎程度随机传输内容。同时,提供者探查相邻节点是否具有内容的副本,如果相邻节点有重复内容,则提供商移动时无需传输内容。然而,当移动设备进行网络切换时,其性能不能达到最佳。此外,考虑邻居只会限制资源利用率来管理生产者的移动性。文献[24]提出一种OpCacheMob方法,基本思想是在切换发生之前主动将缓存期间要求的数据放置在高速缓存中,该方法需要知道两条信息:第一个是移动的生产者的切换时间;第二个是知道在收敛时间内从移动生产者那里请求什么数据。文中使用位置估计器和请求模式预测器来查找未来请求的时间,数据和消费者。文中仅假设这样的信息是可用和正确的,并不能保证其在真实环境中的适用性。
1.3 不同移动性缓存方法的比较与分析
由于对内容提供方的移动性缓存研究相对较少,本节首先对用户移动性缓存方法进行比较分析,随后对用户移动性、内容提供方移动性两类不同情况的移动性缓存方法进行比较分析。
1.3.1 用户移动性缓存方法的比较与分析
表1从六个方面对不同类型的用户移动性缓存方案进行比较。
从表中可以看出,反应型的特点是内容来源为旧接入点,其缓存冗余度相比持久订阅与主动型相对较低,因为反应型不需要重新在新接入点进行缓存,但是相比主动型来说要付出时延较长的代价;持久订阅目前的研究相对较少,因为持久订阅的缺点十分明显,属于机械式的缓存,无论用户处于离线或在线状态,代理都将缓存用户订阅的内容,造成缓存空间的匮乏;主动型缓存的特点是内容源为新接入点,但是与反应型相比缓存冗余度相对较高,因为需要在新接入点重新缓存,但是相比反应型来说,主动型的时延相对较低;启发型缓存方案是根据移动属性动态影响着缓存策略,来调整对内容的缓存,具有更加广泛的普适性。
1.3.2 用户移动性、内容提供方移动性的移动性缓存方法的比较与分析
内容提供方中移动性缓存的方法研究与用户移动性中的主动缓存类似,都是提前在邻近节点对内容进行预取,来满足用户服务,从分析中可以看出,两类移动性情况的缓存方法是相互联系的,通过分析两者之间的关系,有助于启迪学者开展更加深入的研究。
2
ICN中传统缓存与移动性缓存的比较与分析
ICN中传统缓存策略多数研究的是有线场景,部分考虑无线场景,而移动性缓存研究主要是考虑无线场景缓存、移动性对缓存的影响。
2.1 有线场景与无线场景
有线场景:ICN传统缓存主要考虑有线场景下的缓存,网络拓扑相对固定,旨在使内容导向的网络服务可行。
无线场景:ICN移动性缓存主要考虑无线场景下的缓存,需要考虑用户或内容源的移动性,旨在减少请求内容时延。
2.2 路径缓存与任意路径缓存
路径缓存:传统缓存策略又称作路径缓存,本质上,路径缓存允许内容沿传播路由缓存,从而减少后续用户获取相同内容的延迟。然而,对于高移动性的无线网络,这种方法可能导致移动网络的低效率,原因是每当移动用户在附着点发生变化时,都需要将兴趣包重新发送到内容发布者,这可能会导致不可接受延迟和网络重大开销。
任意路径缓存:移动性缓存又称任意路径缓存,任意路径缓存允许根据用户移动性考虑内容的缓存,尽可能把内容缓存到离移动用户较近的位置,从而减少移动用户获取请求内容的延迟。然而移动性缓存中的启发型缓存又与传统缓存相似,简单的来说可以认为是在传统缓存中把移动性的因素加入到原有缓存策略中,支持移动性。
综上所述,路径缓存与任意路径的缓存侧重点不同,路径缓存侧重于内容,任意路径缓存侧重于移动用户。
2.3 内容属性与用户行为
内容属性:传统缓存策略中,文件内容主要按照内容的属性来决定是否(如流行度、大小等)缓存在分布式ICN服务器上。由于跨服务器或传出流量通常是昂贵的,所以ICN提供商尝试通过适当的缓存策略尽可能地在本地服务器处理请求,即处于较高的缓存命中率。然而,用户移动性对内容的流行度有很大的影响。一个站点的不完整下载可能被移动用户携带到另一个站点,从而产生对相同内容的新请求。因此,来自传统ICN纯粹的基于流行度的缓存方法对于接入移动用户的ICN而言变得无效。
用户行为:现有的工作要么着重于在ICN中提供良好的缓存命中率,或者探讨移动网络中用户移动性,部分工作考虑到ICN缓存方案中的用户行为。移动性缓存主要考虑到内容属性与用户行为的结合。在移动性缓存中,通常关注用户行为,比如用户的转移概率、用户将要请求的内容、用户在某个地理位置将会请求什么类型的内容、用户行为会对内容属性造成什么样的影响等,尽可能实现一个全面的考虑,从而提高网络的缓存命中率。
3
移动性缓存未来的研究方向和挑战
ICN中移动性缓存的研究取得了一定进展,但是目前研究相对较少,因此,当前仍然是一个充满挑战和机遇的新兴研究领域,可以进行开拓式创新或继承式研究,并且值得研究的方向还有很多,主要包括:
(1)内容源移动性的研究
目前研究中大多数是关于用户移动性的研究,对内容源移动性的研究相对较少,如何建立内容源移动与缓存方案的关联模型,并根据此优化缓存模型,是能够有效提高无线场景下缓存命中率的潜在途径,更进一步来说,如何关联内容源的移动与用户的移动,也是一个仍待解决的问题,并且目前的数学模型和实证研究十分缺乏。
(2)用户行为的研究
移动性缓存策略的研究中,用户行为即用户的转移概率都是假设值,部分文献针对用户移动性实现随机游走模型,这对于调查真正的移动性跟踪是不切实际的。有些文献则侧重于不同的场景或方法。现有研究中,很少有针对用户行为的研究,因为用户转移概率的不同会直接影响到缓存策略,所以开展真实有效的用户行为研究是十分必要的。
(3)数据重传的持续开销问题
现有移动性缓存策略使用的技术是反应型或主动式,其尝试减少数据访问时间,但是需要重传。然而,在ICN设计中隐含的假设,移动性由兴趣包重传支持发现是次优的,这增加了数据访问时间并降低网络的总吞吐量。因此,针对数据重传问题的研究对于成功的移动性缓存策略是非常有意义的。
(4)缓存决策策略的研究
在现有移动性缓存策略中,存在所有到达内容项目都需要缓存的情况。然而,在现有网络规模下,系统地缓存所有块可能导致低缓存分集,从而降低ICN的效率。此外,由于缓存操作在路由器中必须是线速,因此大多数现有的缓存策略并不具有实际意义。上述结果表明,缓存决策策略对于提高缓存分集具有重要意义,可以通过与高速缓存替换策略的配合来大大优化缓存性能。
(5)多路径转发
某些信息中心网络(如CCN)支持多径路由,即对同一内容前缀的请求可以同时通过多条路径在网络中并行传输,请求可能会被发往所有匹配的前缀发布者。多径转发有助于解决移动性和多宿主等问题。
当然,未来研究工作中还有一些其他很有意义的工作,比如高速缓存成本和延迟之间的权衡、移动性缓存策略的计算复杂性和可扩展性,引入指导启发式技术来提供实时接近最优的缓存决策,以及网络拓扑、业务需求、信息项大小、断开周期持续时间和网络内缓存如何影响缓存策略的性能,另一方面,较高级别的代理可能潜在地服务更大数量的移动附接点,因此使用较高级别的代理可以减少需要主动缓存信息的代理数量,从而减少总高速缓存成本等。
4
结论
随着移动用户的高速增长,开展对信息中心网络的移动性缓存研究可以更好促进未来网络的发展。本文对近年来国内外学者在移动性缓存领域的研究成果进行了回顾、分析、比较、总结,并比较了ICN网络中传统缓存策略与移动性缓存策略的特征与不同;同时也讨论了移动缓存中若干主要问题的研究现状,包括内容源移动性的研究、用户行为研究、数据重传开销、缓存决策策略等。总体来说,对ICN网络中移动性缓存的研究处于起步阶段,具有广阔的研究空间,无论在理论模型还是性能优化方法方面都有大量关键问题需要进行开拓性的探索和深入细致的研究。这些问题的解决和完善,对于设计、规划和运营未来的ICN网络具有重要的理论价值和实践指导意义。
领取专属 10元无门槛券
私享最新 技术干货