基本概念
内容分发网络 (CDN) 是负责内容交付的互联网透明骨干网。不管我们是否知道,其实我们每个人每天都与CDN互动。
无论你做什么,或者你消费什么类型的内容,你都有可能在发送到你的PC和移动浏览器的每个文本字符、每个图像像素和每个电影帧后面找到CDN。
为什么需要CDN?
要理解为什么CDN被如此广泛地使用,首先需要认识到它们被设计用来解决的问题。这就是所谓的延迟,它是指从你请求加载网页到页面内容真正出现在屏幕上所花费的时间。
延迟间隔受许多因素的影响,其中许多因素是特定于特定网页的。然而,在所有情况下,延迟时间会受到您与该网站主机服务器之间的物理距离的影响。
CDN的任务实际上是缩短物理距离,目标是提高站点渲染速度和性能。
为了最小化访问者和网站服务器之间的距离,CDN将其内容的缓存版本存储在多个地理位置(也就是入网点或pop)。每个PoP包含许多缓存服务器,负责在其附近向访问者传递内容。
从本质上讲,CDN 将您的内容一次性放在许多地方,为您的用户提供大面积的覆盖。例如,当有人在北京访问你的杭州网站,它是通过当地的北京PoP 完成的。。这比让访问者的请求和你的回复穿越北京到杭州然后再返回要快得多。
工作方式
让我们先看看没有CDN服务时,一个网站是如何向用户提供服务的。
今天我们看到的网站系统基本上都是基于B/S架构的。B/S架构,即Browser-Server(浏览器-服务器)架构,是对传统C/S架构的一种变化或者改进架构。
在这种架构下,用户只需使用通用浏览器,主要业务逻辑在服务器端实现。B/S架构,主要是利用了不断成熟的WWW浏览器技术,结合浏览器的多种Script语言(VBScript、JavaScript等)和ActiveX等技术,在通用浏览器上实现了C/S架构下需要复杂的软件才能实现的强大功能。
用户通过浏览器等方式访问网站的过程入下图所示。
(1)用户在自己的浏览器中输入要访问的网站域名。
(2)浏览器向本地DNS服务器请求对该域名的解析。
(3)本地DNS服务器中如果缓存有这个域名的解析结果,则直接响应用户的解析请求。
(4)本地DNS服务器中如果没有关于这个域名的解析结果的缓存,则以递归方式向整个DNS系统请求解析,获得应答后将结果反馈给浏览器。
(5)浏览器得到域名解析结果,就是该域名相应的服务设备的IP地址。
(6)浏览器向服务器请求内容。
(7)服务器将用户请求内容传送给浏览器。
在网站和用户之间加入CDN以后,用户不会有任何与原来不同的感觉。
最简单的CDN网络有一个DNS服务器和几台缓存服务器就可以运行了。一个典型的CDN用户访问调度流程如下图所示。
(1)当用户点击网站页面上的内容URL,经过本地DNS系统解析,DNS系统会最终将域名的解析权交给CNAME指向的CDN专用DNS服务器。
(2)CDN的DNS服务器将CDN的全局负载均衡设备IP地址返回用户。
(3)用户向CDN的全局负载均衡设备发起内容URL访问请求。
(4)CDN全局负载均衡设备根据用户IP地址,以及用户请求的内容URL,选择一台用户所属区域的区域负载均衡设备,告诉用户向这台设备发起请求。
(5)区域负载均衡设备会为用户选择一台合适的缓存服务器提供服务,选择的依据包括:根据用户IP地址,判断哪一台服务器距用户最近;根据用户所请求的URL中携带的内容名称,判断哪一台服务器上有用户所需内容;查询各个服务器当前的负载情况,判断哪一台服务器尚有服务能力。基于以上这些条件的综合分析之后,区域负载均衡设备会向全局负载均衡设备返回一台缓存服务器的IP地址。
(6)全局负载均衡设备把服务器的IP地址返回给用户。
(7)用户向缓存服务器发起请求,缓存服务器响应用户请求,将用户所需内容传送到用户终端。如果这台缓存服务器上并没有用户想要的内容,而区域均衡设备依然将它分配给了用户,那么这台服务器就要向它的上一级缓存服务器请求内容,直至追溯到网站的源服务器将内容拉到本地。
DNS服务器根据用户IP地址,将域名解析成相应节点的缓存服务器IP地址,实现用户就近访问。使用CDN服务的网站,只需将其域名解析权交给CDN的GSLB设备,将需要分发的内容注入CDN,就可以实现内容加速了。
参考资料:
- 《CDN技术详解》
- https://www.imperva.com/learn/performance/what-is-cdn-how-it-works/