CDN加速静态文件访问

CDN加速静态文件访问

CDN是Content Delivery Network的缩写,意思是内容分发网络。CDN的作用是把用户需要的内容分发到离用户近的地方,这样可以使用户
能够就近获取所需内容。
整个CDN系统(如图1-1所示)分为CDN源站和CDN节点,CDN源站提供CDN节点使用的数据源头,而CDN节点则部署在距离最终用户比较
近的地方,加速用户对站点的访问。
CDN其实就是一种网络缓存技术,能够把一些相对稳定的资源放到距离最终用户较近的机房,一方面可以节省整个广域网的带宽消耗,另外
一方面可以提升用户的访问速度,改进用户体验。我们一般把一些相对静态的文件(例如图片、视频、JS脚本、一些页面框架)放在CDN中。

图1-1

我们通过浏览器访问一个网站的过程大致如图1-2所示。
图1-2

(1)用户向浏览器提交要访问的域名。
(2)浏览器对域名进行解析,得到域名对应的IP地址。
(3)浏览器向所得的IP地址发送请求。
(4)浏览器根据返回的数据显示网页的内容。

而在有了CDN以后,用户通过浏览器访问网站的过程会产生一些变化。如图1-3

图1-3

(1)用户向浏览器提交要访问的域名。
(2)浏览器对域名进行解析,由于CDN对域名解析过程进行了调整,所以得到的是该域名对应的CNAME记录。
(3)对CNAME再次进行解析,得到实际IP地址。在这次的解析中,会使用全局负载均衡DNS解析,也就是我们需要返回
具体IP地址,需要根据地理位置信息以及所在的ISP来确定返回的结果,这个过程才能让身处不同地域、连接不同接入商的
用户得到最适合自己访问的CDN地址,才能做到就近访问,从而提升速度。
(4)得到实际的IP地址以后,向服务器发出访问请求。
(5)CDN会根据请求的内容是否在本地缓存进行不同处理:
1)如果存在,则直接返回结果。
2)如果不存在,则CDN请求源站,获取内容,然后再返回结果。

通过这个流程,我们可以看到CDN中的几个关键技术。

全局调度

全局调度是完成用户就近访问的第一步,我们需要根据用户地域、接入运营商以及CDN机房的负载情况去调度。前面两个调度因素需要一个
尽可能精准的IP地址库,这是正确调用的前提(误识别的IP地址到地理位置的对应可能会把东北的用户调度到华南的站点去),当然,做到
100%的精确是不现实的。IP地址库的维护是一个持续和变化的过程,并且调度的策略随着CDN机房的增加也会变化。例如,我们不可能在
所有城市都设置CDN机房,假设刚开始河南整个省份没有CDN机房,可能河南靠北的城市使用天津的CDN,同时河南靠南的城市使用湖北
的CDN会比较好,而如果后来在郑州市建设了CDN机房的话,那么原来的调度策略就会修改了。CDN的负载也是调度中的一个影响因素,
举例来说,如果一个CDN机房举例你的位置比较近,但是它的负载已经很高,响应很慢,那么你的请求送到距离稍远的CDN机房反而会更快。

缓存技术

从上面的流程中我们看到,如果用户请求的内容不在CDN中的话,CDN会回到源站去加载内容,然后返回给用户。所以,如果CDN机房的请求
命中率不高的话,那么起到的加速效果也是相对有限的。
要提升命中率,就需要CDN机房中有尽可能全面的数据,这要求CDN机房的缓存容量要足够大,我们可以使用“内容+SSD+机械硬盘”的混合存
储方式来提升整体的缓存容量,并且我们做好冷热数据的交换,在提升命中率时也尽量降低缓存的响应时间。
此外,当CDN的Cache没有命中要回源加载数据时,合并同样数据的请求也是一个很重要的优化,这样可以减少重复的请求,降低源站的压力。
最后,新增、变更数据后的CDN预加载也是一个提升命中率的办法。也就是在没有请求进来时,CDN主动去加载数据,做好准备。当然这个主
动加载一般也需要源站有一个通知过来。

内容分发

这里提到的内容分发主要是对内容全部在CDN上不用回源的数据的管理和分发,例如一些静态页面等。具体做法是在内容管理系统中进行编辑
修改后,通过分发系统分发到各个CDN的节点上。分发的效率以及对分发文件一致性、正确性的校验是需要关注的点。

带宽优化

CDN提供了内容加速,很多请求和流量都压到了CDN上,那么如何能够比较有效地节省带宽会是一个很重要的事情,因为这直接关系到流量
成本。优化的思路是只返回必要的数据、用更好的压缩算法等。

在CDN的应用中,从传统意义上来讲,主要是把用户需要访问的内容放到离用户近的地方。可以发现大部分流量是从源站到CDN机房的流量,我们也可以利用CDN机房距离目标用户近的地点,让一些上传的工作从CDN接入,然后再从CDN传到源站
,这一方面可以提升用户的上传速度,另一方面也很好地利用了从CDN机房到源站的上行带宽。

参考书籍 :大型网站系统与Java中间件实践

(0)

相关推荐

  • 短视频行业因被ddos攻击而用户流失?高防CDN能解决吗?

    随着互联网流量往视频.直播行业涌入,就如鲸入海.如鸟投林,火热的不得了!当一个行业火了,安全问题接踵而来!高防服务器太贵,换服务器影响太大,为了满足网站加速和加防御的新需求,你可能需要在cdn需求上进 ...

  • 一起来看看你的网站是否需要高防CDN

    DDoS流量攻击来势汹汹,好像子弹怎么都发射不完,但高防CDN的针对性保护策略也随之崛起,拦截清洗.后端隐藏.网站提速.实时监控等一系列防御操作,让DDoS流量攻击土崩瓦解,为网站保驾护航. 什么是高 ...

  • 利用CDN加速GithubPage访问速度

    在国内,githubpage的访问速度相当感人,于是使用CDN加速就变得十分有必要了. 文章目录 Github Page Netlify 其他说明 Github Page Github Pages为G ...

  • Vue 打包的静态文件不能直接运行的原因及解决办法

      更新时间:2020年11月19日 11:24:44   作者:rxliuli    问题 吾辈使用 vue-cli 直接生成的 vue 模板项目,在模板之上继续开发的.然而在使用 npm run ...

  • .NET Core MVC 静态文件应用

    一.静态文件应用方面 ASP.NET Core 静态文件应用,主要分为两方面:网站访问和静态文件整合 二.案例 1.访问静态文件 我们都知道,在 ASP.NET 项目中,我们的静态文件一般要放在 ww ...

  • 什么是静态文件?

    表白:黑白圣堂血天使,天剑鬼刀阿修罗.  讲解对象:/什么是静态文件? 作者:融水公子 rsgz HTML 教程 HTML 教程 http://www.rsgz.top/post/99.html 静态 ...

  • Gitlab + jenkins + S3 静态文件 CICD

    对于一些前后端分离的应用,静态代码最佳的存放地点就是对象存储,比如我们这里所说的 S3,那我们该如何通过 jenkins 自动把 gitlab 上面的代码推送到 S3 以实现 CI/CD呢?

  • (1条消息) win10局域网硬盘文件访问

    共享端电脑设置(比如共享整个D盘)步骤: 一:D盘右键–属性–共享–高级共享–共享此文件夹打钩–权限给Everyone用户全部打钩 二: 获取IPV4地址: win+R - 输入 cmd ----输入 ...

  • flask项目部署nginx后静态文件不显示的解决办法

    Win10下,进入nginx.conf,在监听的server下加入 location /static { alias C:\Users\ganyuning\Desktop\flask-test\sta ...

  • CDN是什么?CDN加速对网站SEO有什么影响?

    CDN是什么? CDN的全称是Content Delivery Network,即内容分发网络,为了让用户能够更快速的得到请求的数据.CDN主要用于加速,它能保证用户能流畅的访问网站,对搜索引擎就没有 ...