超能课堂(87):除了404,HTTP网页状态码还有啥?
在这个广域网中,我们所有人都一定会看到3个Logo:测试你网速的蓝色熊掌,令你绝望的加载圆圈,还有“裤子都脱了就给我看这个?”的404页面。前两个好歹还能让你看点东西,而最后一个则是最糟糕的用户体验——除了告诉你打不开网页就似乎真的什么也没有了,不知道各位有没有想过这个404是怎么产生的,除了404还有什么?今天我们就来谈一谈那些状态码。
404和HTTP状态码
上面所说的404其实是一种标准的HTTP返回代码,官方名称是HTTP状态码(HTTP Status Code),用于表示网页服务器HTTP的响应状态。但似乎一般人都不会仔细研究这些HTTP状态码和这些状态码对开发人员的影响。也许,一个开发人员就算不知道这些状态码也能开发出一个网站,但如果企业要开发一个大型网站,在某些时候需要微调或系统整合需要到更底层的网络工作时,就有可能遇到瓶颈,特别是在出错时更加明显。对于状态码的分类有三个层级,就好像404那样用3三个数字表示,分为大类,中类和小类。值得一提的是,在IIS(Internet信息服务)中还有不少微软制定的扩充状态码,格式类似404.1这样,能更深层次的让开发者清楚出错原因。
在进行请求的时候,我们看到的都只是服务器最后返回来的状态码,比如出错的404和成功的200,但是实际上在请求的过程中,会有很多的状态码在快速变化,除非是类似打断点的操作,一步操作停一下,否则是不能看出这些状态码是怎么变化的,这就导致在服务器响应过程中有很多状态码我们都看不到。
审查元素可以看到各个请求最终的状态码
首先,我们要知道几乎所有的HTTP状态码都被分成了五大类:
1开头的表示服务器收到请求并需要请求这继续处理;
2开头的成功响应,表示成功处理了请求;
3开头的重定向,引导浏览器跳转到另一个资源页面;
4开头表示请求出错,妨碍了服务器的处理,服务器会返回一个状态码解释到底是什么错误;
5开头的表示服务器错误,并不是请求者的原因;
就拿404举个例子,作为最出名的状态码,我们想来详细解释下404这三个数字的含义:第一个4表示客户端出错,第二个0表示请求者把网址打错了,最后的4表示4开头的错误状态码中排第四。
那么404是怎么产生的呢?当用户在地址栏输入一个网址后,这时候IIS首先会检测用户输入的地址是否有对应的网页信息,如果没有,IIS就会通过服务器想用户返回404错误状态码提示,告诉用户找不到地址对应的网页信息,但服务器并不清楚这种情况是暂时性的还是永久性的。出现404最多的原因就是用户输入了错误的链接,或者无法响应并找不到原因,也有可能就是网页被删除了。
为什么要设计404页面
以4xx开头的错误都是跟“客户端”有关,比如用户可能访问了不存在的页面,用户权限不足或者未提供有效的验证信息(输入错误的账号密码等)。尽管404页面被用户浏览到的概率相对于全站的其他页面来说要小得多,但页面难免会出错,无论是用户的误操作还是服务器的原因,作为网站开发者也无法控制错误页面的出现,但开发者可以通过设计一个特别的404错误页面将用户失望度降到最低,开发者需要在这个页面很好的把信息传达给用户,并引导用户进行下一步的操作。
访问到错误页面是不愉快的用户体验,作为开发者可以提供一些应对方法
还有什么比较出名的状态码?
其实除了404 Not Found外,还有很多HTTP状态码,这些状态码都有自己的含义,所以我们说说一些比较常见的状态码以及它们的表达信息。
400错误请求:400代表语义有误,服务器无法理解用户的请求,除非进行修改,不然没必要一边按F5一边喷服务器垃圾。比如说别把www.baidu.com.打成com.baidu.www.,否则服务器是不知道你在说什么鸟语。在减少这类错误的道路上,伟大的人类发明了搜索引擎,容错率随之提高。
401未授权:一般来说该错误消息表明你首先需要登录(输入有效的用户名和密码)。如果你不输入这些信息,就会有401错误,这意味着验证信息出错,服务器无法识别你的身份。
403禁止:有句话叫“拉不出屎千万别怪地球没引力”,出现403是因为服务器拒绝了你的地址请求,或者你根本没权限访问网站,提供身份验证也没用,也就是说,用户被禁止访问了。然而除非与Web服务器管理员联系,否则一旦遇到403状态码都无法自行解决。
408请求超时:遇到408意味着你的请求发送到该网站花的时间比该网站的服务器准备等待的时间要长,即链接超时。408错误往往难以解决,通常涉及系统工作量或系统操作中的一次性变化。如果用户持续看到408错误,管理员首先要考虑到Web服务器的工作量,特别是在产生408错误的时间段,另外网络流量激增也可能导致用户无法访问网页从而出现该错误。
梯子不够长,墙外的世界不是你想看就能看的
410永久删除:如果用户访问的网页被永久删除,服务器就会返回410代码。410实际上和404有点相似,在服务器不确定这个情况是不是永久的情况下,应该使用404状态码。410响应的目的主要是帮助网站管理员维护网站,通知用户这个网页资源已经不能再使用,并且服务器拥有者希望所有指向这个资源的远端链接也被删除。不过之后的事,就涉及到301和302返回码了。
301永久移动,302临时移动:在优化网站的时候,301重定向是网站管理员必用的,在网页被移动后多数情况下浏览器会自动定向到新的URI(统一资源标识符),并且以后任何新的请求都应使用新的URI来代替。而302只是URI被理解为临时交换而已,客户端还是会继续使用原来的地址发送请求。这两种现象出现在网页的域名更换后,搜索引擎还使用原有域名地址访问URI,如果搜索引擎得到301返回码,那么搜索引擎就知道管理员更换了域名,下次就会自动用新域名来索引网站。
305使用代理:访问者只能使用代理来访问网页,如果服务器放回这个状态码,意思是你需要一张梯子。想要登陆诸如Google,Youtube,Facebook这些不存在的网站,除了使用VPN别无办法。
509超过带宽限制:相比其他500状态码,509算是一个特殊的存在。之所以特殊,是因为这个错误要用钱来解决。509并不是官方的状态码,但是仍然被广泛使用。正如名字所示,网站流量增大,带宽不够用就会出现这类错误,网站管理员只能掏钱向主机商买流量。
除了上述所说的一部分HTTP状态码外,还有很多其他的状态码,比如100,200等,这些状态码都有自己的信息定义和作用,限于篇幅原因只能列举一些很常见的状态码。HTTP状态码通常都与用户的浏览体验息息相关,它能告诉客户端当前发生了什么事,或者说当前Web服务器的响应状态。作为开发者有必要了解这些状态码,能够明白问题出在哪,从而针对性地解决问题。