日照基业长青人工智能科技有限公司
全网整合营销系统解决方案提供商
联系电话:13863368968

网站被404,怎么办?

一种无能为力叫做:
本来想在网上散个步,却一不小心走到了有着“互联网坟地”之称的404页面
作为互联网的“最后一页”,404中充满了各种理想主义者的幻想。

面对这大写加粗的三个阿拉伯数字,人极容易从“原来互联网是有边界”的挫折感衍生到对人生虚无意义的思考当中。
             
但是404就是你散步的终点了吗?
微信图片_20201229143322.jpg
有一个神奇的网站,叫做wayback machine,是一个互联网的备份工具,被称为互联网时光机。
它是由布鲁斯特·卡利和布鲁斯·吉威特创立,他们在1996年就开始归档网页,并于2001年启动了Wayback Machine项目。
迄今为止,网站已经备份超过了4010亿个网页的历史
       图片     
在网站的自述中,这座巨大的互联网“童年”照相馆保存了:
3300亿的网页;
2000万册书籍和文字;
450录音带(包括18万场现场音乐会);
400万个视频(包括160个电视新闻节目);
300万张图片;
20万个程序软件;
             
Wayback Machine主管Mark Graham在2016年《企业家》文章中指出,网页的平均预期寿命约为100天
这些网页消失的原因有很多:网站创建者继续进行其他项目、网络托管公司破产了、或者页面可能被移动或替换为新的数据和内容。
他们认为,有些网站对于子孙后代来说至关重要,因而依据网站的重要性对其进行快照。
对于大多数网页,是利用爬虫程序不定期保存其页面信息,而对于特别重要的,则由人工进行保存。
保存的规律并不是依据网站的迭代,而是根据网站的重要性从几个月到几个小时不等。
不用担心你QQ空间的非主流照片也被保存,因为对于他们来说,你的网页可能不那么重要。
       图片       
这个互联网时光机的网址是:https://archive.org/web/
在搜索栏中输入你想要寻找的网址,比如我们输入万恶的百度网址。
       图片       
就能看到百度在近20年间不同时期分别长什么样。
       图片       
比如我们点开2007年,就可以看到日历中随机分布显示的蓝色圆圈。
这表示在该日期对网站进行了不定次数的快照保存。
点开其中一个,就能看到当时网页的模样。
例如2001年早期百度。
       图片       
除了对网页历史搜索外,还能进行高级搜索:
       图片       
在下拉栏中,可以看到有搜索元数据、文字内容、电视新闻字母、存档网站的选项。
比如我想搜索内容中存在“孙悟空”字样的书籍,在输入栏中输入孙悟空后,选择下拉栏第二个“搜索文字内容”的选项。
       图片       
点开书籍就能进行pdf阅读。
       图片       
但值得注意的是,时光机保存的大多数只是网页的快照,其中的链接不可操作,比如,我点入这个具有历史年代感的网站。
       图片     
但我的操作就止步在了“满18岁,请按此”的蓝色字条中,就像看着你的童年照片你并不能真正回到童年一样。
             
于是我又回去看了看2010年的人人网
       图片       
2005年的碧海银沙聊天版:
       图片       
随便点开一个特约聊天室,都是互联网老年人的回忆。
       图片       
这些消失的网站足以证明:我们发表在社交网络上的内容不会永远的存在,随着网站的关闭而消失。

例如美国开创性的社交网站MySpace,去年丢失了大约12年的音乐和照片
这表明,即使是存储在最大网站上的内容,可能也不安全。
而谷歌的Google+也已经关闭,但是否所有用户都备份了发表在Google+上的照片和记忆?
2005 年 ,英国一名 21 岁的学生 Alex Tew 为了解决学业贷款问题。
他创建了一个网站:把这个网站上的 100 万个像素以广告位的形式卖掉
用户买了这些广告位后可以投放图案广告,并为该图案添加一个指向他们自己网站的链接。
通过口口相传以及一些营销手段,不到半年这些广告位就卖光了,Alex 成功赚了近一百万美元。
这个网页也被 2800 个左右的网站给填满了。
       图片       
然而才过了10年,这些网站中有1000多个已经失效或者转向别的域名。
全球有一系列机构试图在人类互联网出现头十年最后的痕迹完全消失之前挽救出其中的一部分。
在英国,数字保存的工作部分落到了大英图书馆肩上。
该图书馆有一个英国网络档案馆,从2004年开始获准收集网站信息。
该档案馆的项目经理韦伯说,这个问题比大多数人以为的要大得多。
就连1991年创建的全球首个网页到1996年的时候就已经消失了。
韦伯说:“我觉得我们对一切都会失去的认知非常低。数字世界短暂无常,我们看着手机,其实还没有思考,手机上的东西就变了。不过现在人们越来越意识到我们可能正在失去很多东西。”
有时候,网站消失是伴随社会的大变革发生的,比如国家本身的诞生和灭亡。
例如南斯拉夫,yu曾是代表南斯拉夫的域名,但南斯拉夫解体后,这种情况随之结束。
对于历史研究来说,这些消失的网页正代表着历史的空白。