我们可以把Wayback Machine想象成一台虚拟的时间机器。有了它,你可以回到过去,查看不同的网站在整个历史上的固定时间段的样子。在进行研究或事实核查时,这可能是非常有用的,而在记录网页设计技术多年来的演变时,也同样有趣。
Wayback Machine在成立短短一年后就成功地归档了2TB字节的数据,这在当时是一个巨大的数据量。如今,你可以把所有这些数据存储在一个30美元的U盘里,并把它放在你的口袋里随身携带。
今天,Wayback Machine的数据库中包含超过7000亿个网页,总容量接近100PB。不幸的是,这个非营利组织的工作并没有变得更容易,因为付费墙和围墙花园反抓取机制(如Facebook)正在使它越来越难以纪录互联网的样子。20年后,我们还有可能看到今天的社交媒体活动的记录吗?
再者,如果元宇宙像一些人预测的那样实现,互联网档案馆将不得不相应地发展其收集工作,或者因为某种原因无法对该数字媒体中发生的事情进行编目。
并非所有人都认为该组织有权做它所做的一些事情。当互联网档案馆在大流行病开始时推出没有等待名单的国家紧急图书馆时,一些出版商说这相当于故意大规模侵犯版权。互联网档案馆提前关闭了其紧急借阅图书馆,希望能避免一场昂贵的诉讼,但出版商还是提起了诉讼。7月,双方都提出了简易判决的动议。
扫一扫
在手机上阅读