article_image

🔗 原文链接

皮尤研究中心最近的一项研究揭示了互联网内容消失的严重性,即所谓的 “数字衰变” 现象。研究发现,2013 年的网页中,有 38% 在十年后已经无法访问。这一发现令人震惊,因为这些网页涉及到政府、新闻网站、维基百科和社交媒体等多个重要领域。


2013 年 38% 的网页无法再访问
2013 年 38% 的网页无法再访问

具体来说,政府网站中有 21% 的链接已经失效,新闻网站则有 23%。这些数据表明,不仅是低流量网站,高流量的网站也未能幸免于链接失效的问题。此外,维基百科作为全球最大的在线百科全书,其 54% 的页面存在至少一个失效的引用链接。这对信息的可靠性构成了严重威胁,因为用户无法再访问原始参考资料。


23% 的新闻网页至少有一个坏链
23% 的新闻网页至少有一个坏链

在社交媒体方面,推特上的情况也不容乐观。研究显示,约有 18% 的推文在几个月内消失,这主要是由于账户变更或删除导致。这些消失的推文中,许多可能包含重要的信息或讨论,使得社交媒体上的信息获取更加不稳定。

研究还发现,网页内容越旧,其失效的可能性越大。这意味着,随着时间的推移,越来越多的内容将变得不可访问。这不仅影响到用户的体验,也对历史记录和学术研究造成了困扰。

为了进行这项研究,皮尤研究中心使用了 Common Crawl 的数据进行抽样分析。无论是高流量网站还是低流量网站,链接失效的问题普遍存在。数字衰变现象广泛存在于各类在线平台,这也凸显了存档和维护在线内容的重要性。

“数字内容的短暂性提醒我们,必须采取措施确保信息的持久性。”

本站也提供了许多文章和解决方案,鼓励大家自己保存网页内容,避免内容消失——


author_avatar

UNTAG 官方