
Image by Bernard Goldbach, from Flickr
数字档案管理员致力于保护公共数据不被遗忘
在过去的30多年里,互联网档案馆的Wayback Machine一直在保存对研究至关重要的政府网站和数据集,这一点在Spectrum的新报告中有详细说明。
赶时间?这里有快速事实:
- 网络历史回溯机(Wayback Machine)存储了重要的政府数据,这些数据是科学和工程研究的重要材料。
- 在特朗普的第二个总统任期内,超过8000个政府网页和数据库从公众访问中消失。
- 哈佛大学的图书馆创新实验室成功保存了Data.gov收集的311,000个数据集。
这些记录,来自NASA和国家科学基金会等机构,为科学家和工程师提供了必不可少的数据。正如Spectrum所指出的,如果这些记录消失,研究的有效性和历史的准确性将面临风险。
政府数据的删除并不是一个新现象。在9/11之后,布什政府出于安全考虑删除了数百万字节的信息。与此不同,奥巴马政府在2009年启动了Data.gov,以扩大公众的访问权限,正如Spectrum报道的那样。
在特朗普的首个任期中,环境数据与治理倡议的研究人员发现一些政府网站无法访问,而且“气候变化”的参考资料从多个页面上被抹去,Spectrum这样表示。
在特朗普的第二个任期内,数据保存问题的关注度有所升级。今年二月,《纽约时报》报道,超过8000个政府网页和数据库被撤下。
一些已经重新出现,但Grist发现了变化,包括删除了“气候变化”和“清洁能源”等词汇。2月11日,随之而来的法律挑战,一位联邦法官命令恢复某些CDC和FDA的数据集,这一消息由Spectrum报道。
为了抵抗这种损失,数字档案管理员已经采取了行动。哈佛法学院的图书馆创新实验室已经复制了Data.gov的整个16太字节的档案——包含超过311,000个数据集。他们通过APIs使用自动化查询每天保持更新。
档案管理员在保护知识方面发挥了重要的作用,他们通过维护历史记录为未来的一代保存知识。如果他们不存在,重要信息的丧失将导致公共记录被重写,限制未来的研究可能性。
留下评论
取消