存档

存档
Archive.is-Screenshot.png
档案的屏幕截图。today主页
站点类型
网络归档
可用多种语言
URL
登记
发射2012年5月16日; 10年前[1][2]

存档(或者Archive.ph或者Archive.is)是网络存档网站,成立于2012年,节省快照按需,并支持JavaScript - 诸如此类的网站谷歌地图渐进的网络应用程序推特.[3]Archive.today记录两个快照:一个复制原始网页,包括任何功能性实时链接;另一个是截屏页面。[4]

特征

功能

Archive.today可以捕获单个页面,以响应明确的用户请求。[5][6][7]自开始以来,Archive.today支持爬行页面URL包含现在剥夺的哈希束碎片#!)。[8]

存档。图仅记录文本和图像,不包括XMLRTF电子表格XLS或者ODS) 和别的非静态内容。但是,某些网站的视频,例如推特,保存。[9]它跟踪保存的快照历史记录,在添加已经保存的页面的新快照之前请求确认。[10][11]

页面以1,024像素的浏览器宽度捕获。CSS被转换为排队CSS,删除响应式网页设计和选择者,例如:徘徊:积极的。使用的内容JavaScript在爬行过程中,出现在冷冻状态下。[12]HTML类名称保存在老班级属性。什么时候选择文本,JavaScript小程序生成一个URL碎片在浏览器的地址栏这会自动突出显示文本的一部分。

网页不能是重复从Archive.today到web.archive.org作为二级备份,作为Archive.today放置Wayback Machine的排除,并且不会以Warc格式保存其快照。反向 - 从web.archive.org到archive.today,可能是可能的,[13]但是副本通常比直接捕获要多的时间。一些网站从中删除互联网档案追溯列表或由于他们的robots.txt文件,但是存档。today不使用此。[14]

研究工具栏启用高级关键字运算符,使用*作为通配符角色。几个引号将搜索定为标题或网页正文中存在的精确序列,而insite操作员将其限制在特定的Internet域。[15]

一旦归档网页,就无法直接由任何Internet用户删除它。[16]可以通过要求所有者在他的博客上进行广告,弹出式或扩展链接来删除广告,弹出窗口或扩展链接。[17]

保存一个动态列表,Archive.today搜索框仅显示链接列表的上一部分和以下部分的结果(例如,页面的20个链接)。[18]保存的其他网页被过滤,有时可能会通过其中一项出现找到。[19][需要澄清]

搜索功能由Google CustomSearch支持。如果没有提供任何结果,则存档。TODAY尝试使用yandex搜索.[20]

保存页面时,单个页面元素及其内容大小的URL列表,HTTP状态哑剧类型显示。只能在爬行过程中查看此列表。

可以将存档页面作为邮政编码下载,除了自2019年11月29日以来存档的页面当Archive.today从phantomjs.[21]

自2013年7月以来,存档。API纪念品项目.[22][23]

历史

Archive.today成立于2012年。该网站最初以Archive.today为名,但在2015年5月,将主要镜像更改为Archive.is。[24]

2019年1月,它开始贬低档案域,支持存档镜。[25]

全球可用性

澳大利亚

2019年3月,该地点被封锁了六个月澳大利亚人互联网提供商基督城清真寺枪击事件试图限制攻击镜头的分布。[26][27]此后一直没有阻碍。

中国

根据大火.org,Archive.today自2016年3月以来在中国被封锁,[28]自2017年9月以来的Archive.li,[29]自2018年7月以来的Archive.fo,[30]以及自2019年12月以来的存档。[31]

芬兰

2015年7月21日,运营商阻止了所有人的访问芬兰IP地址在Twitter上说,他们这样做是为了避免升级据称与芬兰政府的争议升级。[32]此后一直没有阻碍。

俄罗斯

俄罗斯,只有HTTP访问才能;HTTPS连接被阻止。[33][34]

Cloudflare DNS可用性

截至2018年5月,使用时不可能到达网站Cloudflare1.1.1.1DNS服务。[35]Cloudflare的工作人员表示,问题是在存档的末尾。today,因为它的权威名称服务器从Cloudflare网络中查询时返回无效的记录,因为Archive.Today将无效的数据返回通过CloudFlare的DNS DNS服务器传递的DNS请求。Archive.today的理由是Cloudflare不会发送的事实EDNS客户端子网DNS请求中的信息。[36][37]

也可以看看

参考

  1. ^Archive.is博客 - 档案网站最初启动的时候?在Archive.today(2021年3月20日存档)
  2. ^Archive.IS - Викиреал进在Archive.today(2021年4月29日存档)
  3. ^布林克曼,马丁(2015年4月22日)。“使用Archive.is创建公开可用的网页档案”.ghacks.存档从2019年4月12日的原始。检索6月13日2015.
  4. ^Brunelle,Justin F。;凯利,垫子;韦格尔(Michele C);尼尔森,迈克尔·L。(2015年1月25日)。“ JavaScript对可容纳性的影响”(PDF).国际数字图书馆杂志.17(2):95–117。doi10.1007/S00799-015-0140-8.S2CID 8433375.存档(PDF)从2019年5月27日的原始作品。
  5. ^Dascalescu,Dan(2013年2月18日)。“网页归档 - Dan Dascalescu的Wiki(评论)”。 wiki.dandascalescu.com。存档原本的2013年9月22日。检索10月3日2013.
  6. ^Koebler,Jason(2014年10月29日)。“亲爱的Gamergate:请停止偷走我们的狗屎”.母板.存档从2019年5月27日的原始。检索3月22日2017.网站无法保护自己免于拥有存档。
  7. ^“ Archive.is/faq”.Archive.is。检索2月15日2019.
  8. ^“ Archive.IS的主页”,2013年”。存档原本的2013年1月12日。
  9. ^“存档。.存档来自2021年9月7日的原件。
  10. ^用档案存档网站,检索1月27日2022
  11. ^“ Archive.is上的快照历史”.
  12. ^JavaScript生成的加载动画Dailymotion视频出现在冷冻状态
  13. ^“示例:从Web存档到Archive.is的页面”(西班牙语)。从2013年5月20日从原始作品存档。检索10月23日2019.
  14. ^“存档。.Archive.ph.{{}}:CS1维护:url-status(链接)
  15. ^例如,字符串insite:https://en.wikipedia.org“世界杯”返回“世界+杯”/相关快照
  16. ^“一些经常问的问题”(博客).Archive.is。 2013年1月24日。存档来自2013年9月26日的原始。检索11月12日2018.
  17. ^“ Archive.is Blog上的用户请求”.Archive.is博客。检索4月7日2022.
  18. ^“动态列表的示例”.worldcat.org.
  19. ^用档案存档网站,检索1月27日2022
  20. ^“只是意识到今天我可以在搜索栏中搜索档案库中的关键字,这是最近添加的功能吗?”.Archive.is博客。检索1月27日2022.
  21. ^“ Archive.is博客”。 2020年7月17日。存档来自2020年10月3日的原件。
  22. ^尼尔森,迈克尔·L。(2013年7月9日)。“ Archive.is支持Memento”.研究和教学更新。网络科学和数字图书馆研究小组旧多米尼翁大学.存档从2013年7月27日的原始。检索9月17日2013.
  23. ^“存档。”.纪念品协议信息。纪念品开发小组。存档原本的2013年9月15日。检索9月17日2013.
  24. ^“为什么您将URL从档案馆更改为Archive-is?”.Archive.is博客。 2015年5月3日。存档从2015年6月1日的原始。检索1月6日2019.
  25. ^@archiveis(2019年1月4日)。“请不要使用Archive.is镜子链接,使用其他镜子[.today .fo .li .vn .md .ph]。(鸣叫)。存档从2019年1月6日的原件 - 通过推特.
  26. ^“ AU中的ISP和新西兰开始审查互联网而没有法律先例”.私人互联网访问。 2019年3月19日。检索3月20日2019.
  27. ^“新西兰ISP说他们正在阻止无法删除基督城拍摄视频的网站”.澳大利亚Gizmodo。 2019年3月19日。存档从2019年5月18日的原始。检索3月20日2019.
  28. ^“ Archive.I在中国100%被封锁”.Greatfire分析仪。 2018年8月12日。存档来自2018年8月12日的原始内容。
  29. ^“ Archive.li在中国100%被封锁”.大火分析仪。 2018年8月12日。存档来自2018年8月12日的原始内容。
  30. ^“ Archive.fo在中国100%被封锁”.大火分析仪。 2018年8月12日。存档来自2018年8月12日的原始内容。
  31. ^“档案。.en.greatfire.org。检索4月7日2022.
  32. ^Lapintie,Lassi(2015年7月22日)。“ suomalaisilta estettiin haktivistien suosimallaverkkosivullaKäynti”[芬兰人对黑客主义者使用的网站的访问被阻止]。Iltalehti(在芬兰)。存档从2019年5月27日的原始。检索3月4日2016.
  33. ^Elistratov,弗拉基米尔(2016年1月29日)。“ Roskomnadzor Zablokiroval Servis Archive.is,Khranyashchiy Kopii Veb-Saytov”e°μзаблокироровалсервиmarchive.is,хранраняInound.tjournal(俄语)。存档来自2017年8月30日的原始。检索1月30日2016.
  34. ^库欣,蒂姆(2016年2月4日)。“俄罗斯阻止了另一个档案网站,因为它可能包含有关毒品的旧页面”.Techdirt.存档从2019年3月23日的原始。检索2月26日2016.
  35. ^“ Archive.is-错误1001”.Cloudflare社区。 2018年5月15日。检索12月2日2021.
  36. ^@archiveis(2018年7月16日)。"“必须做”在这里不是那么直接。DNS和相关的HTTP请求的缺乏EDN和巨大的不匹配(不仅在/国家/地区,甚至在非洲大陆层面上)来自许多原因,因此我认为Cloudflare的无效请求是无效的“无效的”。(推文) - 通过推特.
  37. ^“马修·普林斯对黑客新闻的评论”.黑客新闻。 2019年5月4日。原本的2022年5月13日。检索10月4日2021.

外部链接