封面前言
前两天在「网上冲浪」发现一个互联网存档网,堪称互联网的博物馆。发现大家在做一个被称为 「"互联网档案计划"」 的事情,于是我尝试能不能将我自己的网站也用同样的形式保存下来。「ArchiveBox」它能帮你搭建网站的存档,包括内容、链接、资源等等,你只需要提供url,它便能根据你的设置保存你想要的内容,很是不错。
部署
docker中搜索ArchiveBox,找到如下容器名后下载,标签选择latest即可。
下载后设置容器,在docker中新建一个archivebox文件夹,随后映射路径设置为/data,环境变量可设置添加一个MEDIA_MAX_SIZE,用于控制媒体文件的最大尺寸,端口设置随意,不冲突即可。
容器设置体验
浏览器输入「http://NASIP:本地端口」即可访问了,访问之前我们还需要创建一个管理员,官方文档提示不能使用root,所以只能用内置用户archivebox来新建。
管理员创建
首先打开ssh工具连接NAS,以此执行以下命令:
1.获取管理员权限「(sudo -i)」
2.进入容器「(docker exec -it --user archivebox archivebox /bin/bash)」
3.输入创建管理员命令「(archivebox manage createsuperuser)」
最后根据提示以此输入用户名、邮箱以及密码即可,密码如果较为简单,会提示,直接选择y跳过即可。
随后再次输入地址登录进入主界面,该项目没有中午支持,我这里是用网页翻译翻译后的结果。
主界面
这里我以我的网址为例子,我们右上角选择添加,输入网址,下面会有添加选项,可按照自己需求选择那些不需要保存。
添加网址
所有设置好之后点击最下面的按钮,工具便开始工作了。(提示,网址一定要带前缀,不然不能进行添加)
开始抓取
如果网址内容比较多,抓取时间会比较长,这里你可以直接点击左上角查看目前的工作状态,可以看到它正在抓取网址的快照。
快照总结
算是蛮有趣的一款容器,不过在抓取时的占用也不算小。该容器并没有实际的用途,只能说可以作为一个兴趣保存一些自己比较喜欢的网址,再一个就是某些网址的内容可能会存在站长或者作者自己会删除,而你通过存档形式保存下来便能反复观看了。
以上便是本期的全部内容了,如果你觉得还算有趣或者对你有所帮助,不妨点赞收藏,最后也希望能得到你的关注,咱们下期见!
领取专属 10元无门槛券
私享最新 技术干货