Loading [MathJax]/jax/output/CommonHTML/config.js

开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >专栏 >从长亭的wiki上获取我想要的数据

从长亭的wiki上获取我想要的数据

信安之路

发布于 2018-08-08 07:40:36

发布于 2018-08-08 07:40:36

1.9K0

举报

文章被收录于专栏：信安之路信安之路

本文作者：myh0st

那么，如何寻找喜欢分享，有可能加入我们的同学呢？

通常有自己博客的朋友都可以算作是喜欢分享，技术能力是次要的，只要爱分享就是我们所寻找的有缘人。

那么如何寻找有博客的朋友呢？

国内有两个 wiki 平台，一个是 www.sec-wiki.com，另一个就是 wiki.ioin.in 了，这上面，大家提交了很多质量比较好的文章，有些是为了推广平台自己添加上去的，有些是一些朋友看到好的文章主动提交的，所以这就是一个比较好的资源库，有大量的喜欢分享的朋友在上面，所以这就是我的目标。

今天的主题是长亭的 wiki，也就是 wiki.ioin.in。

获取 wiki 平台上所有的文章链接

这个工作肯定不是通过纯手工可以搞定的，必须使用工具，那么自己写工具吗？

作为一个懒人，很久没写代码了，所以就用已有的工具来完成吧，这里用到的工具有：burp、emeditor。

打开 wiki.ioin.in，如图：

url 中的页数是可以遍历的，所以我们就用 burp 来设置参数，遍历一下，如图：

遍历完之后，将响应返回的结果保存下来，保存选项如下图：

保存完之后，就可以用我们的 emeditor，这个编辑器是我最喜欢的，功能很强大，把所有短链接提取出来，如下图：

从上图可以看出，短链接是有规律的，所以只需要把行里有 <a href="/url 导出来就可以了，如图：

提取后的结果如图：

将提取后的结果保存在一个文件里，然后设置下一波爆破，如图：

设置完，启动爆破，然后把结果保存下来，如图：

把含有 Location: 的行提取出来，然后替换掉就获得了所有的链接，如图：

分析获取的链接数据

拿到结果之后，我们要把这里面涉及的网站做个统计，看看哪些网站出现的次数最多，发布的文章最多，这里可以使用 linux 下的两个命令：sort 、 uniq。

1、将结果中的域名提取出来

用 emeditor 将域名之前的 http 的部分替换掉，可以用正则替换，如: http[s]?://，然后将域名后面的部分替换点，正则如：/.*，然后获得结果如下：

2、对以上结果进行排序统计

可以使用如下命令对文件进行处理：

sort links.txt | uniq -c > 1.txt sort -r -k 1 -n 1.txt > 2.txt

处理结果如图：

下面就可以看小伙伴的博客，如果内容比较好的，我就联系大家了。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2018-03-31，如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自信安之路微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

评论

登录后参与评论

暂无评论

编辑精选文章

换一批

万字详解高可用架构设计

Go 开发者必备：Protocol Buffers 入门指南

10分钟带你彻底搞懂分布式链路跟踪

多租户的 4 种常用方案

亿级月活的社交 APP，陌陌如何做到 3 分钟定位故障？

60页PPT全解：DeepSeek系列论文技术要点整理

重构Sec-News之路

flask mongodb 云数据库 MongoDB 缓存 http

不知道什么时候突然发现我已经稳定运行了近半年的sec-news（http://wiki.ioin.in）突然变得特别慢，为跳转效率我也是尝试了很多方法，比如加缓存。我使用了一个叫flask-cache的缓存: https://pythonhosted.org/Flask-Cache/ ，很好用的cache。

phith0n

2020/10/15

7580

SRC混子的漏洞挖掘之道

https 安全 github git 开源

还是那句老话,渗透测试的本质是信息收集，对于没有0day的弱鸡选手来说，挖SRC感觉更像是对企业的资产梳理，我们往往需要花很长的时间去做信息收集，收集与此公司相关的信息，包括企业的分公司，全资子公司，网站域名、手机app,微信小程序，企业专利品牌信息，企业邮箱，电话等等，对于很多万人挖的src来说，你收集到了别人没有收集过的资产，往往离挖到漏洞就不远了。

Power7089

2021/01/11

3.3K0

浅析云存储的攻击利用方式

云主机安全腾讯云 idaas 运维安全漏洞

本次的议题，关于云存储的一个攻击利用方式，在SRC漏洞挖掘，或在火线安全平台的众测项目中，我们也会收到很多关于对象存储的一个劫持和权限配置的一些问题，对象存储在安全这一块也是一个不可忽略的方向。

火线安全

2022/03/14

2.8K0

大数据开发工程师基本功修炼之史上最全Linux学习笔记(建议收藏)

yum linux html ide

Linux是大数据中的基础,无论是运维或开发,都免不了要学,而且学的越扎实越好,下面为大家带来Linux学习笔记

Maynor

2021/06/29

1.7K0

Ha1cyon_CTF部分wp

ctf 二维码加密脚本字符串

打开文档得到一长串字符串，如果用ctrl+a全选文件内容的话，就可以发现在下面还隐藏着一些东西

回天

2023/04/25

4340

Ha1cyon_CTF部分wp

最新Burp Suite进阶技术

网站安全测试漏洞数据

Burp Scanner主要用于自动检测Web系统的各种漏洞。本节介绍Burp Scanner的基本使用方法，在实际使用中可能会有所改变，但大体环节如下。

Ms08067安全实验室

2023/08/18

7370

最新Burp Suite进阶技术

各种日志分析方式汇总

grep linux unix python tcp/ip

Windows 系统日志是记录系统中硬件、软件和系统问题的信息，同时还可以监视系统中发生的事件。用户可以通过它来检查错误发生的原因，或者寻找受到攻击时攻击者留下的痕迹。

信安之路

2019/07/05

6.2K0

2024全网最全面及最新且最为详细的网络安全技巧十一：应急响应系列之Windows，Linux及Web日志分析入侵排查；（2）[含2024护网行动各厂商面试精题及全网查杀工具整合]

日志分析网络安全工具技巧面试

Windows系统日志是记录系统中硬件、软件和系统问题的信息，同时还可以监视系统中发生的事件。用户可以通过它来检查错误发生的原因，或者寻找受到攻击时攻击者留下的痕迹。

盛透侧视攻城狮

2024/10/21

1750

分享Emlog博客程序建站SEO优化技巧方法

博客程序技巧建站优化

之所以叫做简易优化指南，是因为emlog网站程序本身并不支持多么复杂的优化手段，比如说尽管5.0.0版实现了首页的网页标题和浏览器标题（也即title）分开设置，但栏目页和作者页还是老样子网页标题和浏览器标题只能一起弄。此外还有缺少二级分类支持啦、无法单独提取置顶和带图文章啦——修改数据库之类的主意就免了吧，可以的话咱尽量只动模板，实在不行稍微改动一下程序文件就够了。

用户8099761

2023/05/10

1.8K0

干货 | 渗透测试全流程归纳总结

安全访问管理 github git 开源

　　从旁观者的角度了解整个WEB应用乃至整个目标的全貌，但是资产是收集不完的，可以边收集，边进行一定程度的测试。信息收集最小的粒度应是目录。

HACK学习

2021/03/03

4.4K0

日拱一卒，MIT教你耍帅，炫酷无比的命令行用法

正则表达式 https 网络安全 linux unix

今天我们继续聊聊麻省理工的missing smester，消失的学期，讲解那些不会在课上提及的工具和技术。

TechFlow-承志

2022/09/21

1.1K0

日拱一卒，MIT教你耍帅，炫酷无比的命令行用法

Python实现抖音短视频去水印及批量获取用户主页无水印视频

https 网络安全 php 短视频 css

首语抖音，是由今日头条孵化的一款音乐创意短视频社交软件。该软件于2016年9月20日上线，是一个面向全年龄的短视频社区平台。作为抖音的重度使用患者，每天刷着视频笑哈哈😄，不亦乐乎。可是大家都知道，抖音下载的视频是带水印的。作为一个有强迫症的程序猿，这是绝对不允许的。网上许多的去水印工具，它们的原理是咋样的，是写了一种特别厉害的算法嘛。好奇心驱使我开始了研究。短视频去水印分析我们从抖音的分享链接入手，从抖音复制的分享链接格式如下： 2.82 wsr:/ Happy birthday to Kob

八归少年

2022/06/29

5.1K0

Python实现抖音短视频去水印及批量获取用户主页无水印视频

文本分类中语料库的获取——搜狗语料库

这次主要总结搜过语料库的获取，因为老师要求20万数据，而我自己只爬了2万多，所以用到了搜狗的语料库. 在这个页面中，我选择的是一个月的数据，别小看一个月，我从里面只用了24万，这24万可能在这一个月里

机器学习AI算法工程

2018/03/14

3K0

文本分类中语料库的获取——搜狗语料库

密码破解那些事

最近恰巧刚好搞到一批hash,所以就寻思着,要不顺手小结一点关于hash破解的东西吧,反正经常要用,就当留备忘了,顺便也分享给大家,主要还是希望大家都能在实际渗透中能尽快上手用,既是这样,就肯定不会涉及太深,比如,其内部的破解算法具体是如何实现的等等…,我们都不会去深入剖析,毕竟,并不是为了去写此类工具,如果真的有兴趣,可自行去读源码[起码自己暂时还没那能力],经常渗透的朋友可能都非常清楚,由于各种各样的途径,我们经常会搞到各种各样的散列[hash],比如,各类web管理用户的密码hash,各类系统用户的密码hash,各种第三方服务器工具配置文件中的hash,各类办公套件文件启动密码的加密hash,等等……今天,我们就来简要说明一下关于各类hash破解工具的使用,以备不时之需……其实,明眼人都很清楚,hash破解的本质是没啥实际的技术含量的[前提你不自己写此类工具],还是那句话,主要目的还是希望大家能尽快上手,既然是好东西就要想办法把它应用到实际干活儿中,不然,意义何在呢...废话少说,咱们开始介绍今天的第一款hash破解工具,'hashcat'想必该工具早已家喻户晓 [关于hash破解的东西,后续我会做成一个单独的系列],希望大家能持续关注,你们的支持,会是自己努力创作的源泉,嘿嘿……

信安之路

2018/08/08

6.3K0

命令行上的数据科学第二版五、清理数据

命令行工具工具命令行数据数据科学

两章前，在 OSEMN 数据科学模型的第一步，我们看到了从各种来源获取数据。这一章讲的都是第二步：清理数据。你看，你很少能立即继续探索甚至建模数据。您的数据首先需要清理或清理的原因有很多。

ApacheCN_飞龙

2023/03/31

2.8K0

【实用的开源项目】使用服务器部署Wiki.js，一个美观且强大的开源Wiki程序

轻量应用服务器云服务器小微企业云服务器容器镜像服务 wiki

上个月小俊介绍了一款支持跨平台、跨终端的在线文档、知识库管理程序： MrDoc觅思文档，后来又在寻找有没有其他的程序，这不，美观且强大的开源Wiki程序： Wiki.js ，简单使用之后，感觉还不错，也推荐给大家，现在就教大家如何部署这款程序。

小俊是我

2023/07/15

4.3K6

【实用的开源项目】使用服务器部署Wiki.js，一个美观且强大的开源Wiki程序

Linux好用的管道命令

linux 编程算法 express 数据处理 grep

1)在当前目录中，查找后缀有 file 字样的文件中包含 test 字符串的文件，并打印出该字符串的行。此时，可以使用如下命令：

WHYBIGDATA

2023/01/31

9.5K0

腾讯Blade Team胡珀：IoT时代，“白帽子”以网为剑捍卫安全

10月10日至10月11日，第三届腾讯安全国际技术峰会（TenSec2018）在深圳顺利举办。由腾讯安全发起、腾讯安全科恩实验室与腾讯安全平台部联合主办，腾讯安全学院协办的TenSec 2018，邀请了来国内外业界技术大咖，共同探讨物联网、云计算、区块链等多领域的安全问题。作为前沿技术安全研究团队代表，腾讯安全平台部总监、Tencent Blade Team负责人胡珀在会上进行了分享。TencentBlade Team近年来在智能设备安全研究方面积累了大量成果，包括发现首个谷歌TensorFlow

腾讯技术工程官方号

2018/10/12

8270

腾讯Blade Team胡珀：IoT时代，“白帽子”以网为剑捍卫安全

buuctf_misc部分wp（8.25更）

加密脚本流量数据字符串

看到 n e 可以判断为rsa，脚本解密： import gmpy2 p=gmpy2.mpz(3) q=gmpy2.mpz(11) e=gmpy2.mpz(3) l=(p-1)*(q-1) d=gmpy2.invert(e,l) c=gmpy2.mpz(26) n=p*q ans=pow(c,d,n) print ans 得到结果：5 然而真实的压缩包密码是：答案是5 解压后得到一个图片和一个文件，将图片用winhex打开可以看到是png文件，修改图片高度可得到：

回天

2023/04/25

1.1K0

buuctf_misc部分wp（8.25更）

基于k-means++和brich算法的文本聚类

分词和过滤停用词，这里分词有两步，第一步是对停用词进行分词，第二步是切分训练数据。

opprash

2019/09/09

2.5K0

相关推荐

重构Sec-News之路

更多 >

LV.1

信安之路创始人

作者相关精选

换一批

目录

获取 wiki 平台上所有的文章链接

分析获取的链接数据

加入讨论

的问答专区 >

相关课程

一站式学习中心 >

腾讯云向量数据库-RAG七天入门训练营

向量数据库

腾讯云安灯

腾讯云WeData大数据开发与治理训练营

数据开发治理平台 WeData

AI驱动的TDSQL-Cserverless实战营

云原生数据库 TDSQL-C

💥开发者 MCP广场重磅上线！

精选全网热门MCP server，让你的AI更好用 🚀