Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >从长亭的wiki上获取我想要的数据

从长亭的wiki上获取我想要的数据

作者头像
信安之路
发布于 2018-08-08 07:40:36
发布于 2018-08-08 07:40:36
1.9K0
举报
文章被收录于专栏:信安之路信安之路

本文作者:myh0st

那么,如何寻找喜欢分享,有可能加入我们的同学呢?

通常有自己博客的朋友都可以算作是喜欢分享,技术能力是次要的,只要爱分享就是我们所寻找的有缘人。

那么如何寻找有博客的朋友呢?

国内有两个 wiki 平台,一个是 www.sec-wiki.com,另一个就是 wiki.ioin.in 了,这上面,大家提交了很多质量比较好的文章,有些是为了推广平台自己添加上去的,有些是一些朋友看到好的文章主动提交的,所以这就是一个比较好的资源库,有大量的喜欢分享的朋友在上面,所以这就是我的目标。

今天的主题是长亭的 wiki,也就是 wiki.ioin.in

获取 wiki 平台上所有的文章链接

这个工作肯定不是通过纯手工可以搞定的,必须使用工具,那么自己写工具吗?

作为一个懒人,很久没写代码了,所以就用已有的工具来完成吧,这里用到的工具有:burpemeditor

打开 wiki.ioin.in,如图:

url 中的页数是可以遍历的,所以我们就用 burp 来设置参数,遍历一下,如图:

遍历完之后,将响应返回的结果保存下来,保存选项如下图:

保存完之后,就可以用我们的 emeditor,这个编辑器是我最喜欢的,功能很强大,把所有短链接提取出来,如下图:

从上图可以看出,短链接是有规律的,所以只需要把行里有 <a href="/url 导出来就可以了,如图:

提取后的结果如图:

将提取后的结果保存在一个文件里,然后设置下一波爆破,如图:

设置完,启动爆破,然后把结果保存下来,如图:

把含有 Location: 的行提取出来,然后替换掉就获得了所有的链接,如图:

分析获取的链接数据

拿到结果之后,我们要把这里面涉及的网站做个统计,看看哪些网站出现的次数最多,发布的文章最多,这里可以使用 linux 下的两个命令:sortuniq

1、将结果中的域名提取出来

emeditor 将域名之前的 http 的部分替换掉,可以用正则替换,如: http[s]?://,然后将域名后面的部分替换点,正则如:/.*,然后获得结果如下:

2、对以上结果进行排序统计

可以使用如下命令对文件进行处理:

sort links.txt | uniq -c > 1.txt sort -r -k 1 -n 1.txt > 2.txt

处理结果如图:

下面就可以看小伙伴的博客,如果内容比较好的,我就联系大家了。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-03-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 信安之路 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
重构Sec-News之路
不知道什么时候突然发现我已经稳定运行了近半年的sec-news(http://wiki.ioin.in)突然变得特别慢,为跳转效率我也是尝试了很多方法,比如加缓存。我使用了一个叫flask-cache的缓存: https://pythonhosted.org/Flask-Cache/ ,很好用的cache。
phith0n
2020/10/15
7580
SRC混子的漏洞挖掘之道
还是那句老话,渗透测试的本质是信息收集,对于没有0day的弱鸡选手来说,挖SRC感觉更像是对企业的资产梳理,我们往往需要花很长的时间去做信息收集,收集与此公司相关的信息,包括企业的分公司,全资子公司,网站域名、手机app,微信小程序,企业专利品牌信息,企业邮箱,电话等等,对于很多万人挖的src来说,你收集到了别人没有收集过的资产,往往离挖到漏洞就不远了。
Power7089
2021/01/11
3.3K0
浅析云存储的攻击利用方式
本次的议题,关于云存储的一个攻击利用方式,在SRC漏洞挖掘,或在火线安全平台的众测项目中,我们也会收到很多关于对象存储的一个劫持和权限配置的一些问题,对象存储在安全这一块也是一个不可忽略的方向。
火线安全
2022/03/14
2.8K0
浅析云存储的攻击利用方式
大数据开发工程师基本功修炼之史上最全Linux学习笔记(建议收藏)
Linux是大数据中的基础,无论是运维或开发,都免不了要学,而且学的越扎实越好,下面为大家带来Linux学习笔记
Maynor
2021/06/29
1.7K0
Ha1cyon_CTF部分wp
打开文档得到一长串字符串,如果用ctrl+a全选文件内容的话,就可以发现在下面还隐藏着一些东西
回天
2023/04/25
4340
Ha1cyon_CTF部分wp
最新Burp Suite进阶技术
Burp Scanner主要用于自动检测Web系统的各种漏洞。本节介绍Burp Scanner的基本使用方法,在实际使用中可能会有所改变,但大体环节如下。
Ms08067安全实验室
2023/08/18
7370
最新Burp Suite进阶技术
各种日志分析方式汇总
Windows 系统日志是记录系统中硬件、软件和系统问题的信息,同时还可以监视系统中发生的事件。用户可以通过它来检查错误发生的原因,或者寻找受到攻击时攻击者留下的痕迹。
信安之路
2019/07/05
6.2K0
各种日志分析方式汇总
2024全网最全面及最新且最为详细的网络安全技巧 十一:应急响应系列之Windows,Linux及Web日志分析入侵排查;(2)[含2024护网行动各厂商面试精题及全网查杀工具整合]
Windows系统日志是记录系统中硬件、软件和系统问题的信息,同时还可以监视系统中发生的事件。用户可以通过它来检查错误发生的原因,或者寻找受到攻击时攻击者留下的痕迹。
盛透侧视攻城狮
2024/10/21
1750
分享Emlog博客程序建站SEO优化技巧方法
之所以叫做简易优化指南,是因为emlog网站程序本身并不支持多么复杂的优化手段,比如说尽管5.0.0版实现了首页的网页标题和浏览器标题(也即title)分开设置,但栏目页和作者页还是老样子网页标题和浏览器标题只能一起弄。此外还有缺少二级分类支持啦、无法单独提取置顶和带图文章啦——修改数据库之类的主意就免了吧,可以的话咱尽量只动模板,实在不行稍微改动一下程序文件就够了。
用户8099761
2023/05/10
1.8K0
干货 | 渗透测试全流程归纳总结
  从旁观者的角度了解整个WEB应用乃至整个目标的全貌,但是资产是收集不完的,可以边收集,边进行一定程度的测试。信息收集最小的粒度应是目录。
HACK学习
2021/03/03
4.4K0
日拱一卒,MIT教你耍帅,炫酷无比的命令行用法
今天我们继续聊聊麻省理工的missing smester,消失的学期,讲解那些不会在课上提及的工具和技术。
TechFlow-承志
2022/09/21
1.1K0
日拱一卒,MIT教你耍帅,炫酷无比的命令行用法
Python实现抖音短视频去水印及批量获取用户主页无水印视频
首语 抖音,是由今日头条孵化的一款音乐创意短视频社交软件。该软件于2016年9月20日上线,是一个面向全年龄的短视频社区平台。 作为抖音的重度使用患者,每天刷着视频笑哈哈😄,不亦乐乎。可是大家都知道,抖音下载的视频是带水印的。作为一个有强迫症的程序猿,这是绝对不允许的。网上许多的去水印工具,它们的原理是咋样的,是写了一种特别厉害的算法嘛。好奇心驱使我开始了研究。 短视频去水印 分析 我们从抖音的分享链接入手,从抖音复制的分享链接格式如下: 2.82 wsr:/ Happy birthday to Kob
八归少年
2022/06/29
5.1K0
Python实现抖音短视频去水印及批量获取用户主页无水印视频
文本分类中语料库的获取——搜狗语料库
这次主要总结搜过语料库的获取,因为老师要求20万数据,而我自己只爬了2万多,所以用到了搜狗的语料库. 在这个页面中,我选择的是一个月的数据,别小看一个月,我从里面只用了24万,这24万可能在这一个月里
机器学习AI算法工程
2018/03/14
3K0
文本分类中语料库的获取——搜狗语料库
密码破解那些事
最近恰巧刚好搞到一批hash,所以就寻思着,要不顺手小结一点关于hash破解的东西吧,反正经常要用,就当留备忘了,顺便也分享给大家,主要还是希望大家都能在实际渗透中能尽快上手用,既是这样,就肯定不会涉及太深,比如,其内部的破解算法具体是如何实现的等等…,我们都不会去深入剖析,毕竟,并不是为了去写此类工具,如果真的有兴趣,可自行去读源码[起码自己暂时还没那能力],经常渗透的朋友可能都非常清楚,由于各种各样的途径,我们经常会搞到各种各样的散列[hash],比如,各类web管理用户的密码hash,各类系统用户的密码hash,各种第三方服务器工具配置文件中的hash,各类办公套件文件启动密码的加密hash,等等……今天,我们就来简要说明一下关于各类hash破解工具的使用,以备不时之需……其实,明眼人都很清楚,hash破解的本质是没啥实际的技术含量的[前提你不自己写此类工具],还是那句话,主要目的还是希望大家能尽快上手,既然是好东西就要想办法把它应用到实际干活儿中,不然,意义何在呢...废话少说,咱们开始介绍今天的第一款hash破解工具,'hashcat'想必该工具早已家喻户晓 [关于hash破解的东西,后续我会做成一个单独的系列],希望大家能持续关注,你们的支持,会是自己努力创作的源泉,嘿嘿……
信安之路
2018/08/08
6.3K0
密码破解那些事
命令行上的数据科学第二版 五、清理数据
两章前,在 OSEMN 数据科学模型的第一步,我们看到了从各种来源获取数据。这一章讲的都是第二步:清理数据。你看,你很少能立即继续探索甚至建模数据。您的数据首先需要清理或清理的原因有很多。
ApacheCN_飞龙
2023/03/31
2.8K0
【实用的开源项目】使用服务器部署Wiki.js,一个美观且强大的开源Wiki程序
上个月小俊介绍了一款支持跨平台、跨终端的在线文档、知识库管理程序: MrDoc觅思文档 ,后来又在寻找有没有其他的程序,这不,美观且强大的开源Wiki程序: Wiki.js ,简单使用之后,感觉还不错,也推荐给大家,现在就教大家如何部署这款程序。
小俊是我
2023/07/15
4.3K6
【实用的开源项目】使用服务器部署Wiki.js,一个美观且强大的开源Wiki程序
Linux好用的管道命令
1)在当前目录中,查找后缀有 file 字样的文件中包含 test 字符串的文件,并打印出该字符串的行。此时,可以使用如下命令:
WHYBIGDATA
2023/01/31
9.5K0
Linux好用的管道命令
腾讯Blade Team胡珀:IoT时代,“白帽子”以网为剑捍卫安全
10月10日至10月11日,第三届腾讯安全国际技术峰会(TenSec2018)在深圳顺利举办。由腾讯安全发起、腾讯安全科恩实验室与腾讯安全平台部联合主办,腾讯安全学院协办的TenSec 2018,邀请了来国内外业界技术大咖,共同探讨物联网、云计算、区块链等多领域的安全问题。 作为前沿技术安全研究团队代表,腾讯安全平台部总监、Tencent Blade Team负责人胡珀在会上进行了分享。TencentBlade Team近年来在智能设备安全研究方面积累了大量成果,包括发现首个谷歌TensorFlow
腾讯技术工程官方号
2018/10/12
8270
腾讯Blade Team胡珀:IoT时代,“白帽子”以网为剑捍卫安全
buuctf_misc部分wp(8.25更)
看到 n e 可以判断为rsa,脚本解密: import gmpy2 p=gmpy2.mpz(3) q=gmpy2.mpz(11) e=gmpy2.mpz(3) l=(p-1)*(q-1) d=gmpy2.invert(e,l) c=gmpy2.mpz(26) n=p*q ans=pow(c,d,n) print ans 得到结果:5 然而 真实的压缩包 密码是:答案是5 解压后得到一个图片和一个文件,将图片用winhex打开可以看到是png文件,修改图片高度可得到:
回天
2023/04/25
1.1K0
buuctf_misc部分wp(8.25更)
基于k-means++和brich算法的文本聚类
分词和过滤停用词,这里分词有两步,第一步是对停用词进行分词,第二步是切分训练数据。
opprash
2019/09/09
2.5K0
推荐阅读
相关推荐
重构Sec-News之路
更多 >
领券
💥开发者 MCP广场重磅上线!
精选全网热门MCP server,让你的AI更好用 🚀
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档