好久没有更新公众号了,最近和大家聊的最多的就是安全+机器学习的话题,送了一些书,好多人也让我推荐一些书籍,无耐天天忙着没有系统的梳理一下,趁着假期绘制一张思维导图。
以下列举了一些读过的书和使用过的数据集,仅供参考。
以上分为三部分,简单说明一下。
Machine Learning & CyberSecurity中大部分书籍国内都未出版,国人兜哥写了两本Web安全+机器学习,看英文吃力的同学可以先从这两本入门。
DataSets主要推荐一些安全相关的数据集,相比图像、文字的数据集标定,安全数据集的标定需要更高的成本,因为这部分只能由安全相关人员人工识别,可见成本之高,所以网上开源的数据集尤为宝贵。如果你对病毒感兴趣的话,可以关注Github该公众号同名的数据仓库,我分享了黑白名单各1000个的样本数据及其机器学习处理思路,当然由于一定原因没有公开所有细节。
Visualization涉及可视化部分,我们知道很多更高维度空间的数据通过可视化可以很好的表达,有助于对数据集的整体把控。
领取专属 10元无门槛券
私享最新 技术干货