社交机器人在社交媒体上的大量存在导致了诸多问题,如散布虚假信息、操纵选举等。有效检测社交机器人对于保护用户利益和确保平台稳定运行至关重要。传统的机器学习方法如随机森林在社交机器人检测中表现出色,但未能充分利用账户间的交互信息。
本文提出了一种名为RF-GNN的新型检测框架,即随机森林增强图神经网络。这种方法将图神经网络(GNN)作为基分类器,构建随机森林,有效结合了集成学习和GNN的优势,以提高模型的准确性和鲁棒性。
RF-GNN框架:由子图构建模块、对齐机制和模型集成模块组成,如图所示:



实验中,使用所有标记的用户构建社交图。特别是对于MGTAB数据集,使用了信息增益最高的20个用户属性特征和BERT提取的768维用户推文特征。对于Twibot-20和Cresci-15,遵循了先前研究的处理方法,使用了用户属性特征、BERT提取的用户描述特征和用户推文特征。
对比了多种半监督学习基线方法,包括:决策树 (DT)、随机森林 (RF)、Node2Vec、APPNP、图卷积网络 (GCN)、图简化卷积网络 (SGC)、图注意力网络 (GAT)、Boosting-GNN、JK-Nets、GraphSAINT、LA-GCN。
为了评估RF-GNN各个模块对性能提升的贡献,生成了完整RF-GNN模型的几个变体。RF-GNN模型包括三个主要模块:子图构建模块、对齐机制模块和模型集成模块。为了进行消融研究,选择性地启用或禁用了这些模块的某些组件。以下是这些变化的说明:
实验在装有9个Titan RTX GPU、2.20GHz Intel Xeon Silver 4210 CPU和512GB RAM的服务器上执行,操作系统为Linux。
由于社交媒体上人类和机器人的数量并不大致相等,使用准确率(Accuracy)和F1分数(F1-score)来表示分类器的整体性能。准确率和F1分数的计算公式如下:

其中,TP是真正例,TN是真负例,FP是假正例,FN是假负例。这些详细的实验设置为评估RF-GNN模型提供了坚实的基础,并允许与其他方法进行公平比较。
作者在公共可用的社交机器人检测数据集上进行了实验,以评估所提方法的有效性,对于RF-GNN,所有数据集的S设为10,提出的基线方法和完整RF-GNN方法的最佳结果以粗体突出显示:

实验采用1:1:8的比例随机划分训练集、验证集和测试集,以减少随机性并确保结果的稳定性。每种方法使用不同的随机种子评估了五次,并报告了平均测试结果。结果显示,RF-GNN在所有情况下都优于其他基线方法和变体。
消融研究的目的是评估RF-GNN中不同模块对整体有效性的贡献,分别计算了RF-GCN- e、RF-GCN- es和RF-GCN三个基分类器在Twibot-20上输出的平均余弦相似度:

基分类器的数量是影响RF-GNN性能的关键参数。当基分类器数量较少时,RF-GNN的分类误差较高,性能相对较差。
增加基分类器的数量可以提高集成分类器的多样性,但构建RF-GNN的时间与基分类器的数量成正比,设置过多可能导致模型效率降低。 实验结果表明,当基分类器数量从2增加到10时,所有数据集的模型实例准确率均有所提高:

基于GCN骨干模型,研究了超参数的敏感性,包括:

实验结果表明,特征选择比例β对RF-GCN性能影响最大,当β小于0.3时性能较差,而当β设置为0.7或0.9时性能最佳。
将RF-GNN框架扩展到异构图GNN,特别是使用RGCN和RGAT作为基分类器。同构gnn在社交机器人检测中的平均性能比较。每种方法用不同的种子进行5次评价。我们提出的基线方法和完整RF-GNN方法的最佳结果以粗体突出显示:

异构图GNN能够区分不同类型的关系,例如关注者和好友关系,并利用这些信息提高检测结果。
在社交机器人检测中,机器人可能会更改其注册信息以逃避检测。为了模拟这种情况,向账户的特征向量中添加了一定比例的随机噪声,将均值为0、方差为1的高斯噪声随机添加到10%、20%和30%的特征中,实验结果如图所示:

实验结果显示,RF-GCN在不同噪声比例下的性能优于RF-GCN-ES和GCN,表明所提出的对齐机制提高了模型的准确性和鲁棒性。
RF-GNN通过结合GNN的节点关系利用能力和随机森林的集成学习优势,显著提高了社交机器人检测的性能和鲁棒性。实验结果表明,RF-GNN在社交机器人检测基准数据集上一致性地超越了现有的GNN基线。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。