据外媒报道,近日美国共和党对谷歌公司发起诉讼,指控谷歌在共和党筹款关键时期,将数百万封的电子邮件归入到潜在捐助者和支持者的垃圾邮件文件夹。谷歌对此拒不承认,并表示反垃圾邮件不会根据政治派别来过滤。
发垃圾邮件系统的规则
谷歌的反垃圾邮件规则如何,只有谷歌最清楚。但现行的反垃圾邮件基本都是系统智能过滤,会集成人工智能+程序规则,一般规则如下:
简单粗暴的黑白名单,邮件系统可以根据互联网历史积累的垃圾邮件名单,自动形成黑名单。同时,也允许用户自己添加可疑的黑名单。
行为判断,垃圾邮件的行为通常从一个节点批量发送到多个目标。那么反垃圾邮件系统就可以通过高频发送来确定可疑的垃圾邮件的源头,并将它列入黑名单。同时,很多垃圾邮件为了实现自己的利益目标,内容通常不规范,且带有很多广告或者危害链接。反垃圾邮件系统也可以通过这个特征来设置关键字、内容过滤。
源头真实性判断:正常人发邮件一般都是真实的IP、真实的账号。一切都是真实的!而垃圾邮件发送者为了躲避追踪,常常采用伪造发送者地址来避免被列入黑名单。然而这又给反垃圾邮件多了一个行之有效的判断规则。
智能判断:不少用户在使用邮件,碰到垃圾邮件时,会向系统反馈。智能判断系统会利用大数据来进行深度学习,智能形成反垃圾规则。当然,邮件运营商也可以组织人员来对智能系统进行大量的垃圾样本学习,以提高准确度。
过滤规则会牵涉政治派别之争吗?
上面的规则从技术角度来说,对所有人都是公平的,不存在政治派别之争。但是,技术是服务于人类的,过滤规则也是聪明的人类来制定的。既然是人类制定的系统,如果有人从中介入,系统就有可能出现误判,是有可能牵涉政治派别之争的。比如:
如果有人在行为判断这里,故意针对政治活动邮件的特征做了误判的规则,系统在执行检测时,自然很容易将这类邮件误判到某一类垃圾邮件之中。
如果有人在智能判断这里,故意给大数据系统容易误判的样本进行学习。这样学习出来的系统,自然很容易出现误判,因为它学习了错误的知识。
当然,发生这种事情的概率很低。因为要误导系统,做得天衣无缝很难。毕竟系统的规则是不能随便更改的,如果有人特意去改,就很容易留下痕迹。对于谷歌这次被起诉,它只要证明自己反垃圾邮件规则是公平的,而且一直没有被人篡改过。基本也就可以说明自己的系统规则没有政治派别之争。
结语
随着科技的发展,将来会越来越多的科技服务于生产生活,也会有越来越多的科技服务于政治活动。谷歌反垃圾邮件这件事情,很可能是共和党的筹款邮件本身很像捐赠的垃圾邮件,导致系统误判。不过,这件事情给所有科技企业提了个醒,做系统千万不要牵扯政治派别之争,否则后果不堪设想。
领取专属 10元无门槛券
私享最新 技术干货