隐私需要保护,效率也要提高,提高效率一定要建立在泄露隐私的基础上吗?隐私与效率,不能兼得吗?有没有什么好的搜索算法,或者改进搜索算法提高效率还不会泄露隐私?
搜索算法的特点如下:
有的时候搜索算法里时间和热度这两个因素占了很大程度,毕竟谁也不会想看到好多年前都没有人看过的什么文章。那就有问题,但网上“原创火不过转载”的事情时有发生,如果单纯用时间和热度来评判位置前后是无法辨别出原创和转载的。但是哪怕,原创不够火,我们也应该支持原创。所以,搜索算法应该把原创或者原文或者官方网站放在第一条,这样才能保证搜索的准确性,尊重原创内容。同时应该对原创的图片等这些盗用的资源加上权限或者提醒。
搜索的另一个特点就是及时性。不但范围广,容量大,而且要及时更新。这要求算法复杂度一定不能过高,不然是不能称之为一个优秀的搜索算法的。搜索要跟得上潮流,这可是个接口,得及时更新。
算法应当是公正的,不应该带有主观感情色彩。更不要说出现的前几都是广告。这是不对的,搜索算法是提供服务的主体,而不是希望客户去消费。应当只返回客观公正的搜索结果,不是一大堆广告。这就已经失去搜索的本心了。
讲完搜索的特点,是不是觉得根本没有涉及到隐私?这就对了,算法都是公正的,使用算法的人跟你说,你把隐私给我吧,我能提高你搜索的效率哦。
浏览器的好坏在这里就不详细说了,毕竟这里是讲算法。也没啥好说的,大家都懂。
我觉得提高效率应该不只是个性化而已,怎么筛选内容,怎么去除不相关的,保留专业的,更理解语言,这些都优化好才是真正的从核心提高效率。在专业性的问题上不废话,在寻常的问题上“亲切”。
也就是俗称的“我们不生产内容,只做内容的搬运工”。搜索算法是客观公正得显示最值得推得。不形成框硬推,也不会造堵墙挡隔绝在外。
最后,搜索给你你想要的,而不是给你它想给你的。
楼主你要明白,搜索和推荐是不一样的。搜索算法是面对所有用户而非个性化算法,优化是为了准确和真实,而不是更合心意。
如果只是在浏览器进行搜索,是不需要也不应该泄露隐私的。搜索功能应当是抓取网页,然后在客户输入时返回准确的结果。
这就要求抓取大量网站,抓取的内容要具有多样性,也要求这怒地不同文化不同内容作出更细致的筛选。所以一个好的搜索算法并不是获取用户的隐私来提高效率,而是完善自身容量,提高自身准确,根据表面信息(注意,比如国家地区是在cookie里有,这并不算个人隐私,如果你非要较真我也没办法,那你就只能活在真空世界了)得出准确的结果。
比如你用不同语言搜索,返回的是你用的语言和在你用的语言环境下的最准确的内容。