AI科技评论消息,近日,Kaggle平台上公布了Twitter客户支持数据集,这个数据集包括来自大企业的超百万条推文与回复,大家可以利用这个数据集做很多有意思的工作。数据集的具体信息如下所示,AI科技评论编辑整理如下: Twitter客户支持数据集(Customer Support)是一个庞大的推文与回复语料库,这个数据集比较现代化,有助于自然语言理解和会话模型的创新,也对客户支持实践与影响效果的相关研究有所帮助。 背景 自然语言处理(NLP)目前仍然需要密集的编码方式,NLP中的创新加速了对数据的理解
Twitter产品经理Todd Sherman今天正式宣布,以后发推特,包括图片、GIF、视频、投票、转发和回复等内容将不计入140个字符限制。此前,用户发布的推特中,这些内容大约要占25个字符左右,这在某种程度上放开了推特的字符限制,用户在一条推特上可以发布更多内容。不知新浪微博会不会也做出相应改动呢? 此外,该公司将改变推文的显示方式,用户包含艾特对象的推文也将即时出现在用户的推特时间线内。 这一改变对用户习惯和互联网世界又意味着什么呢?我们听听Twitter产品经理Todd Sherman如何讲述?
来源:InfoQ 3 月 31 日,正如马斯克一再承诺的那样,Twitter 已将其部分源代码正式开源,其中包括在用户时间线中推荐推文的算法。目前,该项目在 GitHub 已收获 10k+ 个 Star。 GitHub 地址:https://github.com/twitter/the-algorithm 马斯克在 Twitter 上表示此次发布的是“大部分推荐算法”,其余的算法也将陆续开放。他还提到,希望“独立的第三方能够以合理的准确性确定 Twitter 可能向用户展示的内容”。在关于算法发布的 Sp
整理 | 凌敏、核子可乐 等来等去,马斯克终于兑现了他的开源承诺。 马斯克开源 Twitter 推荐算法 3 月 31 日,正如马斯克一再承诺的那样,Twitter 已将其部分源代码正式开源,其中包括在用户时间线中推荐推文的算法。目前,该项目在 GitHub 已收获 10k+ 个 Star。 GitHub 地址:https://github.com/twitter/the-algorithm 马斯克在 Twitter 上表示此次发布的是“大部分推荐算法”,其余的算法也将陆续开放。他还提到,希望“独立
设计一个简化版的推特(Twitter),可以让用户实现发送推文,关注/取消关注其他用户,能够看见关注人(包括自己)的最近十条推文。你的设计需要支持以下的几个功能:
在推送给用户的推特,是该用户关注的人发的推特,并通过时间顺序合并在一起。采用多路归并的方式合并,在归并时,通过最小堆优化。
这是一个系列文章的第一篇,从更实际的角度探讨“Twitter 算法开源”会是什么样子。
---- 新智元报道 来源:网络 编辑:David 粥粥 【新智元导读】此前被Twitter「永封」的美国前总统特朗普放大招了!他宣布另起炉灶,自己成立社交媒体「真实社交」,对抗大型科技公司的「暴政」。愿世间再无Fake News! NO FAKE NEWS ANYMORE! 自从特朗普卸任美国总统以来,已经很久没有听到他用最淳朴的语言,说出最能打动人心的话了。 曾为「治国利器」的Twitter账号被永久禁言,主流媒体上的报道被大幅压制,网上还是CNN、NBC等媒体巨头一统天下。 怎么办?事实表明
10月12日,知名科技媒体 CleanTechnica 在Twitter上发布了一篇名为《Tesla Autopilot Updates & Notes from Elon Musk》(特斯拉自动驾驶系统更新和埃隆·马斯克的注释)的文章,特斯拉CEO马斯克在该推文的回复中表示下周二起向部分车主推送全自动驾驶Beta版。
机器之心报道 机器之心编辑部 如何振兴推特,马斯克选择「流量最大」的打法。 马斯克曾把特斯拉的专利开源,现在推特的算法也被他开源了。 首富伊隆・马斯克去年收购推特前就曾表示,推特的代码应该在 GitHub 上公开,以便公众对其进行检查,这样才算得上健全。在这不久后,马斯克宣布收购推特,推特的 GitHub 主页上很快新增了一个「the-algorithm」仓库,不过这个仓库很快就 404 了。 前几天他又表示,推特会在 3 月 31 日开源推荐代码。这一次,他终于兑现了。 马斯克在推特上表示,目前发布的是
马斯克的裁员大戏还在继续,而最新的这“一集”,矛头直指一名在推特待了6年的工程师。
---- 新智元报道 来源:unite.ai 编辑:LRS 【新智元导读】有时候发了一条微博,评论区回复只有一个表情包,你真的明白这个背后的含义吗?台湾学者研究了三万条推特,最后竟然发现大部分道歉的情感竟然都是有套路的。 自然语言最美妙和最可恶的地方都在于它是有歧义的,例如同样一句话,以不同的语气说出来,可能是完全不同的含义。 例如使用微信打字交流,或者发一条朋友圈,朋友们错误地领会了你的感受,那可真是太尴尬了。 但是当你加入了表情包,就相当于说话中带了语气和表情,那文本的情绪就很好判断了。 显
瑞典马尔默有一所名为 The Game Assembly 的学校。这所学校专注于教学生游戏制作。从编程到艺术和设计,所有内容都教。这是一个为期三年的计划,最后一年会去游戏工作室实习。
MIT 媒体实验室近日发表在Science的一项迄今最大规模的假新闻研究发现,在 Twitter 上不实消息被转发的概率比真相高 70%,真消息扩散至 1500 人所需的时间平均是不实消息的 6 倍。研究以海量数据揭示了假新闻的传播路径和传播特征——谣言比真相传得更远、更深、更快,而且每个人都是散播恐惧、厌恶的假新闻的放大器。 一项迄今最大规模的关于新闻在社交媒体上传播方式的研究,以海量数据揭示了假新闻的传播路径和传播特征——谣言比真相传得更远、更深、更快,而且每个人都是散播恐惧、厌恶的假新闻的放大器
内容提要:自从 2016 年美国大选之后,各社交平台因虚假消息误导选民而备受批评。近几年来,Twitter 在消除虚假信息上投入了大力气,最近晒出了今年的成果。
作者 | 褚杏娟 近日,推特全球用户再次遇到了一个持续了约 90 分钟的故障,他们无法正常发送推文,而是收到一条自动消息,说他们“超过了每天发送推文的限制”,甚至当天一次还没有发布过用户都收到了该消息。 据悉,Twitter 的帮助中心表示,每天的推文数量上限为 2,400 条。中断不仅影响了新推文发布,还影响了推文的转发和回复。 美国科技出版物 The Information报道称,马斯克告诉推特员工暂停“新功能开发”,以在中断期间最大限度地提高平台的稳定性。 推特的开发团队在出现故障后发推文称,对其
据BleepingComputer 11月16日消息,Twitter 正准备为其平台上用户之间的私信 (DM) 添加端到端加密 (E2EE),预计这一功能将很快到来。 这是一项广受欢迎且需求量很大的功能,它将有助于进一步保护通信双方的私密性,免受任何第三方甚至是法律请求的影响。 早在2018年,Twitter就曾尝试推出 E2EE 系统的原型,并将其命名为“秘密对话”(Secret Conversation),但随后就没有了下文。而最近,移动研究员 Jane Manchun Wong发推称,她发现Twit
在安全研究小组MalwareHunterTeam最近的一项调查研究中曝光了多个传播虚假消息的机器人账户,它们为真实用户发出的帖子进行大量点赞,其目的是吸引用户点击查看它们账户的个人资料,利用其中的链接将用户引诱至色情内容网站。
鱼羊 发自 凹非寺 量子位 | 公众号 QbitAI OpenAI还没撕完,马斯克又跟微软杠上了,甚至直接在推特上放话: 我要告微软! 这又是发生了甚么? 原因无它:微软刚刚“封杀”了推特。公告显示,从4月25日,也就是下周开始,微软的广告平台将不再支持推特。 简单来说,就是广告主们没法用微软提供的社交媒体管理工具,在推特上投广告了。 微软重击Twitter 先来瞅一眼微软的具体公告内容。 其中提到,从2023年4月25日起,微软Smart Campaigns的多平台服务将不再支持推特。 通过这一免费
你可能没察觉到,自从伊隆 · 马斯克端着洗手池出现在推特总部以来,已经过去了漫长的一个月,这位首富「整活」的消息一直没有少过。近段时间来,马斯克治理推特的消息可谓是一波接着一波。
开发语言:Java 操作系统:window10 开发工具:IDEA JDK版本:1.8
出品 | OSC开源社区(ID:oschina2013) 马斯克又发布推文表示,推特将于 3 月 31 日开源所有用于推文推荐的代码。他解释称: 我们的 “算法” 过于复杂且内部未完全理解。人们会发现很多愚蠢的问题,但我们会在发现问题后立即修补!我们正在开发一种简化的方法来提供更具吸引力的推文,但这项工作仍在进行中。这也将是开源的。提供代码透明度一开始会令人尴尬,但它应该会让推荐质量快速提高。最重要的是,我们希望赢得你的信任。 事实上,马斯克已经不止一次的表示即将开源推特算法。他在去年收购推特前就说过,T
作者|褚杏娟、核子可乐 “从始至终,我们一直都笑呵呵的。” 当地时间周一上午,Twitter 网站又出了新故障。 有 Twitter 用户在登录之后发现了一大堆相互关联的问题。首先是单击链接无法跳转,反而弹出了一条神秘的错误消息,称“您当前的 API 计划不包括对此端点的访问权限”。 “我猜这意味着 Twitter 非常需要现金,它开始收取 Twitter API 访问权限费用,但 Twitter 自己无法支付这笔费用。”普林斯顿计算机科学教授 Arvind Narayanan 发布推文略带调侃地评论
---- 新智元报道 编辑:时光 【新智元导读】这个世界真真假假,虚实难分,粉丝也是假的,连美国总统都不放过。 什么?推特粉丝都是假的? 大佬花钱买「水军」? 究竟是怎么回事? 不止1/4的「假粉丝」 最近,关于推特的新闻可真不少。 推特简直活成了卞之琳笔下的诗:「我在桥上看风景,看风景的人在楼上看你。」 本来是,我在推特看新闻,现在变成了,看新闻的人在看推特。 关键是,粉丝装饰了推特的窗子,推特装饰了别人的梦。 据媒体报道,1/4的推特粉丝是假的,这?粉丝装饰的推特窗子,竟然是假的。 两家
在如今的世界中,算法已经成为了我们日常生活的核心。当你进行网络搜索,滚动浏览社交媒体上的信息,或者从Spotify上接收到歌曲推荐时,实际上你正在被算法指导,甚至算法比你本人更了解你的消费习惯。
当地时间12月28日凌晨,上万名Twitter用户报告Twitter出现故障,用户无法访问该网站或使用其主要功能。此次故障范围波及包括美国、日本、英国在内的全球各个国家和地区,换句话说,Twitter再次爆发了全球性宕机事件。
---- 新智元报道 编辑:桃子 拉燕 【新智元导读】马斯克入股推特成为最大股东后,却拒绝加入董事会引来许多人的猜测。周二,一名推特股东直接起诉马斯克推迟披露持有股份,并人为压低股价。 难道一切都是恶意策划? 马斯克在抢购7千多万股推特后,却拒绝加入董事会,这是意欲何为? 美国时间周二,一名股东直接将马斯克告上了法院,因其延迟披露持有推特的股份。 更重要的是,控告指出马斯克还「人为压低」了股票价格。 正如Fortune 所指出的那样,如果马斯克加入董事会,他将获得超过14.9%的股份。 反而,由
区块链是一个不可变的记录链,称为块,可促进交Y,有助于跟踪Z产并记录数据和文件,其具有去中心化、不可篡改、全程留痕、集体维护、公开透明等特点,基于这些特点,区块链技术可以开√发出自带信任体系特征的系统,实现多个主体之间的协作信任与一致行动。
说实话,我有点暗恋Twitter上的一个帅哥。 他叫Kevin Brown。 我很喜欢这个小伙子在Twitter上的头像,一看就是很沉稳的性子。 我们的政治态度很像,我不喜欢特朗普,而他也常常在Twi
印第安纳大学复杂网络和系统研究中心的研究人员初步开发出一套名为Truthy的系统,它每小时能够对微博服务提供商Twitter用户发送的数千条推文进行分析,以识别其中反映出的用户行为模式以及传播的观点等信息。这一系统采用了文本和数据挖掘、复杂系统模型分析等先进技术,研究人员希望最终能借助该系统实现对社交媒体中传播错误信息的行为进行自动识别和监测。 该项目小组首先收集对于可疑Twitter账户的举报信息,而后使用网络分析技术来理清这些账户间究竟有何种联系。研究者还通过追踪所谓的即时动态信息来甄别那些突然流行
自马斯克入主 Twitter 以来,Twitter 员工的大部分时间都被耗在三件事上:灭火,执行不可能完成的任务,再就是在缺少明确指导和预期结果的情况下「提高效率」。
在承诺推出自主社交媒体网络几个月后,终于!前美国总统川普在周二为他的网站推出了一个新板块「来自川普办公桌的声音」(From the desk of Donald J. Trump) .
良好的系统设计能力,是一个优秀程序员的必要素质,反应出了处理复杂问题的能力,也是面试过程中能否获得相应的职位和薪酬的关键。
机器之心报道 编辑:泽南、蛋酱 推特上最大的网红收购了推特。 人们一直在说「马斯克的收购提案具有不确定性」,但事情就这么谈成了。一口价,全资收购。 本周一,推特董事会宣布接受收购要约,伊隆・马斯克以约 440 亿美元现金达成收购社交网络公司推特(Twitter Inc)的交易。该交易将把这家拥有 2.17 亿用户和全球影响力的社交媒体平台的控制权完全转移给全球首富。 对于推特这家拥有 16 年历史的科技公司来说,这是一个发生重大转折的时刻,它已成为世界上最具影响力的公共广场之一,现在也面临着一系列挑战。
这是一场震惊技术界的混战,但传奇软件建模专家、容器领域专家、基础设施技术主管等众多技术专家都挺身而出,十分一致地站到了马斯克的对立面,为“叫板马斯克的 Twitter 工程师们”表达支持态度。
2020年10月,多家美媒曾披露了一系列材料,指拜登之子亨特·拜登利用自己的家庭关系,将自己的父亲介绍给了乌克兰一家大型能源公司布利斯玛的一位高级顾问。
鱼羊 丰色 发自 凹非寺 量子位 | 公众号 QbitAI “马斯克气疯了”! 就在今天,推特又双叒崩溃了,图片和任何链接都打不开。 据马斯克自己的说法,原因只是“API的一个小改动”。 但后果很严重,起码在网友们看来,推特的现场是酱婶的: 而吃瓜群众们的心情,则是: 并非网友们太过刻薄,只是这事儿吧,确实有点孽力回馈的意思。 据Platformer消息,出现问题的是第三方客户端访问推特的API。就在2月初,马斯克决定不再免费开放这一API,要改成收费模式。 那这代码不就得跟着改嘛,然鹅,负责这事儿的竟
---- 新智元报道 来源:Twitter 【新智元导读】昨天,马斯克发推称,他要造半机械龙,引起粉丝哗然。目前,关于马斯克造龙还没有更多细节。 Oh btw I’m building a cyborg dragon “噢,顺便一提,我正在打造一条半机械龙” 马斯克昨天下午在他的Twitter随手发了这样一句话。 半机械...龙? 但这是马斯克,那个同时在造车、造火箭、挖隧道,并且以他的公司的名义卖过帽子、卖过喷火器的人。所以,造一条龙似乎也不是不可能。 马斯克在SpaceX、特斯拉、隧道公司The
衡宇 萧箫 发自 凹非寺 量子位 | 公众号 QbitAI 靓号,一个提起来就让人脑子充满“13888888888”(手机号)或者“123456”(QQ号)的名词。 现在即将在推特平台上重出江湖,重振威望。 推特老板马斯克,被曝考虑回收一批不活跃用户名(username),并拍卖其中的“靓号”。 要知道在这之前,推特可是连个人买卖账号都不允许的社交平台。 有网友已经预判了马斯克的下一步操作: 马斯克:为什么不把那些名人账号/靓号回收,再以高价出售给他们本人呢? 也有网友对这种“圈钱行为”感到愤怒: 怎么,
明敏 发自 凹非寺 量子位 | 公众号 QbitAI 真是难得见到马斯克服软啊…… 今天一早老马紧急发推,在线诚招PR副总裁! 再一看评论区,全是嘲讽和阴阳怪气: 自动回复 就能很好完成这项工作了。 (我可以)我擅长写一些居高临下、轻率的回复。 你愿意让位了? 哦豁,这又是发生了什么鬼热闹? 原来就在这几天,推特用户突然发现了一个令人毛骨悚然的隐私泄露bug: 发在好友圈(Twitter Circle)里的推特,会被推荐给陌生人看到! 有人就表示自己发了一条仅一个好友可见的推特,结果有俩陌生人点赞
很多人都知道社交媒体可以成为对外发布消息的平台,其实更重要的是你可以利用社交媒体对特定的人群在特定的时间内进行发布内容的洞察。
近年来,越来越多的恶意攻击者盯上了各大社交媒体。这些社交平台由于使用便捷、可扩展性强、自动化程度高,受众面广泛等特性,为攻击者发起僵尸网络攻击提供了得天独厚的条件。 这里的僵尸网络指的是由中央控制台控制的社交平台账户集合。这些账户均由机器控制,而非真实人类所有。这些机器账户能够形成僵尸网络,发送恶意链接,例如钓鱼广告、恶意软件、勒索软件、欺诈调查、垃圾邮件、对受害者账户进行劫持控制的恶意应用程序以及点击即收费的垃圾邮件网站等等。 自今年2月起,ZeroFOX威胁研究团队调查了一个Twitter上名为SIRE
大数据文摘出品 作者:Caleb 事情是这样的。 在周日的超级碗比赛时,马斯克发现自己的推文的点赞和转发等数据都没有拜登来得多,再加上最近马斯克的推特数据不如以前,马斯克当下拍板决定,要把自己的推文的优先级提高。 于是在当地时间12日深夜,马斯克召集了推特员工,让他们连夜加班修改算法,把自己的推文优先级人为提高了1000倍。 马斯克的副手表示,如果不这样做,他们将会“失去工作”。 周一下午,推特已经部署了修改的代码,对马斯克的所有推文都自动“开绿灯”。周二,马斯克测试了该功能,发布了一个“被迫喝牛奶”的
---- 新智元报道 来源:Facebook 编辑:yaxin, Emil 【新智元导读】Facebook今年把特朗普的账号封了。昨天,还给这个禁令加上了一个期限:至少2年。 川普和小扎友谊的小船说翻就翻! 「下次入主白宫不和小扎吃饭了。」 究竟为何? 昨天,Facebook官方宣布,作为对Facebook独立监督委员会(Oversight Board)的回应,将继续禁止前总统特朗普的Facebook和Instagram社交账户至少到2023年1月。 在今年5月份,由外部独立专家团队组成的Fa
你是一个数据分析师,你想用Python爬取Twitter上的一些数据,比如用户的昵称、头像、发言、点赞、转发等等。你觉得这应该是一件很简单的事情,只要用requests库和BeautifulSoup库就可以轻松搞定。但是,当你真正开始写代码的时候,你发现事情并没有那么顺利。你遇到了以下几个问题:
HTTP 参数污染,或者 HPP,在网站接受用户输入,将其用于生成发往其它系统的 HTTP 请求,并且不校验用户输出的时候发生。它以两种方式产生,通过服务器(后端)或者通过客户端。
今天为大家介绍的是来自James Zou 团队的一篇论文。公开可用的医学图像缺乏注释,成为计算研究和教育创新的主要障碍。与此同时,许多医生在医学Twitter等公共论坛上分享了匿名化的图像和大量知识。在这里,作者利用这些群体平台来策划OpenPath,这是一个包含208,414张病理图像与自然语言描述配对的大型数据集。通过开发病理语言-图像预训练(PLIP)来展示这个数据资源的价值,这是一个具有图像和文本理解能力的多模式人工智能,它在OpenPath上进行了训练。
7月25日,一则发自Github员工的Twitter推文引起了不少开发者的关注和评论,以下是推文原文:
领取专属 10元无门槛券
手把手带您无忧上云