首页
学习
活动
专区
圈层
工具
发布

拿 NLP 来分析我自己的 Facebook 数据,会发生什么?

翻译 | 老赵 莫青悠 校对 | 付腾 整理 | MY 当一个 NLP(自然语言处理)在观察我的写作风格(也是如何处理我自己的 Facebook 数据!) ?...找到你的数据 在考虑过我所有的数据之后,我决定聚焦于以下几个数据源: 我写的学校作业 我的日记 我创作的歌曲集 我的 Facebook 数据(包括我的评论,帖子和聊天内容) 在我整个工程中我使用了以上所有的数据源...但是对于 Facebook 的数据,我需要做一些额外的预处理。 如何得到你的 Facebook 数据 我们要如何能够获取到 Facebook 的数据呢?事实上要你想象的简单很多。...预处理你的 Facebook 数据 我打算下载所有的 Facebook 数据,但是我并不希望在这个课题中使用所有的 Facebook 数据。对这个课题而言,我只关心我的帖子,评论和聊天历史。...如果某些情况下,JSON 的关键字不工作,我会忽略它。 对我写的帖子我做了非常类似的事情: ? 我的评论: ? 从那里开始,我已准备好使用我的 Facebook 数据。

1.1K20

Facebook数据被滥用?8个视频案例教你用好Facebook Graph API

直到现在,Facebook CEO小扎也没有发出任何官方回应,以及未来该如何更好的保护私人数据。...这些视频将向你展示如何做基本的分析,例如: 从Facebook下载数据 从json转换为更方便的数据结构 处理Graph API中的日期变量和其他数据 第1课:介绍和了解Graph API 在本视频中,...第4课:评论最多的帖子 在第四课中,我将向您展示一种简单的方式,以获得评论最多的帖子。...您也可以在评论中使用相同的功能。...https://v.qq.com/x/page/f06099j7ats.html 第8课:按日期分组 在本视频中,我们将探索“创建时间”变量,以按照年份,月份或星期几对帖子进行分组。

1.9K20
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    【业界】Facebook的基础AI算法是如何驱动社交网络的发展?

    【导读】Facebook的基础AI算法是如何驱动社交网络的发展。我们来一览这篇文章。 Instagram工程师曾在2016年接到一个艰巨的任务。...Joaquin Candela,Facebook的机器学习应用主管 坎德拉先生最近解释了他的团队是如何与公司几乎所有其他工程团队合作来创建新的工具,以及人工智能如何成为Facebook大部分基础功能的核心...因为Facebook的AI实际上“知道”La SagradaFamilia是什么以及它所在的地方,任何子评论中推荐它的人都会看到它在该贴子上面弹出。...创建该帖子的人激活了“建议”功能;其他人通过对零售商地址的评论发表评论。 坎德拉先生说,团队为Facebook的主算法添加了新功能,以“增加社会互动价值”。行政总裁马克?...然而,它的措辞是衡量人们与Facebook的应用和网络互动的方式,不管是增加他们喜欢或评论的帖子的数量,或者他们找到机器翻译的帖子有多有用,或者他们多久使用M,坎德拉先生说,Facebook的基于Messenger

    1.3K60

    Nature评论|AlphaFold如何在结构生物学中实现AI的全部潜力

    2022年8月2日,Nature发表了一篇简短的评论文章,从AlphaFold的技术成就出发,讨论了如何实现AI的全部潜力。...上周,DeepMind宣布其研究人员已经使用AlphaFold预测了来自100多万个物种的2.14亿个蛋白质的结构,基本上囊括所有已知的蛋白质。...AlphaFold显然是近几十年来生命科学领域最令人兴奋的发展之一。截至上周,来自190个国家的50多万名研究人员已经访问了DeepMind自去年7月以来发布的200多万个蛋白质结构。...除了创建工具本身,DeepMind还做出了在结构生物学转型中发挥重要作用的决策。这包括它在去年7月决定将AlphaFold的基础代码开源,这样任何人都可以使用这个工具。...例如,它不是用来预测一个蛋白质的形状如何被致病突变所改变的。它最初也不是为了预测蛋白质在与其他蛋白质相互作用时如何改变形状--尽管研究人员在这个下一代的挑战上正在取得进展。

    78710

    参与的论文即将中顶会,但我发现了数学错误,到底该不该说?

    论文中的证明部分利用了新、旧文献中某个概念两种定义之间的细微差别。此外,最终版的论文还用到了浮夸的数学符号,使得错误难以被发现。在我看来,这种数学写作风格和矛盾定义的使用似乎是故意为之。...因为从理论上来说,每个人都要为论文的正确性负责。」 既然不能袖手旁观,那现在的问题就变成了:「如何指出问题?在此之前要注意什么?」 对于普通研究者来说,写出一篇能被顶会接收的论文着实不易。...在帖子中,作者指出了一个问题:论文中采用了一些浮夸的数学符号以及令人迷惑的写作风格,因此错误不易被发现。其实,这一问题在 ML 社区非常常见,有人甚至给它起了个名字,叫「数学墙 」。...如今,ML 社区的「数学墙」问题似乎变得越来越严重,如果任由其「劣币驱逐良币」,原本不愿同流合污的研究者也要被拖下水了。 在这个帖子的下面,还有不少网友给出了自己的看法和建议。...如果你有更好的做法,欢迎在评论区与我们分享。

    55610

    特朗普「很大」的自建社交平台上线

    然而,当这个新「平台」出世,有人感叹:这设计就像一个通用版本的Twitter,但是以博文的形式列出了川普此前发表的评论。...但Facebook尚未置评。 该平台在昨天正式启动,但有一些帖子可以追溯到3月24日。...一个可以自由和安全发言的地方。直接来自唐纳德-J-特朗普的办公桌」。 据福克斯新闻报道,川普「最终」将能够与他的支持者直接交流,尽管目前还不清楚这将如何发生。川普的新闻办公室没有立即回应评论请求。...因暴动而「失声」的推文风格:大写字母,感叹号与拼写错误 Twitter和Facebook等社交媒体平台一直是特朗普最有价值的政治资产之一。 他的推文的风格包括大写字母,感叹号和拼写错误。...2019年10月17日,Facebook扎克伯格在乔治城大学发表演讲就提到了「第五权」:人们有了大规模表达(意见)的权力,是今天世界上的一股新力量,也即与社会其他权力结构并列的「第五权」。

    1K30

    这个评论系统设计碉堡了

    先赞后看,南哥助你Java进阶一大半 geeksforgeeks.org官网给出了Facebook评论系统的高级设计图,Facebook的评论竟然是支持实时刷新的。...也就是说用户不用刷新帖子,只要帖子有新的评论就会自动推送到用户端,这里Facebook使用的便是每天在全球有超过20亿设备在使用的WebSocket技术。 我是南哥,一个Java学习与进阶的领路人。...评论系统设计 1.1 评论表如何设计 评论系统的表要这么设计,每条评论的id标识要么是根评论id、要么是回复评论id。...其实抖音这种评论模式叫嵌套式评论结构,嵌套式评论注重用户对话交流,用户可以很方便地查看一个对话里的所有回复,我们看下抖音评论里有着展开10条回复的按钮。...其他评论模式设计还有平铺式评论结构,像微信朋友圈,或者Github的issue都是平铺式评论结构。这种设计更适合用户关注重点在发布的内容本身,而不是对话。

    60998

    “夸夸机器人”App来了:变身百万粉丝大V,48万人给你的帖子点赞

    一款全新的社交媒体风格的应用为用户提供了生活在一个奇特网络虚拟世界的机会。在这个世界里,你将拥有数以百万计的粉丝,他们热烈追随你,并且为你每一次发帖而痴狂。...也许这个世界会觉得不那么孤独(尽管这是模拟的)。” 这款应用既有趣又令人不安。当Botnet评论员告诉我,电影明星基努·里维斯将赢得新罕布什尔州的初选时,我在办公桌前大声笑了起来。...早在2017年,Binky就为无聊的用户提供了浏览无数虚假社交帖子的机会。...阅读该应用说明,我们可以知道:“与其他类似Facebook,Twitter或Instagram之类的应用程序不同,Binky不会让你感到压力,也不会让你讨厌朋友,它只是会把你的注意力集中在它该属于的地方...Botnet将这一想法发扬光大,并且实际上为你的无聊帖子提供了反馈。重要的是,Chasen告诉Mashable,并不是像Facebook这样的真实社交媒体公司为了获得奇怪数据。

    1.1K20

    让机器理解语言的魔法师——揭秘Facebook语言技术小组

    上个月,在 Facebook CEO 马克·扎克伯格的玻璃墙围起的会议室里,他坐在一个朴实的灰色沙发上进行了首次网络直播问答,人工智能的话题不可避免地被提起。...如何将这个世界的机会开放给每个人?」...2013 年,该公司创建了 Facebook 人工智能研究中心(FAIR),该机构的人员数量现已超过了 60 位,而其领导者也是世界知名的深度学习专家,以及 55 岁的 Yann LeCun。...语言技术组的第三个分支是会话理解(conversational understanding),这是目前 FAIR 的头等大事。文本理解是精确调节(curating)相关帖子、评论和搜索结果的关键。...而且 Facebook 上大部分文本都仍然是「非结构化的(unstructured)」,这意味着其还未被机器解读或分类。

    60250

    每个数据科学家都应该知道的顶级GitHub库和Reddit线程(2018年6月版)

    人体姿势估计在今年的深度学习社区中引起了很多关注。当Facebook将姿势估计框架DensePose开放代码时,Facebook将事情提升到了一个新的水平。...使用YOLOv3进行扑克牌检测 该线程有很多关于如何创建该技术的有用信息(这是开发人员的逐步解释),花了多长时间,它可以做什么样的其他事情等等。你会学到很多关于这个线程中的计算机视觉。...如果这个话题没有引起你的注意,那么前几条评论肯定会。这个讨论就像是数据科学家和机器学习从业者希望从社区中看到的愿望清单。由于每个想法产生的讨论,这个帖子成了我的清单。...一旦一个人将他们的想法添加到帖子中,多个人回答他们关于如何实现它的想法以及是否已经存在类似的研究。 对于爱好者和从业者来说,这是一个必读的讨论。...有些评论更具怀疑性,但值得一读,以了解专家和爱好者对强化学习的看法。

    60160

    DeepText:Facebook的文本解析引擎

    但是要更加接近人类理解文本的能力,需要教会电脑理解俚语以及如何消除歧义。比如如果某个人说,“I like blackberry”,那么他指的是水果还是手机?...DeepText能够检测到这个帖子是在卖东西,然后提取一些有用的信息,包括正在卖东西以及东西的价钱。然后,会提示卖家使用Facebook已有的工具更好地达成交易。...这些交流通常会带来成百上千的评论。从这些各种语言的评论中找到高质量且相关度较高的评论是一个很大的挑战。除此之外,DeepText面临的另一个挑战是如何找到相关度或质量最高的评论。...采用手工方式很难生成这些数据集,于是我们开始尝试使用公共Facebook页面采用半监督的方式生成这样的数据集。很容易想象,这些页面上都是和特定主题相关的帖子。...Facebook上非结构化数据提供了一个独一无二的机会,用多种不同语言对文本解析系统进行自动训练,使得自然语言处理技术的发展能更进一步。

    1.7K20

    五、eclipse如何创建一个ftl(FreeMarker)的文件和设置ftl文件的显示风格(ftl文件高亮显示)

    1、首先需要在eclipse中去下载一个FreeMarker插件https://blog.csdn.net/IT_CREATE/article/details/86682538 2、创建ftl的文件(有多种方式...,我会分别介绍) 2.1 利用file来创建,我们new个 file文件 写上页面的名字,后缀名改为ftl 这样就创建好了,不过里面没有任何内容,我们需要自己添加一些基本信息 添加一些html的基本样式...html文件 然后选中你创建的HTML文件,按下F2,对文件进行重命名,修改后缀名为ftl,然后一直点击ok 这样就建好了ftl文件,这样就自带了html的那些基本信息。...2、设置 ftl文件的显示风格 因为ftl默认的显示风格是全黑的,所以我们需要一些高亮显示 1)选中你的ftl文件,点击右键,选择Open With–>Other 2)然后弹出来一个选择框,我们勾选Use...it for all ‘.ftl’ files,然后在框中选择HTML Editor ,点击 ok ,这样所有的 ftl文件都用的是html风格的编辑方式,你也可以选择其他的编辑方式,比如jsp风格的

    4.2K10

    全球主流社交媒体算法解析:Facebook、YouTube、Twitter如何利用算法推荐内容?

    在扎克伯格的帖子中,他概述了以算法为中心的Facebook的新发展方向。 “我们营造的Facebook的方法正在发生重大改变。...Facebook提供的有意义的互动包括: 个人评论、对他人的状态更新或照片的点赞 个人对朋友分享的内容所做出的回复 视频或文章评论中的多人互动 通过Messenger共享链接与一群朋友开启对话 此举引发了一些依赖...7 / 如何适应Facebook算法?...);3.关系(如果你为某些帖子点很多赞,并发表很多评论,算法会把你认定为这些账号的朋友和家人) 定期发布将有助于你在用户的时间轴中得到更高的权重,并且算法不会降低发布次数过多的人的权重 算法并不偏好使用...Stories,直播或其他特殊功能的用户 通过DM分享的帖子会被算法排名 评论的权重比仅点赞的权重更高 使用不多于30个话题标签来优化内容,这样更容易被用户发现。

    3.8K20

    代码审查的残酷真相:为什么高级开发者从不纠结命名和格式?

    虚拟滚动解决的是"如何高效渲染大量DOM"的问题。但真正的问题是"为什么要在前端渲染这么多数据"。这就像你家着火了,你选择买个更好的灭火器,而不是找出起火原因。...这里有个建筑学的概念很有启发——承重墙和非承重墙。承重墙支撑整个结构,拆了房子就塌;非承重墙只是分隔空间,改了无伤大雅。 代码也一样。...(userId) { await db.users.delete(userId); // 等等,用户的帖子、评论、关系怎么办?...第二条评论不只说了做什么,还解释了: 问题是什么: 每次渲染都重复计算 为什么重要: 处理大量数据,影响性能 怎么解决: 用useMemo缓存结果 效果如何: 实际性能提升数据 当你解释"为什么"时,你不是在给指令...我们需要重构成支持多用户的结构,现在改比上线后改容易得多。" 第二种方式提供了上下文,让开发者理解更大的图景。这样的反馈引导理解,而不只是强制服从。

    22120

    人类的悲欢虽不相通,但情感分析模型读得懂

    使用社交媒体语言跟踪心理状态的波动: 基于每周情绪波动的案例研究 取样校准 作者使用「效价」和「唤起」这两个基本情绪维度,来评价 Facebook 上帖子的情绪。...他们首先让已经有心理学研究基础的人类研究助理,给一项早期研究中的 2895 条公开 Facebook 帖子做注释。...实验结果 作者对用户的情绪评价进行了可视化,如下图,描述了一个女性(左)和一个男性(右)的每周情绪和唤醒波动,以及五大人格特征预测。 注:五大人格特征是现代心理学中,用于人格特质描述的结构模型。...其次,不同社交平台,具有不同的属性与风格,使用 Facebook 帖子所获得的成果,能否在不同社交媒体 比如 Twitter 上进行复制,还是个未知数。...荷兰阿姆斯特丹自由大学(Vrije Universiteit Amsterdam)人工智能学者黄智生,于 2018 年创建了一个叫做「树洞救援队」的 AI 程序,在微博上搜寻有自杀倾向的帖子,然后通过「

    97510

    如何通过AI自动辨别虚假新闻?计算机科学家Filippo Menczer教你识别互联网虚假信息

    “人们正在创建带有垃圾信息的社交网站,并从其广告中获利。”但是毫无根据的假新闻是不存在的,他仍记得他对自己说,“这肯定不是一个孤立的事件。”当然,事实证明了这一点。...社交垃圾邮件已经演变成“政治谣言”:捏造赚钱的帖子,诱使数百万Facebook,Twitter和YouTube用户分享这些带有挑衅的谎言 - 其中不乏头条新闻声称民主党候选人希拉里•克林顿曾经向伊斯兰国家出售过武器...然后在2017年5月,Facebook宣布将提供消息帖子的低质量信息排名。那么新闻传送算法应该如何识别什么是“低质量”呢?...Menczer说,原则上,这些平台可以(也可能是)使用印第安纳小组在Truthy系统中使用的相同类型的机器学习技术来筛选帖子的内容。...然而,这种媒体素养不是那么容易培养,这是一种了解媒体如何运作以及如何警惕所有的标准误传的技巧。Menczer认为,平台可以通过在系统中产生一些阻碍来使得分享变得更加困难。

    2.4K120

    我们分析了1亿条阅读量超高的标题,这就是为什么你会被标题党吸引

    最吸引人的标题关键词 对2017年3月1日至2017年5月10日期间发布的1亿条文章标题的分析结果显示,获得Facebook最多参与(喜欢、分享、评论)的三连词或三字词组如下所示: 为什么这些数据会让你再次思考...这种类型的内容往往借助读者的好奇心和窥视欲来吸引其注意力。去年里这种帖子中最常见的标题就是“吓坏了”。 我们想提醒作者尽量避免“接下来会发生什么”这种风格的标题。...常用于标题开头和结尾的词 最流行的短语“Will make you(会让你)”是一个很明显位于标题中心的短语,因为它连接了两个不同的元素。也就是说它通过将某事物与情绪反应联系起来形成语句结构。...我们绘制了帖子标题的字数和在Facebook中的平均参与度的关系。结果见下图。 我们可以看到,标题字数在12到18个词的帖子获得了最高的Facebook参与度平均值。...具体明确(例如“这就是什么”,“这就是如何使”,“原因是”) 你能在标题里包括一个情感因素吗?

    1.2K30

    万字长文带你解读『虚假新闻检测』最新进展

    以往的方法大多只使用到了自顶向下的谣言传播结构。有基于CNN的方法考虑到了散布结构,但是由于其不能处理图结构的数据,因此不能捕获全局的结构信息。 (3)模型还使用到了「根源帖子特征的增强」。...思考 本文模型是针对谣言传播网络建模的,构建的图中只有帖子的信息和帖子间的关联信息,是个同质图。...「面临的问题是」:用户的反馈信息有噪声,如何将这种弱标注信息转换为训练集中的标注样本,如何选择高质量的样本。...「本文解决的挑战」: (1)如何实现可解释的假新闻检测,并同时提高检测性能和可解释性; (2)在训练时没有ground truth的条件下,如何抽取出有解释性的评论; (3)如何联合建模新闻内容和用户评论间的关系...(2)研究如何将其他用户的社交行为作为副信息引入,以帮助发现可解释的评论。 (3)考虑发布新闻的人的可信度,以进一步提高假新闻检测模型的性能。

    2.7K20
    领券