首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

用数据分析唤醒你“原力”:星球大战系列电影影响

大数据文摘将通过数据可视化方法对比从星球大战电影中得到收入与演员自己全部票房收入,分析了该影片中23位演员事业状况。 ? 数据分析师最擅长事,就是要呈现用数据能做些什么。...这其中一个例子就是Analytics@American创造数据可视化,他们将出演过星球大战系列电影23位演员从星球大战电影中得到收入与他们一生票房收入进行了对比。...每个题材类型表现、相关电影票房、主演人员受欢迎程度……诸如此类历史数据,可以让分析师们用来预测一部电影是否会走红。 2012收购了卢卡斯影业(LucasFilm)迪士尼公司在本月非常之期待。...白色粗体字是演员名字,紧挨着演员在星战电影角色名字。蓝色数字表示演员参与星战电影拍摄次数,而橙色数字则代表其到目前为止出演电影数量。...Jackson相比,他单部电影票房收入高得多,大约是3.3亿美元对比1.3亿美元。 而出演过最多次星战电影Anthony Daniels基本上就是一个星战专业户,一共参加了8次星战电影拍摄!

59490

那些年,吴孟达出演过作品与合作过演员

今天,我们通过Python爬取豆瓣里达叔238部作品,看看那些年, 达叔出演过作品与合作过演员们。...达叔作品评分分布 达叔出演过电视剧评分基本都在6分左右及以上,达叔出演过电影则大部分集中在6-8分。 ? 达叔作品评分分布 达叔作品中评分前五: ? 评分前5作品 1.6....那些年达叔合作过他们 和达叔合作过导演有166位(同一部电影或电视剧都存在多个导演),演员则高达1,157位(豆瓣作品详情页记录演员)。 2.1....与星爷合作30不戏除了01年《少年足球》之前,其余全部为上个世纪作品,不过星爷作为演员在01年之后也只出演过三部电影而已; ?...豆瓣作品详情爬虫代码 这里不介绍详情爬虫过程了,直接贴源码: 思路:从个人页作品列表中找到每个作品详情页采集详情数据。

69830
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Python 实战(7):连连看

    除此之外,数据库里还有其他很多信息我们没有用上,比如演员和导演。这些信息还有个重要作用,就是把不同影片关联起来。比如你看了一部电影,对其主演感兴趣,自然就想知道他还演过什么影片。...因此,如果只是想显示这些信息,可以简单地实现: 主演:$movie.casts 不过现在我们不仅仅要显示主演名字,还希望能通过主演关联到其他影片。...超链接地址暂时为空,我们还没有能够处理点击演员合适页面。 此时刷新页面,可以看到详细页面上已有了演员信息,并且每个名字下面有一个下划线。只是点击之后并不会有特别的反应。...那么接下来问题,点击了演员名称之后要如何处理。我想法是进行一次搜索,搜索所有影片演员信息中包含此演员电影。因为我们演员信息是一个字符串存储,所以可以采用之前搜影片名称类似的方法进行。...这样就已完成演员搜索。现在再点击演员名,就可以跳转到搜索结果页面。 然而,这时候你很可能发现,点击搜索结果,并不能再跳转到其他电影页面(至少我这里是这样)。

    1.2K80

    MySQL:如何查询每个 Group Top n 条记录?

    需求: 查询每月 order_amount(订单金额) 排行前3记录。 例如对于2019-02,查询结果中就应该是这3条: ?...这句含义: 取得order_date中月份值,赋值给current_month,这样就可以跟踪每个月份。 ?...MySQL 8 MySQL 8 引入了一个 rank() 函数,可以更简便实现排行功能。 ? 执行结果: ? 效果和 5.7 中方法是一致。 我们看下语句中 rank() 方法: ?...PARTITION BY 是指定分区依据,这里是根据订单年、月进行分区。 ORDER BY 指定了分区内排序依据,这里是根据订单 年、月、金额 进行降序排列。 这样就会自动计算出排行数值。...需要注意是,这个地方和 5.7 方法不一样: ? 就是参与排序几个值一样时候,rank 值是一样。 最终SQL语句: ?

    3.8K20

    关于neo4j图数据库笔记六-电影库和最短路径问题

    创建电影相关演员、导演、制片商、作家和相关关系,这些数据来自于neo4jmovie数据 ACTED_IN(角色扮演)关系,共172条,源数据为演员,目标数据为电影,属性包括 roles,属性值为数组...nineties.released<2000 RETURN nineties.title,nineties.released ORDER BY nineties.released 6、查找"Tom Hanks"参演过电影名称...Atlas"}) RETURN people.name,Type(relatedTo),relatedTo,movie.title 10、查找与演员"Kevin Bacon"存在4条及以内关系任何演员电影...:Person{name:"Meg Ryan"})) RETURN p 12、查找没有与Tom Hanks合作过演员 1、先找到Tom Hanks还没有合作过演员,但Tom Hanks合作伙伴曾经与其合作过...ACTED_IN]->(m2)<-[:ACTED_IN]-(cruise:Person{name:"Tom Cruise"}) RETURN tom,m,others,m2,cruise 14、匹配某个电影相关演员和导演等多种关系

    76320

    豆瓣电影数据分析

    进一步做出每个年份下不同评级等级电影数据占比,可以发现,近年来,评分在[2.0,6.0)电影数据占比有着明显提升,评分在[6.0,7.0)数据占比不变,评分在[7.0,10.0)数据占比减少,可能原因有...2.电影数据地区分析 2.1 全球电影数量分布 图 6 各个地区电影数量分布 表格 2 电影数量前十国家 根据各个国家电影数量作图,可以得到图6,列出电影数量前十国家可得表格2,发现美国在电影数量上占第一...只主演过1-2部作品。...图 21 不同类型电影数量、评价得分与票房表现 5.4 导演、演员票房表现 提取导演/演员姓名,对导演/演员字段进行聚合,计算每个导演/演员票房总和,上映电影均分、以及执导/参与电影数目进行计算...针对导演演员统计,揭示少部分导演与演员拍摄了大部分作品,符合二八定律,此外还根据作品评分、数量以及评价人数列举了部分较为优秀导演/演员

    3.3K30

    NEO4J 图数据库哪里和哪里 从哪里开始

    上期已经安装了图数据库,本期就该讨论到底这个图数据库里面的一些基本概念和如何操作。...理解NEO4J 中关键几个属性: 1 节点:下图中每个方块可以看做一个节点 2 属性:每个节点有多个属性,以 KEY VALUE 形式来进行描述 3 关系: 节点和节点之间关系,也是通过key...(翻译成人类能看懂文字) 1 keanu 作为一个演员在TheMatrix电影里面扮演了 Neo这个角色,同时 Carrie在TheMatrix 这个电影里面扮演了Trinity 这个角色,Laurence...from Movie WHERE title = 'Cloud Atlas' 下面这张图意思是 查找tom hanks 到底演过几部电影 当然写到这里我也是纳闷了两天 tom 和 tomHanksMovies...我根本就没有在任何地方输入过这些信息到NEO4J中,到底他们是怎么展示这些信息,在经过琢磨后,照猫画虎写出了下面查询Keanu 到底演过什么电影查询语句。

    3K20

    sqlite3使用总结

    by year limit 10; 或是年份比较近电影列出来: select * from film order by year desc limit 10; 或是我们只想看电影名称跟年份:...select title, year from film order by year desc limit 10; 查所有茱蒂佛斯特演过电影: select * from film where starring...='Jodie Foster'; 查所有演员名字开头叫茱蒂电影('%' 符号便是 SQL 万用字符): select * from film where starring like 'Jodie%...'; 查所有演员名字以茱蒂开头、年份晚于1985年、年份晚优先列出、最多十笔,只列出电影名称和年份: select title, year from film where starring like...如何更改或删除资料 了解select用法非常重要,因为要在sqlite更改或删除一笔资料,也是靠同样语法。

    1.7K20

    Time To Die |《银翼杀手》生化人Roy扮演者果然在2019年去世,Tears in Rain却永不谢幕

    新智元报道 编辑:小芹、金磊、张佳 【新智元导读】曾在电影《银翼杀手》等很多著名影视剧中饰演过重要角色荷兰演员鲁特格尔・哈尔因病去世,享年 75 岁。...据Variety等多家外媒报道,荷兰演员电影《银翼杀手》中饰演反派生化人Roy演员鲁特格尔·哈尔(Rutger Hauer)于上周五去世,享年75岁。 ?...同年,Hauer荣获“金犊奖”(Golden Calf)最佳男演员奖。 为了能说一口正宗美语,Hauer聘请了一位语言专家教。...后来,他成为当时除一些英国演员外唯一一个能熟练讲美国英语而不带一点口音欧洲演员。 1982年,他出现在《银翼杀手》中。 1985年,Hauer出现在华纳兄弟中世纪魔幻电影《鹰狼传奇》中。...Hauer在本片中塑造角色也被认为是他演员生涯中塑造得最复杂、诠释得最出色角色。 ? 《圣饮者传奇》剧照,Hauer左 八十年代末,Hauer被《好莱坞报道》评为“50位最有价值演员”之一。

    1.3K30

    十万条评论告诉你,给《流浪地球》评1星都是什么心态?

    然而在票房大卖同时,其豆瓣电影评分却从8.5一路滑落到7.9,出现大量1星差评。到底这部号称中国首部硬核科幻电影总体口碑如何?是否值得一看呢?...我们爬取了猫眼电影从上映日起到2月11日18时102580条评论和评分数据,通过硬核分析告诉你答案! 一、电影总体评价如何?...说明这部电影总体来说是很受大家欢迎,也说明相对于豆瓣电影评分者来说,猫眼电影观众观后感更好一些,不存在恶意刷大量低分情况。 二、总体评价时间走向如何? 那评分是否会随时间出现规律性变化呢?...女主演讲是本片最大败笔,年轻演员撑不起这样巨作。 五、低分的人群有哪些特征? 给电影打低分的人群都有哪些特征呢?是不是对于科幻片来说,女生比较容易打低分呢?...七、总结 总体来说,猫眼观众对于这部电影认可度还是很高,认为导演良心、剧情紧凑、表演过关、特效震撼,中国首部硬核科幻电影当之无愧!

    52530

    计算与推断思维 六、可视化

    其中列是: 列 内容 Actor 演员名称 Total Gross 演员所有电影国内票房总收入(百万美元) Number of Movies 演员所演电影数量 Average per Movie...总收入除以电影数量 1 Movie 演员所演票房最高电影 Gross 演员 #1 电影国内票房总收入(百万美元) 在总票房计算中,数据制表人没有包括一些电影,其中演员是客串角色或陈述角色,...一些演员有很多电影,但总收入中等。 其他人电影数量中等,但收入很高。正相关只是一个大体趋势叙述。 在课程后面,我们将学习如何量化关联。目前,我们只是定性地思考。...一般来说,演员电影数量越多,每部电影平均收入就越少。 另外,有一个点是非常高,在绘图左边。 它对应于一个电影数量很少,每部电影平均值很高演员。 这个点是异常。 它位于数据一般范围之外。...Python 绘制了两个散点图:这个变量和另外两个之间关系,每个关系一个。 金色和蓝色散点图向上倾斜,并显示儿子高度和父母高度之间正相关。

    2.8K20

    SQLite3 简要使用指南

    year limit 10; 或是年份比较近电影列出来: select * from film order by year desc limit 10; 或是我们只想看电影名称跟年份: select...title, year from film order by year desc limit 10; 查所有茱蒂佛斯特演过电影: select * from film where starring=...'Jodie Foster'; 查所有演员名字开头叫茱蒂电影(‘%’ 符号便是 SQL 万用字符): select * from film where starring like 'Jodie%';...查所有演员名字以茱蒂开头、年份晚于1985年、年份晚优先列出、最多十笔,只列出电影名称和年份: select title, year from film where starring like 'Jodie...如何更改或删除资料 了解select用法非常重要,因为要在sqlite更改或删除一笔资料,也是靠同样语法。

    1K20

    电影知识图谱问答(四)| 问句理解及答案推理

    上篇文章《电影知识图谱问答(三)|Apache Jena知识存储及SPARQL知识检索》中讲到如何将处理后RDF数据存储至Apache Jena数据库之中、如何利用SPARQL语句从Apache Jena...本篇文章将主要介绍如何理解问句所表达深层语义含义、如何将自然语言问句转换成SPARQL查询语句、如何进行答案推理。...# 某电影图片/上映地区/语言/上映时间/时长/其他名称/介绍/评分/ 评价人数 # 某电影类型 # 某电影有哪些演员 # 某电影有哪些编剧 # 某电影有哪些导演 # 某电影详细信息 # 某人图片...# 某人出演了多少部电影 # 某演员参演评分大于X电影有哪些 # 某演员演过哪些类型电影 # 演员A和演员B合作出演了哪些电影 # ......下篇文章,将介绍如何电影知识图谱问答系统部署至微信公众平台,并利用微信公众号进行知识问答,构建一个完整知识图谱问答系统Demo。

    3.4K22

    东哥带你刷图论第四期:二分图判定

    从简单实用角度来看,二分图结构在某些场景可以更高效地存储数据。 比如前文 介绍《算法 4》 文章中例子,如何存储电影演员电影之间关系?...如果用哈希表存储,需要两个哈希表分别存储「每个演员电影列表」映射和「每部电影演员列表」映射。...但如果用「图」结构存储,将电影和参演演员连接,很自然地就成为了一幅二分图: 每个电影节点相邻节点就是参演该电影所有演员每个演员相邻节点就是该演员演过所有电影,非常方便直观。...类比这个例子,其实生活中不少实体关系都能自然地形成二分图结构,所以在某些场景下图结构也可以作为存储键值对数据结构(符号表)。 好了,接下来进入正题,说说如何判定一幅图是否是二分图。...既然说到遍历图,也不涉及最短路径之类,当然是 DFS 算法和 BFS 皆可了,DFS 算法相对更常用些,所以我们先来看看如何用 DFS 算法判定双色图。

    58310

    白话Elasticsearch53-深入聚合数据分析之Collect Model_bucket优化机制:深度优先、广度优先

    ---- 示例 当buckets数量特别多时候,深度优先和广度优先如何选择?...举个例子:每个演员每个电影评论 每个演员评论数量 --> 每个演员每个电影评论数量 评论数量排名前10个演员 --> 每个演员电影取到评论数量排名前5电影 { "aggs" :...,构建了一整颗完整树出来了,10万个actor,每个actor平均有10部电影,10万 + 100万 --> 110万数据量一颗树 裁剪掉10万个actor中99990 actor,99990...* 10 = film,剩下10个actor,每个actor10个film裁剪掉5个,110万 --> 10 * 5 = 50个 构建了大量数据,然后裁剪掉了99.99%数据,浪费了 ---- 广度优先方式去执行聚合...个film即可,10万 ->取 50个 和深度优先方式(110万取50个)相比,10倍优势

    31720

    不用绿幕也能做特效,谷歌「LED蛋」让你告别五毛特效,光线、影子都能调

    比如某些古装剧某些场景会让人非常戏,除了演员演技太差之外,很有可能是因为光效不太自然,盯着电视机屏幕时,你甚至能想象出来演员头顶摄影棚。 ? 在影视制作过程中,想要复制完美的光效仍然是个难题。...通过与 AR 等技术融合,该系统可以无缝地将捕捉到的人体融合到现实世界中或电影、游戏等中数字场景。它可能会彻底变革 3D 捕获技术领域。 ? 用来拍摄「LED 蛋」。 ?...然后,他们展示了如何设计一个混合几何和机器学习重建流程来处理高分辨率输入并输出一个体积视频。...最后,由两个梯度照明条件推断反射率图。 捕捉 该系统核心依赖于一个包含多视角(主动)立体深度传感器灯光球面舞台,舞台周围有 331 个可编程灯以及 90 个高分辨率 12.4MP 重建相机。...后者用于在实际表演过程中分割表演者。 重建 接下来,研究者将数据上传到公共存储库中,第一个阶段是生成每个「机位」深度图、分割图和 3D 网格 [Kazhdan 和 Hoppe 2013]。

    82440

    我这有个数据集,向取出每天每个国家确诊数量前30数据,使用Pandas如何实现?

    一、前言 前几天在Python最强王者交流群【此类生物】问了一个Pandas处理问题,提问截图如下: 部分数据截图如下所示: 二、实现过程 这里【隔壁山楂】和【瑜亮老师】纷纷提出,先不聚合location...location', 'total_cases']].apply(lambda x: x.values.tolist()).to_dict() 可以得到如下预期结果: 先取值,最后转成字典嵌套列表,...这篇文章主要盘点了一个Pandas处理问题,文中针对该问题,给出了具体解析和代码实现,帮助粉丝顺利解决了问题。...最后感谢粉丝【此类生物】提问,感谢【隔壁山楂】、【猫药师Kelly】、【瑜亮老师】给出思路和代码解析,感谢【Python进阶者】、【Python狗】等人参与学习交流。

    1.1K10

    数据告诉你,其实中国电影票房最强锦鲤,不是吴京

    当然,并非每个人都一定是某个明星拥趸,但当你看见一位口碑不错演员出演了某部影片时,不难会产生“某某某演电影应该挺值得一看”想法,反之,你会避开。...这是因为观众对知名演员市场定位和选片原则都有一个大概判断,这些判断直接影响了电影市场表现,也就是票房。 那么,成百上千位中国演员里,谁主演电影通常伴随着优质市场表现?...事实上,她目前主演电影数量仅有5部,通过《美人鱼》、《西游伏妖篇》两部“星爷”电影加持拉高了均数,是否具有真正票房号召力还有待市场观察。...(点击查看大图) 其它演员多数也入围了累计票房榜,显示其较高市场价值。 其中,徐峥与邓超主演次数最多,但片均票房依然逼近5亿。...而在2005至2009、2010至2014年两个时间段内,这个数量回落至5部和3部。近5年,已低于3部。

    40830

    移动电影售票系统案例分析

    用例图 运用StarUML/EA(Enterprise Architect ),完成不少于5个用例用例图,并为每个用例添加用例描述. 第一步:给系统取个名称:移动电影售票系统。...议题与其他 UC002:查询电影票 用例名: 查询电影票 用例编号 UC002 参与者 潜在会员,会员 用例描述 参与者根据电影名称、导演、以及演员,检索所需电影详细信息和...前置条件 参与者访问系统 后置条件 参与者查询到所需电影 基本流程 1. 参与者请求查询电影 2. 参与者提交电影名称、导演、以及演员等查询条件 3....会员查询电影 2. 会员选择预定电影,输入预定数量 3. 系统显示会员订单列表 4. 会员输入预定数量,选择以下动作: 添加到新订单 添加到已有订单 5....顺序图 为每个用例画出系统鲁棒图(BCE模式)顺序图。

    2.1K50
    领券