首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

中国大学MOOC探索数据的奥秘答案

以下试题由众课帮-公众号和小程序提供

1、人类探索世界的第四科学范式是指

A、实验

B、理论

C、计算

D、数据科学

答案:数据科学

--------------------------------

2、以下关于大数据的特点描述,错误的是

A、大数据是指体量非常大的结构化数据

B、大数据具有种类繁多、速度快时效高的特点

C、大数据的价值密度相对较低

D、数据量大到常常需要并行计算处理

答案:大数据是指体量非常大的结构化数据

--------------------------------

3、以下关于数据科学的说法,你认为正确的是

A、数据科学其实就是统计学

B、数据科学就是机器学习

C、数据科学就是传统意义的“科学”,不必过多考虑工程应用

D、数据科学涉及多学科与工程应用的融合与交叉

答案:数据科学涉及多学科与工程应用的融合与交叉

--------------------------------

4、一个完整的数据科学项目,应起始于

问题的确定

数据搜集

建立高大上的模型

目标制定

答案:问题的确定

--------------------------------

5、关于模型的评价,以下说法中不正确的是:

模型采用什么样的评价指标和具体的模型类型密切相关

对于一个有效的数据科学模型,其评价指标需优于以往实现同类任务的模型所实现的指标

在不了解以往工作的情况下,分类模型优于50%的准确率指标(也就是随机分类准确率)即可

分类模型的性能评价常规采用混淆矩阵

答案:在不了解以往工作的情况下,分类模型优于50%的准确率指标(也就是随机分类准确率)即可

--------------------------------

6、又到了大学新生入学的时间。你作为学生会中的老干部,很荣幸领到了一项为新生匹配舍友的任务,每四个新生同住一间宿舍。有无穷活力的你,决定利用你所了解的数据科学来实现自动匹配,让个性、爱好相似的人成为舍友。请问,从数据科学的观点,这是一个什么问题?

A、分类

B、聚类

C、关联化

D、特征提取

答案:聚类

--------------------------------

7、一位葡萄酒经销商找到你,想了解到底酸度、剩余糖分、氯化物、酒精浓度、酸碱度等性质中究竟哪种性质最影响大众对葡萄酒的喜好程度。请问,从数据科学的观点,这是一个什么问题?

分类

关联化

特征提取

预测

答案:关联化

--------------------------------

8、以下哪些技术支撑了现今的数据时代?

A、传感技术

B、互联网与通信技术

C、存储技术

D、航天技术

答案:传感技术;

互联网与通信技术;

存储技术

--------------------------------

9、以下哪些是数据?

A、你听讲座时的录音文件

B、十字路口的监控视频

C、传感器采集到的你的生命体征信息

D、你在朋友圈里发布的动态

答案:你听讲座时的录音文件;

十字路口的监控视频;

传感器采集到的你的生命体征信息;

你在朋友圈里发布的动态

--------------------------------

10、以下说确的是:

A、问题和目标,都涉及两个层面:用户层面和数据科学层面。

B、用户层面我们面临的一般是一个现实世界中的具体问题。

C、用户层面的问题与目标涉及到最后项目的验收,因此一旦明确,也就指出了我们努力的方向和路径。

D、数据科学层面的问题与目标确定,其中的关键是现实问题的抽象化。

答案:C源程序不可直接运行产生结果

--------------------------------

11、“张大妈服用我们的产品治好了多年的老寒腿”,为什么不能作为产品有效的科学依据?

A、样本容量太小

B、存在抽样偏差

C、未考虑混杂因素

D、单个个体不能代表总体

答案:样本容量太小;

存在抽样偏差;

未考虑混杂因素;

单个个体不能代表总体

--------------------------------

12、一个数据科学项目,可能涉及的人员包括项目出资方、客户(或用户)、数据科学家、数据架构师和运营工程师,不同的角色有不同任务,大家各有其专业领域,各司其职即可,不要相互影响。

正确

错误

答案:错误

--------------------------------

13、现在的模型功能非常强大,所以拿到数据以后,可以直接建模,让模型自动化分析。

正确

错误

答案:错误

--------------------------------

14、明确数据科学层面的任务(问题和目标)之后,我们需要首先提出前提假设。

正确

错误

答案:正确

--------------------------------

15、根据前提假设,只要能设计出对应的数据构成,我们就可以进入数据收集。

正确

错误

答案:错误

--------------------------------

16、不同的假设很可能会涉及不同的数据,最终导致不同的研究内容。

正确

错误

答案:正确

--------------------------------

17、确定数据的构成,一般是指建立一张不可再分的二维表。表中一行代表一个样本,一列代表样本的一个特征或属性。

正确

错误

答案:正确

--------------------------------

18、传统统计学认为样本容量大于30就具备统计学意义了,所以大数据时代的数据,哪怕不是全部数据,也可以有效代表总体。

正确

错误

答案:错误

--------------------------------

19、抽样偏差(Sampling bias)是指从总体中非随机性抽样带来的系统性错误。

正确

错误

答案:正确

--------------------------------

20、产生“辛普森悖论”的主要原因是没有排除混杂因素的影响。

正确

错误

答案:正确

--------------------------------

21、所谓混杂因素,是指那些不是我们的考察对象,但却可能对结果造成影响的因素。

正确

错误

答案:正确

--------------------------------

22、在一个数据科学项目中,最核心的人员是( )

答案:数据科学家

--------------------------------

23、明确问题与目标,都包含两个层面:现实层面和( )层面

答案:数据科学

--------------------------------

24、样本真实反映总体的两个前提条件是:1.样本容量足够大;2.()

答案:无偏

--------------------------------

25、样本真实反映总体的两个前提条件是:1.();2.无偏抽样

答案:(以下答案任选其一都对)样本容量足够大;样本足够多;样本够多

--------------------------------

1、Pandas.read_csv函数读取数据文件时,指定参数( )(也就是为其赋值)可以实现数据的流读取,即不将数据一次性加载,而是以连续流的方式加载。

A、chunksize

B、index

C、header

D、delimiter

答案:chunksize

--------------------------------

2、执行以下代码: my_list=['C#','Java','Python','R'] for i in [1, 2]: print ('xixi') for opt_language in my_list: print ('haha') print ('hello') 会在输出区打印( )次 hello

A、2

B、1

C、8

D、7

答案:8

--------------------------------

3、执行以下代码: my_list=['C#','Java','Python','R'] for i in [1, 2]: print ('xixi') for opt_language in my_list: print ('haha') print ('hello') 会在输出区打印( )次 xixi

A、1

B、2

C、4

D、3

答案:8

--------------------------------

4、在Jupyter Notebook中执行以下代码,在输出区会打印(): my_list=['haha',True, 56,7,8,9,10] print(my_list[1:3])

[True,56]

['haha',True]

[56,7]

[9,10]

答案:[True,56]

--------------------------------

5、我想创建一个其中元素可以被修改、同时支持不同数据类型的数据结构,可以选择以下的:

A、list(列表)

B、tuple(元组)

C、set()

D、Pandas的DataFrame(数据框)

答案:list(列表);

Pandas的DataFrame(数据框)

--------------------------------

中国大学MOOC探索数据的奥秘答案

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20230110A06YKQ00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券