中国大学MOOC上海财经大学数据时代的

1、单选(2分):这是一个治疗肾结石的例子,下表展示了A疗法和B疗法两种疗法的康复率:单独看治疗效果方面的数据,A疗法对治疗两种大小的肾结石的效果都更好,但是将数据合并后发现,B疗法针对所有情况的疗效更优。我们通常称此现象为(C)

A.区群谬误

B.罗杰斯现象

C.辛普森悖论

D.罗素悖论

2、单选(2分):为了描述身高与体重之间是否有某种关系,适合采用的图形是(D)

A.箱线图

B.对比条形图

C.条形图

D.散点图

3、单选(2分):分层抽样最重要的特点为?(B)

A.抽样的有效性低

B.总体各个部分在样本中都有代表

C.调查成本易控制

D.操作简单易行

4、单选(2分):一组数据中出现频数最多的数值称为(D)

A.均值

B.四分位数

C.中位数

D.众数

5、单选(2分):某居民小区准备采取一项新的物业管理措施,为此,随机抽取了户居民进行调査,其中表示赞成的有69户,表示中立的有22户,表示反对的有9户。该组数据的中位数是(D)

A.22

B.69

C.中立

D.赞成

6、单选(2分):比较两组数据的离散程度最适合的统计量是(D)

A.极差

B.平均值

C.标准差

D.变异系数

7、单选(2分):经验法则表明,对于钟形分布的数据,落在距离均值2倍标准差内的数据大约有(B)

A.0.99

B.0.95

C.0.68

D.0.82

8、单选(2分):某班共有25名学生,期末商务口语课程的考试分数分别为:68,73,66,76,86,74,61,89,65,90,69,67,76,62,81,63,68,81,70,73,60,87,75,64,56,该班考试分数的下四分位数和上四分位数分别是(B)

A.67.5和71.5

B.64.5和78.5

C.64.5和71.5

D.64.5和67.5

9、单选(2分):假定一个样本由5个数据组成:3,7,8,9,13。该样本的方差为(D)

A.9.7

B.10.4

C.8

D.13

10、单选(2分):假如我们将一枚硬币抛10次,以下哪个结果更有可能发生?(C)

A.反反反反反正正正正正

B.正反正反反正正反反正

C.其它选项中三种情况概率相同

D.正正正正正正正正正正

11、单选(2分):下列四种关于概率的说法中,正确的是:(A)

A.0.01:这个事件发生的机会很小,不过在重复多次的实验中偶尔会发生。

B.0.5:这个事件发生的机会比不发生的机会大。

C.1:这是一件必定会发生的事,每次尝试它都会发生

D.0:这件事不可能,它永远不会发生

12、单选(2分):由3张一元的人民币,3张五元的人民币,2张十元的人民币,在无法找零的情况下,可以恰好支付(B)种不同的金额。

A.47

B.31

C.48

D.32

13、单选(2分):有三个外观完全一致的袋子,其中一个袋子里面是一块金币和一块银币、一个袋子里面是两块金币、一个袋子里面是两块银币。任选一个袋子后,从中摸出了一枚钱币,发现是金币。那么袋子中另一枚钱币也是金币的概率是多少?(D)

A.1/2

B.2/5

C.1/3

D.2/3

14、单选(2分):在置信水平和总体标准差不变的条件下,想要缩小置信区间,则需要(B)

A.无法通过样本量实现

B.增加样本量

C.保持样本量不变

D.减少样本量

15、单选(2分):数据伦理思考中最重要的部分是(C)

A.对数据本身的思考

B.对数据运用精度的思考

C.对数据使用目标以及利益指向的思考

D.对数据运用准确度的思考

16、单选(2分)年,旅美韩国科研人员韩东杓(音译)因学术造假,获刑57个月。据了解,韩东杓于年在美国俄亥俄州克利夫兰市凯斯西保留地大学参与教授迈克尔·赵领导的艾滋病疫苗研究项目。研究小组发现,兔子体内产生艾滋病病毒抗体,被学术界认为是重大成果。实际上,这一发现是韩东杓造假的结果。他供述,起初误把含有抗体的人血与兔子血混合,从而导致实验结果看似兔子体内产生抗体。在实验的过程中,韩东杓发现了错误,但隐瞒不报,继续造假,理由是不想让导师迈克尔·赵“失望”。这一行为在造假中属于(A)

A.捏造

B.拼凑

C.炮制

D.愚弄

17、单选(2分):一般来说,下面哪些变量是相关关系,而不是因果关系(D)。

A.铁块的大小与质量

B.商品房面积与销售总价

C.行驶的里程与出租车费用

D.成年人的身高与年龄

18、单选(2分):抽取一个样本量为的随机样本,其均值为12,标准差12,则总体均值的95%置信区间为(A)

A.(9.65,14.35)

B.(8.90,15.10)

C.(10.03,13.97)

D.(8.48,15.52)

19、单选(2分):置信度为95%的置信区间指(A)

A.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为95%

B.总体参数落在一个特定的样本所构造的区间内的概率为5%

C.一个特定的样本落在总体参数所构造的区间内的概率为95%

D.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为5%

20、单选(2分):同时抛掷两枚质地均匀的正方体骰子(骰子每个面上的点数分别为1,2,3,4,5,6)。下列事件中概率为1的事件的是:(D)

A.两枚骰子朝上一面的点数均为奇数

B.两枚骰子朝上一面的点数均为偶数

C.两枚骰子朝上一面的点数和为6

D.两枚骰子朝上一面的点数和不小于2

21、多选(3分):为了规避数据分析中可能存在的陷阱,首先需要学习正确的数据分析方法,了解陷阱的种类;其次不能完全依赖数据,需要将(ABCD)有机结合,只有这样才能正确地进行数据分析并制定可靠的商业决策。

A.业务知识

B.商业逻辑

C.数据本身

D.数据分析方法

22、多选(3分):抽样调查相比全面普查,具有的特点有(ACD)。

A.更节省成本

B.结果更准确

C.更节省时间

D.更加易操作

23、多选(3分):下列属于概率抽样的有(ACD)。

A.分层抽样

B.判断抽样

C.系统抽样

D.整群抽样

24、多选(3分):非抽样误差产生的原因多种多样,主要可以分为哪几类?(ABC)

A.回应误差

B.计量误差

C.抽样框误差

D.代表性误差

25、多选(3分):下列有关“个人概率”和“重复多次的比例”的说法中,正确的是:(AB)

A.决策者本人也可能会根据自己对于已经出现的“重复多次的比例”的观察不断调整个人概率

B.“个人概率”只代表个人观点,无所谓对错

C.“个人概率”是错误的概率

D.“重复多次的比例”与“个人概率”一定不同

26、多选(3分):下列关于显著性水平的说法中,正确的是:(CD)

A.显著性水平只能是5%

B.显著性水平只能是1%

C.显著性水平影响拒绝域的确定

D.显著性水平既可以是5%,也可以是1%

27、多选(3分):相关系数的取值可以是(BCD)。

A.3

B.0.5

C.-1

D.0

28、多选(3分):一般而言,数据保存与共享的基本规范是什么?(ABCD)。

A.了解并遵守所在机构关于实验数据和材料所有权的规定,未经允许不得擅自将实验记录本或其他材料带离实验室

B.应当保存所有实验或调查数据的记录

C.遵守各学科领域关于科学数据保存期限的规定

D.应适当整理、保存所获得的数据并进行必要的备份、归档,防止数据的损毁、灭失或被篡改

29、多选(3分):数据时代的推断陷阱可能来自哪些方面?(ABCD)

A.数据的存在及感知

B.数据的特征及预测

C.数据的目标及伦理

D.数据的表达及提升

30、多选(3分):下列统计量中,稳健性度量包括(AD)

A.中位数

B.极差

C.均值

D.四分位间距

31、判断(2分):直方图通常被用来描述分类型数据。(×)

32、判断(2分):气泡图主要用于描述三个变量之间的相关关系。(√)

33、判断(2分):非概率抽样操作简单、成本低、省时间,所抽取的样本可以推断总体的性质。(×)

34、判断(2分):在其它条件相同的情况下,95%的置信区间比90%的置信区间宽。(×)

35、判断(2分):均值在任何情况下描述数据集中趋势的效果都比中位数好。(×)

36、判断(2分):假设将大量独立的随机变量相加,不论原来的随机变量是多少,它们的和会趋向于正态分布。(√)

37、判断(2分):“好”图表只要求正确地表现数据,与是否符合展现数据的具体目标无关。(×)

38、判断(2分):大数据时代中信息技术的发展和各类人工智能算法的出现极大地拓展了感知数据的方式和能力,从而在方方面面挖掘出大量的数据。(√)

39、判断(2分):在胰岛素实验中,通常将小白鼠分为实验组和对照组,在控制其它条件相同的情况下,实验组的小白鼠被注射适量胰岛素,对照组的小白鼠被注射等量的生理盐水,观测两组小白鼠的血糖浓度变化。设置对照组是为了排除胰岛素以外其他因素的影响。(√)

40、判断(2分):数据的使用是否符合集团利益在当前使用模式下的最佳体现,以及集团利益与个体利益之间是否为最佳平衡,是最重要的数据伦理决策问题。(√)

41、填空(2分):甲、乙两人同时射击目标,甲击中目标的概率为0.8,乙击中的概率为0.7,则目标未被击中的概率为(0.06)。

42、填空(2分):“平均律”也被称为“大数定律”,指的是大量独立存在的随机现象在重复发生的过程中,(平均数)或比例有可能随着次数增加变得更稳定。

43、填空(2分):随机抛掷两枚骰子,正面向上的点数之和为奇数的概率为(0.5)。

44、填空(2分):圆周上有十个等分圆周的点,从这十个点中任取三点为顶点作三角形,则有(40)个是直角三角形。

45、填空(2分):两个随机变量的相关系数数值越接近+1正相关就越强,越接近-1负相关就越强,数值越接近(0)代表相关关系越弱。



转载请注明:http://www.abuoumao.com/hykz/7528.html

网站简介| 发布优势| 服务条款| 隐私保护| 广告合作| 网站地图| 版权申明

当前时间: 冀ICP备19029570号-7