数据《交通大数据分析与处理》综合测试题及答案

大数据处理  时间:2021-02-26  阅读:()

深圳职业技术学院交通专业2017级

交通大数据分析与处理试卷【闭卷】

总得分______ 统分人签名________ 核分人签名__________

分 【得分 】

1. MapReduc e任务过程分为两个处理阶段阶段和阶段。

2. 云计算使得使用信息的存储是一个、的方式它会大大地节约网络的成本使得网络将班级 来越来越泛在、越来越普及成本越来越低。

3. 大数据系统体系建设规划包括采数据、 、 、建模型。

并行计算架构通过网络将数台、数十台甚至上百○ 台普通服务器连接到一起组成。

8. 数据库使用来完成数据的存储和管理。 SCSDB对象主要有、数据表、索引及等。

9. SCSDB提供了查看当前会话连接状态的命令使用该命令可查看当前的状态信息。

二、判断题20分每题2分 【得分 】

1.对于大数据而言最基本、最重要的要求就是减少错误、保证质量。因此大数据收集

的信息量要尽量精确。  

2.一般而言分布式数据库是指物理上分散在不同地点但在逻辑上是统一的数据库。因

此分布式数据库具有物理上的独立性、逻辑上的一体性、性能上的可扩展性等特点。  

3.谷歌流感趋势充分体现了数据重组和扩展对数据价值的重要意义。  

4.当表存在大量的UPDATE/DELETE操作时会导致表的数据文件、索引文件产生空洞、碎片这种情况下会逐渐降低该表的查询性能。  

5.数据库对象名只能由字母、数字、下划线组成且只能以字母开头。  

6.完整的建表语句中包含表名、列名、列定义、主键信息、索引信息、表分区信息、表注释信息等。  

7.SCSDB的数据节点分为主节点和从节点一个主节点对应一个或多个从节点。  

8.当数据量小时应用开发人员只需要关心查询语句的功能实现不需要关心性能问题。  

9.当SCSDB收到用户查询SCSQL后交给优化器进行分析 由执行器生成执行计划 

10.大数据的安全存储采用虚拟化海量存储技术来存储数据资源。  

三、不定项选择题20分每题2分多选、少选不得分 【得分 】

1.国务院在哪一年印发了《促进大数据发展行动纲要》   

A.2015年 B.2016年 C.2017年 D.2018年

2.梅特卡尔夫定律主要是描述信息网络指出网络的价值在于网络的互联联网的接点数与其价值呈现 的方式联网越多系统的价值越大。

A.对数 B.指数 C.正比 D.反比

3.SCSDB安全管理主要分为 三个部分。

A账户管理 B.权限管理 C.数据库审计 D.角色扮演

4.大数据的主要特征表现为 。

A.数据类型多 B.处理速度快 C.数据容量大 D.商业价值高

5.数据库使用数据库对象来完成数据的存储和管理。SCSDB对象主要有 、索引及视图等。

A.菜单 B.数据库 C.数据表 D.按钮

6.大数据的核心是洞察洞察有以下哪些特色  。

A.洞察工作重点

B.洞察调度奥妙

C.洞察管理规律

D.洞察未来趋势

7.大数据的来源包括 。

A.互联网数据 B.实时数据 C.探测数据 D.传感器数据

8.大数据的利用过程是  

A.采集——挖掘——清洗——统计

B.采集——统计——清洗——挖掘

C.采集——清洗——挖掘——统计

D.采集——清洗——统计——挖掘

9.大数据的本质是 。

A.洞察 B.搜集 C.联系 D.挖掘

10.SCSDB是一个 、并行计算的结构化数据库。

A.开放式 B.分布式存储 C.同步式存储 D.附着式存储

四、简答题25分每题5分 【得分 】

1.什么是分布式计算

2.在Hadoop HDFS中集群中的DataNode节点需要周期性地向NameNode发送什么信息

3.简要描述交通管理大数据的感知层

4.简述SCSDB数据库的存储逻辑结构管理。

5.简述基于SCSDB创建数据库的方法。

五、应用题15分 【得分】

在基于SCSDB进行大数据管理中数据表管理是其中较重要的环节请结合所学知识完成以下两项任务

1.给出创建数据表的句法并进行必要的解释。

2.给出查看数据表的句法并进行必要的解释。

交通大数据分析与处理试卷参考答案

一、 1. Map reduce

2. 分布式、共享式

3. 搭平台、编代码

4. 数据类型多、处理速度快

5. 信息化

6. 感知层、 网络层应用层

7. 分布式存储计算集群

8. 数据库对象数据库、视图

9. 会话连接

10.水平存储

二 1. × 2.√ 3. × 4.√ 5.√ 6.√ 7.√ 8.√ 9. × 10.√

三 1.A 2.B 3.ABC 4.ABCD 5.BC

6.ABCD 7.ABCD 8.D 9.A 10.B

四 1.答分布式计算是一门计算机科学主要研究分布式系统。一个分布式系统包括若干通过网络互联的计算机。这些计算机互相配合以完成一个共同的目标我们将这个共同的目标称为“项目”。具体的过程是将需要进行大量计算的项目数据分割成小块 由多台计算机分别计算再上传运算结果后统一合并得出数据结论。在分布式系统上运行的计算机程序称为分布式计算程序分布式编程就是编写上述程序的过程。

2.答在Hadoop HDFS中 DataNode需要周期性地向集群中的DataNode Master节点发送心跳信息和块报告。接收到心跳信息说明该DataNode节点工作正常块报告包含了DataNode节点上所有块的列表以及块id与磁盘文件存储的映射关系。

3.答交通管理大数据感知层是交通大数据总体架构的最底层主要实现交通信息的采集与前端处理功能是整个交通管理大数据架构中起决定性的部分。交通管理大数据感知层不仅包括各类交通传感器技术还包括前端的各类信息处理、通信、 网络、安全、标识、定位、同步等技术 以及相关的协同处理等新技术覆盖的范围非常宽泛。

4.答在SCSDB数据库中 Database相当于容器里面存放了各种数据表、视图。其中包括

1一个库下可以有多张数据表、视图。

2某个数据表或视图只能隶属于一个库。

3数据节点的分配是以数据库为单位的同一个库下的所有表分布在相同的数据节点上且同一个库下的所有表的HAS H映射关系是相同的。

5答可使用CREATE DATABASE语句创建数据库其语法如下所示

CREATE{DATABASE|SCHEMA}[IF NOTEXISTS]db_name[node_number]

说明 (1)[no de_numb er ]为空时默认使用集群的所有数据节点。 no de_numb er最少为1 最大为当前集群节点总数。 (2)新创建数据库在为其分配数据节点时会选择当前负载较小的数据节点使每个数据节点上的数据库数量尽可能均衡。 3 SCHEMA是DATABAS E的同义词。创建数据库database_test不指定节点数(使用全部节点数进行数据存储)示例如下scsdb>create database database_test.

五

1.答数据表用来存储数据记录 由行和列组成列代表属性每一个行是一条记录。使用CREATE TABLE语句建表时最基础的部分是定义表名以及表包含的数据列名和列定义其语法如下

CREATE TABLE table_name(column_namecolumn_definition,

[column_namecolumn_definition,]. . .

)

句法说明如下

1 c olumn_name列名也叫字段名在创建数据表时必须指定列名且表至少包含一个列。

2 column_definition列定义也称字段属性。首先是数据类型后面可以追加NOT NULL或NULL、 DEFAULT default_value、 AUTO_INCREMENT、 UNIQUE [KEY]或PRIMARYKEY等修饰词以及备注CO MM ENT 。

3列定义与下一个列名之间用“,”隔开最后一个列定义后不可加“,”。

创建一个driver s表并设置id自增长且为主键。

2答查看当前数据库中数据表的语句如下所示

SHO W[FULL|HASH]TABLES[LIKE p' attern' |WHERE expr]

说明如下

1 FULL显示Tab le_type列信息用于表明每个行引用的是表(BAS E_TABLE)还是视图(VIEW)。

2HAS HHAS H选项为自定义的S HOW HAS H TABLES查询当前库的HASH分布表

并返回HAS H字段若HAS H字段为组合字段那么多个字段之间以逗号分隔。3 LIKE子句用给定模式p attern匹配表名。

4WHERE子句只输出满足表达式的数据行。

查看表名里面包含以’dri’开头的数据表的句法如下database_test>showfull tables like 'dri%'.

Virmach款低价VPS可选可以选择多个机房,新增多款低价便宜VPS主机7.2美元起

Virmach商家我们是不是比较熟悉?速度一般,但是人家价格低,而且机房是比较多的。早年的时候有帮助一个有做外贸也许需要多个机房且便宜服务商的时候接触到这个商家,有曾经帮助够买过上百台这样的低价机器。这里需要提醒的,便宜但是速度一般,尤其是中文业务速度确实不快,如果是外贸业务,那肯定是没有问题。这几天,我们有看到Virmach推出了夏季优惠促销,VPS首年8折,最低年付仅7.2美元,多机房可选,如...

Ceranetworks顶级合作伙伴 香港E3 16G 299元 香港E5 32G 650元 美国E3 16G 650元

提速啦(www.tisula.com)是赣州王成璟网络科技有限公司旗下云服务器品牌,目前拥有在籍员工40人左右,社保在籍员工30人+,是正规的国内拥有IDC ICP ISP CDN 云牌照资质商家,2018-2021年连续4年获得CTG机房顶级金牌代理商荣誉 2021年赣州市于都县创业大赛三等奖,2020年于都电子商务示范企业,2021年于都县电子商务融合推广大使。资源优势介绍:Ceranetwo...

Hostodo(年付12美元),美西斯波坎机房Linux VPS主机66折

Hostodo 商家是比较小众的国外VPS主机商,这不看到商家有推送促销优惠在美国西岸的斯波坎机房还有少部分库存准备通过低价格促销,年付低至12美元Linux VPS主机,且如果是1GB内存方案的可以享受六六折优惠,均是采用KVM架构,且可以支付宝付款。第一、商家优惠码优惠码:spokanessd 1GB+内存方案才可以用到优惠码,其他都是固定的优惠低至年12美元。第二、商家促销这里,我们可以看到...

大数据处理为你推荐
在线漏洞检测网站好像有漏洞,直接看代码可以找出来吗?如何建立一个网站要建立一个网站怎么弄啊?xp系统停止服务XP停止服务后该怎么办?创维云电视功能创维电视怎么用,我买了个创维云电视,现在不知道怎么用手机往电视上传照片,谁能解答以下,怎么升级ios6iPad怎么升级到iOS6正式版?微信电话本怎么用微信电话本短信管理功能怎么用?声母是什么22个声母是什么网站推广外链网站推广发外链,外链内容怎么确定请客网飞宴网是做什么的网页窗口最大化怎么现在不能直接将网页窗口最大化
本网站服务器在美国维护 site5 bluevm kvmla stablehost vultr美国与日本 地址大全 网站被封 web服务器架设 大容量存储器 免费个人空间 hinet 速度云 卡巴斯基破解版 台湾谷歌 怎么建立邮箱 双12 厦门电信 免费邮件服务器 百度云加速 更多