大数据工程技术人员考试题

考试总分:100分

考试类型:模拟试题

作答时间:90分钟

已答人数:391

试卷答案:没有

试卷介绍:本站精心整理了大数据工程技术人员考试题,快来看看你的分数是多少吧。

开始答题

试卷预览

  • 1. Mac OS系统的开发者是( )

    A微软公司

    B惠普公司

    C苹果公司

    DIBM公司

  • 2. 下列哪项不属于流计算的处理流程的三个阶段?

    A数据实时采集

    B数据批量采集

    C数据实时计算

    D实时查询服务

  • 3. 下列关于Storm和Hadoop架构组件功能对应关系,哪个是错误的?

    AHadoopJob 对应 Storm Topology

    BHadoopTaskTracker对应 Storm Supervisor

    CHadoopJobTracker对应 Storm Spout

    DHadoopReduce对应 Storm Bolt

  • 4. 下列关于数据交易市场的说法中,错误的是()

    A数据交易市场是大数据产业发展到一定程度的产物

    B商业化的数据交易活动催生了多方参与的第三方数据交市场

    C数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助

    D数据交易市场是大数据资源化的必然产物

  • 5. HDFS1.0默认BlockSize大小是多少。

    A32MB

    B64MB

    C128MB

    D256MB

  • 1. java和python都是面向对象的语言,都可以应用到大数据编程中。

    A

    B

  • 2. 网络爬虫可以爬取互联网上任意的网页。

    A

    B

  • 3. Hive默认不支持动态分区功能,需要手动设置动态分区参数开启功能。

    A

    B

  • 4. 删除Hive外部表时,表数据也会删除。

    A

    B

  • 5. Hive的元数据存储在关系数据库中。

    A

    B

  • 1. 下列关于推荐长尾理论的描述,哪些是正确的?

    A推荐系统可以创造全新的商业和经济模式,帮助实现长尾商品的销售

    B“长尾”概念于2004年提出,用来描述以亚马逊为代表的电子商务网站的商业和经济模式

    C可以通过发掘长尾商品并推荐给感兴趣的用户来提高销售额

    D热门推荐的主要缺陷在于推荐的范围有限,所推荐的内容在一定时期内也相对固定。无法实现长尾商品的推荐

  • 2. 大数据具有哪些特点?

    A数据的“大量化”

    B数据的“快速化”

    C数据的“多样化”

    D数据的“价值密度比较低”

  • 3. 下列对于Pregel的执行过程,哪些是正确的?

    A选择集群中的多台机器执行图计算任务,每台机器上运行用户程序的一个副本

    BMaster把一个图分成多个分区,并把分区分配到多个Worker

    CMaster会把用户输入划分成多个部分,通常是基于文件边界进行划分

    DMaster向每个Worker发送指令,Worker收到指令后,开始运行一个超步

  • 4. Spark具有以下哪几个主要特点?

    A运行速度快

    B容易使用

    C通用性

    D运行模式单一

  • 5. 下列关于文档数据库的描述,哪些是正确的?

    A性能好(高并发),灵活性高

    B具备统一的查询语法

    C文档数据库支持文档间的事务

    D复杂性低,数据结构灵活