下载APP 帮助中心

当前位置：首页 > 查试题 >

在很多小文件场景下，Spark会起很多Task，当SQL逻辑中存在Shuffle操作时，会大大增加hash分桶数，严重影响性能。FusionInsight中，针对小文件的场景通常采用算子，来对Table中的小文件生成的partition进行合并，减少partition数，从而避免在shuffle的时候，生成过多的hash分桶，提升性能（）

单选题

在很多小文件场景下，Spark会起很多Task，当SQL逻辑中存在Shuffle操作时，会大大增加hash分桶数，严重影响性能。FusionInsight中，针对小文件的场景通常采用算子，来对Table中的小文件生成的partition进行合并，减少partition数，从而避免在shuffle的时候，生成过多的hash分桶，提升性能（）

A. group by

B. coalosce

C. connect

D. join

查看答案

该试题由用户443****51提供查看答案人数：15190 如遇到问题请联系客服

热门试题

Spark的应用场景有哪些？（） SPark适用于以下哪些场景？（） 对象存储不适合存储小文件。（） spark中driver在任务调度中不负责task执行结果的回收 消息列的使用场景有很多,以下描述错误的是（） 下列关于合并小文件说法正确的是？（） 下列关于合并小文件说法有误的是？（） 文件的分类有很多标准,只读文件和读写文件属于( )分类. 恢复误删除文件的工具有很多，以下（）不能在Windows9x下运行 HFS的出现解决了需要在HDFS中存储大量的小文件（10MB以下）。同时也要存储一些大文件（10MB以上）的混合的场景（） “当医生吧!你有足够的天资,你会喜欢这个工作,你能帮助很多人。还有,你还可以赚很多钱”!这句话不属于论证。() 淘宝采用哪种存储方式存储其海量小文件（） 关于ODPS中小文件的说法,正确的是（） 海量小文件备份的普遍技术难点是哪个（） Spark应用运行时，如果某个task运行失败则导致整个app运行失败（） 车牌的存水量为什么会很多？ 件的分类有很多标准，只读文件和读写文件属于（）分类。 程序是为完成某项活动规定的途径，在很多情况下记录要形成文件。 程序是为完成某项活动规定的途径，在很多情况下记录要形成文件（） hadoop和spark的都是并行计算，两者都是用mr模型来进行并行计算，hadoop的一个作业称为job，job里面分为maptask和reducetask，每个task都是在自己的进程中运行的，当task结束时，进程也会结束

~~购买搜题卡~~会员须知|联系客服

免费查看答案购买搜题卡

关注公众号，回复验证码
享30次免费查看答案

微信扫码关注立即领取

恭喜获得奖励，快去免费查看答案吧~

去查看答案

全站题库适用，可用于聚题库网站及系列App

只用于搜题看答案，不支持试卷、题库练习，下载APP还可体验拍照搜题和语音搜索

支付方式

登录成功

首次登录已为您完成账号注册，
可在【个人中心】修改密码或在登录时选择忘记密码
账号登录默认密码：~~手机号后六位~~