单选题

在很多小文件场景下,Spark会起很多Task,当SQL逻辑中存在Shuffle操作时,会大大增加hash分桶数,严重影响性能。FusionInsight中,针对小文件的场景通常采用算子,来对Table中的小文件生成的partition进行合并,减少partition数,从而避免在shuffle的时候,生成过多的hash分桶,提升性能()

A. group by
B. coalosce
C. connect
D. join

查看答案
该试题由用户443****51提供 查看答案人数:15190 如遇到问题请联系客服
正确答案
该试题由用户443****51提供 查看答案人数:15191 如遇到问题请联系客服
热门试题
Spark的应用场景有哪些?() SPark适用于以下哪些场景?() 对象存储不适合存储小文件。( ) spark中driver在任务调度中不负责task执行结果的回收 消息列的使用场景有很多,以下描述错误的是() 下列关于合并小文件说法正确的是?() 下列关于合并小文件说法有误的是?() 文件的分类有很多标准,只读文件和读写文件属于( )分类. 恢复误删除文件的工具有很多,以下()不能在Windows9x下运行 HFS的出现解决了需要在HDFS中存储大量的小文件(10MB以下)。同时也要存储一些大文件(10MB以上)的混合的场景() “当医生吧!你有足够的天资,你会喜欢这个工作,你能帮助很多人。还有,你还可以赚很多钱”!这句话不属于论证。() 淘宝采用哪种存储方式存储其海量小文件() 关于ODPS中小文件的说法,正确的是() 海量小文件备份的普遍技术难点是哪个() Spark应用运行时,如果某个task运行失败则导致整个app运行失败() 车牌的存水量为什么会很多? 件的分类有很多标准,只读文件和读写文件属于()分类。 程序是为完成某项活动规定的途径,在很多情况下记录要形成文件。 程序是为完成某项活动规定的途径,在很多情况下记录要形成文件() hadoop和spark的都是并行计算,两者都是用mr模型来进行并行计算,hadoop的一个作业称为job,job里面分为maptask和reducetask,每个task都是在自己的进程中运行的,当task结束时,进程也会结束
购买搜题卡会员须知|联系客服
会员须知|联系客服
关注公众号,回复验证码
享30次免费查看答案
微信扫码关注 立即领取
恭喜获得奖励,快去免费查看答案吧~
去查看答案
全站题库适用,可用于聚题库网站及系列App

    只用于搜题看答案,不支持试卷、题库练习 ,下载APP还可体验拍照搜题和语音搜索

    支付方式

     

     

     
    首次登录享
    免费查看答案20
    登录成功
    首次登录已为您完成账号注册,
    可在【个人中心】修改密码或在登录时选择忘记密码
    账号登录默认密码:手机号后六位