首页
搜题
试题标题
试题标题
搜索
Apache Spark
【判断题】
一个进程中只能有一个线程在工作,可以处理多个数据分区(例如运...
【判断题】
DAG是一种非常重要的图论数据结构。
【判断题】
join算子操作既可以属于窄依赖,也可以属于宽依赖。
【判断题】
Hadoop的MapReduce进行计算时,每次产生的中间结...
【判断题】
RDD采用了惰性调用。
【判断题】
RDD的分区原则是分区的个数尽量等于集群中的CPU核心(Co...
【判断题】
Application中包含了多个驱动器(Driver)进程...
【判断题】
flatMap(func)与map(func)相似,应用于(...
【判断题】
Spark可以运行在Hadoop模式、Mesos模式、Sta...
【判断题】
Spark生态系统已经发展成为一个可应用于大规模数据处理的统...
【判断题】
RDD的持久化操作有两种方法,分别是cache()方法和pe...
【判断题】
对于迭代式计算和交互式数据挖掘,RDD可以将中间计算的数据结...
【判断题】
Spark不支持在各种集群管理器(Cluster Manag...
【判断题】
Cluster Manager负责整个集群的统一资源管理,W...
【判断题】
在数据科学应用中,数据工程师可以利用Spark进行数据分析与建模。
【判断题】
Spark计算框架在处理数据时,所有的中间数据都保存在磁盘中。
【判断题】
Worker Node为执行器的工作单元。
【多项选择题】
下列选项中,属于Spark生态圈的组件有()。
【多项选择题】
下列选项中,属于RDD行动算子的有()。
【多项选择题】
Spark编程支持的语言有()。
【单项选择题】
下列选项中,用于提交和监控Task任务的是()。
【单项选择题】
在Spark运行过程中,每个Job可以划分为更小的Task集...
【单项选择题】
Spark集群的任务是由()进行调度的。
【单项选择题】
持久化RDD的存储级别中,将RDD分区全部存储到磁盘上的存储...
【单项选择题】
在RDD的转换算子中,用于将每个元素传递到函数func中,并...
【单项选择题】
下列选项,不属于集群管理器的有()。
【单项选择题】
在RDD的转换算子中,主要用于(Key,Value)键值对的...
【单项选择题】
Spark与Hadoop在基于内存的运算中,说法正确的是()。
【单项选择题】
在Spark RDD中,划分Stage的依据是()。
【单项选择题】
如果一个有向图无法从任意顶点出发经过若干条边回到该点,则这个...
【单项选择题】
在RDD的行动算子中,用于用于返回数组的第一个元素的行动算子是()。
【单项选择题】
下列选项中,可以支持Scala和Python编程的交互式解释...
【单项选择题】
下列选项中,可以用于退出Spark-Shell客户端的命令是()。
【填空题】
Spark支持的操作可以分为Transformation和A...
【填空题】
spark生态圈的核心是()。
【填空题】
scala中获取数组第一个元素可以用()。
【填空题】
scala中声明常量的关键词为()。
【填空题】
scala的REPL提供了()模式,用于粘贴大量的代码。
【填空题】
scala解释器也称为()。
【填空题】
词频TF(t,d)是指词语t在()中出现的次数。
试题标题
试题标题
搜索
欢迎来到赞题库!
登录
注册
微信快捷登录/注册
使用微信扫码登录账号
账号密码登录
立即登录
找回密码、申诉账号等操作请下载赞题库APP