V
主页
Spark中Driver、Executor、Job、Stage、Task、Partition如何理解
发布人
Spark中的这些基础概念混淆了很多初学者,搞懂这些很重要...
打开封面
下载高清视频
观看高清视频
视频下载器
spark的driver和executor两种角色
整理了一些Spark的面试题
什么是索引?如何理解索引?
hive跟spark到底有啥区别?
选Spark还是Flink?
自定义Partitioner进一步优化数据倾斜
简单理解spark中的rdd
跑spark选多executor单CPU,还是单executor多CPU?
面试问:你们的数据质量是如何保证的?
传统SQL和Java开发转Spark,可以吗?
为什么学历低的人不要学大数据?
group by与partition by的联系与区别?
什么是宽表?如何理解宽表?
没有大数据开发经验,面试被问到项目问题,咋办?
Spark如何读取变化的外部数据源?
分布式计算引擎为啥要用虚拟CPU?
现在的大学生就业都得做二次培训 #大学生 #就业 #培训
面试问spark调优,如何回答比较高级?
如何正确理解spark中的累加器
Flink对比Spark写Elasticsearch,谁更快?
数据仓库为啥要分层呢?
流式计算为啥需要checkpoint?
学习大数据,不推荐你去看书
大数据开发薪水有多高?
离线数仓开发,选spark还是Hive SQL?
大数据岗位一定都是高学历?
Spark on yarn,client和cluster模式的区别是啥?
数仓架构和大数据架构有啥区别?
RDD还有人用吗?
Flink CDC到底是个啥?是Flink啥关系?
如何简单理解HDFS?
一个用spark解决数据倾斜的案例
数据开发与数据挖掘,有啥区别?
我们每次说的CDC,到底是个什么玩意?
Spark为什么比MapReduce快?
利用Spark窗口函数进行空值填充
Hive on spark和Spark on hive有啥区别?
spark的运行参数,如何设置比较合理?
啥是ETL?为啥我们需要它?
当面试被问spark数据倾斜问题时,该如何回答?