V
主页
Spark或者flink任务提交集群,出现jar包冲突,咋整?
发布人
当大数据的开发环境跟集群环境冲突时,咋整?
打开封面
下载高清视频
观看高清视频
视频下载器
选Spark还是Flink?
hive跟spark到底有啥区别?
Spark on yarn,client和cluster模式的区别是啥?
面试问:你们的数据质量是如何保证的?
什么是3阶段提交?
离线数仓开发,选spark还是Hive SQL?
什么是两阶段提交?
Spark的RDD,存储数据吗?
想用 Flink CDC 必须要要满足哪些条件?
Flink的精确一次性,真的能保证吗?
面试问:kafka消费端如何保证精确一次性消费?
没过试用期,原因可能是这些...
整理了一些Spark的面试题
自定义Partitioner进一步优化数据倾斜
教你如何解决大数据开发中的jar包冲突
流式计算为啥需要checkpoint?
Flink对比Spark写Elasticsearch,谁更快?
spark的driver和executor两种角色
Flink CDC 3.0 用起来到底怎么样?
如何正确理解spark中的累加器
传统SQL和Java开发转Spark,可以吗?
Spark如何读取变化的外部数据源?
spark的运行参数,如何设置比较合理?
程序本地VS集群运行,环境变量为什么不一样?
Hive on spark和Spark on hive有啥区别?
大数据开发简历包装的2个误区,你有吗?
Spark为什么比MapReduce快?
什么是宽表?如何理解宽表?
Flink跟Spark的聚合状态恢复,谁能达到精确一次性?
大数据开发中为什么会出现jar包冲突?
Flink的CDC跟JDBC,区别与联系?
如何理解实时计算中的windows功能?
跑spark选多executor单CPU,还是单executor多CPU?
分布式任务,为什么本地跟集群跑的不一样?
面试问spark调优,如何回答比较高级?
group by与partition by的联系与区别?
Spark为毛不能定义全局变量呢?
Flink CDC 3.0.1,到底能不能行?
Flink CDC到底是个啥?是Flink啥关系?
Flink跟Spark精确一次性对比,谁更厉害?