V
主页
spark的repartition
发布人
实测文章链接:https://mp.weixin.qq.com/s?__biz=MzI0OTEwNzQyNA==&mid=2247488611&idx=1&sn=2f7e21c598e7fe877b8709915879f02b&chksm=e997d2ecdee05bfa5ec41d1b8d0e52662addb11d91aff072629ad7cb37fcf630b5fad3b56013#rd
打开封面
下载高清视频
观看高清视频
视频下载器
选Spark还是Flink?
Hive on spark和Spark on hive有啥区别?
Spark为什么比MapReduce快?
离线数仓开发,选spark还是Hive SQL?
Spark on yarn,client和cluster模式的区别是啥?
啥是接口,啥又是API?
Spark中Driver、Executor、Job、Stage、Task、Partition如何理解
Doris 对比 Clickhouse,你选谁?
spark的运行参数,如何设置比较合理?
Spark如何直接读取外部数据源?
Spark的RDD,存储数据吗?
hive跟spark到底有啥区别?
Flink对比Spark写Elasticsearch,谁更快?
面试问spark调优,如何回答比较高级?
面试问:你们的数据质量是如何保证的?
Doris是一款什么样的数据库,对比clickhouse如何呢?
Spark引入外部数据源之广播变量
spark任务变慢,有哪些解决办法?
Spark如何用连接单例,来引入外部数据源?
Spark对比flink导出相同数据量,谁需要的内存更大?
当面试被问spark数据倾斜问题时,该如何回答?
如何正确理解spark中的累加器
传统SQL和Java开发转Spark,可以吗?
面试中问到了hive on spark和spark on hive,你该这么回答
Spark怎么用ThreadLocal引入外部数据源?
Flink跟Spark的聚合状态恢复,谁能达到精确一次性?
啥是ETL?为啥我们需要它?
RDD还有人用吗?
Flink跟Spark的流状态管理,有啥不一样?
什么是宽表?如何理解宽表?
spark和flink并行度,你更喜欢谁的?
Spark为毛不能定义全局变量呢?
SQL的join慢问题,该如何解决?
什么是拉链表?什么情况下用拉链表?
Spark或者flink任务提交集群,出现jar包冲突,咋整?
一个用spark解决数据倾斜的案例
如何理解湖仓一体?
如何创建一个最简spark工程?
Flink CDC到底是个啥?是Flink啥关系?
啥是mpp数据库,跟普通分布式数据库有啥区别呢?