V
主页
程序本地VS集群运行,环境变量为什么不一样?
发布人
为什么同一个大数据程序,在本地可以顺利运行,但在集群环境下却不行呢?
打开封面
下载高清视频
观看高清视频
视频下载器
如何根据项目特点,来估算大数据集群配置?
什么是集群,集群有哪些种类?
hive跟spark到底有啥区别?
什么是拉链表?什么情况下用拉链表?
啥是接口,啥又是API?
spark的运行参数,如何设置比较合理?
啥是ETL?为啥我们需要它?
Spark引入外部数据源之广播变量
分布式计算引擎为啥要用虚拟CPU?
数据开发与数据挖掘,有啥区别?
啥叫存算分离?啥又叫存算一体?
数据血缘到底是个什么东西呀?
啥是高可用?啥又是负载均衡?两者有啥区别?
group by与partition by的联系与区别?
如何通俗理解分布式系统中的“脑裂”现象?
物化视图是个啥,该怎么用?
Zookeeper自己是如何防止脑裂问题的呢?
大数据开发薪水有多高?
zookeeper是如何防止分布式系统的"脑裂"问题的?
面试问:你的集群规模有多大?
如何简单理解星型和雪花模型?
什么是倒排索引,跟普通索引啥区别?
如何理解湖仓一体?
SQL的join慢问题,该如何解决?
什么是索引?如何理解索引?
“流批一体”该如何正确理解?
Flink CDC到底是个啥?是Flink啥关系?
Flink的CDC跟JDBC,区别与联系?
大数据平台那么多,该如何选择?
Doris 对比 Clickhouse,你选谁?
spark的repartition
面试问:是否有过数仓优化案例?
Clickhouse的本地表与分布式表,谁更快?
同步跟异步,到底说的是啥?
为什么会出现索引失效的情况呢?
什么是宽表?如何理解宽表?
Clickhouse处理字段变化的json,效果如何?
学习大数据,不推荐你去看书
流批一体到底是个啥?
教你如何解决大数据开发中的jar包冲突