V
主页
同步跟异步,到底说的是啥?
发布人
程序间的数据通信方式,你真的很清楚吗...
打开封面
下载高清视频
观看高清视频
视频下载器
StreamPark 跟 Dinky 使用起来怎么样?
数据血缘到底是个什么东西呀?
分布式计算引擎为啥要用虚拟CPU?
数据出现重复 该怎么解决?
为什么你总喜欢用join?
什么是宽表?如何理解宽表?
数据源导入,选全量还是增量?
你的数仓建设是在生搬硬套建模理论吗?
hive跟spark到底有啥区别?
分区、分桶、排序字段,如何确定?
kafka出现数据积压,如何解决?
Clickhouse的存储策略,你造吗?
啥是高可用?啥又是负载均衡?两者有啥区别?
Flink的精确一次性,真的能保证吗?
Doris跟Clickhouse的数据导出,谁更好使?
Clickhouse的分片集群和副本集群
面试架构师,要准备些啥?
kafka的削峰填谷和异步解耦,该如何理解?
Doris是一款什么样的数据库,对比clickhouse如何呢?
为什么会出现索引失效的情况呢?
如何理解Java中的类、接口,以及抽象类?
SQL查询时,group by真的要比count distinct更好吗?
YARN是啥?
程序本地VS集群运行,环境变量为什么不一样?
流式计算的低延迟与高吞吐,跟GC有啥子关系?
分布式任务,如何查看具体的后台进程?
大数据开发简历包装的2个误区,你有吗?
Elasticsearch处理字段不确定的json,效果怎么样呢?
什么是软件生态?如何理解软件生态?
group by与partition by的联系与区别?
跑spark选多executor单CPU,还是单executor多CPU?
Zookeeper自己是如何防止脑裂问题的呢?
啥是外部表?啥又是内部表?
什么是索引?如何理解索引?
Doris跟Clickhouse比,谁更快?
如何理解流式计算的watermark?
流批一体到底是个啥?
什么是3阶段提交?
多宽的表算宽表?什么情况下适合用宽表?
啥是mpp数据库,跟普通分布式数据库有啥区别呢?