V
主页
Flink的CDC跟JDBC,区别与联系?
发布人
有了Flink CDC,为啥还要JDBC?
打开封面
下载高清视频
观看高清视频
视频下载器
我们每次说的CDC,到底是个什么玩意?
group by与partition by的联系与区别?
hive跟spark到底有啥区别?
Flink CDC到底是个啥?是Flink啥关系?
选Spark还是Flink?
分布式计算引擎为啥要用虚拟CPU?
Cloudera Manager、Ambari、CDH、HDP、CDP都分别指的什么?
Flink中的回撤流,该怎么理解?
想用 Flink CDC 必须要要满足哪些条件?
数据开发与数据挖掘,有啥区别?
spark和flink并行度,你更喜欢谁的?
kafka出现数据积压,如何解决?
Flink CDC 3.0 用起来到底怎么样?
面试问:你们的数据质量是如何保证的?
啥是高可用?啥又是负载均衡?两者有啥区别?
你的数仓建设是在生搬硬套建模理论吗?
Hive on spark和Spark on hive有啥区别?
流式计算为啥需要checkpoint?
什么是拉链表?什么情况下用拉链表?
Spark或者flink任务提交集群,出现jar包冲突,咋整?
什么是宽表?如何理解宽表?
什么是倒排索引,跟普通索引啥区别?
离线数仓开发,选spark还是Hive SQL?
zookeeper是如何防止分布式系统的"脑裂"问题的?
啥是ETL?为啥我们需要它?
Zookeeper自己是如何防止脑裂问题的呢?
Flink CDC 3.1.1导大表,表现怎么样呢?
数据导入工具那么多,选哪个呢?
数仓建模到底是怎么一肥事?
数仓架构和大数据架构有啥区别?
数据血缘到底是个什么东西呀?
物化视图是个啥,该怎么用?
大数据开发简历包装的2个误区,你有吗?
流式计算的低延迟与高吞吐,跟GC有啥子关系?
学习大数据,不推荐你去看书
Spark如何读取变化的外部数据源?
数据库如果没有日志功能,如何手动CDC?
如何理解实时计算中的windows功能?
多宽的表算宽表?什么情况下适合用宽表?
Spark对比flink导出相同数据量,谁需要的内存更大?