V
主页
Flink CDC 3.0.1,到底能不能行?
发布人
本次测试文章地址:https://mp.weixin.qq.com/s?__biz=MzI0OTEwNzQyNA==&mid=2247487804&idx=1&sn=637036bf977a256eeb1303af83c70902&chksm=e997d7b3dee05ea5b2c284426f8ef48e8af9555f78803b63e2eb30ab24e844ae7d98a69c27db#rd
打开封面
下载高清视频
观看高清视频
视频下载器
我们每次说的CDC,到底是个什么玩意?
面试问:你们的数据质量是如何保证的?
想用 Flink CDC 必须要要满足哪些条件?
Flink CDC 3.0 用起来到底怎么样?
Flink中的回撤流,该怎么理解?
Flink CDC 3.1.1导大表,表现怎么样呢?
啥是ETL?为啥我们需要它?
StreamPark 跟 Dinky 使用起来怎么样?
数据开发与数据挖掘,有啥区别?
分布式计算引擎为啥要用虚拟CPU?
如何理解流式计算的watermark?
Flink的精确一次性,真的能保证吗?
啥是高可用?啥又是负载均衡?两者有啥区别?
hive跟spark到底有啥区别?
大数据开发简历包装的2个误区,你有吗?
离线数仓开发,选spark还是Hive SQL?
什么是宽表?如何理解宽表?
Cloudera Manager、Ambari、CDH、HDP、CDP都分别指的什么?
什么是两阶段提交?
这样调优,Flink CDC的内存可以节省近40%.
什么是拉链表?什么情况下用拉链表?
如何理解实时计算中的windows功能?
学习大数据,不推荐你去看书
数仓架构和大数据架构有啥区别?
流式计算的低延迟与高吞吐,跟GC有啥子关系?
大数据平台那么多,该如何选择?
大数据开发什么环节会丢数据?
数据出现重复 该怎么解决?
Doris 对比 Clickhouse,你选谁?
大数据项目,怎么跟MySQL,Redis发生关系?
什么是3阶段提交?
spark的运行参数,如何设置比较合理?
Spark或者flink任务提交集群,出现jar包冲突,咋整?
同步跟异步,到底说的是啥?
zookeeper是如何防止分布式系统的"脑裂"问题的?
没过试用期,原因可能是这些...
Zookeeper自己是如何防止脑裂问题的呢?
程序本地VS集群运行,环境变量为什么不一样?
面试架构师,要准备些啥?
没有大数据开发经验,面试被问到项目问题,咋办?