V
主页
数据血缘到底是个什么东西呀?
发布人
数据血缘看着好像很高大上,其实就那么回事...
打开封面
下载高清视频
观看高清视频
视频下载器
【白话数仓】网易数据中台产品在数仓模型设计方向的设计与创新
数据治理这行,能做多久?
如何理解数据库中的事实表与维度表?
啥是ETL?为啥我们需要它?
什么是宽表?如何理解宽表?
面试问:你们的数据质量是如何保证的?
面试问:给你一亿数据,如何对数据分析做优化?
数据仓库为啥要分层呢?
什么是索引?如何理解索引?
啥是接口,啥又是API?
数据开发与数据挖掘,有啥区别?
如何理解湖仓一体?
数仓建模到底是怎么一肥事?
大数据开发薪水有多高?
要抽取的数据量很大时,该怎么办?
什么是拉链表?什么情况下用拉链表?
数据仓库、大数据平台、数据中台、数据湖,你迷瞪不?
面试问:是否有过数仓优化案例?
如何简单理解星型和雪花模型?
啥是数据切片?啥又是数据快照?
SQL的join慢问题,该如何解决?
多宽的表算宽表?什么情况下适合用宽表?
啥叫存算分离?啥又叫存算一体?
hive跟spark到底有啥区别?
Spark中Driver、Executor、Job、Stage、Task、Partition如何理解
当面试被问spark数据倾斜问题时,该如何回答?
一个用spark解决数据倾斜的案例
你的数仓建设是在生搬硬套建模理论吗?
我们每次说的CDC,到底是个什么玩意?
Flink CDC到底是个啥?是Flink啥关系?
kafka如何做到不丢数据,以及精确一次性消费?
kafka出现数据积压,如何解决?
如何通俗理解分布式系统中的“脑裂”现象?
StreamPark 跟 Dinky 使用起来怎么样?
Spark的五种Join策略介绍
zookeeper是如何防止分布式系统的"脑裂"问题的?
Hive on spark和Spark on hive有啥区别?
学习大数据,不推荐你去看书
数据出现重复 该怎么解决?
离线数仓开发,选spark还是Hive SQL?