V
主页
大数据文件系统HDFS的设计目标、系统架构和容错设计
发布人
HDFS是现在大数据分布式存储的标准,也是Hadoop的核心项目,适合于以流的方式批量访问大容量数据的场景。HDFS是一个典型的master slave架构设计,NameNode存储文件系统的元数据,多个DataNode存储大文件被拆分后的block数据。HDFS使用了磁盘故障检测,数据校验等一系列鲁棒性策略。
打开封面
下载高清视频
观看高清视频
视频下载器
大数据技术全景图:一图描绘大数据技术生态全貌
Apache Spark大数据计算框架的概念、原理与架构
Spark内存管理机制及优化实践
大数据技术系列(6)列式存储格式Parquet/ORC
6条优化Spark应用的经验总结及参数配置
基于Hadoop的数据仓库Hive:系统设计与架构
企业数据治理系列(二)数据标准,数据模型,元数据,主数据
企业数据治理系列(一)数据资产管理实践白皮书4.0
企业数据治理系列(三)数据质量,数据安全,数据价值,数据共享
企业数据治理系列(四)数据质量管理
Hugo: Go语言实现的Markdown静态网站生成器,托管GitHub Pages, Gitee Pages搭建个人博客,程序员必看!
Github开源项目精选之miniserve:简易文件HTTP服务器
手绘风格架构图/流程图绘制工具,免费!在线!颜值超高!
Spark 3.0重磅特性AQE(Adaptive Query Execution)盘点介绍
【Java热门场景题】说说如何设计一个秒杀系统?一通说下来我直接被录用了!!
基于Spark Mllib的大数据机器学习算法
3种SparkSQL Join的优化技巧和适用场景
大数据技术系列:大数据分布式SQL计算引擎
企业数据治理系列(五)数据质量管理手段,质量标准,流程,持续改进
简述7种最常用的分布式系统模式
【大数据-hadoop spark 基于大数据的旅游景点推荐系统设计与实现 毕业设计实战】 python数据爬取 hdfs存储 spark协同过滤推荐
你可能不知道的“996”三大隐形危害!别被蒙在鼓里!
美籍大叔:我在美国做大数据工作,我对西方民主并不抱太大幻想
(强推)强推!【推荐系统算法】目前最好的推荐系统算法与项目实战教程!——(推荐算法、Hadoop、Hive 和 HBase、人工智能、AI)
自定义DSL+Presto分布式SQL计算引擎筛选NLP数据集
DataX,来自阿里巴巴的离线数据同步工具
惊!夜深人静写代码时,VSCode突然传出女声!
单步断点调试是一种低效的调试方法!
尚硅谷大数据技术之新能源汽车数仓
一个非常变态,但可以让你快速学会C++的方法!草履虫都能听懂,还学不会我退出it圈
Oracle Always Free 云服务,免费使用,无限时长!
Google的跨平台UI框架 Flutter 2.0 发布
几乎通杀女生所有年龄段,能做到的人很少
强推!耗时33小时,内部人士都在偷偷看的【推荐系统基础算法】教程,囊括所有核心知识点,存下吧,真的比啃书好太多了!
如何做科研?请凭心而动
大数据技术之DolphinScheduler2.x
4分钟带你一览Github Universe 2022大会精彩看点
在家坚持Python接单,昨天698,分享我的接单经验技巧、流程、以及学习资源!!!
Google Chrome浏览器将禁用第三方cookie
2024年就业最惨的三大技术岗位:前端、java、大数据