作者: 石头 (Elazer)
前阿里巴巴数据架构专家,10年大数据从业经验
摸爬滚打10余年,落下了一身的毛病,决定走困境,将过去10年的经验整理成册,分享给大家。希望对大家的大数据工作有所帮助。
今日更新:0
栏目文章数:0
Python与Apache Spark的集成:操作指南
在大数据处理领域,Apache Spark因性能优越成为开发者的首选工具之一,而Python的简洁特性和丰富库支持使其与...

Apache Spark 概述
Apache Spark 是由加州大学伯克利分校的 AMPLab 研发的开源大数据处理系统,现为 Apache 基金会顶...

Hive 中数据倾斜的解决办法
Hive 中数据倾斜的解决办法包括:数据预处理,如哈希分区和范围分区;合理设计表分区,如按日期分区;使用 Skew Jo...
