王家林每日大数据语录Spark篇0018（2015.11.7于南宁）

2021年11月4日 08:13 • 大数据, 开源, 研发管理, 移动开发, 编程笔记

在Spark的reduceByKey操作时会触发Shuffle的过程，在Shuffle之前，会有本地的聚合过程产生MapPartitionsRDD，接着具体Shuffle会产生ShuffledRDD,之后做全局的聚合生成结果MapPartitionsRDD

原创文章，作者：ItWorker，如若转载，请注明出处：https://blog.ytso.com/185704.html

上一篇 2021年11月4日

下一篇 2021年11月4日

登录后才能评论