-
mappy:一款模拟Python Hadoop MapReduce调度器的工具
资源介绍
映射
mappy是 Hadoop MapReduce 调度程序的重新实现,旨在展示 并突出该技术的优势。 mappy的作业调度器相当于 Hadoop 的,它重新实现了 Hadoop Java 实现中的 3 个类提供的功能:JobImpl、TaskImpl 和 TaskAttemptImpl。 这 3 个类中的每一个都实现了一个事件驱动的状态机,并共同构成了 Hadoop 作业调度程序及其故障处理的核心。 每个状态机都是通过指定可以可视化为转换表的内容来定义的。 实现明确指定每个转换具有开始状态、结束状态、触发事件和转换动作。 可以在以下位置找到为每个类实现的“转换表”:
每个转换动作本身都是作为一个嵌套类实现的,它具有一个成员函数transition ,它定义了动作的主体。 是一个相对的操作示例,其中 、 和显示了 3 个几乎相同的转换。
mappy重新实现了 JobImpl.java