Работал с MPICH2, но в объеме пары курсовиков всего. Там довольно просто взаимодействие процессов организуется, главное чтобы вычисления распараллеливалась и обмена данными мещду процессами по сети было поменьше. Встроенных возможностей для перераспределения нагрузки я не видел, зато в алгоритмах была время от времени синхронизация и в результате все процессы просто ждали бы того который замедлился.