Таймаут при ожидании завершения процессов. Это может вызываться дефектной
программой rsh (Некоторые версии Kerberos rsh имеют эту проблему).
Это не проблема P4 или mpich, а проблема операционной среды. Для многихЧто это означает?
приложений эта проблема замедляет прекращение процессов.
О: Если что-либо вызывает завершение MPI_Finalize за время более, чем 5 минут, в этом подозревается реализация rsh. rsh, используемая в некоторых инсталляциях Kerberos предполагает, что sizeof (FD_SET) == sizeof (int). Это означает, что программа rsh предполагает, что наибольшее значение FD это 32. Если программа использует fork для создания процессов, которые запускают rsh с поддержкой stdin, stdout, и stderr порожденных процессов, это предположение неверно, поскольку FD, которые rsh создает для сокета, могут быть > 31, если запущено достаточно много процессов. При использовании такой неисправной реализации rsh симптомом является то, что задача никогда не завершается, поскольку задачи rsh ждут (благодаря select) закрытия сокета.
Устройство ch_p4mpd исключает эту проблему.