Перейти к публикации

Starcd 3.26 ошибка при расчете на двух узлах Mpich Wsaeconnrefused Err


Рекомендованные сообщения

Итак, в продолжение задачи о расчете в кластере: см. ветку http://fsapr2000.ru/index.php?show...mp;#entry114905, получили следующую ошибку: mpich wsaeconnrefused error.

Конечно mpich не настраивал, хотелось бы узнать мнения гуру, почему так происходит??

Ссылка на сообщение
Поделиться на других сайтах


Может быть именно потому, что MPICH не настраивали, а? :wink:

Там же все подробно описано в FAQ, единственный тонкий момент там только в том, что Simple file sharing надо отключать ДО установки.

Ссылка на сообщение
Поделиться на других сайтах

Это вы вообще к чему?

И я так и не понял, почему сложно было настроить MPICH? Неужели так тяжко набрать на двух машинах в командной строке mpiregister?

Ссылка на сообщение
Поделиться на других сайтах

Да нет, почему же тяжко, конечно нет....занабирался весь уже....И у юзера права доменного админа, а толку пока никакого....По поводу комплектаций машин - ошибочка вышла, просто star-cd не понравилось, что задача лежит на системном диске, почему-то....В итоге получили следующую картину:

Star-CD 3.26, WinXP64, менеджер лицензий поднят на одной из машин, при расчете на одном узле (даже в многопроцессорном режиме), вопросов нет...все считается (по крайней мере туториалы), а при попытке расчета на 2 узлах, даже в однопроцессорном режиме, вылетает ошибка....

Конфигурация XP - идентичная (образ с одной залит на винт другой и вторая машина введена в домен под своим именем). Star-CD устанавливался индивидуально, mpiregister был выполнен до начала расчетов. Надо ли редактировать файлы каталога %stardir%\etc?

Ссылка на сообщение
Поделиться на других сайтах

0. Файрвол отключить совсем!

1. Как я уже говорил, Simple file sharing (Простой общий доступ) отключен? Отключен ДО установки Star-CD?

2. Какая реакция mpich на регистрацию? Т.е. проверить, а зарегестрилось ли - набрать

mpiregister -validate -host <имя>

Проверить соответственно а) на той машине где набираем, б) с одной машины на другую

3. У юзера в имени и пароле нет русских букв? Он нормально получает доступ с одной машины к расшареным папкам другой? Расшаренные папки с именем star326 на машинах есть, с доступом к ним все нормально?

4. Менеджер лицензий поднят на одной из машин. На второй при этом запускается локальный расчет? Т.е. она реально видит этот менеджер лицензий?

5. Если ничего не помогло, попробовать в файле hosts на обеих машинах прописать их адреса и имена

Изменено пользователем Lynx
Ссылка на сообщение
Поделиться на других сайтах

1. Simple file sharing (Простой общий доступ) отключен, ДО установки Star-CD на первой машине, соответственно на второй, я так понимаю, он и не включался.

2. mpiregister -validate -host <имя> дает ответ, что все нормально и к локальной машине и к удаленной (gr-001 и gr-002 соответственно).

3. Юзер без русских букв. В пароле правда присутствуют и заглавные и прописные буквы...Играет роль??

4. Локально расчет идет на обеих машинах. На менеджере лицензий, в логе, видно, как отдаются и возвращаются лицензии.

5. вот по пятому пункту - в ПН попробую....

Есть еще предложения??

Благодарен за ответ, спасибо...:-))

По поводу файера - так он вырублен как служба.

Изменено пользователем feda_z
Ссылка на сообщение
Поделиться на других сайтах

Не знаю как StarCD, но c CFX у меня была проблема, MPICH не видел файла hosts.ccl

Тогда для работы необходимо скопировать полученный файл «hosts.ccl» из папки

«C:\Program Files\Ansys Inc\CFX\CFX-10.0\config»

в папку

«C:\Documents and Settings\UserName\.cfx»

Ссылка на сообщение
Поделиться на других сайтах

Ну еще до кучи - проверить все-таки, как там с расшаренными папками star326 (бывает такой глюк при установке, что они не расшариваются), убедиться что MPICH Daemon запущен на момент запуска расчета, проверить системные логи на предмет ошибок в сетевых службах...

Но вообще если mpiregister -validate работает с одной машины на другую, то это уже подозрительно. Если не помогут пляски с файлом hosts, то скорее всего дело в WinXP64, так как она официально не поддерживается

Изменено пользователем Lynx
Ссылка на сообщение
Поделиться на других сайтах
  • 2 недели спустя...

Вот только освободился и смог проверить варианты. Никакие рекомендации не помогли. Все по-прежнему. Локально - на всех четырех процах. При запуски их кластера - ошибка. Могу прислать логи. Есть возможность посмотреть?? может все-же виновато mpi?? Ибо вот такая ошибка:

easy connect failed: MPIRunLaunch Process: Connect to <hostname> failed, error 10061

Заранее спасибо за ответы.

p/s кстати, расшарка star326 создается автоматически, без каких-либо усилий с моей стороны. mpi служба работает постоянно mpiregister -validate - проходит без проблем и локально, и на удаленной тачке.

В файле hosts забиты все ip и имена машин участвующих в этом безобразии...

В чем же дело...:-(

Изменено пользователем feda_z
Ссылка на сообщение
Поделиться на других сайтах

Ну можно еще попробовать поставить вместо MPICH 1.2.5 (который идет со Star-CD) MPICH 2.x.

Ссылка на сообщение
Поделиться на других сайтах
  • 3 месяца спустя...

Выкладываю лог ошибки

STAR 3.26.000 [Victoria_171w]: windows_5.0-absoft_8.2-dso

RUNNING, CASENAME: star

Error 64, process 0, host TEST3:

GetQueuedCompletionStatus failed for socket 1 connected to host '128.254.9.18 1' E:\>cscript.exe //nologo \\test4\star326\bin\unmount.vbs D:

G:\>cscript.exe //nologo \\test4\star326\bin\unmount.vbs E:

G:\>cscript.exe //nologo \\test4\star326\bin\unmount.vbs G: process 0 on test3 exited without calling MPIFinalize Sending kill commands to launched processes process 1 on test4 exited without calling MPIFinalize PNP: Shutdown [2007-01-12-13:23:03] Execution aborted by request (SIGABRT) af ter 129 seconds (TOTAL ELAPSED TIME).

Прочитал, что данная бага связана с реализацией mpich и несовместимостью с WinXP SP2. Что-то про ограничение количества одновременных подключений. Данное ограничение снимается редактированием реестра и системного файла...Отредактировал....Результат - см. лог выше....

Ссылка на сообщение
Поделиться на других сайтах

Если нет желания переходить на Linux, то можно попробовать еще несколько вещей.

1. Проверить тщательно все железо - память Memtest'ом и т.д. Star-CD очень чувствителен к мелким "железным" глюкам, которые на работе всего остального могут и не отражаться.

2. Попробовать все-таки MPICH 2.x

3. По крайней мере раньше на сайте MPICH были всякие тестовые программки, можно попробовать их позапускать. Или какие-нибудь параллельные бенчмарки. В общем, что-нибудь отличное от Star-CD, но работающее через MPICH

4. Попробовать поставить вместо WinXP64 обычную WinXP

В общем смысл всего этого - как-то локализовать проблему

Ссылка на сообщение
Поделиться на других сайтах

с локализацией проблемы кажется определились...Нашел ОС Win XP Professional 32 bit без SP. Что удивительно, все работает. Как и под Windows 2000. Что касается SP2, то тут мне кажется, правда мелкомягкие постарались...Просматривал патчи и увидел многое интересное, особенно это касается ограничения по запуску rsh, способа доступа к сетевым расшаркам, и т.д.....Короче всему виной SP2. (Теперь вот ломаю голову где найти Win XP64-bit без интегрированного SP2.) Спасибки, просветили что такого пока еще нет.

Что касается использования mpich 2.0, то это мне достаточно сложно реализовать, так как в этом случае требуется точно отредактировать файл запуска Star-CD "star", в котором нужно заменить и команду mpirun на соответствующую аналогичной в mpich2 и к чему это приведет - не знаю....Попробовал, но результат - ошибки...

Изменено пользователем feda_z
Ссылка на сообщение
Поделиться на других сайтах

> Короче всему виной SP2. Теперь вот ломаю голову где найти Win XP64-bit без интегрированного SP2.

А ХР64 без SP2 вообще существует в природе?

Ссылка на сообщение
Поделиться на других сайтах

Да...я же не сказал....видимо, опираясь на опыт внедрения SP2 в Windows 32-bit, В Windows 64-bit Edition, Microsoft изначально ввел ограничения не позволяющие запускать кластер под Star-CD.

Кстати, народ, может кто-нибудь подсказать, в чем написан скрипт запускающий Star-CD??

Изменено пользователем feda_z
Ссылка на сообщение
Поделиться на других сайтах

Присоединяйтесь к обсуждению

Вы можете опубликовать сообщение сейчас, а зарегистрироваться позже. Если у вас есть аккаунт, войдите в него для написания от своего имени.
Примечание: вашему сообщению потребуется утверждение модератора, прежде чем оно станет доступным.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.

  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу.




×
×
  • Создать...