Перейти к публикации

Starcd 3.26 ошибка при расчете на двух узлах Mpich Wsaeconnrefused Err


Рекомендованные сообщения

Итак, в продолжение задачи о расчете в кластере: см. ветку http://fsapr2000.ru/index.php?show...mp;#entry114905, получили следующую ошибку: mpich wsaeconnrefused error.

Конечно mpich не настраивал, хотелось бы узнать мнения гуру, почему так происходит??

Ссылка на сообщение
Поделиться на других сайтах


Может быть именно потому, что MPICH не настраивали, а? :wink:

Там же все подробно описано в FAQ, единственный тонкий момент там только в том, что Simple file sharing надо отключать ДО установки.

Ссылка на сообщение
Поделиться на других сайтах

Это вы вообще к чему?

И я так и не понял, почему сложно было настроить MPICH? Неужели так тяжко набрать на двух машинах в командной строке mpiregister?

Ссылка на сообщение
Поделиться на других сайтах

Да нет, почему же тяжко, конечно нет....занабирался весь уже....И у юзера права доменного админа, а толку пока никакого....По поводу комплектаций машин - ошибочка вышла, просто star-cd не понравилось, что задача лежит на системном диске, почему-то....В итоге получили следующую картину:

Star-CD 3.26, WinXP64, менеджер лицензий поднят на одной из машин, при расчете на одном узле (даже в многопроцессорном режиме), вопросов нет...все считается (по крайней мере туториалы), а при попытке расчета на 2 узлах, даже в однопроцессорном режиме, вылетает ошибка....

Конфигурация XP - идентичная (образ с одной залит на винт другой и вторая машина введена в домен под своим именем). Star-CD устанавливался индивидуально, mpiregister был выполнен до начала расчетов. Надо ли редактировать файлы каталога %stardir%\etc?

Ссылка на сообщение
Поделиться на других сайтах

0. Файрвол отключить совсем!

1. Как я уже говорил, Simple file sharing (Простой общий доступ) отключен? Отключен ДО установки Star-CD?

2. Какая реакция mpich на регистрацию? Т.е. проверить, а зарегестрилось ли - набрать

mpiregister -validate -host <имя>

Проверить соответственно а) на той машине где набираем, б) с одной машины на другую

3. У юзера в имени и пароле нет русских букв? Он нормально получает доступ с одной машины к расшареным папкам другой? Расшаренные папки с именем star326 на машинах есть, с доступом к ним все нормально?

4. Менеджер лицензий поднят на одной из машин. На второй при этом запускается локальный расчет? Т.е. она реально видит этот менеджер лицензий?

5. Если ничего не помогло, попробовать в файле hosts на обеих машинах прописать их адреса и имена

Изменено пользователем Lynx
Ссылка на сообщение
Поделиться на других сайтах

1. Simple file sharing (Простой общий доступ) отключен, ДО установки Star-CD на первой машине, соответственно на второй, я так понимаю, он и не включался.

2. mpiregister -validate -host <имя> дает ответ, что все нормально и к локальной машине и к удаленной (gr-001 и gr-002 соответственно).

3. Юзер без русских букв. В пароле правда присутствуют и заглавные и прописные буквы...Играет роль??

4. Локально расчет идет на обеих машинах. На менеджере лицензий, в логе, видно, как отдаются и возвращаются лицензии.

5. вот по пятому пункту - в ПН попробую....

Есть еще предложения??

Благодарен за ответ, спасибо...:-))

По поводу файера - так он вырублен как служба.

Изменено пользователем feda_z
Ссылка на сообщение
Поделиться на других сайтах

Не знаю как StarCD, но c CFX у меня была проблема, MPICH не видел файла hosts.ccl

Тогда для работы необходимо скопировать полученный файл «hosts.ccl» из папки

«C:\Program Files\Ansys Inc\CFX\CFX-10.0\config»

в папку

«C:\Documents and Settings\UserName\.cfx»

Ссылка на сообщение
Поделиться на других сайтах

Ну еще до кучи - проверить все-таки, как там с расшаренными папками star326 (бывает такой глюк при установке, что они не расшариваются), убедиться что MPICH Daemon запущен на момент запуска расчета, проверить системные логи на предмет ошибок в сетевых службах...

Но вообще если mpiregister -validate работает с одной машины на другую, то это уже подозрительно. Если не помогут пляски с файлом hosts, то скорее всего дело в WinXP64, так как она официально не поддерживается

Изменено пользователем Lynx
Ссылка на сообщение
Поделиться на других сайтах
  • 2 недели спустя...

Вот только освободился и смог проверить варианты. Никакие рекомендации не помогли. Все по-прежнему. Локально - на всех четырех процах. При запуски их кластера - ошибка. Могу прислать логи. Есть возможность посмотреть?? может все-же виновато mpi?? Ибо вот такая ошибка:

easy connect failed: MPIRunLaunch Process: Connect to <hostname> failed, error 10061

Заранее спасибо за ответы.

p/s кстати, расшарка star326 создается автоматически, без каких-либо усилий с моей стороны. mpi служба работает постоянно mpiregister -validate - проходит без проблем и локально, и на удаленной тачке.

В файле hosts забиты все ip и имена машин участвующих в этом безобразии...

В чем же дело...:-(

Изменено пользователем feda_z
Ссылка на сообщение
Поделиться на других сайтах

Ну можно еще попробовать поставить вместо MPICH 1.2.5 (который идет со Star-CD) MPICH 2.x.

Ссылка на сообщение
Поделиться на других сайтах
  • 3 месяца спустя...

Выкладываю лог ошибки

STAR 3.26.000 [Victoria_171w]: windows_5.0-absoft_8.2-dso

RUNNING, CASENAME: star

Error 64, process 0, host TEST3:

GetQueuedCompletionStatus failed for socket 1 connected to host '128.254.9.18 1' E:\>cscript.exe //nologo \\test4\star326\bin\unmount.vbs D:

G:\>cscript.exe //nologo \\test4\star326\bin\unmount.vbs E:

G:\>cscript.exe //nologo \\test4\star326\bin\unmount.vbs G: process 0 on test3 exited without calling MPIFinalize Sending kill commands to launched processes process 1 on test4 exited without calling MPIFinalize PNP: Shutdown [2007-01-12-13:23:03] Execution aborted by request (SIGABRT) af ter 129 seconds (TOTAL ELAPSED TIME).

Прочитал, что данная бага связана с реализацией mpich и несовместимостью с WinXP SP2. Что-то про ограничение количества одновременных подключений. Данное ограничение снимается редактированием реестра и системного файла...Отредактировал....Результат - см. лог выше....

Ссылка на сообщение
Поделиться на других сайтах

Если нет желания переходить на Linux, то можно попробовать еще несколько вещей.

1. Проверить тщательно все железо - память Memtest'ом и т.д. Star-CD очень чувствителен к мелким "железным" глюкам, которые на работе всего остального могут и не отражаться.

2. Попробовать все-таки MPICH 2.x

3. По крайней мере раньше на сайте MPICH были всякие тестовые программки, можно попробовать их позапускать. Или какие-нибудь параллельные бенчмарки. В общем, что-нибудь отличное от Star-CD, но работающее через MPICH

4. Попробовать поставить вместо WinXP64 обычную WinXP

В общем смысл всего этого - как-то локализовать проблему

Ссылка на сообщение
Поделиться на других сайтах

с локализацией проблемы кажется определились...Нашел ОС Win XP Professional 32 bit без SP. Что удивительно, все работает. Как и под Windows 2000. Что касается SP2, то тут мне кажется, правда мелкомягкие постарались...Просматривал патчи и увидел многое интересное, особенно это касается ограничения по запуску rsh, способа доступа к сетевым расшаркам, и т.д.....Короче всему виной SP2. (Теперь вот ломаю голову где найти Win XP64-bit без интегрированного SP2.) Спасибки, просветили что такого пока еще нет.

Что касается использования mpich 2.0, то это мне достаточно сложно реализовать, так как в этом случае требуется точно отредактировать файл запуска Star-CD "star", в котором нужно заменить и команду mpirun на соответствующую аналогичной в mpich2 и к чему это приведет - не знаю....Попробовал, но результат - ошибки...

Изменено пользователем feda_z
Ссылка на сообщение
Поделиться на других сайтах

> Короче всему виной SP2. Теперь вот ломаю голову где найти Win XP64-bit без интегрированного SP2.

А ХР64 без SP2 вообще существует в природе?

Ссылка на сообщение
Поделиться на других сайтах

Да...я же не сказал....видимо, опираясь на опыт внедрения SP2 в Windows 32-bit, В Windows 64-bit Edition, Microsoft изначально ввел ограничения не позволяющие запускать кластер под Star-CD.

Кстати, народ, может кто-нибудь подсказать, в чем написан скрипт запускающий Star-CD??

Изменено пользователем feda_z
Ссылка на сообщение
Поделиться на других сайтах

Присоединяйтесь к обсуждению

Вы можете опубликовать сообщение сейчас, а зарегистрироваться позже. Если у вас есть аккаунт, войдите в него для написания от своего имени.
Примечание: вашему сообщению потребуется утверждение модератора, прежде чем оно станет доступным.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.

  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу.




  • Сообщения

    • Dimetil Gidrozin Dnepr
      куда пропал твой парень? с ним в паре вы замечательно смотрелись и ты был гораздо круче спасибо. я уже с автором темы связался он мне ссылок дал и где качать и как ставить. понту мне смотреть то чего у меня нет)) я поставлю то что он мне дал и посмотрю по нему. он видеоуроки пишет. норм чувак кста
    • IgorT
      Да че там хорошего? По мне уже то, что нет возможности выбрать плоскость симметрии напряг.
    • AlexKaz
      А если сделать такой финт: есть два тела, на телах две площадки с одинаковой сеткой. Что будет, если создать много RBE2 от площадки к площадке, но каждый RBE2 связывает только 1 узел на первой площадке с 1 узлом на второй (а не несколько узлов с одним узлом)? По логике вещей, получается аналог нескольких простых MPC узел в узел, т.е. для каждой пары узлов с разных площадок имеем Ux1-Ux2=0, Uy1-Uy2=0, Uz1-Uz2=0. Т.е. получим деформируемые границы площадок (вместо абсл. жёстких), но "сшитые" попарно по площадкам узлы, и попарные узлы на площадках должны перемещаться на одинаковое расстояние. Или нет?
    • Anat2015
      Не путайте модель станка и модель ЧПУ. Синумерик - это ЧПУ, у вас точно ЧПУ Sinumerik SN-770, или это все таки название станка, не встречал, чтобы Сименс станки делал. Определитесь с точным названием УЧПУ.   Теоретически, да, но можно и с внешнего инструмента (ноутбука) а процесс восстановления привязан к модели ЧПУ. Только arc. (архив) бывает разный, могут быть отдельно архивы NCU, PLC, HMI, а может быть объединенный. Где батарейка, какие настройки вы имеете ввиду? Может и архивы не надо восстановливать? Подробнее опишите свои проблемы.
    • ID_Hacker
      Бывает на пульте кнопка, бывает М командами откидывается. Если заходите в меню измерения инструмента в режиме Jog, возможно надо выбрать параметры измерения и нажать "Цикл старт" Вариантов реализации много, и без осмотра подсказать практически нереально. Вы вообще уверены, что у вас моторизированная рука, а не откидываемая руками? Правильно вам пишут - необходимо смотреть в руководстве пользователя станка. Если нет руководства, просить поставщика, производителя. Ну а если уже совсем край, искать специалиста, готового провести исследование и возможно пусконаладку.
    • Мрачный
      Компас напоминает в своих способностях SW 2001-2006 г. Очень во многих местах. А вот с зеркальными деталями-сборками там вроде бы все весьма неплохо, гораздо лучше чем в SW. Вот такое неоднозначие...
    • maxx2000
      там посыл скорее про оформление чертежей согласно ГОСТ Айтишники и манагеры. Что с них взять. 1 семестр начерталки и 1 семестр инженерной графики, если не всё вместе, на отстань в каком нить педагогическом или аграрном вузе
    • brigval
      Заложено, но на усмотрение пользователя. К сожалению.
    • Ветерок
      Хочешь сказать, что разработчики Компаса не знают начерталку? Это же должно быть заложено в программу.
    • gudstartup
      бывает что и не в нуле если в 1240 что то записано 
×
×
  • Создать...