Перейти к публикации

Starcd 3.26 ошибка при расчете на двух узлах Mpich Wsaeconnrefused Err


Рекомендованные сообщения

Итак, в продолжение задачи о расчете в кластере: см. ветку http://fsapr2000.ru/index.php?show...mp;#entry114905, получили следующую ошибку: mpich wsaeconnrefused error.

Конечно mpich не настраивал, хотелось бы узнать мнения гуру, почему так происходит??

Ссылка на сообщение
Поделиться на других сайтах


Может быть именно потому, что MPICH не настраивали, а? :wink:

Там же все подробно описано в FAQ, единственный тонкий момент там только в том, что Simple file sharing надо отключать ДО установки.

Ссылка на сообщение
Поделиться на других сайтах

Это вы вообще к чему?

И я так и не понял, почему сложно было настроить MPICH? Неужели так тяжко набрать на двух машинах в командной строке mpiregister?

Ссылка на сообщение
Поделиться на других сайтах

Да нет, почему же тяжко, конечно нет....занабирался весь уже....И у юзера права доменного админа, а толку пока никакого....По поводу комплектаций машин - ошибочка вышла, просто star-cd не понравилось, что задача лежит на системном диске, почему-то....В итоге получили следующую картину:

Star-CD 3.26, WinXP64, менеджер лицензий поднят на одной из машин, при расчете на одном узле (даже в многопроцессорном режиме), вопросов нет...все считается (по крайней мере туториалы), а при попытке расчета на 2 узлах, даже в однопроцессорном режиме, вылетает ошибка....

Конфигурация XP - идентичная (образ с одной залит на винт другой и вторая машина введена в домен под своим именем). Star-CD устанавливался индивидуально, mpiregister был выполнен до начала расчетов. Надо ли редактировать файлы каталога %stardir%\etc?

Ссылка на сообщение
Поделиться на других сайтах

0. Файрвол отключить совсем!

1. Как я уже говорил, Simple file sharing (Простой общий доступ) отключен? Отключен ДО установки Star-CD?

2. Какая реакция mpich на регистрацию? Т.е. проверить, а зарегестрилось ли - набрать

mpiregister -validate -host <имя>

Проверить соответственно а) на той машине где набираем, б) с одной машины на другую

3. У юзера в имени и пароле нет русских букв? Он нормально получает доступ с одной машины к расшареным папкам другой? Расшаренные папки с именем star326 на машинах есть, с доступом к ним все нормально?

4. Менеджер лицензий поднят на одной из машин. На второй при этом запускается локальный расчет? Т.е. она реально видит этот менеджер лицензий?

5. Если ничего не помогло, попробовать в файле hosts на обеих машинах прописать их адреса и имена

Изменено пользователем Lynx
Ссылка на сообщение
Поделиться на других сайтах

1. Simple file sharing (Простой общий доступ) отключен, ДО установки Star-CD на первой машине, соответственно на второй, я так понимаю, он и не включался.

2. mpiregister -validate -host <имя> дает ответ, что все нормально и к локальной машине и к удаленной (gr-001 и gr-002 соответственно).

3. Юзер без русских букв. В пароле правда присутствуют и заглавные и прописные буквы...Играет роль??

4. Локально расчет идет на обеих машинах. На менеджере лицензий, в логе, видно, как отдаются и возвращаются лицензии.

5. вот по пятому пункту - в ПН попробую....

Есть еще предложения??

Благодарен за ответ, спасибо...:-))

По поводу файера - так он вырублен как служба.

Изменено пользователем feda_z
Ссылка на сообщение
Поделиться на других сайтах

Не знаю как StarCD, но c CFX у меня была проблема, MPICH не видел файла hosts.ccl

Тогда для работы необходимо скопировать полученный файл «hosts.ccl» из папки

«C:\Program Files\Ansys Inc\CFX\CFX-10.0\config»

в папку

«C:\Documents and Settings\UserName\.cfx»

Ссылка на сообщение
Поделиться на других сайтах

Ну еще до кучи - проверить все-таки, как там с расшаренными папками star326 (бывает такой глюк при установке, что они не расшариваются), убедиться что MPICH Daemon запущен на момент запуска расчета, проверить системные логи на предмет ошибок в сетевых службах...

Но вообще если mpiregister -validate работает с одной машины на другую, то это уже подозрительно. Если не помогут пляски с файлом hosts, то скорее всего дело в WinXP64, так как она официально не поддерживается

Изменено пользователем Lynx
Ссылка на сообщение
Поделиться на других сайтах
  • 2 недели спустя...

Вот только освободился и смог проверить варианты. Никакие рекомендации не помогли. Все по-прежнему. Локально - на всех четырех процах. При запуски их кластера - ошибка. Могу прислать логи. Есть возможность посмотреть?? может все-же виновато mpi?? Ибо вот такая ошибка:

easy connect failed: MPIRunLaunch Process: Connect to <hostname> failed, error 10061

Заранее спасибо за ответы.

p/s кстати, расшарка star326 создается автоматически, без каких-либо усилий с моей стороны. mpi служба работает постоянно mpiregister -validate - проходит без проблем и локально, и на удаленной тачке.

В файле hosts забиты все ip и имена машин участвующих в этом безобразии...

В чем же дело...:-(

Изменено пользователем feda_z
Ссылка на сообщение
Поделиться на других сайтах

Ну можно еще попробовать поставить вместо MPICH 1.2.5 (который идет со Star-CD) MPICH 2.x.

Ссылка на сообщение
Поделиться на других сайтах
  • 3 месяца спустя...

Выкладываю лог ошибки

STAR 3.26.000 [Victoria_171w]: windows_5.0-absoft_8.2-dso

RUNNING, CASENAME: star

Error 64, process 0, host TEST3:

GetQueuedCompletionStatus failed for socket 1 connected to host '128.254.9.18 1' E:\>cscript.exe //nologo \\test4\star326\bin\unmount.vbs D:

G:\>cscript.exe //nologo \\test4\star326\bin\unmount.vbs E:

G:\>cscript.exe //nologo \\test4\star326\bin\unmount.vbs G: process 0 on test3 exited without calling MPIFinalize Sending kill commands to launched processes process 1 on test4 exited without calling MPIFinalize PNP: Shutdown [2007-01-12-13:23:03] Execution aborted by request (SIGABRT) af ter 129 seconds (TOTAL ELAPSED TIME).

Прочитал, что данная бага связана с реализацией mpich и несовместимостью с WinXP SP2. Что-то про ограничение количества одновременных подключений. Данное ограничение снимается редактированием реестра и системного файла...Отредактировал....Результат - см. лог выше....

Ссылка на сообщение
Поделиться на других сайтах

Если нет желания переходить на Linux, то можно попробовать еще несколько вещей.

1. Проверить тщательно все железо - память Memtest'ом и т.д. Star-CD очень чувствителен к мелким "железным" глюкам, которые на работе всего остального могут и не отражаться.

2. Попробовать все-таки MPICH 2.x

3. По крайней мере раньше на сайте MPICH были всякие тестовые программки, можно попробовать их позапускать. Или какие-нибудь параллельные бенчмарки. В общем, что-нибудь отличное от Star-CD, но работающее через MPICH

4. Попробовать поставить вместо WinXP64 обычную WinXP

В общем смысл всего этого - как-то локализовать проблему

Ссылка на сообщение
Поделиться на других сайтах

с локализацией проблемы кажется определились...Нашел ОС Win XP Professional 32 bit без SP. Что удивительно, все работает. Как и под Windows 2000. Что касается SP2, то тут мне кажется, правда мелкомягкие постарались...Просматривал патчи и увидел многое интересное, особенно это касается ограничения по запуску rsh, способа доступа к сетевым расшаркам, и т.д.....Короче всему виной SP2. (Теперь вот ломаю голову где найти Win XP64-bit без интегрированного SP2.) Спасибки, просветили что такого пока еще нет.

Что касается использования mpich 2.0, то это мне достаточно сложно реализовать, так как в этом случае требуется точно отредактировать файл запуска Star-CD "star", в котором нужно заменить и команду mpirun на соответствующую аналогичной в mpich2 и к чему это приведет - не знаю....Попробовал, но результат - ошибки...

Изменено пользователем feda_z
Ссылка на сообщение
Поделиться на других сайтах

> Короче всему виной SP2. Теперь вот ломаю голову где найти Win XP64-bit без интегрированного SP2.

А ХР64 без SP2 вообще существует в природе?

Ссылка на сообщение
Поделиться на других сайтах

Да...я же не сказал....видимо, опираясь на опыт внедрения SP2 в Windows 32-bit, В Windows 64-bit Edition, Microsoft изначально ввел ограничения не позволяющие запускать кластер под Star-CD.

Кстати, народ, может кто-нибудь подсказать, в чем написан скрипт запускающий Star-CD??

Изменено пользователем feda_z
Ссылка на сообщение
Поделиться на других сайтах

Присоединяйтесь к обсуждению

Вы можете опубликовать сообщение сейчас, а зарегистрироваться позже. Если у вас есть аккаунт, войдите в него для написания от своего имени.
Примечание: вашему сообщению потребуется утверждение модератора, прежде чем оно станет доступным.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.

  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу.




  • Сообщения

    • mev13
      Может ведомость упаковки?  Тогда указана форма рекомендуемая в ГОСТ В 20.39.308
    • Greenston
      Привет! По идее, реально. Ведь 800 цикл аналог мазаковского, хоть и выглядит немного по-другому. Но лучше править с фануковского поста, проще. Пример трансформации Мазака: G68.2 X15.1027 Y-26.1587 Z-32.4463 I30.0 J55.0 K-90.0 G53.1
    • Greenston
      с большой долей вероятности надо править постпроцессор. Стойку такую не слыхал даже)
    • Мрачный
      Прям как дети... https://hh.ru/vacancy/95765023 Joymechanix, Москва, Калужская, улица Бутлерова, 17Б от 1 300 до 2 000 $ на руки
    • mactepnew
      Так я конкретно расписал, что мне не понравилось. Вам всерьез нравится панель измерений? Например то, что нужно каждый раз выбирать направление измерения, если выбрана плоская поверхность и точка.  И два меню настроек тоже нравятся?  А, есть же еще третье. Где две команды: И несколько меню свойств объекта - это тоже нормально? Settings, Edit, Edit text и Properties. Хотя у Крео тоже их два... Или то, что в эскизе может быть избыток ограничений, которое NX может поначалу игнорировать, а в какой-то момент сам отменить какие-то из них и сделать из эскиза каля-маля. Крео такого не позволяет. Кнопка Create persistent relations регулярно отключается сама по себе. А как вручную удалить одно из ограничений я так и не понял. NX пишет: click to relax. Кликал всеми семью кнопками со всеми комбинациями Shift, Ctrl и Alt - оно не удаляется.    Да, к Крео у меня тоже были претензии поначалу, но всё равно он раз в 10 быстрее и намного дружественнее. В NX можно перенести размеры из 3D на чертеж?    Простите, если это уже оффтоп, но просто вот эта кривая логика ломает мне мозг.
    • Greenston
      в 2016-2017 версии FC было доступно много постов (потом их убрали). Их можно найти +- тут: \Program Files\Delcam\FeatureCAM 2016\Posts\Mill\5-Axis В том числе и на дмг. Ну без гарантий, канеш
    • Alexey8107
      Да, я написал При этом, после сбоя не помогает возврат в реф. А если задать систему координат заготовки то корректоры на инструмент становятся неверными. Возможно бред, но примерно так и есть. С другими станками такой проблемы нет. А с этим почему то каждый раз.
    • BSV1
      Еще забыли сообщить, где такое счастье расположено и как туды написАть.    ЗЫ И еще бы поменьше пионерского задора.
    • Greenston
      @Beliko у Вас пост написан на 2 канала (видимо, на 2 револьверные головы). Каждый канал чаще всего постпроцессируется в отдельный файл уп (но бывает и в один файл, как на Окумах). Надо либо пост править в 1 канал, либо искать одноканальный пост. И вообще лучше сначала спросить, на станке 1 револьверная голова?
    • maxx2000
      @ANT0N1DZE держи недостающее, выбери на свой вкус 
×
×
  • Создать...