Перейти к публикации

CFX + Windows 2008R2 + кластер


Рекомендованные сообщения

Здравствуйте, такая проблема, мучаюсь уже 2й месяц. Имеется машина: IBM, 4 проца по 12 ядер. 130гб ОЗУ, ССД 250гб. + ко всему этому рабочие станции с win7x64. Возникла сильная необходимость в кластере =) Нашел ветку на этом форуме <noindex>http://fsapr2000.ru/index.php?showtopic=15178</noindex> где описывается параллелизация. Все достаточно просто, но у меня не запахало в итоге =) Но суть не в этом. На IBM поставил win2008r2, поставил 14й ансис. Запускаю локал параллел задачу в CFX и солвер просто висит. На ядра вроде бъет, но появляется заголовок Solve и он дальше молчит и ничего не делает. Не пойму почему так, на тачках с семеркой локал параллел естественно нормально работает.. а здесь - нет. обращаюсь к коммунити за помощью:

1. Как заставить работать все ядра (на сколько потянет лицуха) в cfx на IBM машине

2. Грамотно развернуть кластер с головным узлом IBM и рабочими станциями на win7x64.

Спасибо заранее. Сам уже не знаю куда копать.

Ссылка на сообщение
Поделиться на других сайтах
  • 3 недели спустя...


Алексей Шмаков

1. По фотографии не лечим :), приложите пожалуйста .out файл. Возможно на команде Solve зависает, чтобы Вы могли ввести логин/пароль для планировщика задач MS Windows HPC Server 2008R2, а это окно скрыто за остальными окнами на рабочем столе (если используете MS MPI). А если Platform Computing MPI (PC MPI), то надо тоже сохранить логин/пароль, согласно инструкции в ветке указанной Вами ранее.

2. Чтобы грамотно развернуть кластер надо соеденить отдельной высокоскоростной сеткой сервер и рабочие станции под Win7. Нужна HPC редакция серверной ОС и далее в ней выполнить действия по созданию/настройке кластера.

3. Воспользоваться инструкциями из раздела помощи ниже, чтобы задачи из CFX Solver Manager отправлялись в планировщик задач кластера, а он бы уже выделял вычислительные ресурсы и лицензии ANSYS.

// Installation and Licensing Documentation // Configuring High Performance Computing Guide // Configuring ANSYS CFX Parallel // 2. ANSYS CFX Windows Parallel Setup // 2.3. Setting up and Running CCS 2003/HPC 2008

Учтя небольшие замечания к ней ниже.

Установить на главном узле кластера ANSYS CFX & ANSYS Workbench, расшарить C:\Program Files\ANSYS Inc как \\<HeadNodeName>\ANSYS Inc

далее выполнить установку на главном и вычислельных узлах согласно разделу помощи 4.1.3. Network Installation and Product Configuration, с той корректировкой, что команда будет

C:\Windows\Microsoft.NET\Framework\v2.0.50727\CasPol.exe -m -ag 1.2 -url file://"\\<HeadNodeName>\ANSYS Inc\*" FullTrust

расшарить рабочую директорию на главном узле, например C:\Users\<UserName> как \\<HeadNodeName>\<UserName>

при запуске на расчет в Define Run ввести FULL, Submit to Windows CCS or HPC Queue, кол-во ядер, рабочую директорию \\<HeadNodeName>\<UserName>

Заменить Installation Root в файле hostinfo.ccl на управляющем узле

Installation Root = \\HeadNodeName\ANSYS Inc\v140\CFX

P.S. Чтобы поменьше было проблем в 2008 сервере с Workbench, надо добавить его в доверенные узлы локальной сети (открыть Internet Explorer, настройки безопасности, локальная сеть/local intranet, кнопка узлы/sites, написать hostname главного узла, нажать добавить).

Ссылка на сообщение
Поделиться на других сайтах

Спасибо за развернутый ответ =) Тему можно считать не актуальной, т.к. поплевавшись с WinHPC Server и Win2008r2+HPC Pack, я поставил RHEL 6.2 (Red hat Linux Server Enterprise 6.2) и теперь очень рад =) Ансис встал сразу, cfx и fluent параллелятся тоже сразу на линуксе, в отличие от виндов..

В красной шляпе по умолчанию даже стоят 3 решателя - выбирай любй =))

От объединения в кластер головного IBM и станций с Вин7 отказался, т.к. сеть у меня обычная - 100мбс.. Будет только глючить и тормозить =)

Решил просто считать на серве в 48 ядер. + ко всему этому поставил SSD на 240гб.. на SSD - ансис и файлы проекта..

Теперь буду по Вашей инструкции мутить кластер среди рабочих станций по сети, без IBM машины..

Еще раз спасибо за мануал по HPC. Сохранил себе на комп.

Изменено пользователем ftanke
Ссылка на сообщение
Поделиться на других сайтах
  • 3 недели спустя...

Здравствуйте, такая проблема, мучаюсь уже 2й месяц. Имеется машина: IBM, 4 проца по 12 ядер. 130гб ОЗУ, ССД 250гб. + ко всему этому рабочие станции с win7x64. Возникла сильная необходимость в кластере =) Нашел ветку на этом форуме <noindex>http://fsapr2000.ru/index.php?showtopic=15178</noindex> где описывается параллелизация. Все достаточно просто, но у меня не запахало в итоге =) Но суть не в этом. На IBM поставил win2008r2, поставил 14й ансис. Запускаю локал параллел задачу в CFX и солвер просто висит. На ядра вроде бъет, но появляется заголовок Solve и он дальше молчит и ничего не делает. Не пойму почему так, на тачках с семеркой локал параллел естественно нормально работает.. а здесь - нет. обращаюсь к коммунити за помощью:

1. Как заставить работать все ядра (на сколько потянет лицуха) в cfx на IBM машине

2. Грамотно развернуть кластер с головным узлом IBM и рабочими станциями на win7x64.

Спасибо заранее. Сам уже не знаю куда копать.

У меня все работает, тока машина не IBM

Настраивал следующим образом:

1. Поставил английскую версию win2008r2 Enterprise+SP1

2. отключил полностью UAC в локальной политике безопасности

3. в настройках локальной политики безопасности: убрал усиления разрешений для внутренних системных объектов, разрешил анонимный доступ к именованным каналам-добавил С$, разрешил применение разрешения для всех к анонимным пользователям

4. отключил брандмауэр и DEP

5.Включил .net 3.5.1 в системе (Add Future)

6. поставил из под встроенного Administrator'a полностью (все модули) ансис с путями по умолчанию

7. поставил лицензию в которой количество лицензий на CFX превышает количество ядер на которых требуется осуществить запуск

8. перезагрузился

9. сложил в папку с английским путем без пробелов задачу StaticMixer и запустил на все доступные локально 64 ядра задачу, распараллелив локально с помощью Platform MPI Local Parallel

для запуска в распределенном режиме делал дополнительно после установки ансис следующее:

1. из папки C:\Program Files\ANSYS Inc\v140\commonfiles\MPI\Platform\8.1.2\Windows установил Platform-MPI-V8.01.02.02-20110907r с опцией "Platform MPI Libraries, tools and and service for Windows XP/2003/Vist/2008" все остальное по умолчанию. в конце согласился что бы сервис запустился немедленно. в настройках служб поставил в настройках сервиса немедленный перезапуск после сбоев (на всякий случай)

2. из папки C:\Program Files\ANSYS Inc\v140\commonfiles\MPI\Platform\8.1.2\Windows запустил setpcmpipassword.bat и набрал пароль текущего пользователя (Administrator)

3. поставил системную переменную CFX_SOLVE_DISABLE_REMOTE_CHECKS=T

4. перезагрузился

5. запустил cfx5parhosts -benchmark на обоих узлах

6. добавил информацию о первом вычислительном узле из файла hostinfo.ccl в аналогичный файл на втором, в файл на первом узле соответственно из файла на втором.перезапустил cfx для того что бы обновленная иноформаци в hostinfo.ccl была доступна в CFX

7. сложил в папку с английским путем без пробелов задачу StaticMixer и запустил на все доступные 128 ядер ( по 64 ядра локально на двух узлах) задачу, распараллелив с помощью Platform MPI Distribute Parallel

Примечания:

1. запускать и устанавливать rshd и mpich2 или hp-mpi как описанно в <noindex>http://fsapr2000.ru/index.php?showtopic=15178</noindex> не нужно под win2008r2 и win7 (в ансис 14 вместо hp-mpi используется pc-mpi)

2. сеть должна быть настроена-т.е. узлы должны пинговаться и быть видны друг другу. я обычно проверяю следующим образом адекватность настройки сети-подключаю сетевой диск к примеру на второй узел так \\node1\С$ и иду по сети со второго узла на первом в папку C:\windows\system32 и делаю там каталог-если каталог создан-сеть готова к употреблению с CFX

Не смотря на успешную настройку рапараллеливания испытываю серьезные проблемы с графикой на win server 2008r2 Enterprise+sp1.

А именно периодически CFXPre, CFXPost и Workbanch не запускаются или вылетают с ошибкой: "The NVIDA OpenGL driver lost connection with the dysplay driver and is unable to continue. the application must close. Error code:2 NVIDA OpenGL Driver".

Видео: ASUS Gforce GT 430

Драйвера:опробовал от 266.хх до 301.хх

Пробовал обновлять DirectХ

В системе включены: Desctop Expirience

Иногда проблема не возникает, иногда ни в какую не запускается. Температура видео низкая, тесты видео на OpenGL и DirectX различными утилитами проходят.

Аппаратное ускорение видео при установке драйверов видео-включил

Пробовал ставить на машину win7-все отлично работает без нареканий

Прошу помочь мне в решении описанной проблемы

Ссылка на сообщение
Поделиться на других сайтах

Присоединяйтесь к обсуждению

Вы можете опубликовать сообщение сейчас, а зарегистрироваться позже. Если у вас есть аккаунт, войдите в него для написания от своего имени.
Примечание: вашему сообщению потребуется утверждение модератора, прежде чем оно станет доступным.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.

  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу.




  • Сообщения

    • Anatlijj8
      Добрый день. Скажите сразу встроенная в солидворкс какая версия идёт?  Скажите как-то можно где-то скачать версию про?
    • Lev72rus
      Есть ли более свежая ссылка на видео? Похожая беда сейчас
    • bard
      Странно, как-то. Кто Вам разрешит отгружать изделия (не важно) какие по безлитерной документации? Кто Вам разрешит использовать в литерованном изделии безлитерные части? Если Вы приняли неверные технические решения, как Вы про это узнаете не проведя испытания?
    • vad0000
      Не важно, Не нужен output при зелёной и красной кнопки.
    • ispite
      Всем привет, спасибо за ответы, но просто так не удалось создать сборку, солид выдавал ошибку. Пришлось Сохранить как IGES (файл разросся до 920 МБ), потом открыл как деталь (в нейстало шустрее работать), нажал "создать сборку" и она создалась! НО она создалась без поверхностей, а они тоже нужны Всем привет, спасибо за ответы, но просто так не удалось создать сборку, солид выдавал ошибку. Пришлось Сохранить как IGES (файл разросся до 920 МБ), потом открыл как деталь (в ней появились Тела и Поверхности и стало шустрее работать), нажал "создать сборку" и она создалась! НО она создалась без поверхностей, а они тоже нужны. Как создать сборку с телами и поверхностями? Пробовал в детали сохранить поверхности, но оно как будто работает наоборот и все поверхности стирает.  PS удалите плз предыдущий ответ, я его случайно отправил.
    • Alexey8107
      Всем доброго дня. Имеется ивановский обрабатывающий центр ИС-800, в нем установлены: PSM-45HVi A06B-6120-H045 SPM-30HVi A06B-6121-H030#H550 Возникла авария 9030 Overcurrent in the converter input circuit. Если смотреть В-65285 в этом случае на PSM должна отображаться 1, а на SPM - 30. Так оно и есть на самом деле. Документ ссылается на пункт 3.1.1, в свою очередь этот пункт говорит о неисправности PSM и следует проверить Входящее питание. Скорее всего здесь имеется ввиду питание управления, оно 240 В и стабильно Рекомендуют проверить реактор. Сразу откидываем, т.к. дело до включения силового питания еще даже не доходит, МСС отключен. Да и реактор штатный, всю жизнь работал с этим реактором. Проверить IGBT. Проверить проверил как мог, на КЗ, но дело до силовухи еще не доходит, ее питания еще нет и физически включиться не может из за MCC(ну это естественно, блок в аварии). Принципиально все рекомендации. На LEADWELL была похожая ситуация, на торможении шпинделя на PSM помнится выпадала авария 1, а на шпинделе не помню уже что. Тоже думали на PSM, а судя по всему мозг вынимал рекуператор в SPM. Т.к. на шине 500 вольт на торможении шпинделя напряжение вылетало далеко за 500 вольт выше. Здесь тоже нечто подобное, SPM опрокидывает PSM в аварию. Вобщем при включении питания станка, запитывается только управление на PSM, а он в свою очередь раздает 24 вольта на все остальные блоки по CXA2A, если все нормально и ЧПУ включена, замыкается контакт МСС, разрешая подачу силового питания на PSM. Шаги загрузки на полностью исправном станке PSM    SPM   -          A   -         50   -         12(или 18)   -         -- После включения ЧПУ и подачи силового питания   0         0 У нас PSM    SPM   -          A   -         50   -         12(или 18)   1         30 Включение силовухи невозможно. Что было сделано: 1. Проверены все питания, 240 СХ1А, 24 СХА2А, силовое питание, везде порядок. 2. Проверены IGBT на PSM и SPM, явного замыкания нет. 3. Проверены обмотки серво двигателя шпинделя. На всех 0,4 ома(сопротивление щупов 0,2 + обмотки 0,2 ома). Сравнил с заведомо исправным таким же двигателем(он стоит в другом таком же станке и работает), все тоже самое, На массу КЗ нет. Да и силовухи тоже нет, так что это бессмысленно. 4. Откинул от PSM разъем СХА2А(тупо обесточил остальные блоки от 24 вольт), включил питание управления, PSM перестал опрокидываться в ошибку, на дисплее "-". Ждал долго, не опрокидывается. Силовое питание подавать не стал, ибо чревато для остальных блоков, а скидывать шинку постоянного тока честно говоря поленился. 5. С соседнего станка снял плату управления SPM и переставил в неисправный станок, по номерам они идентичные. Станок включился и даже подал силовое питание на PSM без всяких аварий. Гонял пару минут в холостую, все было нормально, но после опрокинулся с той же ошибкой 1 и 30 на PSM и SPM соответственно. 6. Взял плату управления SPM с неисправного станка и установил в исправный. Станок включился и сколько бы не гонял, и даже шпинделем крутил, не опрокидывается. Т.е. к обоим платам претензий ноль. После вернул все обратно. Исправный станок работает как ни в чем не бывало, неисправный сразу опрокидывается в аварию почти сразу после включения управляющего питания. На ЧПУ ошибка 9030 и какие то еще по осям, но они связаны с отсутствием питания на шине постоянного тока если не ошибаюсь, так что это нормально. Итого, силовуха явных признаков неисправности не имеет, и даже на какое то время с другой платой включает силовое питание(скорее всего это связано с разбросом параметров защит на разных платах). К самому PSM тоже вроде претензий не должно быть, хотя В-65285 указывает именно на него. В истории с LEADWELL точно помню, что тоже все указывало на PSM(в том числе 1 на дисплее), и даже сервисный инженер FANUC был уверен в неисправности именно PSM. По факту, неисправен был как раз SPM. К платам управления тоже никаких претензий, обе работают в исправном станке. Единственное логическое объяснение, неисправность силовухи SPM. НО!!! Шина постоянного тока даже не думает запитываться, так что и тут с опрокидыванием сразу после включения есть засада! Ну не тестирует же SPM и PSM силовую часть напряжением 24 вольта??? Ведь до включения силового питания в этом случае даже не доходит из-за аварии! Может у кого есть еще идеи или опыт устранения таких дефектов? Помнится у фанука была типовуха на платах А16В-2203-0623 с датчиками тока, они отгорали и привод отваливался в аварию по одной из фаз. Это были привода шпинделя и двух осей в одном корпусе, были такие у нас на токарных. Сервисники фанука тогда их тучами меняли... Хотя тут я думаю не наш случай
    • Kelny
      Даже при всём при этом оно не всегда корректно работало, так что даже в старых версиях было быстрее удалить размер и потом вставить заново, чем искать эти точки размеров, а потом пытаться их привязать к новому месту.   Возможно это всего лишь глюк новой версии, в последних версиях они похоже штатно закладываются.
    • maxx2000
      @davidovka я их сразу ссыпаю в TEMP,  в тех что живы нет отметок о создании current_session.pro. Интересно что сам current_session.pro создаётся, но не обновляется дата в отличии от даты модели. Может быть и вправду менял какие нить настройки и забывал сохранить
    • Ahito
    • maxx2000
      т.е. доверять разработчикам оснований нет. Ясно-понятно
×
×
  • Создать...