Chardash

Суперкомпьютер своими руками для расчетов в ansys и 3d приложениях

1 309 сообщений в этой теме

Кстати, не смог найти в исходных кодах Линпак от Интела. Итерационные алгоритмы нашел.

мне кажется, он лежит на той же странице, что и линпак.

мне сейчас сложно проверить - с очень медленного инета всю неделю буду.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах


"Если я постоянно говорю про SSE и AVX, а вы не слышите" - <noindex>http://ru.wikipedia.org/wiki/SSE</noindex> мое мнение, что этим должны разработчики компиляторов заниматься. Страуструп тоже об этом писал. Это не имеет отношения к алгоритмам, только к их реализациям, они меняются часто, а алгоритмы стабильны :unsure:

МКЭ не меняется, а Ansys каждый год :unsure:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Да он же не о железе писал, а о программировании. Низкоуровневое программирование он и отнес к задачам тех кто пишет компиляторы. Прикладные программы редко затачивают под марку проца, это считается неэффективным в целом. Даже под операционки стараются не делать :unsure:

Я вообще обычно работаю на виртуальных машинах :unsure:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Я считаю, что лезть в это пустая трата времени и сил если не компилятор пишешь :unsure:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

<noindex>http://ru.wikipedia.org/wiki/SSE</noindex> да вон их сколько разных, выбирайте на вкус :unsure:

Это фрагменты перехода к 128 разрядным операционным системам о которых писал когда-то Рихтер в Windows для профессионалов :unsure:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Да под них вообще не вижу особого смысла программировать, мелкий вопрос Это же не система реального времени, где такое может быть критично :unsure:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

"Следующий пример демонстрирует перемножение четырёх пар чисел с плавающей точкой одной инструкцией " видите 4 float значит 2 double плюс накладные на вызов функции. Ну и где тут в 15 раз ? Максимум в полтора на умножениях... :unsure:

DPPD xmm1, xmm2/m128, imm8 — (Dot Product of Packed Double Precision Floating-Point Values) может эта команда что-то дает...

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Не, я что-то не догоняю. Ну так объясните на какой функции и почему происходит ускорение. Или Вы в чудеса верите ? Так тут не все чайники, вопрос то пустяковый :unsure:

Вон у Голуба и Ван Лоуна <noindex>http://www.twirpx.com/file/87886/</noindex> алгоритмы описываются через условную функцию gaxpy для векторизации и векторные обмены подсчитывают.

"Конечно управление обменами с памятью не является чем-то особенно новым в научных вычислениях. При решении матричных задач на самых первых электронных машинах приходилось продумывать обмен данными с бумажными лентами и другими примитивными устройствами хранения информации " так они пишут :rolleyes:

Или вы компьютерным фетишизмом занимаетесь ? Помню как расстроил когда-то одного коллегу. Он писал программку по смазке и она считала часа два, он этим очень гордился. Я предложил пропустить через оптимизирующий PL/1 и повключал всякую оптимизацию. Стала проскакивать меньше чем за пять минут. После этого несколько лет руки мне не подавал обиженный :unsure:

Пишут же, что и от компиляторов и операционных систем тоже скорость решения зависит. Это давно известно. Ну очень давно. Но при чем здесь математика и ее концепты ? :rolleyes:

Где-то видел табличку, что Ansys на юниксовых операционках вообще намного быстрее работает...

"Включите все опции по оптимизации и SSE и AVX" я что, похож на идиота чтобы подключить то, чего в 486 заведомо нет ? По себе то всех не равняйте :rolleyes:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Ближе к суперкомпьютеру, а не к программам, на нем выполняемым...

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Ну как бы помягче это сказать?

Ваш пост никакого отношения к теме не имеет.

Спорить на эту тему не буду.

Последующие сообщения не по теме буду удалять.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Ну как бы помягче это сказать?

Ваш пост никакого отношения к теме не имеет.

Вы только скажите.

Я сам все посты из данной темы удалю.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Перелистал тему. :unsure:

По теме нет ни одного сообщения.

Можно все спокойно удалить. :unsure:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Последние тоже не по теме - можно смело удалять.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Ближе к суперкомпьютеру, а не к программам

Так компьютер покупают под программы. Для решения тех или иных задач.

А чтобы по теме писать нужно знать о какой версии программы речь идет. Нет смысла платить деньги за 16 ядер, если матрица жесткости составляется на 1 ядре. Например.

Опять же нужно знать задачи какой размерности будут решаться.

И уже только потом своими руками компьютер собирать. :unsure:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Последующие сообщения не по теме буду удалять.

Я считаю, что это неправильно.

Как тут выше заметили, суперкомпьютер без суперпрограммы - бесполезная вещь.

Поэтому лучше тему переименовать в "Суперкомпьютеры и HPC-приложения".

Суперкомпьютеры тут обсуждались любые: кластеры, многопроцессорные системы, сетевое распараллеливание, многоядерные современные процессоры, GPU-системы.

кластеры - только для крупных организаций.

многопроцессорные системы - при необходимости, один из самых доступных профессиональных вариантов

сетевое распараллеливание - если в ограничения не упираться, то может быть полезным, но гигабита много где недостаточно. Полезнее на двух машинах запустить две задачи, чем одну задачу параллелить по сети.

многоядерный ПК - это даже домашний вариант на данный момент и по производительности может быть сравним со старыми кластерами

GPU - при поддержке софтом можно добавить в систему адекватные игровые ВК, но с GPU как-то всё затухает, реальных программ - по пальца пересчитать. Саш, в бета-тесте не будет, случаем, GPU-примочек для пробы?

Ну еще я забыл интеловские-Xeon Phi-карточки..., но там что-то очень специфичное... недоГПУ... памяти - кот наплакал.

На этом железо кончается, и начинаются нюансы его использования и реализации софта под него.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Ну еще я забыл интеловские-Xeon Phi-карточки..., но там что-то очень специфичное... недоГПУ... памяти - кот наплакал.

8 Гб памяти, 60 ядер, 240 потоков.

30 Мб кэша 2-го уровня.

Линпак должен показать 1200 Гфл/сек для double. В спавнении с обычным сопроцессором - это космическая скорость.

А больше и не нужно для ОДНОГО ускорителя. :unsure:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

8 Гб памяти

как я понимаю, это самое узкое место, и варианта для наращивания нету.

Хотя 8 Гб в CFD это не так уж мало - это 2 млн точек, мне почти для всего хватало.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

как я понимаю, это самое узкое место, и варианта для наращивания нету.

Ставите 100 ускорителей в один ряд. Вот вам и настоящий суперкомпьютер.

А скорость будет около 100 000 Гфл.

А один ускоритель предназначен для ускорения узких мест в программе. У него 4 режима работы. Выбираете нужный и работаете. :unsure:

И не нужно его путать с Квадро ускорителем. :unsure:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Вообще-то главное быстро решать стоящие задачи, если собрать 9 беременных женщин, ребенок через месяц не родится :unsure:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

На мой взгляд непросто будет полность загрузить все ядра процессора и Xeon Phi.

Программы опять придется переписать. :unsure:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Fedor

Вам, уважаемый, бан на недельку, просто от скуки мне так захотелось.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Вообще-то главное быстро решать стоящие задачи, если собрать 9 беременных женщин, ребенок через месяц не родится :unsure:

Данная аналогия в данном случае неуместна.

Десять ускорителей решают стоящие задачи в 8 раз быстрее. :unsure:

По этому принципу и собирают суперкомпьютеры.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Задачи решает человек, а не компьютер :rolleyes:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Задачи решает человек

Тема про суперкомпьютеры, а не про Суперчеловека.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Любая техника в руках героя одноименного романа Достоевского - груда лома. Если мы многого хотим от техники, то от себя должны потребовать еще большего :unsure:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

как я понимаю, это самое узкое место, и варианта для наращивания нету.

Хотя 8 Гб в CFD это не так уж мало - это 2 млн точек, мне почти для всего хватало.

У Вас вероятно задачи в основном в 2D. Для 3D 8 Гб маловато.

PS: в том же CFX тестовая задачка размером 100x100x100 (1 млн. ко) съесть примерно 2 Гб

в нашей внутренней решалке это будет около 1.6 Гб. - 4Гб за 1 млн. ко это весьма дорого

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

PS: в том же CFX тестовая задачка размером 100x100x100 (1 млн. ко) съесть примерно 2 Гб

Поставьте в нем Дабл пресижн в решалке и будет как у всех.

:)

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Купил таки комплектующие на новый комп, два процессора Intel Xeon E5-2695V2, quadro k6000, много памяти, SuperMicro сервер и тп. Если все устроит с quadro, рассмотрим tesla k40c (которые в текущих событиях неожиданно резко пропали и цена, на которые, так же неожиданно выросла почти на 20%). Надеюсь соберу компьютер без неожиданностей. 

ps пока квадро к6000 поставил на свою старую сборку, о которой писал выше, честно говоря пока эффекта вау нет, да, графические вроде стали работать живее, но времени разобраться и нормально посмотреть пока нет. Будет два компьютера, сравню. Мануал по новому серверу великоват правда, надеюсь, разберусь.

Всем спасибо!

 

 

:smile:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
Гость
Эта тема закрыта для публикации сообщений.

  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу



  • Реклама

  • Сообщения

    • eksodus
      Вижу, нинджа гадит не только в повермилловской ветке форума
    • sennik53
      Солид кам может и с коррекцией на полный радиус и на износ инструмента. В предлагаемом примере ясно в "шапке" УП прописано "compensation-wear@, Т.Е. В ПОСТПРОЦЕССОРЕ ПРИМЕНЯЕТСЯ ВВОД КОРРЕКЦИИ НА ИЗНОС ИНСТРУМЕНТА. Проблема решается изменением всего лиш одного параметра в ПОСТПРОЦЕССОРЕ и в УП  будет выводится компенсация на полный радиус инструмента. И ни какой ложечки гемора, как говорит  Ninja, НЕТ. Это все заложено (применение коррекции на диаметр или износ инструмента) в написании постпроцессора. Так, что @Ninja учите матчасть по SC и не флудите понапрасну.
    • Frezer_PU
      Для этой стратегии предпочтительно использовать монолитные фрезы зажатые в силовые патроны, а так же использование максимально режущей части фрезы (Ар) при не больших радиальных съемах (Ае) и на подачах значительно больших от тех которые используются  классических стратезиях!  Для примера чтоб было понятно что я имел в виду,  да вы и сами наверное это знаете :  
    • boristsybin
      В наличии пара AMD Radeon FirePro w8100. 44900р./шт или 84900 за пару. Карта гарантированно поддерживает виртуализацию (проброс в виртуалку) на hyper-v, проверено.
      Возможен обмен с доплатой туда-сюда на 
      = GTX1070-1080Ti или Тitan Xp, обязательно турбинка
      = блок питания Corsair 1000 Вт и выше,
      Питание карта получает с заднего торца, потому без хитростей влезет в рэковый 3U корпус Отправка по России. Регулярно бываю в Курске, могу привезти.
      Возможен безнал - вы покупаете интересные мне позиции там и так, как вам удобно и обмениваетесь со мной. Гибкий взаимовыгодный торг. Могу даже какую-нибудь бумажку написать "выдал, обязуюсь".   История карт такова: карты бал с рук в августе 2017, для проекта распределенных вычислений milkyway@home, повелся на заявленные 2,1TFLOPS двойной точности. На практике выдают где-то 1,2TFLOPS (чуть больше старушки 7970)      
    • k_v
      за пару сотен тысяч рублей можно сделать десяток вновь-разработанных планетарных редукторов или пяток волновых/планетарно-цевочных. больше ни на что не хватит. это даже не учитывая что прототипов каждого узла надо делать не одну итерацию. про движки от шуруповертов даже не смешно)
    • hlibhlib
      @qqqq Все-бы ничего, да до кошмариков удручает дикая зависимость направления и стиля траектории инструмента от его профиля, даже при одинаковом его диаметре... Чтоб добиться точного совпадения с предложенным Вами примером, пришлось создать именно Новый инструмент, а инструменты из моей библиотеки создают совсем другой рисунок. Может опять не в тот лес я зашел??? Подскажите и направьте на путь истинный пожалуйста. Какие еще встречаются подводные камни в этой стратегии?                     
    • Maik812
      Для некоторых действий экзоскелета например кисть или еще что то быстрое требующие скоростных перемещений эффективно и дешего линейные асинхронные двигатели с высоким моментом. с этим могу помочь
    • Борман
      Слона всегда нужно есть по частям. Сначала нужен врач, который конкретно скажет что нужно.
    • AlexKaz
      Рейки, шарниры, батарейки,  микроконтроллеры с датчиками, движки от шуруповёртов - простецкий прототип сравним по цене с далеко не самым свежим авто. Вам бы записаться на собеседование в московскую Моторику - они пилят кистевые протезы для детей, летом традиционно собирают школьников и студентов на микроковоркинг. Могу дать имейл представителя. Рядом со мной есть пиаристая группа бывших и не очень бывших студентов из Пермском политеха - тож пилили свой бюджетный микроэкзоскелет для, хех, грузчиков...
    • LxCoder
      Вроде готово, если я все правильно понял. С выводами систем G54 - выставляйте FIXTURE_OFSET_REG=54 только в первом сиквенсе, или там, где хотите, чтобы был принудительный вывод G54. UNCX01.F44 UNCX01.P44 UNCX01.s44