Chardash

Суперкомпьютер своими руками для расчетов в ansys и 3d приложениях

1 309 сообщений в этой теме

Кстати, не смог найти в исходных кодах Линпак от Интела. Итерационные алгоритмы нашел.

мне кажется, он лежит на той же странице, что и линпак.

мне сейчас сложно проверить - с очень медленного инета всю неделю буду.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

"Если я постоянно говорю про SSE и AVX, а вы не слышите" - <noindex>http://ru.wikipedia.org/wiki/SSE</noindex> мое мнение, что этим должны разработчики компиляторов заниматься. Страуструп тоже об этом писал. Это не имеет отношения к алгоритмам, только к их реализациям, они меняются часто, а алгоритмы стабильны :unsure:

МКЭ не меняется, а Ansys каждый год :unsure:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Да он же не о железе писал, а о программировании. Низкоуровневое программирование он и отнес к задачам тех кто пишет компиляторы. Прикладные программы редко затачивают под марку проца, это считается неэффективным в целом. Даже под операционки стараются не делать :unsure:

Я вообще обычно работаю на виртуальных машинах :unsure:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Я считаю, что лезть в это пустая трата времени и сил если не компилятор пишешь :unsure:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

<noindex>http://ru.wikipedia.org/wiki/SSE</noindex> да вон их сколько разных, выбирайте на вкус :unsure:

Это фрагменты перехода к 128 разрядным операционным системам о которых писал когда-то Рихтер в Windows для профессионалов :unsure:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Да под них вообще не вижу особого смысла программировать, мелкий вопрос Это же не система реального времени, где такое может быть критично :unsure:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

"Следующий пример демонстрирует перемножение четырёх пар чисел с плавающей точкой одной инструкцией " видите 4 float значит 2 double плюс накладные на вызов функции. Ну и где тут в 15 раз ? Максимум в полтора на умножениях... :unsure:

DPPD xmm1, xmm2/m128, imm8 — (Dot Product of Packed Double Precision Floating-Point Values) может эта команда что-то дает...

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Не, я что-то не догоняю. Ну так объясните на какой функции и почему происходит ускорение. Или Вы в чудеса верите ? Так тут не все чайники, вопрос то пустяковый :unsure:

Вон у Голуба и Ван Лоуна <noindex>http://www.twirpx.com/file/87886/</noindex> алгоритмы описываются через условную функцию gaxpy для векторизации и векторные обмены подсчитывают.

"Конечно управление обменами с памятью не является чем-то особенно новым в научных вычислениях. При решении матричных задач на самых первых электронных машинах приходилось продумывать обмен данными с бумажными лентами и другими примитивными устройствами хранения информации " так они пишут :rolleyes:

Или вы компьютерным фетишизмом занимаетесь ? Помню как расстроил когда-то одного коллегу. Он писал программку по смазке и она считала часа два, он этим очень гордился. Я предложил пропустить через оптимизирующий PL/1 и повключал всякую оптимизацию. Стала проскакивать меньше чем за пять минут. После этого несколько лет руки мне не подавал обиженный :unsure:

Пишут же, что и от компиляторов и операционных систем тоже скорость решения зависит. Это давно известно. Ну очень давно. Но при чем здесь математика и ее концепты ? :rolleyes:

Где-то видел табличку, что Ansys на юниксовых операционках вообще намного быстрее работает...

"Включите все опции по оптимизации и SSE и AVX" я что, похож на идиота чтобы подключить то, чего в 486 заведомо нет ? По себе то всех не равняйте :rolleyes:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Ближе к суперкомпьютеру, а не к программам, на нем выполняемым...

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Ну как бы помягче это сказать?

Ваш пост никакого отношения к теме не имеет.

Спорить на эту тему не буду.

Последующие сообщения не по теме буду удалять.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Ну как бы помягче это сказать?

Ваш пост никакого отношения к теме не имеет.

Вы только скажите.

Я сам все посты из данной темы удалю.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Последние тоже не по теме - можно смело удалять.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Ближе к суперкомпьютеру, а не к программам

Так компьютер покупают под программы. Для решения тех или иных задач.

А чтобы по теме писать нужно знать о какой версии программы речь идет. Нет смысла платить деньги за 16 ядер, если матрица жесткости составляется на 1 ядре. Например.

Опять же нужно знать задачи какой размерности будут решаться.

И уже только потом своими руками компьютер собирать. :unsure:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Последующие сообщения не по теме буду удалять.

Я считаю, что это неправильно.

Как тут выше заметили, суперкомпьютер без суперпрограммы - бесполезная вещь.

Поэтому лучше тему переименовать в "Суперкомпьютеры и HPC-приложения".

Суперкомпьютеры тут обсуждались любые: кластеры, многопроцессорные системы, сетевое распараллеливание, многоядерные современные процессоры, GPU-системы.

кластеры - только для крупных организаций.

многопроцессорные системы - при необходимости, один из самых доступных профессиональных вариантов

сетевое распараллеливание - если в ограничения не упираться, то может быть полезным, но гигабита много где недостаточно. Полезнее на двух машинах запустить две задачи, чем одну задачу параллелить по сети.

многоядерный ПК - это даже домашний вариант на данный момент и по производительности может быть сравним со старыми кластерами

GPU - при поддержке софтом можно добавить в систему адекватные игровые ВК, но с GPU как-то всё затухает, реальных программ - по пальца пересчитать. Саш, в бета-тесте не будет, случаем, GPU-примочек для пробы?

Ну еще я забыл интеловские-Xeon Phi-карточки..., но там что-то очень специфичное... недоГПУ... памяти - кот наплакал.

На этом железо кончается, и начинаются нюансы его использования и реализации софта под него.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Ну еще я забыл интеловские-Xeon Phi-карточки..., но там что-то очень специфичное... недоГПУ... памяти - кот наплакал.

8 Гб памяти, 60 ядер, 240 потоков.

30 Мб кэша 2-го уровня.

Линпак должен показать 1200 Гфл/сек для double. В спавнении с обычным сопроцессором - это космическая скорость.

А больше и не нужно для ОДНОГО ускорителя. :unsure:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

8 Гб памяти

как я понимаю, это самое узкое место, и варианта для наращивания нету.

Хотя 8 Гб в CFD это не так уж мало - это 2 млн точек, мне почти для всего хватало.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

как я понимаю, это самое узкое место, и варианта для наращивания нету.

Ставите 100 ускорителей в один ряд. Вот вам и настоящий суперкомпьютер.

А скорость будет около 100 000 Гфл.

А один ускоритель предназначен для ускорения узких мест в программе. У него 4 режима работы. Выбираете нужный и работаете. :unsure:

И не нужно его путать с Квадро ускорителем. :unsure:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Вообще-то главное быстро решать стоящие задачи, если собрать 9 беременных женщин, ребенок через месяц не родится :unsure:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

На мой взгляд непросто будет полность загрузить все ядра процессора и Xeon Phi.

Программы опять придется переписать. :unsure:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Fedor

Вам, уважаемый, бан на недельку, просто от скуки мне так захотелось.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Вообще-то главное быстро решать стоящие задачи, если собрать 9 беременных женщин, ребенок через месяц не родится :unsure:

Данная аналогия в данном случае неуместна.

Десять ускорителей решают стоящие задачи в 8 раз быстрее. :unsure:

По этому принципу и собирают суперкомпьютеры.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Задачи решает человек, а не компьютер :rolleyes:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Любая техника в руках героя одноименного романа Достоевского - груда лома. Если мы многого хотим от техники, то от себя должны потребовать еще большего :unsure:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

как я понимаю, это самое узкое место, и варианта для наращивания нету.

Хотя 8 Гб в CFD это не так уж мало - это 2 млн точек, мне почти для всего хватало.

У Вас вероятно задачи в основном в 2D. Для 3D 8 Гб маловато.

PS: в том же CFX тестовая задачка размером 100x100x100 (1 млн. ко) съесть примерно 2 Гб

в нашей внутренней решалке это будет около 1.6 Гб. - 4Гб за 1 млн. ко это весьма дорого

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

PS: в том же CFX тестовая задачка размером 100x100x100 (1 млн. ко) съесть примерно 2 Гб

Поставьте в нем Дабл пресижн в решалке и будет как у всех.

:)

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Купил таки комплектующие на новый комп, два процессора Intel Xeon E5-2695V2, quadro k6000, много памяти, SuperMicro сервер и тп. Если все устроит с quadro, рассмотрим tesla k40c (которые в текущих событиях неожиданно резко пропали и цена, на которые, так же неожиданно выросла почти на 20%). Надеюсь соберу компьютер без неожиданностей. 

ps пока квадро к6000 поставил на свою старую сборку, о которой писал выше, честно говоря пока эффекта вау нет, да, графические вроде стали работать живее, но времени разобраться и нормально посмотреть пока нет. Будет два компьютера, сравню. Мануал по новому серверу великоват правда, надеюсь, разберусь.

Всем спасибо!

 

 

:smile:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
Гость
Эта тема закрыта для публикации сообщений.

  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу

  • реклама

  • Реклама

  • Ближайшие события

    Предстоящих событий не найдено
  • Дни рождения сегодня

    1. Alex007
      Alex007
      (38 лет)
    2. Alexisski
      Alexisski
      (37 лет)
    3. CSR
      CSR
      (67 лет)
    4. Mihasya
      Mihasya
      (35 лет)
    5. PHilin
      PHilin
      (37 лет)
    Просмотреть все