Перейти к публикации

Суперкомпьютер своими руками для расчетов в ansys и 3d приложениях


Рекомендованные сообщения

Кстати, не смог найти в исходных кодах Линпак от Интела. Итерационные алгоритмы нашел.

мне кажется, он лежит на той же странице, что и линпак.

мне сейчас сложно проверить - с очень медленного инета всю неделю буду.

Ссылка на сообщение
Поделиться на других сайтах


"Если я постоянно говорю про SSE и AVX, а вы не слышите" - <noindex>http://ru.wikipedia.org/wiki/SSE</noindex> мое мнение, что этим должны разработчики компиляторов заниматься. Страуструп тоже об этом писал. Это не имеет отношения к алгоритмам, только к их реализациям, они меняются часто, а алгоритмы стабильны :unsure:

МКЭ не меняется, а Ansys каждый год :unsure:

Ссылка на сообщение
Поделиться на других сайтах

Да он же не о железе писал, а о программировании. Низкоуровневое программирование он и отнес к задачам тех кто пишет компиляторы. Прикладные программы редко затачивают под марку проца, это считается неэффективным в целом. Даже под операционки стараются не делать :unsure:

Я вообще обычно работаю на виртуальных машинах :unsure:

Ссылка на сообщение
Поделиться на других сайтах

<noindex>http://ru.wikipedia.org/wiki/SSE</noindex> да вон их сколько разных, выбирайте на вкус :unsure:

Это фрагменты перехода к 128 разрядным операционным системам о которых писал когда-то Рихтер в Windows для профессионалов :unsure:

Ссылка на сообщение
Поделиться на других сайтах

Да под них вообще не вижу особого смысла программировать, мелкий вопрос Это же не система реального времени, где такое может быть критично :unsure:

Ссылка на сообщение
Поделиться на других сайтах

"Следующий пример демонстрирует перемножение четырёх пар чисел с плавающей точкой одной инструкцией " видите 4 float значит 2 double плюс накладные на вызов функции. Ну и где тут в 15 раз ? Максимум в полтора на умножениях... :unsure:

DPPD xmm1, xmm2/m128, imm8 — (Dot Product of Packed Double Precision Floating-Point Values) может эта команда что-то дает...

Ссылка на сообщение
Поделиться на других сайтах

Не, я что-то не догоняю. Ну так объясните на какой функции и почему происходит ускорение. Или Вы в чудеса верите ? Так тут не все чайники, вопрос то пустяковый :unsure:

Вон у Голуба и Ван Лоуна <noindex>http://www.twirpx.com/file/87886/</noindex> алгоритмы описываются через условную функцию gaxpy для векторизации и векторные обмены подсчитывают.

"Конечно управление обменами с памятью не является чем-то особенно новым в научных вычислениях. При решении матричных задач на самых первых электронных машинах приходилось продумывать обмен данными с бумажными лентами и другими примитивными устройствами хранения информации " так они пишут :rolleyes:

Или вы компьютерным фетишизмом занимаетесь ? Помню как расстроил когда-то одного коллегу. Он писал программку по смазке и она считала часа два, он этим очень гордился. Я предложил пропустить через оптимизирующий PL/1 и повключал всякую оптимизацию. Стала проскакивать меньше чем за пять минут. После этого несколько лет руки мне не подавал обиженный :unsure:

Пишут же, что и от компиляторов и операционных систем тоже скорость решения зависит. Это давно известно. Ну очень давно. Но при чем здесь математика и ее концепты ? :rolleyes:

Где-то видел табличку, что Ansys на юниксовых операционках вообще намного быстрее работает...

"Включите все опции по оптимизации и SSE и AVX" я что, похож на идиота чтобы подключить то, чего в 486 заведомо нет ? По себе то всех не равняйте :rolleyes:

Ссылка на сообщение
Поделиться на других сайтах
  • 2 недели спустя...

Ну как бы помягче это сказать?

Ваш пост никакого отношения к теме не имеет.

Спорить на эту тему не буду.

Последующие сообщения не по теме буду удалять.

Ссылка на сообщение
Поделиться на других сайтах

Ближе к суперкомпьютеру, а не к программам

Так компьютер покупают под программы. Для решения тех или иных задач.

А чтобы по теме писать нужно знать о какой версии программы речь идет. Нет смысла платить деньги за 16 ядер, если матрица жесткости составляется на 1 ядре. Например.

Опять же нужно знать задачи какой размерности будут решаться.

И уже только потом своими руками компьютер собирать. :unsure:

Ссылка на сообщение
Поделиться на других сайтах

Последующие сообщения не по теме буду удалять.

Я считаю, что это неправильно.

Как тут выше заметили, суперкомпьютер без суперпрограммы - бесполезная вещь.

Поэтому лучше тему переименовать в "Суперкомпьютеры и HPC-приложения".

Суперкомпьютеры тут обсуждались любые: кластеры, многопроцессорные системы, сетевое распараллеливание, многоядерные современные процессоры, GPU-системы.

кластеры - только для крупных организаций.

многопроцессорные системы - при необходимости, один из самых доступных профессиональных вариантов

сетевое распараллеливание - если в ограничения не упираться, то может быть полезным, но гигабита много где недостаточно. Полезнее на двух машинах запустить две задачи, чем одну задачу параллелить по сети.

многоядерный ПК - это даже домашний вариант на данный момент и по производительности может быть сравним со старыми кластерами

GPU - при поддержке софтом можно добавить в систему адекватные игровые ВК, но с GPU как-то всё затухает, реальных программ - по пальца пересчитать. Саш, в бета-тесте не будет, случаем, GPU-примочек для пробы?

Ну еще я забыл интеловские-Xeon Phi-карточки..., но там что-то очень специфичное... недоГПУ... памяти - кот наплакал.

На этом железо кончается, и начинаются нюансы его использования и реализации софта под него.

Ссылка на сообщение
Поделиться на других сайтах

Ну еще я забыл интеловские-Xeon Phi-карточки..., но там что-то очень специфичное... недоГПУ... памяти - кот наплакал.

8 Гб памяти, 60 ядер, 240 потоков.

30 Мб кэша 2-го уровня.

Линпак должен показать 1200 Гфл/сек для double. В спавнении с обычным сопроцессором - это космическая скорость.

А больше и не нужно для ОДНОГО ускорителя. :unsure:

Ссылка на сообщение
Поделиться на других сайтах

8 Гб памяти

как я понимаю, это самое узкое место, и варианта для наращивания нету.

Хотя 8 Гб в CFD это не так уж мало - это 2 млн точек, мне почти для всего хватало.

Ссылка на сообщение
Поделиться на других сайтах

как я понимаю, это самое узкое место, и варианта для наращивания нету.

Ставите 100 ускорителей в один ряд. Вот вам и настоящий суперкомпьютер.

А скорость будет около 100 000 Гфл.

А один ускоритель предназначен для ускорения узких мест в программе. У него 4 режима работы. Выбираете нужный и работаете. :unsure:

И не нужно его путать с Квадро ускорителем. :unsure:

Ссылка на сообщение
Поделиться на других сайтах

Вообще-то главное быстро решать стоящие задачи, если собрать 9 беременных женщин, ребенок через месяц не родится :unsure:

Ссылка на сообщение
Поделиться на других сайтах
  • MFS открепил тему
Гость
Эта тема закрыта для публикации сообщений.
  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу.




×
×
  • Создать...