Перейти к публикации

Суперкомпьютер своими руками для расчетов в ansys и 3d приложениях


Рекомендованные сообщения

Ну вроде же по русски все написали - распределялка отрабатывала не в начале расчета, а на каждой итерации. Что непонятно?

распределялка чего?
Ссылка на сообщение
Поделиться на других сайтах


Скажем, определенная конфигурация НУ, ГУ и геометрии, в которой считается фиксированное N шагов с постоянным шагом по времени.

Для отдельных заказчиков, которым это нужно, мы вводим в нашу систему тестирования их типовой тест или набор тестов. Обычно это идет в рамках контракта по разработке спец.функционала.

Другие предлагают нас снабдить своими тестами, которые им интересны, но у них пока руки не доходят.

Третьи тестирую самостоятельно свежие версии.

Если речь идет о консалтинге, где моделируется одно изделие в течении, скажем, трех лет на разных нестаицонарных режимах, то в конце мы предоставляем отчет о решении их задачи на трех решателях за эти три года, т.к. он (решатель) был видоизменен.

Касаемо выкалдывания данных тестирования в открытом доступе, а также базы тестов, то я бы пошел еще дальше:

- по каждому релизу выводил бы сводную таблицу с отнормированными результатами с огладкой на железо;

- по разрабатываемой бы версии выводил текущие результаты тестирования.

распределялка чего?

Что же так все сложно-то?

ИСПА, ну что может в CFD задаче распределяться по ядрам?

Ну не колбаса же и хлеб по карточкам.

:)

Сетка распределяется в виде декомпозированной матрицы - куски матрицы.

Нате вам, ИСПА, <noindex>статью для ликбеза по параллельным вычислениям</noindex>, чтобы вопросы детские не задавать.

Цифры уже старые, но общий смысл передан нормально.

Ссылка на сообщение
Поделиться на других сайтах

ИСПА, ну что может

Нате вам, ИСПА,

Напоминаю еще раз, что ИСПА - это программа.

А ко мне обращайтесь господин ISPA.

Я ничего у вас не просил.

И "Нате вам, ИСПА" - очередное хамство.

Ссылка на сообщение
Поделиться на других сайтах

Ну раз "не просил", то и не надо нажимать на приведенную мною ссылку и читать материал.

;)

Ссылка на сообщение
Поделиться на других сайтах

Ну раз "не просил", то и не надо нажимать на приведенную мною ссылку и читать материал.

;)

Да это понятно.

Я же говорю о том, что хамить не нужно.

Ссылка на сообщение
Поделиться на других сайтах

"Например, нельзя параллельно перемножать несколько матриц" - самое интересное если удается распараллелить вычисление скалярных произведений. Параллельно умножать и за раз все сложить. Тогда остальные затраты будут мелочью для прямых методов и численного интегрирования для вычисления матриц элементов. Насколько это удается ? Срабатывают ли специальные вектора о которых писал Страуструп говоря об агрессивной оптимизации в компиляторах. Насколько помню говорилось о вычислении скалярных произведений в 35 раз когда-то...

Ссылка на сообщение
Поделиться на других сайтах

Параллельно умножать и за раз все сложить. Тогда остальные затраты будут мелочью для прямых методов и численного интегрирования для вычисления матриц элементов. Насколько это удается ?

На обычных процесорах с несколькими ядрами это удается делать. А вот на видео ускорителях у которых около 500 графических ядер этого сделать нельзя.
Ссылка на сообщение
Поделиться на других сайтах

Антон Джораев из NVIDIA прислал данные на тему экзерциссов с батькой Abaqus`ом.

Abaqus6.12_and_Tesla_K20_GPU_Benchmarks.pdf

Ссылка на сообщение
Поделиться на других сайтах

Цифры в 77 Тфл просто убивают. Наповал. :clap_1:

очевидно, что там в них указана не производительность системы при решении задачи, а размерность задачи:

что-то типа - сколько надо выполнить операций для решения.

Там приведены понятные цифры: времена и в какое кол-во раз ускорение. Всем всё ясно.

Ссылка на сообщение
Поделиться на других сайтах

Там приведены понятные цифры: времена и в какое кол-во раз ускорение. Всем всё ясно.

Берем 77 Тфл делим на 30 000 = скорось 2.5 Гфл/сек. Это скорость процессора.

А скорость с ускорителем в 3.77 раза быстрее = скорось 9.4 Гфл/сек. Это скорость процессора + ускоритель.

А теперь читаем еще раз статью по ИСПА и видим скорость 75 Гфл/сек.

<noindex>http://www.ispa-soft.ru/statxi/statxq18.htm</noindex>

Ссылка на сообщение
Поделиться на других сайтах

Берем 77 Тфл делим на 30 000 = скорось 2.5 Гфл/сек. Это скорость процессора.

Одного не пойму - что такое 77 и что такое 30000?

Ссылка на сообщение
Поделиться на других сайтах

Одного не пойму - что такое 77 и что такое 30000?

Это общее количество операций 77 Тфл делим на время 30 000 сек получаем скорость 2.5 Гфл/сек.

Это то, что я просил.

ИСПА считает на ЦПУ в 30 раз быстрее.

Ссылка на сообщение
Поделиться на других сайтах

Уточняю:

30000 секунд - это суммарное время собранное со всех ядер или чистый WallTime?

Т.е. это каждое ядро столько пахало или делим 30000 на 6 и получаем время работы ядра?

P.S. У меня просто читалка PDF не фунциклирует временно.

Все, пофиксил.

Ссылка на сообщение
Поделиться на других сайтах

Sandy Bridge, 6 cores, Elapsed Time in seconds ~ 30000.

так что думаю, это время одновременного использования 6ти ядер.

ща картинку добавлю.

Ссылка на сообщение
Поделиться на других сайтах

Не надо. Все уже проглядел.

Для полноты счастья им бы те же самые задачи в линейной постановке показать ибо нелинейность увеличивает время расчета.

Ссылка на сообщение
Поделиться на других сайтах

Берем 77 Тфл делим на 30 000 = скорось 2.5 Гфл/сек. Это скорость процессора.

у них там еще указано - Nonlinear Static (6 Steps)

т.е. это 6 проходов? или как это понимать?

т.е. как минимум надо 2.5*6, не?

Ссылка на сообщение
Поделиться на других сайтах
  • MFS открепил тему
Гость
Эта тема закрыта для публикации сообщений.
  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу.




×
×
  • Создать...