Гость ISPA Опубликовано: 22 ноября 2012 Жалоба Рассказать Опубликовано: 22 ноября 2012 Ну вроде же по русски все написали - распределялка отрабатывала не в начале расчета, а на каждой итерации. Что непонятно?распределялка чего? Ссылка на сообщение Поделиться на других сайтах
a_schelyaev 367 Опубликовано: 22 ноября 2012 Жалоба Рассказать Опубликовано: 22 ноября 2012 Скажем, определенная конфигурация НУ, ГУ и геометрии, в которой считается фиксированное N шагов с постоянным шагом по времени. Для отдельных заказчиков, которым это нужно, мы вводим в нашу систему тестирования их типовой тест или набор тестов. Обычно это идет в рамках контракта по разработке спец.функционала. Другие предлагают нас снабдить своими тестами, которые им интересны, но у них пока руки не доходят. Третьи тестирую самостоятельно свежие версии. Если речь идет о консалтинге, где моделируется одно изделие в течении, скажем, трех лет на разных нестаицонарных режимах, то в конце мы предоставляем отчет о решении их задачи на трех решателях за эти три года, т.к. он (решатель) был видоизменен. Касаемо выкалдывания данных тестирования в открытом доступе, а также базы тестов, то я бы пошел еще дальше: - по каждому релизу выводил бы сводную таблицу с отнормированными результатами с огладкой на железо; - по разрабатываемой бы версии выводил текущие результаты тестирования. распределялка чего? Что же так все сложно-то? ИСПА, ну что может в CFD задаче распределяться по ядрам? Ну не колбаса же и хлеб по карточкам. :) Сетка распределяется в виде декомпозированной матрицы - куски матрицы. Нате вам, ИСПА, <noindex>статью для ликбеза по параллельным вычислениям</noindex>, чтобы вопросы детские не задавать. Цифры уже старые, но общий смысл передан нормально. Ссылка на сообщение Поделиться на других сайтах
Гость ISPA Опубликовано: 22 ноября 2012 Жалоба Рассказать Опубликовано: 22 ноября 2012 ИСПА, ну что может Нате вам, ИСПА, Напоминаю еще раз, что ИСПА - это программа. А ко мне обращайтесь господин ISPA. Я ничего у вас не просил. И "Нате вам, ИСПА" - очередное хамство. Ссылка на сообщение Поделиться на других сайтах
a_schelyaev 367 Опубликовано: 22 ноября 2012 Жалоба Рассказать Опубликовано: 22 ноября 2012 Ну раз "не просил", то и не надо нажимать на приведенную мною ссылку и читать материал. ;) Ссылка на сообщение Поделиться на других сайтах
Гость ISPA Опубликовано: 22 ноября 2012 Жалоба Рассказать Опубликовано: 22 ноября 2012 Ну раз "не просил", то и не надо нажимать на приведенную мною ссылку и читать материал. ;) Да это понятно. Я же говорю о том, что хамить не нужно. Ссылка на сообщение Поделиться на других сайтах
a_schelyaev 367 Опубликовано: 22 ноября 2012 Жалоба Рассказать Опубликовано: 22 ноября 2012 Фу! Фу! Нельзя! Нельзя! Ссылка на сообщение Поделиться на других сайтах
Fedor 1 607 Опубликовано: 22 ноября 2012 Жалоба Рассказать Опубликовано: 22 ноября 2012 "Например, нельзя параллельно перемножать несколько матриц" - самое интересное если удается распараллелить вычисление скалярных произведений. Параллельно умножать и за раз все сложить. Тогда остальные затраты будут мелочью для прямых методов и численного интегрирования для вычисления матриц элементов. Насколько это удается ? Срабатывают ли специальные вектора о которых писал Страуструп говоря об агрессивной оптимизации в компиляторах. Насколько помню говорилось о вычислении скалярных произведений в 35 раз когда-то... Ссылка на сообщение Поделиться на других сайтах
Гость ISPA Опубликовано: 22 ноября 2012 Жалоба Рассказать Опубликовано: 22 ноября 2012 Параллельно умножать и за раз все сложить. Тогда остальные затраты будут мелочью для прямых методов и численного интегрирования для вычисления матриц элементов. Насколько это удается ?На обычных процесорах с несколькими ядрами это удается делать. А вот на видео ускорителях у которых около 500 графических ядер этого сделать нельзя. Ссылка на сообщение Поделиться на других сайтах
a_schelyaev 367 Опубликовано: 22 ноября 2012 Жалоба Рассказать Опубликовано: 22 ноября 2012 Антон Джораев из NVIDIA прислал данные на тему экзерциссов с батькой Abaqus`ом. Abaqus6.12_and_Tesla_K20_GPU_Benchmarks.pdf Ссылка на сообщение Поделиться на других сайтах
Гость ISPA Опубликовано: 22 ноября 2012 Жалоба Рассказать Опубликовано: 22 ноября 2012 Цифры в 77 Тфл просто убивают. Наповал. Ссылка на сообщение Поделиться на других сайтах
Bonusfrag 104 Опубликовано: 22 ноября 2012 Жалоба Рассказать Опубликовано: 22 ноября 2012 Цифры в 77 Тфл просто убивают. Наповал. очевидно, что там в них указана не производительность системы при решении задачи, а размерность задачи: что-то типа - сколько надо выполнить операций для решения. Там приведены понятные цифры: времена и в какое кол-во раз ускорение. Всем всё ясно. Ссылка на сообщение Поделиться на других сайтах
Гость ISPA Опубликовано: 22 ноября 2012 Жалоба Рассказать Опубликовано: 22 ноября 2012 Там приведены понятные цифры: времена и в какое кол-во раз ускорение. Всем всё ясно.Берем 77 Тфл делим на 30 000 = скорось 2.5 Гфл/сек. Это скорость процессора. А скорость с ускорителем в 3.77 раза быстрее = скорось 9.4 Гфл/сек. Это скорость процессора + ускоритель. А теперь читаем еще раз статью по ИСПА и видим скорость 75 Гфл/сек. <noindex>http://www.ispa-soft.ru/statxi/statxq18.htm</noindex> Ссылка на сообщение Поделиться на других сайтах
a_schelyaev 367 Опубликовано: 22 ноября 2012 Жалоба Рассказать Опубликовано: 22 ноября 2012 Берем 77 Тфл делим на 30 000 = скорось 2.5 Гфл/сек. Это скорость процессора. Одного не пойму - что такое 77 и что такое 30000? Ссылка на сообщение Поделиться на других сайтах
Bonusfrag 104 Опубликовано: 22 ноября 2012 Жалоба Рассказать Опубликовано: 22 ноября 2012 77 это 77 TFLOPs из публикации. 30 000 - это Elapsed Time in seconds Ссылка на сообщение Поделиться на других сайтах
Гость ISPA Опубликовано: 22 ноября 2012 Жалоба Рассказать Опубликовано: 22 ноября 2012 Одного не пойму - что такое 77 и что такое 30000?Это общее количество операций 77 Тфл делим на время 30 000 сек получаем скорость 2.5 Гфл/сек. Это то, что я просил. ИСПА считает на ЦПУ в 30 раз быстрее. Ссылка на сообщение Поделиться на других сайтах
a_schelyaev 367 Опубликовано: 22 ноября 2012 Жалоба Рассказать Опубликовано: 22 ноября 2012 Уточняю: 30000 секунд - это суммарное время собранное со всех ядер или чистый WallTime? Т.е. это каждое ядро столько пахало или делим 30000 на 6 и получаем время работы ядра? P.S. У меня просто читалка PDF не фунциклирует временно. Все, пофиксил. Ссылка на сообщение Поделиться на других сайтах
Bonusfrag 104 Опубликовано: 22 ноября 2012 Жалоба Рассказать Опубликовано: 22 ноября 2012 Sandy Bridge, 6 cores, Elapsed Time in seconds ~ 30000. так что думаю, это время одновременного использования 6ти ядер. ща картинку добавлю. Ссылка на сообщение Поделиться на других сайтах
Гость ISPA Опубликовано: 22 ноября 2012 Жалоба Рассказать Опубликовано: 22 ноября 2012 Sandy Bridge, 6 cores, Elapsed Time in seconds ~ 30000.Только там сразу 2 процесора и 2 ускорителя. Ссылка на сообщение Поделиться на других сайтах
a_schelyaev 367 Опубликовано: 22 ноября 2012 Жалоба Рассказать Опубликовано: 22 ноября 2012 Не надо. Все уже проглядел. Для полноты счастья им бы те же самые задачи в линейной постановке показать ибо нелинейность увеличивает время расчета. Ссылка на сообщение Поделиться на других сайтах
Bonusfrag 104 Опубликовано: 22 ноября 2012 Жалоба Рассказать Опубликовано: 22 ноября 2012 Берем 77 Тфл делим на 30 000 = скорось 2.5 Гфл/сек. Это скорость процессора.у них там еще указано - Nonlinear Static (6 Steps) т.е. это 6 проходов? или как это понимать? т.е. как минимум надо 2.5*6, не? Ссылка на сообщение Поделиться на других сайтах
Рекомендованные сообщения