Суперкомпьютер своими руками для расчетов в ansys и 3d приложениях

23 ноября 2012

У SQL неплохо сделан этот момент:

Мне не нравится при продаже продукта спрашивать у клиента "а какой у вас процессор?". А что будет, если они на другом компе будут считать?

На мой взгляд изврат.

Я продаю единицу производительности.

Через недельку погоняю на каком-нибудь AMDюке и посмотрю, что выйдет.

Никто ничего не скрывает, если бы что и хотели скрывать в инет бы вообще никакой инфы бы не выкладывали, поэтому не нужно тут ахинею писать.

Да, я прям спал и видел "как бы получше все это спрятать, выложив у всех на виду".

:)

Испе пока невдомек, что клиентура готова жертвовать скоростью решения ради точности получаемого решения.

И под точностью я имею в виду не алгебраическую характеристику решения, а совпадение с реальными физическими процессами.

Это действительно новизна. Для нелинейной задачи одна скорость, а для линейной другая. Какую наукообразную базу подвели.

Новизной является непонимание отдельных личностей, что некоторые участки кода слабо параллелятся и поэтому на каждой итерации задействуются не все ядра. Итого получаем, что суммарное количество операций остается постоянным, по мере их выполнения задействуются не все ядра, что ведет к сериализации операций, а время тикает.

Пусть Испа свой же документ, наконец-то, прочитает. А то выкладывает, а сам не читает что. Пусть Испа сравнит скорострельность своего алгоритма на разном количестве ядер.

Поэтому, если мы возвращаемся к той мысли, что кругом в мире кроме Испы тоже сидят не дураки, и Абакус это код, который писался больше времени, чем у отдельных товарищей, целым коллективом, то получается, что исходный код написан нормально и имеет характеристики параллелизма на уровне.

А озвученные характеристики со скромной подписью "нелинейная статика" означает, что постановка явно хитрожопая.

У нас в статике считалась постановка с движением изделия по льду с его разрушением.

Задачка не ахти по размерности - порядка сотни тысяч, но из-за особенностей постановки крутилась всю ночь на пролет.

Но Испе же тяжело представить, что кто-то кроме него еще в этом мире умеет писать коды. А тем временем тачка, на которой он рассекает, тоже считалась не на Испе на краш-тест. И возможно Вовой.

:)

23 ноября 2012

И под точностью я имею в виду не алгебраическую характеристику решения

А что такое алгебраическая характеристика решения. Вроде об этом никто не говорил.

Вы уж просветите. :unsure:

23 ноября 2012

Оставляю Испе простор для фантазий.

23 ноября 2012

Испе пока невдомек

Пусть Испа свой же документ

Пусть Испа сравнит

кроме Испы тоже сидят не дураки

Но Испе же тяжело представить

ИСПА - это программа, торговая марка.

Вы хоть понимаете, что программа не может сравнивать и представлять.

ИСПА - КЭ программа, которая быстро решает линейные и нелинейные задачи. Пора бы вам это понять.

Сделаю паузу пока этот дурдом прекратится. :unsure:

23 ноября 2012

Мне не нравится при продаже продукта спрашивать у клиента "а какой у вас процессор?". А что будет, если они на другом компе будут считать?

На мой взгляд изврат.

Я продаю единицу производительности.

Через недельку погоняю на каком-нибудь AMDюке и посмотрю, что выйдет.

мне кажется, что лицензию покупают после ПК или одновременно с ПК. Лицензия на год. За год мало у кого ПК меняется.

в конечном счете покупаются лицензионные опции на ядро без особой привязки к ЦП, а сервер лицензий пусть пересчитывает:

Т.е. вот для этого SQL - можно при 10 лицензиях запускать на 10 интелах или на 12 амд. Всё просто.

Вы себе сами коэффициенты сделаете по результатам тестов. И всё. Будет у вас условная единица производительности.

И владельцы АМД-кластеров порадуются, что чуть сползет цена. И владельцы интелов порадуются - включат HT.

всё это красиво завернуть)

23 ноября 2012

Ну потом АМД сделает новый проц и так что? Генерить под это каждый раз коэффициенты? А потом еще объяснять клиентам почему у них в одном случае так, а в другом эдак?

23 ноября 2012

2 a_schelyaev

Cпасибо за ответ.

п4.1 и 6 многое рассказали о внутренностях вашей решалки :)

PS: Никогда не слышал о проблемах разбиения домена на число поддоменов не кратных степени двойки :)

Архитектора этой части кода уже уволили ? :)

23 ноября 2012

И владельцы АМД-кластеров порадуются, что чуть сползет цена. И владельцы интелов порадуются - включат HT.

Как "владелец" кластеров и на том и на другом могу сказать что "для скорости" код должен иметь принципиально различный дизайн при работе с памятью. Но как правильно было замечено, скорость (сейчас) гораздо меньшая проблема чем точность (совпадение расчёта и эксперимента). Достаточно просто иметь приличную масштабируемость.

PS: Эффективность/неэффективность HТ зависит как от соотношения целочисленных/float point команд в коде (за цикл) так и от "ветвистости" кода. От процессора к процессору это может меняться (не говоря уже об изменениях в коде) так что как "+" так и "-" в плане скорости от HT это вполне нормальная вещь.

PPS: Интересно - обладатели <noindex>Xeon Phi</noindex> тоже будут платить за лицензии "поядерно" :smile:

23 ноября 2012

адм, грубо говоря, объявили о выходе из гонки за самый быстрый ЦП.

коэфф. сделаешь один раз, именно учтутся текущие актуальные процессоры.

Заметь, интелы тоже очень разные, но выравнено именно между самым сильным АДМ и самым сильным Интел.

И то - примерно выравнено для 2ЦП и выше.

Подравняется АМД, сделает новую линейку шуструю - будет для этих новых серий тоже 1 коэф.. и всё. сделаете апдейт таблицы.

Много объяснять тут не надо. Мануал по лицензированию будет не более странички. Или боитесь, что клиенты испугаются "многа букаф" и перейдут на лог.линейку? Всё эволюционирует. Если грамотно подать - наоборот, все обрадуются.

Ну или забить на это всё, не выравнивать. оставить, как было, но сделать именно на ядро, а не на поток - как сейчас.

Причем это именно надо ParallelComputing переименовать в Cores и научить решалку / сервер лицензий считать физические ядра, а не потоки.

Т.е. для двухъядерника с HT - (4 потока) - процесс запустился в две нитки на 0 и 1 потоке - это занято 1 core. Процесс запустился на 0 и 2 потоке - занято 2 cores. На всех 4х потоках 0, 1, 2, 3 - тоже 2 cores.

Но тогда Интелы реально выиграют, а амд останутся там же.

Если вы ни с кем особо не дружите, то лучше подравнять. пусть юзеры выбирают ЦП.

Или для HT отдельную опцию клепать? Так тогда тоже - выяснится, что она не на всех архитектурах так эффективна - снова переделывать будете?

23 ноября 2012

всё это красиво завернуть)

Продавать лицензию на количество запусков решателя (хоть на миллиарде ядер и без ограничения времени)

Эффективность труда расчётчиков резко возрастёт :clap_1:

23 ноября 2012

Продавать лицензию на количество запусков решателя (хоть на миллиарде ядер и без ограничения времени)

неее..... я раз 20 запущу, ток чтоб сетку построить аккуратную.

генератор тут встроен в решалку.

23 ноября 2012

п4.1 и 6 многое рассказали о внутренностях вашей решалки :)

Я сперва ответ наколотил, а потом бегал и уточнял секретно или нет то или се.

PS: Никогда не слышал о проблемах разбиения домена на число поддоменов не кратных степени двойки :)

Мы тоже не слышали. Но речь шла не о поддоменах, а про области, которые являются MPI-объектами.

Архитектора этой части кода уже уволили ? :)

Да вы что, это же национальное достояние.

:)

PS: Эффективность/неэффективность HТ зависит как от соотношения целочисленных/float point команд в коде (за цикл) так и от "ветвистости" кода. От процессора к процессору это может меняться (не говоря уже об изменениях в коде) так что как "+" так и "-" в плане скорости от HT это вполне нормальная вещь.

Мы не анализировали.

PPS: Интересно - обладатели <noindex>Xeon Phi</noindex> тоже будут платить за лицензии "поядерно"

Вооооооот. Я ж говорю, что нужно продавать единицу производительности, по сути. У меня несколько лет назад была идея вешать в граммах. Т.е. продавать не параллельные опции, а количество расчетных ячеек.

Вам сколько? Мульенчик? Пжалуста!

А уж кто там да как считать будет - его дело.

адм, грубо говоря, объявили о выходе из гонки за самый быстрый ЦП.

коэфф. сделаешь один раз, именно учтутся текущие актуальные процессоры.

Если выяснится, что ядро АМД эквивалентно ядру HT Intel, то я и без всяческих коэффициентов предложу простую систему лицензирования.

Много объяснять тут не надо. Мануал по лицензированию будет не более странички. Или боитесь, что клиенты испугаются "многа букаф" и перейдут на лог.линейку? Всё эволюционирует. Если грамотно подать - наоборот, все обрадуются.

Ты не понимаешь. Даже текущая простая система вызывает кучу вопросов.

Или для HT отдельную опцию клепать? Так тогда тоже - выяснится, что она не на всех архитектурах так эффективна - снова переделывать будете?

Вот чтобы не метаться и есть идея лицензировать опять по процессорам.

Сколько бы в ЦП не было ядер - все ваши. Считайте как хотите.

Ладно, это я буду еще думать.

Есть идея вообще параллельные опции давать за так, а лицензировать усложнение постановки задачи.

23 ноября 2012

генератор тут встроен в решалку.

AMR или таки весь генератор ? Это тоже моветон :doh:

Даже если генератор - атомат, должна быть возможность посмотреть на результаты работы этого автомата перед тем как пускать сетку в дело. AMR понятно дело глупо отделять от решалки как и всякие фишки с динамическим перестроением/смещением сеток для подвижных объектов.

Есть идея вообще параллельные опции давать за так, а лицензировать усложнение постановки задачи.

23 ноября 2012

Даже если генератор - атомат, должна быть возможность посмотреть на результаты работы этого автомата перед тем как пускать сетку в дело.

базовая сетка строится до решалки отдельным модулем.

все адаптации применяются только после запуска решалки, и посмотреть результат можно только после 1 шага счета.

23 ноября 2012

AMR или таки весь генератор ? Это тоже моветон

Имеется в виду, что строится сетка непосредственно в решателе, но все критерии ее построения задаются в GUI пере запуском данной процедуры.

Правильной дорогой идёте, товарищи ©

Голая задница покажет правоту.

:)

23 ноября 2012

была идея вешать в граммах. Т.е. продавать не параллельные опции, а количество расчетных ячеек.

Вам сколько? Мульенчик? Пжалуста!

А уж кто там да как считать будет - его дело.

Мильён мильёну - рознь. Одно дело мильён какой нибудь несжимайки или невязкой сжимайки и совсем другое

мильён многокомпонентной реагирующей смеси компонентов этак на 500-600 да всё это еще в неравновесной постановке.

ИдеЙ с дополнительными моделями в виде опций более интересен.

23 ноября 2012

ИдеЙ с дополнительными моделями в виде опций более интересен.

оно и так - в виде опций.

отдельно турбулентность, отдельно химия, излучение, импорты всякие итд

23 ноября 2012

Голая задница покажет правоту.

Как много полезной информации в ваших сообщениях.

Как интереcно их читать. :unsure:

24 ноября 2012

А презентация эта не для ISPA писалась

В том числе и для меня.

Я только догадался скорость Абакуса посчитать.

Скорость компьютера на котором проводился тест 2 600 Гфл в сек, а скорость Абакуса всего 9 Гфл в сек.

Стоимось только ускорителей - 350 000 рублей.

Это же деньги выброшенные на ветер. :unsure:

Теперь все про это знают.

Решили возможности Абакуса отрекламировать, вот и отрекламировали. :unsure:

Вам же было сказано, что форум это не кафедральная мурзилка. Но вы даже этого не поняли.

24 ноября 2012

У меня реализован Холецкий. Скорость не заисит от метода решения, а зависит от программной реализации.

Напишите скорость вашей программы на CPU и на GPU.

И кто из нас глухарь.

Этот вопрос был в Сообщение #646

1. Я неоднократно писал, что матрица у нас неопределенная с комплексным спектром СЗ. Следовательно Холецкий отдыхает :bleh:

(для нас уже давно умер :blink:

);

2. Скорость программы - что это? Поскольку у нас рассчитывается эволюционный процесс, то размерность задачи постоянно меняется, меняется и структура матрицы.

Подробная трассировка на каждом шаге интегрирования с временами CPU и GPU у нас есть. Есть время расчета астрономическое. Вот результаты нас приводят в некоторое недоумение :wallbash: . Если сравнивать одни и те же расчеты на CPU и GPU на соответствующих шагах по времени, то картина следующая. То CPU быстрее GPU раза в два-три, то наоборот в тех же пропорциях. Причем различаются и варианты с nVidia и AMD. Хотя конечный результат расчета абсолютно одинаковый на каждом шаге для любых вариантов.

3. В этой, да и в других ветках форума видно я не найду ни ответов ни рекомендаций :sad: .

4. Предлагаю к ИСПА обращаться: "Повелитель ИСПА", поскольку "господин" как-то сухо и официально :biggrin:

Войти

Суперкомпьютер своими руками для расчетов в ansys и 3d приложениях

Рекомендованные сообщения

a_schelyaev 367

Ссылка на сообщение

Поделиться на других сайтах

Гость ISPA

Ссылка на сообщение

Поделиться на других сайтах

a_schelyaev 367

Ссылка на сообщение

Поделиться на других сайтах

Гость ISPA

Ссылка на сообщение

Поделиться на других сайтах

Bonusfrag 104

Ссылка на сообщение

Поделиться на других сайтах

a_schelyaev 367

Ссылка на сообщение

Поделиться на других сайтах

HFL 34

Ссылка на сообщение

Поделиться на других сайтах

HFL 34

Ссылка на сообщение

Поделиться на других сайтах

Bonusfrag 104

Ссылка на сообщение

Поделиться на других сайтах

HFL 34

Ссылка на сообщение

Поделиться на других сайтах

Bonusfrag 104

Ссылка на сообщение

Поделиться на других сайтах

a_schelyaev 367

Ссылка на сообщение

Поделиться на других сайтах

HFL 34

Ссылка на сообщение

Поделиться на других сайтах

Bonusfrag 104

Ссылка на сообщение

Поделиться на других сайтах

a_schelyaev 367

Ссылка на сообщение

Поделиться на других сайтах

HFL 34

Ссылка на сообщение

Поделиться на других сайтах

Bonusfrag 104

Ссылка на сообщение

Поделиться на других сайтах

Гость ISPA

Ссылка на сообщение

Поделиться на других сайтах

Гость ISPA

Ссылка на сообщение

Поделиться на других сайтах

Eugeen 6

Ссылка на сообщение

Поделиться на других сайтах

Сейчас на странице 0 пользователей

Сообщения