Перейти к публикации

Суперкомпьютер своими руками для расчетов в ansys и 3d приложениях


Рекомендованные сообщения

У SQL неплохо сделан этот момент:

Мне не нравится при продаже продукта спрашивать у клиента "а какой у вас процессор?". А что будет, если они на другом компе будут считать?

На мой взгляд изврат.

Я продаю единицу производительности.

Через недельку погоняю на каком-нибудь AMDюке и посмотрю, что выйдет.

Никто ничего не скрывает, если бы что и хотели скрывать в инет бы вообще никакой инфы бы не выкладывали, поэтому не нужно тут ахинею писать.

Да, я прям спал и видел "как бы получше все это спрятать, выложив у всех на виду".

:)

Испе пока невдомек, что клиентура готова жертвовать скоростью решения ради точности получаемого решения.

И под точностью я имею в виду не алгебраическую характеристику решения, а совпадение с реальными физическими процессами.

Это действительно новизна. Для нелинейной задачи одна скорость, а для линейной другая. :clap_1: Какую наукообразную базу подвели.

Новизной является непонимание отдельных личностей, что некоторые участки кода слабо параллелятся и поэтому на каждой итерации задействуются не все ядра. Итого получаем, что суммарное количество операций остается постоянным, по мере их выполнения задействуются не все ядра, что ведет к сериализации операций, а время тикает.

Пусть Испа свой же документ, наконец-то, прочитает. А то выкладывает, а сам не читает что. Пусть Испа сравнит скорострельность своего алгоритма на разном количестве ядер.

Поэтому, если мы возвращаемся к той мысли, что кругом в мире кроме Испы тоже сидят не дураки, и Абакус это код, который писался больше времени, чем у отдельных товарищей, целым коллективом, то получается, что исходный код написан нормально и имеет характеристики параллелизма на уровне.

А озвученные характеристики со скромной подписью "нелинейная статика" означает, что постановка явно хитрожопая.

У нас в статике считалась постановка с движением изделия по льду с его разрушением.

Задачка не ахти по размерности - порядка сотни тысяч, но из-за особенностей постановки крутилась всю ночь на пролет.

Но Испе же тяжело представить, что кто-то кроме него еще в этом мире умеет писать коды. А тем временем тачка, на которой он рассекает, тоже считалась не на Испе на краш-тест. И возможно Вовой.

:)

Ссылка на сообщение
Поделиться на других сайтах


И под точностью я имею в виду не алгебраическую характеристику решения

А что такое алгебраическая характеристика решения. Вроде об этом никто не говорил.

Вы уж просветите. :unsure:

Ссылка на сообщение
Поделиться на других сайтах

Испе пока невдомек

Пусть Испа свой же документ

Пусть Испа сравнит

кроме Испы тоже сидят не дураки

Но Испе же тяжело представить

ИСПА - это программа, торговая марка.

Вы хоть понимаете, что программа не может сравнивать и представлять.

ИСПА - КЭ программа, которая быстро решает линейные и нелинейные задачи. Пора бы вам это понять.

Сделаю паузу пока этот дурдом прекратится. :unsure:

Ссылка на сообщение
Поделиться на других сайтах

Мне не нравится при продаже продукта спрашивать у клиента "а какой у вас процессор?". А что будет, если они на другом компе будут считать?

На мой взгляд изврат.

Я продаю единицу производительности.

Через недельку погоняю на каком-нибудь AMDюке и посмотрю, что выйдет.

мне кажется, что лицензию покупают после ПК или одновременно с ПК. Лицензия на год. За год мало у кого ПК меняется.

в конечном счете покупаются лицензионные опции на ядро без особой привязки к ЦП, а сервер лицензий пусть пересчитывает:

Т.е. вот для этого SQL - можно при 10 лицензиях запускать на 10 интелах или на 12 амд. Всё просто.

Вы себе сами коэффициенты сделаете по результатам тестов. И всё. Будет у вас условная единица производительности.

И владельцы АМД-кластеров порадуются, что чуть сползет цена. И владельцы интелов порадуются - включат HT.

всё это красиво завернуть)

Ссылка на сообщение
Поделиться на других сайтах

Ну потом АМД сделает новый проц и так что? Генерить под это каждый раз коэффициенты? А потом еще объяснять клиентам почему у них в одном случае так, а в другом эдак?

Ссылка на сообщение
Поделиться на других сайтах

2 a_schelyaev

Cпасибо за ответ.

п4.1 и 6 многое рассказали о внутренностях вашей решалки :)

PS: Никогда не слышал о проблемах разбиения домена на число поддоменов не кратных степени двойки :)

Архитектора этой части кода уже уволили ? :)

Ссылка на сообщение
Поделиться на других сайтах

И владельцы АМД-кластеров порадуются, что чуть сползет цена. И владельцы интелов порадуются - включат HT.

Как "владелец" кластеров и на том и на другом могу сказать что "для скорости" код должен иметь принципиально различный дизайн при работе с памятью. Но как правильно было замечено, скорость (сейчас) гораздо меньшая проблема чем точность (совпадение расчёта и эксперимента). Достаточно просто иметь приличную масштабируемость.

PS: Эффективность/неэффективность HТ зависит как от соотношения целочисленных/float point команд в коде (за цикл) так и от "ветвистости" кода. От процессора к процессору это может меняться (не говоря уже об изменениях в коде) так что как "+" так и "-" в плане скорости от HT это вполне нормальная вещь.

PPS: Интересно - обладатели <noindex>Xeon Phi</noindex> тоже будут платить за лицензии "поядерно" :smile:

Ссылка на сообщение
Поделиться на других сайтах

адм, грубо говоря, объявили о выходе из гонки за самый быстрый ЦП.

коэфф. сделаешь один раз, именно учтутся текущие актуальные процессоры.

Заметь, интелы тоже очень разные, но выравнено именно между самым сильным АДМ и самым сильным Интел.

И то - примерно выравнено для 2ЦП и выше.

Подравняется АМД, сделает новую линейку шуструю - будет для этих новых серий тоже 1 коэф.. и всё. сделаете апдейт таблицы.

Много объяснять тут не надо. Мануал по лицензированию будет не более странички. Или боитесь, что клиенты испугаются "многа букаф" и перейдут на лог.линейку? Всё эволюционирует. Если грамотно подать - наоборот, все обрадуются.

Ну или забить на это всё, не выравнивать. оставить, как было, но сделать именно на ядро, а не на поток - как сейчас.

Причем это именно надо ParallelComputing переименовать в Cores и научить решалку / сервер лицензий считать физические ядра, а не потоки.

Т.е. для двухъядерника с HT - (4 потока) - процесс запустился в две нитки на 0 и 1 потоке - это занято 1 core. Процесс запустился на 0 и 2 потоке - занято 2 cores. На всех 4х потоках 0, 1, 2, 3 - тоже 2 cores.

Но тогда Интелы реально выиграют, а амд останутся там же.

Если вы ни с кем особо не дружите, то лучше подравнять. пусть юзеры выбирают ЦП.

Или для HT отдельную опцию клепать? Так тогда тоже - выяснится, что она не на всех архитектурах так эффективна - снова переделывать будете?

Ссылка на сообщение
Поделиться на других сайтах

всё это красиво завернуть)

Продавать лицензию на количество запусков решателя (хоть на миллиарде ядер и без ограничения времени)

Эффективность труда расчётчиков резко возрастёт :clap_1:

Ссылка на сообщение
Поделиться на других сайтах

Продавать лицензию на количество запусков решателя (хоть на миллиарде ядер и без ограничения времени)

неее..... я раз 20 запущу, ток чтоб сетку построить аккуратную.

генератор тут встроен в решалку.

Ссылка на сообщение
Поделиться на других сайтах

п4.1 и 6 многое рассказали о внутренностях вашей решалки :)

Я сперва ответ наколотил, а потом бегал и уточнял секретно или нет то или се.

PS: Никогда не слышал о проблемах разбиения домена на число поддоменов не кратных степени двойки :)

Мы тоже не слышали. Но речь шла не о поддоменах, а про области, которые являются MPI-объектами.

Архитектора этой части кода уже уволили ? :)

Да вы что, это же национальное достояние.

:)

PS: Эффективность/неэффективность HТ зависит как от соотношения целочисленных/float point команд в коде (за цикл) так и от "ветвистости" кода. От процессора к процессору это может меняться (не говоря уже об изменениях в коде) так что как "+" так и "-" в плане скорости от HT это вполне нормальная вещь.

Мы не анализировали.

PPS: Интересно - обладатели <noindex>Xeon Phi</noindex> тоже будут платить за лицензии "поядерно" :smile:

Вооооооот. Я ж говорю, что нужно продавать единицу производительности, по сути. У меня несколько лет назад была идея вешать в граммах. Т.е. продавать не параллельные опции, а количество расчетных ячеек.

Вам сколько? Мульенчик? Пжалуста!

А уж кто там да как считать будет - его дело.

адм, грубо говоря, объявили о выходе из гонки за самый быстрый ЦП.

коэфф. сделаешь один раз, именно учтутся текущие актуальные процессоры.

Если выяснится, что ядро АМД эквивалентно ядру HT Intel, то я и без всяческих коэффициентов предложу простую систему лицензирования.

Много объяснять тут не надо. Мануал по лицензированию будет не более странички. Или боитесь, что клиенты испугаются "многа букаф" и перейдут на лог.линейку? Всё эволюционирует. Если грамотно подать - наоборот, все обрадуются.

Ты не понимаешь. Даже текущая простая система вызывает кучу вопросов.

Или для HT отдельную опцию клепать? Так тогда тоже - выяснится, что она не на всех архитектурах так эффективна - снова переделывать будете?

Вот чтобы не метаться и есть идея лицензировать опять по процессорам.

Сколько бы в ЦП не было ядер - все ваши. Считайте как хотите.

Ладно, это я буду еще думать.

Есть идея вообще параллельные опции давать за так, а лицензировать усложнение постановки задачи.

Ссылка на сообщение
Поделиться на других сайтах

генератор тут встроен в решалку.

AMR или таки весь генератор ? Это тоже моветон :doh:

Даже если генератор - атомат, должна быть возможность посмотреть на результаты работы этого автомата перед тем как пускать сетку в дело. AMR понятно дело глупо отделять от решалки как и всякие фишки с динамическим перестроением/смещением сеток для подвижных объектов.

Есть идея вообще параллельные опции давать за так, а лицензировать усложнение постановки задачи.

Правильной дорогой идёте, товарищи © :smile:

Ссылка на сообщение
Поделиться на других сайтах

Даже если генератор - атомат, должна быть возможность посмотреть на результаты работы этого автомата перед тем как пускать сетку в дело.

базовая сетка строится до решалки отдельным модулем.

все адаптации применяются только после запуска решалки, и посмотреть результат можно только после 1 шага счета.

Ссылка на сообщение
Поделиться на других сайтах

AMR или таки весь генератор ? Это тоже моветон :doh:

Имеется в виду, что строится сетка непосредственно в решателе, но все критерии ее построения задаются в GUI пере запуском данной процедуры.

Правильной дорогой идёте, товарищи © :smile:

Голая задница покажет правоту.

:)

Ссылка на сообщение
Поделиться на других сайтах

была идея вешать в граммах. Т.е. продавать не параллельные опции, а количество расчетных ячеек.

Вам сколько? Мульенчик? Пжалуста!

А уж кто там да как считать будет - его дело.

Мильён мильёну - рознь. Одно дело мильён какой нибудь несжимайки или невязкой сжимайки и совсем другое

мильён многокомпонентной реагирующей смеси компонентов этак на 500-600 да всё это еще в неравновесной постановке.

ИдеЙ с дополнительными моделями в виде опций более интересен.

Ссылка на сообщение
Поделиться на других сайтах

ИдеЙ с дополнительными моделями в виде опций более интересен.

оно и так - в виде опций.

отдельно турбулентность, отдельно химия, излучение, импорты всякие итд

Ссылка на сообщение
Поделиться на других сайтах

А презентация эта не для ISPA писалась

В том числе и для меня.

Я только догадался скорость Абакуса посчитать.

Скорость компьютера на котором проводился тест 2 600 Гфл в сек, а скорость Абакуса всего 9 Гфл в сек.

Стоимось только ускорителей - 350 000 рублей.

Это же деньги выброшенные на ветер. :unsure:

Теперь все про это знают.

Решили возможности Абакуса отрекламировать, вот и отрекламировали. :unsure:

Вам же было сказано, что форум это не кафедральная мурзилка. Но вы даже этого не поняли.

Ссылка на сообщение
Поделиться на других сайтах

У меня реализован Холецкий. Скорость не заисит от метода решения, а зависит от программной реализации.

Напишите скорость вашей программы на CPU и на GPU.

И кто из нас глухарь. :unsure:

Этот вопрос был в Сообщение #646

1. Я неоднократно писал, что матрица у нас неопределенная с комплексным спектром СЗ. Следовательно Холецкий отдыхает :bleh: (для нас уже давно умер :blink: );

2. Скорость программы - что это? Поскольку у нас рассчитывается эволюционный процесс, то размерность задачи постоянно меняется, меняется и структура матрицы.

Подробная трассировка на каждом шаге интегрирования с временами CPU и GPU у нас есть. Есть время расчета астрономическое. Вот результаты нас приводят в некоторое недоумение :wallbash: . Если сравнивать одни и те же расчеты на CPU и GPU на соответствующих шагах по времени, то картина следующая. То CPU быстрее GPU раза в два-три, то наоборот в тех же пропорциях. Причем различаются и варианты с nVidia и AMD. Хотя конечный результат расчета абсолютно одинаковый на каждом шаге для любых вариантов.

3. В этой, да и в других ветках форума видно я не найду ни ответов ни рекомендаций :sad: .

4. Предлагаю к ИСПА обращаться: "Повелитель ИСПА", поскольку "господин" как-то сухо и официально :biggrin:

Ссылка на сообщение
Поделиться на других сайтах
  • MFS открепил тему
Гость
Эта тема закрыта для публикации сообщений.
  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу.




  • Сообщения

    • maxx2000
      А вот мне интересно.  Как это делается в других системах? И как это портировать в SW? 
    • Guhl
      Я про точность ничего не говорил Я говорил про скорость работы Но сигнал о токе и так уже заведен в процессор. Получается, что компаратор - это дополнительное звено, где ж тут удешевление?
    • Ветерок
      Вопрос в названии темы: Можно ли гасить/негасить элементы в зависимости от значения глобальной переменной? Например, если длина детали меньше определенного значения, то часть элементов гасится, если длина больше, то присутствуют все. Гасимые элементы - не экземпляры массива. Хотелось бы реализовать без создания двух исполнений. Если такое возможно штатными средствами. Это некая базовая модель, по которой планируется генерировать различные варианты с разными произвольными (но в определенном диапазоне) габаритами. Генерировать буду не я, а заказчик. Моя задача реализовать это максимально удобно.   Адептов ТФ  и других систем прошу не рассказывать как это делается в других системах. Вопрос про Солид 2022.
    • gudstartup
      серво система принимает решение по мгновенному значению тока в течении периода времени времени отведенного для управления током и чем чаще она это делает тем лучше и качественней регулирование момента. с аналоговым контуром тока как бы вам не хотелось вы не получите  такие данные точности контура даже близко  дешево и никаких доп. функций не требуется.   
    • Guhl
      Кстати, быстродействующая токовая защита и защита по перенапряжению в современных приводах реализована на компараторах, которые являются представителями аналоговой техники. Почему?
    • ak762
      а какую используете толщину перемычек по высоте чтобы детали не подрывались из заготовки?
    • Guhl
      Я не говорил, что аналоговые приводы лучше современных, я говорил, что принципы остались старые.  Вот какой-то усилитель с токовой связью. У него 2ГГц   Частота среза серийного ОУ ТОС в схеме с ООС составляет от 100 МГц до 2 ГГц — она зависит только от величины сопротивления цепи ООС и встроенной корректирующей ёмкости и практически не зависит от заданного коэффициента усиления.   Если для контура тока требуется преобразовать аналоговый сигнал в цифровой, а потом обработать за 32нс, то как общее время работы всей схемы может быть быстрее работы ее отдельной части?   Да вы принц саркастических ужимок 
    • gudstartup
      ну вы блин даете, назад к обезъяне. В мире повальная цифровизация а вы про аналоговый процессор выдумываете. Ну покажите мне действующую модель аналогового привода на вашем аналоговом процессоре который обеспечит на 10 м\мин отклонение от контура в 2 мкм? 32нс это 30 Мгц больше чем у вашего  741 в 30 раз и при этом там еще алгоритмы отрабатываются по оптимизации сигнала управления моментом . фильтры тоже цифровые применяются и все это за 32нс а в hrv 4 за 15.  а вы попрыгайте легче станет главное чтобы движение было непрерывным как в любимой ващей аналоговой технике которая теперь вас почему то не окружает. Потому что ее на свалку все выкинули!!! А может вы аудиофил и у вас еще граммофон остался и отсюда ваша глубокая привязанность ко всему аналоговому!!! Дуйте в трубу и прогресс вас услышит и повернет обратно!!!
    • Guhl
    • lem_on
      Что мне доказывать тупице, что он тупой?? Воняет из очка у тебя, заткни чем ни будь и проветри комнату. Не зря от тебя жена то ушла.
×
×
  • Создать...