Перейти к публикации

Суперкомпьютер своими руками для расчетов в ansys и 3d приложениях


Рекомендованные сообщения

У SQL неплохо сделан этот момент:

Мне не нравится при продаже продукта спрашивать у клиента "а какой у вас процессор?". А что будет, если они на другом компе будут считать?

На мой взгляд изврат.

Я продаю единицу производительности.

Через недельку погоняю на каком-нибудь AMDюке и посмотрю, что выйдет.

Никто ничего не скрывает, если бы что и хотели скрывать в инет бы вообще никакой инфы бы не выкладывали, поэтому не нужно тут ахинею писать.

Да, я прям спал и видел "как бы получше все это спрятать, выложив у всех на виду".

:)

Испе пока невдомек, что клиентура готова жертвовать скоростью решения ради точности получаемого решения.

И под точностью я имею в виду не алгебраическую характеристику решения, а совпадение с реальными физическими процессами.

Это действительно новизна. Для нелинейной задачи одна скорость, а для линейной другая. :clap_1: Какую наукообразную базу подвели.

Новизной является непонимание отдельных личностей, что некоторые участки кода слабо параллелятся и поэтому на каждой итерации задействуются не все ядра. Итого получаем, что суммарное количество операций остается постоянным, по мере их выполнения задействуются не все ядра, что ведет к сериализации операций, а время тикает.

Пусть Испа свой же документ, наконец-то, прочитает. А то выкладывает, а сам не читает что. Пусть Испа сравнит скорострельность своего алгоритма на разном количестве ядер.

Поэтому, если мы возвращаемся к той мысли, что кругом в мире кроме Испы тоже сидят не дураки, и Абакус это код, который писался больше времени, чем у отдельных товарищей, целым коллективом, то получается, что исходный код написан нормально и имеет характеристики параллелизма на уровне.

А озвученные характеристики со скромной подписью "нелинейная статика" означает, что постановка явно хитрожопая.

У нас в статике считалась постановка с движением изделия по льду с его разрушением.

Задачка не ахти по размерности - порядка сотни тысяч, но из-за особенностей постановки крутилась всю ночь на пролет.

Но Испе же тяжело представить, что кто-то кроме него еще в этом мире умеет писать коды. А тем временем тачка, на которой он рассекает, тоже считалась не на Испе на краш-тест. И возможно Вовой.

:)

Ссылка на сообщение
Поделиться на других сайтах


И под точностью я имею в виду не алгебраическую характеристику решения

А что такое алгебраическая характеристика решения. Вроде об этом никто не говорил.

Вы уж просветите. :unsure:

Ссылка на сообщение
Поделиться на других сайтах

Испе пока невдомек

Пусть Испа свой же документ

Пусть Испа сравнит

кроме Испы тоже сидят не дураки

Но Испе же тяжело представить

ИСПА - это программа, торговая марка.

Вы хоть понимаете, что программа не может сравнивать и представлять.

ИСПА - КЭ программа, которая быстро решает линейные и нелинейные задачи. Пора бы вам это понять.

Сделаю паузу пока этот дурдом прекратится. :unsure:

Ссылка на сообщение
Поделиться на других сайтах

Мне не нравится при продаже продукта спрашивать у клиента "а какой у вас процессор?". А что будет, если они на другом компе будут считать?

На мой взгляд изврат.

Я продаю единицу производительности.

Через недельку погоняю на каком-нибудь AMDюке и посмотрю, что выйдет.

мне кажется, что лицензию покупают после ПК или одновременно с ПК. Лицензия на год. За год мало у кого ПК меняется.

в конечном счете покупаются лицензионные опции на ядро без особой привязки к ЦП, а сервер лицензий пусть пересчитывает:

Т.е. вот для этого SQL - можно при 10 лицензиях запускать на 10 интелах или на 12 амд. Всё просто.

Вы себе сами коэффициенты сделаете по результатам тестов. И всё. Будет у вас условная единица производительности.

И владельцы АМД-кластеров порадуются, что чуть сползет цена. И владельцы интелов порадуются - включат HT.

всё это красиво завернуть)

Ссылка на сообщение
Поделиться на других сайтах

Ну потом АМД сделает новый проц и так что? Генерить под это каждый раз коэффициенты? А потом еще объяснять клиентам почему у них в одном случае так, а в другом эдак?

Ссылка на сообщение
Поделиться на других сайтах

2 a_schelyaev

Cпасибо за ответ.

п4.1 и 6 многое рассказали о внутренностях вашей решалки :)

PS: Никогда не слышал о проблемах разбиения домена на число поддоменов не кратных степени двойки :)

Архитектора этой части кода уже уволили ? :)

Ссылка на сообщение
Поделиться на других сайтах

И владельцы АМД-кластеров порадуются, что чуть сползет цена. И владельцы интелов порадуются - включат HT.

Как "владелец" кластеров и на том и на другом могу сказать что "для скорости" код должен иметь принципиально различный дизайн при работе с памятью. Но как правильно было замечено, скорость (сейчас) гораздо меньшая проблема чем точность (совпадение расчёта и эксперимента). Достаточно просто иметь приличную масштабируемость.

PS: Эффективность/неэффективность HТ зависит как от соотношения целочисленных/float point команд в коде (за цикл) так и от "ветвистости" кода. От процессора к процессору это может меняться (не говоря уже об изменениях в коде) так что как "+" так и "-" в плане скорости от HT это вполне нормальная вещь.

PPS: Интересно - обладатели <noindex>Xeon Phi</noindex> тоже будут платить за лицензии "поядерно" :smile:

Ссылка на сообщение
Поделиться на других сайтах

адм, грубо говоря, объявили о выходе из гонки за самый быстрый ЦП.

коэфф. сделаешь один раз, именно учтутся текущие актуальные процессоры.

Заметь, интелы тоже очень разные, но выравнено именно между самым сильным АДМ и самым сильным Интел.

И то - примерно выравнено для 2ЦП и выше.

Подравняется АМД, сделает новую линейку шуструю - будет для этих новых серий тоже 1 коэф.. и всё. сделаете апдейт таблицы.

Много объяснять тут не надо. Мануал по лицензированию будет не более странички. Или боитесь, что клиенты испугаются "многа букаф" и перейдут на лог.линейку? Всё эволюционирует. Если грамотно подать - наоборот, все обрадуются.

Ну или забить на это всё, не выравнивать. оставить, как было, но сделать именно на ядро, а не на поток - как сейчас.

Причем это именно надо ParallelComputing переименовать в Cores и научить решалку / сервер лицензий считать физические ядра, а не потоки.

Т.е. для двухъядерника с HT - (4 потока) - процесс запустился в две нитки на 0 и 1 потоке - это занято 1 core. Процесс запустился на 0 и 2 потоке - занято 2 cores. На всех 4х потоках 0, 1, 2, 3 - тоже 2 cores.

Но тогда Интелы реально выиграют, а амд останутся там же.

Если вы ни с кем особо не дружите, то лучше подравнять. пусть юзеры выбирают ЦП.

Или для HT отдельную опцию клепать? Так тогда тоже - выяснится, что она не на всех архитектурах так эффективна - снова переделывать будете?

Ссылка на сообщение
Поделиться на других сайтах

всё это красиво завернуть)

Продавать лицензию на количество запусков решателя (хоть на миллиарде ядер и без ограничения времени)

Эффективность труда расчётчиков резко возрастёт :clap_1:

Ссылка на сообщение
Поделиться на других сайтах

Продавать лицензию на количество запусков решателя (хоть на миллиарде ядер и без ограничения времени)

неее..... я раз 20 запущу, ток чтоб сетку построить аккуратную.

генератор тут встроен в решалку.

Ссылка на сообщение
Поделиться на других сайтах

п4.1 и 6 многое рассказали о внутренностях вашей решалки :)

Я сперва ответ наколотил, а потом бегал и уточнял секретно или нет то или се.

PS: Никогда не слышал о проблемах разбиения домена на число поддоменов не кратных степени двойки :)

Мы тоже не слышали. Но речь шла не о поддоменах, а про области, которые являются MPI-объектами.

Архитектора этой части кода уже уволили ? :)

Да вы что, это же национальное достояние.

:)

PS: Эффективность/неэффективность HТ зависит как от соотношения целочисленных/float point команд в коде (за цикл) так и от "ветвистости" кода. От процессора к процессору это может меняться (не говоря уже об изменениях в коде) так что как "+" так и "-" в плане скорости от HT это вполне нормальная вещь.

Мы не анализировали.

PPS: Интересно - обладатели <noindex>Xeon Phi</noindex> тоже будут платить за лицензии "поядерно" :smile:

Вооооооот. Я ж говорю, что нужно продавать единицу производительности, по сути. У меня несколько лет назад была идея вешать в граммах. Т.е. продавать не параллельные опции, а количество расчетных ячеек.

Вам сколько? Мульенчик? Пжалуста!

А уж кто там да как считать будет - его дело.

адм, грубо говоря, объявили о выходе из гонки за самый быстрый ЦП.

коэфф. сделаешь один раз, именно учтутся текущие актуальные процессоры.

Если выяснится, что ядро АМД эквивалентно ядру HT Intel, то я и без всяческих коэффициентов предложу простую систему лицензирования.

Много объяснять тут не надо. Мануал по лицензированию будет не более странички. Или боитесь, что клиенты испугаются "многа букаф" и перейдут на лог.линейку? Всё эволюционирует. Если грамотно подать - наоборот, все обрадуются.

Ты не понимаешь. Даже текущая простая система вызывает кучу вопросов.

Или для HT отдельную опцию клепать? Так тогда тоже - выяснится, что она не на всех архитектурах так эффективна - снова переделывать будете?

Вот чтобы не метаться и есть идея лицензировать опять по процессорам.

Сколько бы в ЦП не было ядер - все ваши. Считайте как хотите.

Ладно, это я буду еще думать.

Есть идея вообще параллельные опции давать за так, а лицензировать усложнение постановки задачи.

Ссылка на сообщение
Поделиться на других сайтах

генератор тут встроен в решалку.

AMR или таки весь генератор ? Это тоже моветон :doh:

Даже если генератор - атомат, должна быть возможность посмотреть на результаты работы этого автомата перед тем как пускать сетку в дело. AMR понятно дело глупо отделять от решалки как и всякие фишки с динамическим перестроением/смещением сеток для подвижных объектов.

Есть идея вообще параллельные опции давать за так, а лицензировать усложнение постановки задачи.

Правильной дорогой идёте, товарищи © :smile:

Ссылка на сообщение
Поделиться на других сайтах

Даже если генератор - атомат, должна быть возможность посмотреть на результаты работы этого автомата перед тем как пускать сетку в дело.

базовая сетка строится до решалки отдельным модулем.

все адаптации применяются только после запуска решалки, и посмотреть результат можно только после 1 шага счета.

Ссылка на сообщение
Поделиться на других сайтах

AMR или таки весь генератор ? Это тоже моветон :doh:

Имеется в виду, что строится сетка непосредственно в решателе, но все критерии ее построения задаются в GUI пере запуском данной процедуры.

Правильной дорогой идёте, товарищи © :smile:

Голая задница покажет правоту.

:)

Ссылка на сообщение
Поделиться на других сайтах

была идея вешать в граммах. Т.е. продавать не параллельные опции, а количество расчетных ячеек.

Вам сколько? Мульенчик? Пжалуста!

А уж кто там да как считать будет - его дело.

Мильён мильёну - рознь. Одно дело мильён какой нибудь несжимайки или невязкой сжимайки и совсем другое

мильён многокомпонентной реагирующей смеси компонентов этак на 500-600 да всё это еще в неравновесной постановке.

ИдеЙ с дополнительными моделями в виде опций более интересен.

Ссылка на сообщение
Поделиться на других сайтах

ИдеЙ с дополнительными моделями в виде опций более интересен.

оно и так - в виде опций.

отдельно турбулентность, отдельно химия, излучение, импорты всякие итд

Ссылка на сообщение
Поделиться на других сайтах

А презентация эта не для ISPA писалась

В том числе и для меня.

Я только догадался скорость Абакуса посчитать.

Скорость компьютера на котором проводился тест 2 600 Гфл в сек, а скорость Абакуса всего 9 Гфл в сек.

Стоимось только ускорителей - 350 000 рублей.

Это же деньги выброшенные на ветер. :unsure:

Теперь все про это знают.

Решили возможности Абакуса отрекламировать, вот и отрекламировали. :unsure:

Вам же было сказано, что форум это не кафедральная мурзилка. Но вы даже этого не поняли.

Ссылка на сообщение
Поделиться на других сайтах

У меня реализован Холецкий. Скорость не заисит от метода решения, а зависит от программной реализации.

Напишите скорость вашей программы на CPU и на GPU.

И кто из нас глухарь. :unsure:

Этот вопрос был в Сообщение #646

1. Я неоднократно писал, что матрица у нас неопределенная с комплексным спектром СЗ. Следовательно Холецкий отдыхает :bleh: (для нас уже давно умер :blink: );

2. Скорость программы - что это? Поскольку у нас рассчитывается эволюционный процесс, то размерность задачи постоянно меняется, меняется и структура матрицы.

Подробная трассировка на каждом шаге интегрирования с временами CPU и GPU у нас есть. Есть время расчета астрономическое. Вот результаты нас приводят в некоторое недоумение :wallbash: . Если сравнивать одни и те же расчеты на CPU и GPU на соответствующих шагах по времени, то картина следующая. То CPU быстрее GPU раза в два-три, то наоборот в тех же пропорциях. Причем различаются и варианты с nVidia и AMD. Хотя конечный результат расчета абсолютно одинаковый на каждом шаге для любых вариантов.

3. В этой, да и в других ветках форума видно я не найду ни ответов ни рекомендаций :sad: .

4. Предлагаю к ИСПА обращаться: "Повелитель ИСПА", поскольку "господин" как-то сухо и официально :biggrin:

Ссылка на сообщение
Поделиться на других сайтах
  • MFS открепил тему
Гость
Эта тема закрыта для публикации сообщений.
  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу.




  • Сообщения

    • Maik812
      я пример привел.  Можно в качестве таблиц или помощника сделать как то. может справочника.
    • Tehnov
      ой не, такое не осилю и суваться туда откровенно не хочется.
    • AlexKaz
      Сложных задач мало, простых задач много. Конструктор с SW практически самодостаточен, поэтому конструктора в спросе. А на сложные госы находят разные прослойки до фрилансеров с тем же sw.
    • AlexKL
      Может лучше в LS-Dyne это делать? Или в ANSYS - это требование такое?
    • maxx2000
      ну так сделай дуги в других плоскостях, будет и в них работать опять какие-то шарады. Так-то инструмент привязывается в машинных координатах (обычно G53), а указывается только смещение рабочей координаты(обычно G54) относительно машинной.
    • maxx2000
      Пригласили на дысь в одну контору занимающуюся проектированием грузоподъёмных механизмов. Конкретно взялись они за проект 90 тонного крана типа Пионер. Модульный, разборный, чтоб можно было на грузовиках по тайге возить. Брали просто готовую конструкцию и масштабировали кратно.  Волновал только навык оценки конструкции на опрокидывание нежели навыки прочностного расчёта.  Т.е. нужен был инженер-конструктор способный оценить возможность эксплуатации в конкретном плане установки крана. И там всё так, краны, балки, укосины -  всё масштабируется кратно, а чтобы двигалось редуктора да моторы пожирнее. Собрали, испытали, наварили где надо.   Ну и да, всё чаще зовут на собеседование в строительные компании на должности проектировщиков КМ,КЖ конструкторов-машиностроителей, а не ПГС. 
    • Fedor
      https://moskvadeluxe.ru/vysotnye-ogranicheniya-v-moskve-398-pp/   
    • Maik812
      Хотелось бы как плагин к Солиду. есть приложение SolidWorks Inspection версия 2014 x64 например, по размерным цепям
    • Jesse
      Так льготную ипотеку только недавно убрали, а зарплаты выросли уже как год/два назад..))
    • Fedor
      В строительстве взяли курс на то, чтобы проектировщик умел бы и считать на прочность и чертить . Для чего программы пишутся если ими не пользоваться ?  Механику деформируемых тел в той или иной форме почти все инженеры учат... :)    Логика прогресса. Сейчас и логарифмической линейкой мало кто умеет пользоваться.  :) А каменный топор и вовсе никто не сможет сделать окажись в лесу :)    Высотный регламент наверняка не позволит. Проще закопаться в глубину :)  https://kgiop.gov.spb.ru/media/uploads/userfiles/2021/02/04/Приложение_2.2_Высоты_1-80.pdf  
×
×
  • Создать...