Перейти к публикации

Суперкомпьютер своими руками для расчетов в ansys и 3d приложениях


Рекомендованные сообщения

У SQL неплохо сделан этот момент:

Мне не нравится при продаже продукта спрашивать у клиента "а какой у вас процессор?". А что будет, если они на другом компе будут считать?

На мой взгляд изврат.

Я продаю единицу производительности.

Через недельку погоняю на каком-нибудь AMDюке и посмотрю, что выйдет.

Никто ничего не скрывает, если бы что и хотели скрывать в инет бы вообще никакой инфы бы не выкладывали, поэтому не нужно тут ахинею писать.

Да, я прям спал и видел "как бы получше все это спрятать, выложив у всех на виду".

:)

Испе пока невдомек, что клиентура готова жертвовать скоростью решения ради точности получаемого решения.

И под точностью я имею в виду не алгебраическую характеристику решения, а совпадение с реальными физическими процессами.

Это действительно новизна. Для нелинейной задачи одна скорость, а для линейной другая. :clap_1: Какую наукообразную базу подвели.

Новизной является непонимание отдельных личностей, что некоторые участки кода слабо параллелятся и поэтому на каждой итерации задействуются не все ядра. Итого получаем, что суммарное количество операций остается постоянным, по мере их выполнения задействуются не все ядра, что ведет к сериализации операций, а время тикает.

Пусть Испа свой же документ, наконец-то, прочитает. А то выкладывает, а сам не читает что. Пусть Испа сравнит скорострельность своего алгоритма на разном количестве ядер.

Поэтому, если мы возвращаемся к той мысли, что кругом в мире кроме Испы тоже сидят не дураки, и Абакус это код, который писался больше времени, чем у отдельных товарищей, целым коллективом, то получается, что исходный код написан нормально и имеет характеристики параллелизма на уровне.

А озвученные характеристики со скромной подписью "нелинейная статика" означает, что постановка явно хитрожопая.

У нас в статике считалась постановка с движением изделия по льду с его разрушением.

Задачка не ахти по размерности - порядка сотни тысяч, но из-за особенностей постановки крутилась всю ночь на пролет.

Но Испе же тяжело представить, что кто-то кроме него еще в этом мире умеет писать коды. А тем временем тачка, на которой он рассекает, тоже считалась не на Испе на краш-тест. И возможно Вовой.

:)

Ссылка на сообщение
Поделиться на других сайтах


И под точностью я имею в виду не алгебраическую характеристику решения

А что такое алгебраическая характеристика решения. Вроде об этом никто не говорил.

Вы уж просветите. :unsure:

Ссылка на сообщение
Поделиться на других сайтах

Испе пока невдомек

Пусть Испа свой же документ

Пусть Испа сравнит

кроме Испы тоже сидят не дураки

Но Испе же тяжело представить

ИСПА - это программа, торговая марка.

Вы хоть понимаете, что программа не может сравнивать и представлять.

ИСПА - КЭ программа, которая быстро решает линейные и нелинейные задачи. Пора бы вам это понять.

Сделаю паузу пока этот дурдом прекратится. :unsure:

Ссылка на сообщение
Поделиться на других сайтах

Мне не нравится при продаже продукта спрашивать у клиента "а какой у вас процессор?". А что будет, если они на другом компе будут считать?

На мой взгляд изврат.

Я продаю единицу производительности.

Через недельку погоняю на каком-нибудь AMDюке и посмотрю, что выйдет.

мне кажется, что лицензию покупают после ПК или одновременно с ПК. Лицензия на год. За год мало у кого ПК меняется.

в конечном счете покупаются лицензионные опции на ядро без особой привязки к ЦП, а сервер лицензий пусть пересчитывает:

Т.е. вот для этого SQL - можно при 10 лицензиях запускать на 10 интелах или на 12 амд. Всё просто.

Вы себе сами коэффициенты сделаете по результатам тестов. И всё. Будет у вас условная единица производительности.

И владельцы АМД-кластеров порадуются, что чуть сползет цена. И владельцы интелов порадуются - включат HT.

всё это красиво завернуть)

Ссылка на сообщение
Поделиться на других сайтах

Ну потом АМД сделает новый проц и так что? Генерить под это каждый раз коэффициенты? А потом еще объяснять клиентам почему у них в одном случае так, а в другом эдак?

Ссылка на сообщение
Поделиться на других сайтах

2 a_schelyaev

Cпасибо за ответ.

п4.1 и 6 многое рассказали о внутренностях вашей решалки :)

PS: Никогда не слышал о проблемах разбиения домена на число поддоменов не кратных степени двойки :)

Архитектора этой части кода уже уволили ? :)

Ссылка на сообщение
Поделиться на других сайтах

И владельцы АМД-кластеров порадуются, что чуть сползет цена. И владельцы интелов порадуются - включат HT.

Как "владелец" кластеров и на том и на другом могу сказать что "для скорости" код должен иметь принципиально различный дизайн при работе с памятью. Но как правильно было замечено, скорость (сейчас) гораздо меньшая проблема чем точность (совпадение расчёта и эксперимента). Достаточно просто иметь приличную масштабируемость.

PS: Эффективность/неэффективность HТ зависит как от соотношения целочисленных/float point команд в коде (за цикл) так и от "ветвистости" кода. От процессора к процессору это может меняться (не говоря уже об изменениях в коде) так что как "+" так и "-" в плане скорости от HT это вполне нормальная вещь.

PPS: Интересно - обладатели <noindex>Xeon Phi</noindex> тоже будут платить за лицензии "поядерно" :smile:

Ссылка на сообщение
Поделиться на других сайтах

адм, грубо говоря, объявили о выходе из гонки за самый быстрый ЦП.

коэфф. сделаешь один раз, именно учтутся текущие актуальные процессоры.

Заметь, интелы тоже очень разные, но выравнено именно между самым сильным АДМ и самым сильным Интел.

И то - примерно выравнено для 2ЦП и выше.

Подравняется АМД, сделает новую линейку шуструю - будет для этих новых серий тоже 1 коэф.. и всё. сделаете апдейт таблицы.

Много объяснять тут не надо. Мануал по лицензированию будет не более странички. Или боитесь, что клиенты испугаются "многа букаф" и перейдут на лог.линейку? Всё эволюционирует. Если грамотно подать - наоборот, все обрадуются.

Ну или забить на это всё, не выравнивать. оставить, как было, но сделать именно на ядро, а не на поток - как сейчас.

Причем это именно надо ParallelComputing переименовать в Cores и научить решалку / сервер лицензий считать физические ядра, а не потоки.

Т.е. для двухъядерника с HT - (4 потока) - процесс запустился в две нитки на 0 и 1 потоке - это занято 1 core. Процесс запустился на 0 и 2 потоке - занято 2 cores. На всех 4х потоках 0, 1, 2, 3 - тоже 2 cores.

Но тогда Интелы реально выиграют, а амд останутся там же.

Если вы ни с кем особо не дружите, то лучше подравнять. пусть юзеры выбирают ЦП.

Или для HT отдельную опцию клепать? Так тогда тоже - выяснится, что она не на всех архитектурах так эффективна - снова переделывать будете?

Ссылка на сообщение
Поделиться на других сайтах

всё это красиво завернуть)

Продавать лицензию на количество запусков решателя (хоть на миллиарде ядер и без ограничения времени)

Эффективность труда расчётчиков резко возрастёт :clap_1:

Ссылка на сообщение
Поделиться на других сайтах

Продавать лицензию на количество запусков решателя (хоть на миллиарде ядер и без ограничения времени)

неее..... я раз 20 запущу, ток чтоб сетку построить аккуратную.

генератор тут встроен в решалку.

Ссылка на сообщение
Поделиться на других сайтах

п4.1 и 6 многое рассказали о внутренностях вашей решалки :)

Я сперва ответ наколотил, а потом бегал и уточнял секретно или нет то или се.

PS: Никогда не слышал о проблемах разбиения домена на число поддоменов не кратных степени двойки :)

Мы тоже не слышали. Но речь шла не о поддоменах, а про области, которые являются MPI-объектами.

Архитектора этой части кода уже уволили ? :)

Да вы что, это же национальное достояние.

:)

PS: Эффективность/неэффективность HТ зависит как от соотношения целочисленных/float point команд в коде (за цикл) так и от "ветвистости" кода. От процессора к процессору это может меняться (не говоря уже об изменениях в коде) так что как "+" так и "-" в плане скорости от HT это вполне нормальная вещь.

Мы не анализировали.

PPS: Интересно - обладатели <noindex>Xeon Phi</noindex> тоже будут платить за лицензии "поядерно" :smile:

Вооооооот. Я ж говорю, что нужно продавать единицу производительности, по сути. У меня несколько лет назад была идея вешать в граммах. Т.е. продавать не параллельные опции, а количество расчетных ячеек.

Вам сколько? Мульенчик? Пжалуста!

А уж кто там да как считать будет - его дело.

адм, грубо говоря, объявили о выходе из гонки за самый быстрый ЦП.

коэфф. сделаешь один раз, именно учтутся текущие актуальные процессоры.

Если выяснится, что ядро АМД эквивалентно ядру HT Intel, то я и без всяческих коэффициентов предложу простую систему лицензирования.

Много объяснять тут не надо. Мануал по лицензированию будет не более странички. Или боитесь, что клиенты испугаются "многа букаф" и перейдут на лог.линейку? Всё эволюционирует. Если грамотно подать - наоборот, все обрадуются.

Ты не понимаешь. Даже текущая простая система вызывает кучу вопросов.

Или для HT отдельную опцию клепать? Так тогда тоже - выяснится, что она не на всех архитектурах так эффективна - снова переделывать будете?

Вот чтобы не метаться и есть идея лицензировать опять по процессорам.

Сколько бы в ЦП не было ядер - все ваши. Считайте как хотите.

Ладно, это я буду еще думать.

Есть идея вообще параллельные опции давать за так, а лицензировать усложнение постановки задачи.

Ссылка на сообщение
Поделиться на других сайтах

генератор тут встроен в решалку.

AMR или таки весь генератор ? Это тоже моветон :doh:

Даже если генератор - атомат, должна быть возможность посмотреть на результаты работы этого автомата перед тем как пускать сетку в дело. AMR понятно дело глупо отделять от решалки как и всякие фишки с динамическим перестроением/смещением сеток для подвижных объектов.

Есть идея вообще параллельные опции давать за так, а лицензировать усложнение постановки задачи.

Правильной дорогой идёте, товарищи © :smile:

Ссылка на сообщение
Поделиться на других сайтах

Даже если генератор - атомат, должна быть возможность посмотреть на результаты работы этого автомата перед тем как пускать сетку в дело.

базовая сетка строится до решалки отдельным модулем.

все адаптации применяются только после запуска решалки, и посмотреть результат можно только после 1 шага счета.

Ссылка на сообщение
Поделиться на других сайтах

AMR или таки весь генератор ? Это тоже моветон :doh:

Имеется в виду, что строится сетка непосредственно в решателе, но все критерии ее построения задаются в GUI пере запуском данной процедуры.

Правильной дорогой идёте, товарищи © :smile:

Голая задница покажет правоту.

:)

Ссылка на сообщение
Поделиться на других сайтах

была идея вешать в граммах. Т.е. продавать не параллельные опции, а количество расчетных ячеек.

Вам сколько? Мульенчик? Пжалуста!

А уж кто там да как считать будет - его дело.

Мильён мильёну - рознь. Одно дело мильён какой нибудь несжимайки или невязкой сжимайки и совсем другое

мильён многокомпонентной реагирующей смеси компонентов этак на 500-600 да всё это еще в неравновесной постановке.

ИдеЙ с дополнительными моделями в виде опций более интересен.

Ссылка на сообщение
Поделиться на других сайтах

ИдеЙ с дополнительными моделями в виде опций более интересен.

оно и так - в виде опций.

отдельно турбулентность, отдельно химия, излучение, импорты всякие итд

Ссылка на сообщение
Поделиться на других сайтах

А презентация эта не для ISPA писалась

В том числе и для меня.

Я только догадался скорость Абакуса посчитать.

Скорость компьютера на котором проводился тест 2 600 Гфл в сек, а скорость Абакуса всего 9 Гфл в сек.

Стоимось только ускорителей - 350 000 рублей.

Это же деньги выброшенные на ветер. :unsure:

Теперь все про это знают.

Решили возможности Абакуса отрекламировать, вот и отрекламировали. :unsure:

Вам же было сказано, что форум это не кафедральная мурзилка. Но вы даже этого не поняли.

Ссылка на сообщение
Поделиться на других сайтах

У меня реализован Холецкий. Скорость не заисит от метода решения, а зависит от программной реализации.

Напишите скорость вашей программы на CPU и на GPU.

И кто из нас глухарь. :unsure:

Этот вопрос был в Сообщение #646

1. Я неоднократно писал, что матрица у нас неопределенная с комплексным спектром СЗ. Следовательно Холецкий отдыхает :bleh: (для нас уже давно умер :blink: );

2. Скорость программы - что это? Поскольку у нас рассчитывается эволюционный процесс, то размерность задачи постоянно меняется, меняется и структура матрицы.

Подробная трассировка на каждом шаге интегрирования с временами CPU и GPU у нас есть. Есть время расчета астрономическое. Вот результаты нас приводят в некоторое недоумение :wallbash: . Если сравнивать одни и те же расчеты на CPU и GPU на соответствующих шагах по времени, то картина следующая. То CPU быстрее GPU раза в два-три, то наоборот в тех же пропорциях. Причем различаются и варианты с nVidia и AMD. Хотя конечный результат расчета абсолютно одинаковый на каждом шаге для любых вариантов.

3. В этой, да и в других ветках форума видно я не найду ни ответов ни рекомендаций :sad: .

4. Предлагаю к ИСПА обращаться: "Повелитель ИСПА", поскольку "господин" как-то сухо и официально :biggrin:

Ссылка на сообщение
Поделиться на других сайтах
  • MFS открепил тему
Гость
Эта тема закрыта для публикации сообщений.
  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу.




  • Сообщения

    • Srgwell
      Еще косяк. sw 2023sp3 так же как и 2024sp2. При настройках всплывающей панели пропадают информация у кнопок и сами кнопки.   bandicam 2024-06-28 14-29-29-353.mp4
    • filsan
      Когда есть мерная фреза это хорошее решение. А когда ее нет, то в наших условиях проще модель дать, чтобы программист станков с ЧПУ имеющимся инструментом сделал обработку.  В любом случае спасибо за ответы всем откликнувшимся. 
    • gudstartup
    • advocut
      @hlibhlib т.е. нужно на каждую установку по слою и симулировать отдельно (или на ходу оно переключается)?
    • Ветерок
      Так оставьте только линию траектории и отфрезеруйте по линии. Получите желаемый результат без всяких научных построений. Зачем с трудами моделировать то, что делается как надо самим инструментом?   Надо только чтобы диаметр фрезы совпадал с шириной канавки. Если диаметр будет меньше, фокус не получится.
    • Ahito
    • Srgwell
      В sw 2023sp3. Появляются дублирующие кнопки макроса, а у некоторые становятся пустыми, только наименование остается. Например . Здесь лишние дубляжи появились. Причем все рабочие. После удаления одного из них другой дубликат оказывается пустой, только наименование. Если меняю свойства кнопки одного, другой дубликат тоже меняется. После выхода из настроек он не активен . Из 10 кнопок 3 продублированный. Хлама полно. Такая же проблема и в 2024sp2. Могу видео снять  
    • Ветерок
      Ну, так пользуйтесь этой камасутрой дальше. Пусть эта деталь будет сделана не в Крео, если результат получается лучше и проще.
    • filsan
      С этим я давеча справился: нашел хорошее видео на русском  GOLF_Sream под тем видео даже комментарий оставлял с советами, как оптимизировать построение. Я тогда больше времени потратил на составление закона закрутки спирали, чем на построение шнеков (2 шт). Их даже отфрезеровали и я их в деле увидел  Круг этот с канавкой после камтракса тоже фрезеровали, все нормально работало. Но не хочется костылями пользоваться, когда можно в одной среде все сделать. 
    • Orchestra2603
      @djtim : В целом,  с определнными упрощениями эта задачка считается на бумажке.   Если очень хочется посчитать по МКЭ, то в любом случае нужно работать с геометрией сначала. Никто не считает такие сборки "как есть". Вы получите много геморроя с построением сетки, всякие малюсенькие элементики, да еще и много локальных сингулярностей, с которами потом непонятно, что делать (на самом деле, более-менее понятно, но это отдельный разговор). Как минимум, нужно свести в оболочечным элементам это все.   Отверстия под болты с у двух соответвующих соединенных деталей я бы просто соединил бы жесктой кинематической связью. Сами болты и гайки из модели я бы викинул. Потом в соответствующих узлах можно вытащить реакции, и не несложным расчетом посмотреть выдерживают ли болты нагрузку на разрыв, срез, момент изгибающий/крутящий или их комбинацию.   Красный профиль я бы вообще балкой бы моделировал (известны же параметры сечения: момент инерции, площадь, центр тяжести и т.д.?). Я не вижу никакой особой выгоды от отлавливания всех этих загибов внутри, только очень много боли. В крайнем случае, можно просто сделать типа такой приведенный трапецивидный коробчатый профиль с внутренними перегородками, если совсем тяжело.   Контакт кронштейна со скобой... Не вижу, почему нельзя просто задать абсолютно жесткое соединение bonded.    Контакт скобы со столбом... Вот тут я вижу проблемы. Я не вижу никаких посадочных мест под скобу на трубе или других креплений с трубой, а значит весь кронштейн с фонарем можем свободно вращаться и скользить по столбу. Выглядит это не очень хорошо. Если считать контакт без трения, то в расчете вся верхняя часть просто "улетит", и расчет не получится. Можно считать как bonded (не знаю, как в Catia это называется), но это будет соответствовать приваренной к трубе скобе, а это не ваш случай (или нет?). Я бы пересмотрел ваш дизайн вообще в этой части.   Кроме этого... Вас интересвет только один расчетный случай, как на картинке? вы не рассматриваете ветер "сбоку" или какие-то комбинации расчетных случаев? Имхо, то что вы на картинке изобразили - это вероятно не самый консервативный расчетный сценарий, вполне можно себе представить случаи более опасные, чем этот.   Это вполе себе типичный расчет. В стандартных инженерным приложениях такого плана, линейно-упругого анализа должно быть достаточно. Это же не какой-то сложный производственный процесс с нелтнейностями. Если его недостаточно (пластические деформации, большие перемещения, контакты меняют статус от нагрузки) , то чаще всего это свидетельствует об ошибках при проектировании. При понимании того, что делаешь, и как работать с результатами, все получится нормально. В целом же, адекватность результатов зависит от адекватности пользователя.  
×
×
  • Создать...