user108

Ansys для проектировщика КЖ-КМ

461 posts in this topic

 

Ну вот, а мелкие матрицы известного персонажа скорее всего влезают в кэш процессора - отсюда и офигенные показатели скорости. В реале в кэш не влезет и весь солвер например ls-dyna, не то что все матрицы задачи.

Share this post


Link to post
Share on other sites


ID: 442   Posted (edited)

Цитата

OpenMp

Вроде ориентировано на HPC с фортраном и сями. 

На С++ на STL мьютексах или использовать /*parallel patterns*/

 

https://habr.com/ru/company/epam_systems/blog/245523/

8 часов назад, ДОБРЯК сказал:

 

ускорьте свою программу хотя бы в 10 раз.

 судя по тому, что Федор ее сделал 20 лет назад - это 2019 - 20 = 1999, тогда С++ был еще последовательным

Edited by Chardash

Share this post


Link to post
Share on other sites

Купил какую-то карточку с cuda  да руки не дошли попрограммировать, да и не особо интерестно когда узнал что double не обрабатывается обычно, только у очень дорогих карточек, а это уже лишает идеи доступности и массового применения.  Векторые машины были и на ЕС в восьмидесятых, но особо не использовались … :)

Да и не мкэ это. Техника на которой считаем

Share this post


Link to post
Share on other sites
7 часов назад, AlexKaz сказал:

Это он про разрешение СЛАУ, одной единственной слау, типа один раз получилось - и результат можно экстраполировать как в комиксе xkcd. На реальной задаче разница между SSE и AVX512 исчисляется единицами процентов, поэтому в мессаге очередной пустой трёп.

Комикс https://xkcd.ru/605/

Ты читай внимательно. Я говорил про Настран и Ансис и другие серьезные программы ...

Разница в скорости если сравнивать с программой Федора будет сотни и тысячи раз. 

AVX быстрее SSE в два раза

AVX2 быстрее AVX в два раза

AVX512 быстрее AVX2 в два раза

На каждом ядре и на одной и той же тактовой частоте.

Уже больше двух лет скорость игрового процессора 1 000 Гфл в сек. На сопроцессоре такой скорости не бывает. 

Этого компилятор сделать не может. 

Матрицы каждого КЭ вычисляются параллельно. А потом запускается решение СЛАУ.

Перестановка строк и столбцов проводится один раз для нелинейных задач. 

Федор до сих пор оптимизирует ширину ленты матрицы и решает СЛАУ складывая строки ... )) И думает что компилятор все оптимизирует.

В итоге скорость и будет в сотни и тысячи раз быстрее. 

Такие же программы в исходных кодах и в интернете. 

Никто коммерческий пакет программ в исходных кодах в интернет не выложит и тебе не подарит. )

 

 

Share this post


Link to post
Share on other sites

ID: 445   Posted (edited)

Наивный... в разы у него вырасло, ага-ага. А пацаны в мире и не в курсе событий оказываеццо

1 ГФлопс - это хреновый CPU в single float. В double float на игровом компе выше 400 не сделать - или покупай Xeon> 20 ядер и молчи в тряпочку.

 

Чтобы не холиварить, смотрите например скриншоты AIDA64 memory and cash benchmark где прямо указаны задержки памяти и кэша в наносекундах. 

Что с того что проц за такт переварит в два раза больше - пересылка в/из RAM как была в 50 раз дороже по времени так и осталась. Так что сними лапшу с ушей 

Edited by AlexKaz

Share this post


Link to post
Share on other sites
50 минут назад, AlexKaz сказал:

1 ГФлопс - это хреновый CPU в single float. В double float на игровом компе выше 400 не сделать - или покупай Xeon> 20 ядер и молчи в тряпочку.

У меня это только вызывает улыбку.

Не 1 Гфл, а 1 000 Гфл на игровом процессоре переменная типа double, двойная точность. На float в два раза быстрее. 18 физических ядер.

Скачай Линпак и проверь. А потом напиши свой Линпак или попроси Федора. )

На одном ядре у тебя раз в 300 будет медленнее. )

А на разреженных матрицах еще нужно оптимально переставить строки и столбцы. И в итоге скорость будет в тысячи раз меньше.

 

1 час назад, AlexKaz сказал:

Чтобы не холиварить, смотрите например скриншоты AIDA64 memory and cash benchmark где прямо указаны задержки памяти и кэша в наносекундах. 

Что с того что проц за такт переварит в два раза больше - пересылка в/из RAM как была в 50 раз дороже по времени так и осталась. Так что сними лапшу с ушей 

Скорость в Гфл AIDA64 не меряет.

Объясняю для особо упоротых еще раз. Программа Линпак от Интел. Скачай и проверь. И тогда поймешь какие глупости ты пишешь.

Ты хочешь сказать, что Интел всем вешает лапшу на уши.)))

На разреженных матрицах скорость будет процентов на 30 меньше.

 

Share this post


Link to post
Share on other sites
11 минуту назад, ДОБРЯК сказал:

Скорость в Гфл AIDA64 не меряет.

Повторяю, AIDA показывает задержки чтения-записи в память, и хоть обосрить от гордости - мифические ускорения в десятки раз не получить.

18 ядер - это не игровой комп. Это то же самое что и Xeon который я предложил.

13 минуты назад, ДОБРЯК сказал:

На разреженных матрицах скорость будет процентов на 30 меньше.

А ты матрицу увеличь до 1 ГБайта double, а не тот унылый набор 0 и единиц, чем тестить сейчас.

 

Мериться linpack-ом в разделе МКЭ - это верх наивности. Если реальнЫй солвер даст хотя бы треть от числа Flops в linpack- это уже мега скорость. Обычная скорость нелинейного солвера ещё ниже, процентов 15-20.

Share this post


Link to post
Share on other sites
Только что, AlexKaz сказал:

Повторяю, AIDA показывает задержки чтения-записи в память, и хоть обосрить от гордости - мифические ускорения в десятки раз не получить.

AIDA скорость в Гфл не меряет. Линпак программа от Интел это делает самым оптимальным образом. Специальная программа.

После этого изучи как правильно работать с кеш памятью. )

3 минуты назад, AlexKaz сказал:

18 ядер - это не игровой комп. Это то же самое что и Xeon который я предложил.

Смешной ты человек. )

https://www.intel.ru/content/www/ru/ru/products/processors/core/x-series/i9-7980xe.html

18 ядер 36 потоков. 

Share this post


Link to post
Share on other sites
2 минуты назад, ДОБРЯК сказал:

Смешной

От МКЭ-клоуна слышу

 

Мне даже не интересно, что ты уходишь от темы начального разговора и пытаешься пропихнуть мегаприбыль от жонглирования AVX-ами. Это твоё типичное поведение - менять темы.

Share this post


Link to post
Share on other sites

ID: 450   Posted (edited)

23 минуты назад, AlexKaz сказал:

От МКЭ-клоуна слышу

 

Мне даже не интересно, что ты уходишь от темы начального разговора и пытаешься пропихнуть мегаприбыль от жонглирования AVX-ами. Это твоё типичное поведение - менять темы.

Я как писал про скорость в Гфл так и пишу. Задержки памяти это из другой оперы. Это ты меняешь тему.

Скачай Линпак и проверь. Хоть знания в вопросе скорости решения СЛАУ появятся. )

 

Реальная модель на 10 000 000 степеней свободы.

Разреженная оптимизация и разреженный решатель на 8 ядрах с AVX2

Для решения потребовалось = 32.121 Гбайт памяти  
Скорость = 145606.41 Мфл в секунду  
Время = 23.479 сек  
 

Ленточный оптимизатор, на одном ядре, на сопроцессоре. Время решения около 45 часов.

 

 

Edited by ДОБРЯК

Share this post


Link to post
Share on other sites

Не понимаю о чем вы, но это мне понравилось..

 

Утверждение и ответ.

35 минут назад, ДОБРЯК сказал:
44 минуты назад, AlexKaz сказал:

Повторяю, AIDA показывает задержки чтения-записи в память...

AIDA скорость в Гфл не меряет.

 

Share this post


Link to post
Share on other sites
2 минуты назад, Борман сказал:

Не понимаю о чем вы, но это мне понравилось.

Все очень просто @AlexKaz говорит что нельзя решить СЛАУ на игровом процессоре со скоростью 1 000 Гфл в сек. И говорит про задержки памяти, которые показывает AIDA.

Я объясняю, что AIDA не показывает скорость решения СЛАУ в Гфл. 

Чтобы узнать скорость процессора нужно запустить Линпак. И только после этого пытаться понять как Линпак решает с такой скоростью.

Естественно размер матриц в тестах Линпак больше чем кеш память процессора. И получается что задержки памяти которые показывает AIDA это из другой оперы.

А он этого не понимает. 

 

Share this post


Link to post
Share on other sites

Мужик:

1) у тебя не игровой комп; типичный игровой - это до 8 ядер; да, в РФ большинство геймеров - процессорные бомжи;

2) не путай циферки линпак с реальностью;

3) ты несёшь херню уже 1530 сообщений.

 

Вывод. У тебя наблюдается явный перекос к ценностям не этой страны (за бугром геймеры таки да, имеют твою конфигурацию или чуть ниже) - ты живёшь не в этой стране и не знаешь её специфики.

Share this post


Link to post
Share on other sites
7 минут назад, AlexKaz сказал:

ты живёшь не в этой стране и не знаешь её специфики

Масквабад, одно слово.

Share this post


Link to post
Share on other sites

ID: 455   Posted (edited)

Цитата

Федор до сих пор оптимизирует

Оно мне надо ?  Просто других алгебраических теорий оптимизации не видел, а в сказки про особые карточки не верю. Знающие люди пробовали и просветили.  Итерационные методы , ну и близкий к ним с предобуславливателем описанный у Голуба не рассматриваю. Далеко не всем нужны машины формулы 1 для принятия проектных решений   :)

 

Цитата

под названием LINPACK часто понимают тесты производительности LINPACK[en] (решение плотной СЛАУ методом LU-декомпозиции).

https://ru.wikipedia.org/wiki/Linpack   плотные матрицы по определению мкэ не интересны :)

 

https://ru.wikipedia.org/wiki/Разреженная_матрица  если бы что-то новенькое  придумали, то было бы отражено …

Edited by Fedor

Share this post


Link to post
Share on other sites
10 минут назад, AlexKaz сказал:

2) не путай циферки линпак с реальностью;

Так это и есть максимальная реальная скорость современного  процессора при решении СЛАУ с использованием всех достижений науки и техники.

Ты проверь скорость решателя в Настран и проверь скорость программулек которые выложены в интернете в исходных кодах или напиши свою программу. )

Разница будет в сотни раз. 

 

 

Share this post


Link to post
Share on other sites

ID: 457   Posted (edited)

12 минуты назад, ДОБРЯК сказал:

Так это и есть максимальная реальная скорость современного  процессора при решении СЛАУ с использованием всех достижений науки и техники.

Хех, как я и писал

15 часов назад, AlexKaz сказал:

Это он про разрешение СЛАУ, одной единственной слау, типа один раз получилось - и результат можно экстраполировать как в комиксе xkcd. На реальной задаче разница между SSE и AVX512 исчисляется единицами процентов

Но солвер не решает одну СЛАУ, перечитывать нада мессаги выше.:acute:

Edited by AlexKaz

Share this post


Link to post
Share on other sites

ID: 458   Posted (edited)

Все таки тема о железобетоне, надо бы куда-нибудь весь мусор переместить. Строители народ конкретный, свалок не любят :)

Edited by Fedor

Share this post


Link to post
Share on other sites
48 минут назад, AlexKaz сказал:

Но солвер не решает одну СЛАУ, перечитывать нада мессаги выше.

И многопроцессорность  и расширенные регистры и правильная работа с кешем это все задействуется в современных КЭ программах.

Ты сравни время решения одной и той же задачи в Настране или Ансисе со скоростью решения той же модели в программульках выложенных в открытом коде. 

Скорость от и до. Не только скорость решения СЛАУ.

Скорость оперативной памяти на это практически не влияет. Я говорю о скорости процессора. )

Share this post


Link to post
Share on other sites
В 11.08.2019 в 16:16, Victoria сказал:
В 11.08.2019 в 15:46, AlexKaz сказал:

Похоже пора мне выкладывать "Библиотеку LS-Dyna"

Было-бы здорово!!!

 

В 11.08.2019 в 23:11, Bnine сказал:

+ - присоединяюсь

http://cccp3d.ru/topic/96276-библиотечка-ls-dyna/

1 person likes this

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!


Register a new account

Sign in

Already have an account? Sign in here.


Sign In Now

  • Recently Browsing   0 members

    No registered users viewing this page.



  • Сообщения

    • chatjokey
         серьезно, заканчивай с этим. а то попахивает тоже сумасшествием. 
    • Крутой инвестор из ЕС
      Это не анализ, а наблюдение) За пару лет. Просто интересно, как такие персонажи как Турта мыслят. Даже читал на эту тему.   Кстати, слово ШАНС из предыдущего поста надо заменить на НАМЕРЕНИЕ - я перепутал. Турта не различает фактический результат и намерение этот результат получить. Он ставит равно между этими понятиями.   Смотрите, как интересно, у него на аватарке (которую лепит куда не попадя) написано "создатель ПИИ" уже много лет, но он ничего не создал, а только НАМЕРИВАЕТСЯ создать. Он называет себя ведущим разработчиком ПИИ, но ничего не разработал и никем не был признан, а только намеревается им стать и получить признание. Но ведущим разработчиком называет себя уже сейчас.   Он не заработал и 100 рублей на своих "прорывных технологиях", а только намеревается заработать триллионы, но уже сейчас заявляет, что его время стоит дороже зарплат всех директоров, назначил триллионную стоимость своего "интеллектуального капитала" и требует уступить место в поликлинике вне очереди (очень показательная и смешная история, я голосину орнул с нее).   Из-за психического расстройства у Турты искаженная логика восприятия реальности.   Турта не видит разницы между достижением и намерением достижения. И из этого у него следует классический бред величия: он восхищается самим собой за НАМЕРЕНИЕ сделать что-то сверхсложное и глобальное, так, как если бы это уже сделал. И искренне не понимает, почему это восхищение им никто больше не разделяет)))   И поэтому легко верит в любую чушь про инвесторов из ЕС и США, китайцев из Хуавея и профессоров из Оксфорда)) Все это нормально в его картине мира, где он великий изобретатель и открыватель с уникальным багажом знаний и опыта, который будет очень востребован за пределами "немытой рашки". И очень глупо, наивно и смешно в картине мира психически здорового человека.
    • MiLloeDelo
      @tm-ares , все просто ))))) ?  СПАСИБО за ссылку !  Но нельзя сделать немного , удобнее : смотрите на скрин .  Скрин
            X
       
    • Артемке
      Ребят помогите пожалуйста и подскажите,как нарезать резьбу га саморезе,саморез спресшайбой, если можно скинте пример программы.
    • karachun
      Я тоже не могу, спросили бы про Nastran - я бы мог подсказать.
    • a_schelyaev
      1. Должны учитываться. Уравнения в документации посмотрите. 2. Документацию откройте. Это задание столба гидростатики.
    • a_schelyaev
      Через весовые коэффициенты с несколькими узлами.
    • jumper99
      @karachun исправил ошибки, осталась одна не могу понять где 118 берется?  The user defined result might not be calculated successfully wholly or in some areas.
          There are some elements (or nodes) which do not contain
          data for the expression in: 118 = CONTAREA     Note that the result data may not be contained in the result file
          or may not be applicable to some element types.
          Also note that the solver module can create elements,
          such as surface effect or interface elements,
          whose results cannot currently be scoped in a contour display. вот архив проекта https://fex.net/s/flry7ae   
    • karachun
      У меня результаты похожие. 0,608 и 1,128 Гц.
    • karachun
      В общем масса получилась 232 грамма и частота 0,787 Гц. И форма колебаний тоже странная. Пришлось сперва сместить узлы в деформированное состояние. В Femap есть специальный пользовательский инструмент, но если надо потом пересчитать модель, то придется этим же инструментом разгибать модель обратно с масштабным коэффициентом -1. И теперь стало похоже на правду.