user108

Ansys для проектировщика КЖ-КМ

461 posts in this topic

 

Ну вот, а мелкие матрицы известного персонажа скорее всего влезают в кэш процессора - отсюда и офигенные показатели скорости. В реале в кэш не влезет и весь солвер например ls-dyna, не то что все матрицы задачи.

Share this post


Link to post
Share on other sites


ID: 442   Posted (edited)

Цитата

OpenMp

Вроде ориентировано на HPC с фортраном и сями. 

На С++ на STL мьютексах или использовать /*parallel patterns*/

 

https://habr.com/ru/company/epam_systems/blog/245523/

8 часов назад, ДОБРЯК сказал:

 

ускорьте свою программу хотя бы в 10 раз.

 судя по тому, что Федор ее сделал 20 лет назад - это 2019 - 20 = 1999, тогда С++ был еще последовательным

Edited by Chardash

Share this post


Link to post
Share on other sites

Купил какую-то карточку с cuda  да руки не дошли попрограммировать, да и не особо интерестно когда узнал что double не обрабатывается обычно, только у очень дорогих карточек, а это уже лишает идеи доступности и массового применения.  Векторые машины были и на ЕС в восьмидесятых, но особо не использовались … :)

Да и не мкэ это. Техника на которой считаем

Share this post


Link to post
Share on other sites
7 часов назад, AlexKaz сказал:

Это он про разрешение СЛАУ, одной единственной слау, типа один раз получилось - и результат можно экстраполировать как в комиксе xkcd. На реальной задаче разница между SSE и AVX512 исчисляется единицами процентов, поэтому в мессаге очередной пустой трёп.

Комикс https://xkcd.ru/605/

Ты читай внимательно. Я говорил про Настран и Ансис и другие серьезные программы ...

Разница в скорости если сравнивать с программой Федора будет сотни и тысячи раз. 

AVX быстрее SSE в два раза

AVX2 быстрее AVX в два раза

AVX512 быстрее AVX2 в два раза

На каждом ядре и на одной и той же тактовой частоте.

Уже больше двух лет скорость игрового процессора 1 000 Гфл в сек. На сопроцессоре такой скорости не бывает. 

Этого компилятор сделать не может. 

Матрицы каждого КЭ вычисляются параллельно. А потом запускается решение СЛАУ.

Перестановка строк и столбцов проводится один раз для нелинейных задач. 

Федор до сих пор оптимизирует ширину ленты матрицы и решает СЛАУ складывая строки ... )) И думает что компилятор все оптимизирует.

В итоге скорость и будет в сотни и тысячи раз быстрее. 

Такие же программы в исходных кодах и в интернете. 

Никто коммерческий пакет программ в исходных кодах в интернет не выложит и тебе не подарит. )

 

 

Share this post


Link to post
Share on other sites

ID: 445   Posted (edited)

Наивный... в разы у него вырасло, ага-ага. А пацаны в мире и не в курсе событий оказываеццо

1 ГФлопс - это хреновый CPU в single float. В double float на игровом компе выше 400 не сделать - или покупай Xeon> 20 ядер и молчи в тряпочку.

 

Чтобы не холиварить, смотрите например скриншоты AIDA64 memory and cash benchmark где прямо указаны задержки памяти и кэша в наносекундах. 

Что с того что проц за такт переварит в два раза больше - пересылка в/из RAM как была в 50 раз дороже по времени так и осталась. Так что сними лапшу с ушей 

Edited by AlexKaz

Share this post


Link to post
Share on other sites
50 минут назад, AlexKaz сказал:

1 ГФлопс - это хреновый CPU в single float. В double float на игровом компе выше 400 не сделать - или покупай Xeon> 20 ядер и молчи в тряпочку.

У меня это только вызывает улыбку.

Не 1 Гфл, а 1 000 Гфл на игровом процессоре переменная типа double, двойная точность. На float в два раза быстрее. 18 физических ядер.

Скачай Линпак и проверь. А потом напиши свой Линпак или попроси Федора. )

На одном ядре у тебя раз в 300 будет медленнее. )

А на разреженных матрицах еще нужно оптимально переставить строки и столбцы. И в итоге скорость будет в тысячи раз меньше.

 

1 час назад, AlexKaz сказал:

Чтобы не холиварить, смотрите например скриншоты AIDA64 memory and cash benchmark где прямо указаны задержки памяти и кэша в наносекундах. 

Что с того что проц за такт переварит в два раза больше - пересылка в/из RAM как была в 50 раз дороже по времени так и осталась. Так что сними лапшу с ушей 

Скорость в Гфл AIDA64 не меряет.

Объясняю для особо упоротых еще раз. Программа Линпак от Интел. Скачай и проверь. И тогда поймешь какие глупости ты пишешь.

Ты хочешь сказать, что Интел всем вешает лапшу на уши.)))

На разреженных матрицах скорость будет процентов на 30 меньше.

 

Share this post


Link to post
Share on other sites
11 минуту назад, ДОБРЯК сказал:

Скорость в Гфл AIDA64 не меряет.

Повторяю, AIDA показывает задержки чтения-записи в память, и хоть обосрить от гордости - мифические ускорения в десятки раз не получить.

18 ядер - это не игровой комп. Это то же самое что и Xeon который я предложил.

13 минуты назад, ДОБРЯК сказал:

На разреженных матрицах скорость будет процентов на 30 меньше.

А ты матрицу увеличь до 1 ГБайта double, а не тот унылый набор 0 и единиц, чем тестить сейчас.

 

Мериться linpack-ом в разделе МКЭ - это верх наивности. Если реальнЫй солвер даст хотя бы треть от числа Flops в linpack- это уже мега скорость. Обычная скорость нелинейного солвера ещё ниже, процентов 15-20.

Share this post


Link to post
Share on other sites
Только что, AlexKaz сказал:

Повторяю, AIDA показывает задержки чтения-записи в память, и хоть обосрить от гордости - мифические ускорения в десятки раз не получить.

AIDA скорость в Гфл не меряет. Линпак программа от Интел это делает самым оптимальным образом. Специальная программа.

После этого изучи как правильно работать с кеш памятью. )

3 минуты назад, AlexKaz сказал:

18 ядер - это не игровой комп. Это то же самое что и Xeon который я предложил.

Смешной ты человек. )

https://www.intel.ru/content/www/ru/ru/products/processors/core/x-series/i9-7980xe.html

18 ядер 36 потоков. 

Share this post


Link to post
Share on other sites
2 минуты назад, ДОБРЯК сказал:

Смешной

От МКЭ-клоуна слышу

 

Мне даже не интересно, что ты уходишь от темы начального разговора и пытаешься пропихнуть мегаприбыль от жонглирования AVX-ами. Это твоё типичное поведение - менять темы.

Share this post


Link to post
Share on other sites

ID: 450   Posted (edited)

23 минуты назад, AlexKaz сказал:

От МКЭ-клоуна слышу

 

Мне даже не интересно, что ты уходишь от темы начального разговора и пытаешься пропихнуть мегаприбыль от жонглирования AVX-ами. Это твоё типичное поведение - менять темы.

Я как писал про скорость в Гфл так и пишу. Задержки памяти это из другой оперы. Это ты меняешь тему.

Скачай Линпак и проверь. Хоть знания в вопросе скорости решения СЛАУ появятся. )

 

Реальная модель на 10 000 000 степеней свободы.

Разреженная оптимизация и разреженный решатель на 8 ядрах с AVX2

Для решения потребовалось = 32.121 Гбайт памяти  
Скорость = 145606.41 Мфл в секунду  
Время = 23.479 сек  
 

Ленточный оптимизатор, на одном ядре, на сопроцессоре. Время решения около 45 часов.

 

 

Edited by ДОБРЯК

Share this post


Link to post
Share on other sites

Не понимаю о чем вы, но это мне понравилось..

 

Утверждение и ответ.

35 минут назад, ДОБРЯК сказал:
44 минуты назад, AlexKaz сказал:

Повторяю, AIDA показывает задержки чтения-записи в память...

AIDA скорость в Гфл не меряет.

 

Share this post


Link to post
Share on other sites
2 минуты назад, Борман сказал:

Не понимаю о чем вы, но это мне понравилось.

Все очень просто @AlexKaz говорит что нельзя решить СЛАУ на игровом процессоре со скоростью 1 000 Гфл в сек. И говорит про задержки памяти, которые показывает AIDA.

Я объясняю, что AIDA не показывает скорость решения СЛАУ в Гфл. 

Чтобы узнать скорость процессора нужно запустить Линпак. И только после этого пытаться понять как Линпак решает с такой скоростью.

Естественно размер матриц в тестах Линпак больше чем кеш память процессора. И получается что задержки памяти которые показывает AIDA это из другой оперы.

А он этого не понимает. 

 

Share this post


Link to post
Share on other sites

Мужик:

1) у тебя не игровой комп; типичный игровой - это до 8 ядер; да, в РФ большинство геймеров - процессорные бомжи;

2) не путай циферки линпак с реальностью;

3) ты несёшь херню уже 1530 сообщений.

 

Вывод. У тебя наблюдается явный перекос к ценностям не этой страны (за бугром геймеры таки да, имеют твою конфигурацию или чуть ниже) - ты живёшь не в этой стране и не знаешь её специфики.

Share this post


Link to post
Share on other sites
7 минут назад, AlexKaz сказал:

ты живёшь не в этой стране и не знаешь её специфики

Масквабад, одно слово.

Share this post


Link to post
Share on other sites

ID: 455   Posted (edited)

Цитата

Федор до сих пор оптимизирует

Оно мне надо ?  Просто других алгебраических теорий оптимизации не видел, а в сказки про особые карточки не верю. Знающие люди пробовали и просветили.  Итерационные методы , ну и близкий к ним с предобуславливателем описанный у Голуба не рассматриваю. Далеко не всем нужны машины формулы 1 для принятия проектных решений   :)

 

Цитата

под названием LINPACK часто понимают тесты производительности LINPACK[en] (решение плотной СЛАУ методом LU-декомпозиции).

https://ru.wikipedia.org/wiki/Linpack   плотные матрицы по определению мкэ не интересны :)

 

https://ru.wikipedia.org/wiki/Разреженная_матрица  если бы что-то новенькое  придумали, то было бы отражено …

Edited by Fedor

Share this post


Link to post
Share on other sites
10 минут назад, AlexKaz сказал:

2) не путай циферки линпак с реальностью;

Так это и есть максимальная реальная скорость современного  процессора при решении СЛАУ с использованием всех достижений науки и техники.

Ты проверь скорость решателя в Настран и проверь скорость программулек которые выложены в интернете в исходных кодах или напиши свою программу. )

Разница будет в сотни раз. 

 

 

Share this post


Link to post
Share on other sites

ID: 457   Posted (edited)

12 минуты назад, ДОБРЯК сказал:

Так это и есть максимальная реальная скорость современного  процессора при решении СЛАУ с использованием всех достижений науки и техники.

Хех, как я и писал

15 часов назад, AlexKaz сказал:

Это он про разрешение СЛАУ, одной единственной слау, типа один раз получилось - и результат можно экстраполировать как в комиксе xkcd. На реальной задаче разница между SSE и AVX512 исчисляется единицами процентов

Но солвер не решает одну СЛАУ, перечитывать нада мессаги выше.:acute:

Edited by AlexKaz

Share this post


Link to post
Share on other sites

ID: 458   Posted (edited)

Все таки тема о железобетоне, надо бы куда-нибудь весь мусор переместить. Строители народ конкретный, свалок не любят :)

Edited by Fedor

Share this post


Link to post
Share on other sites
48 минут назад, AlexKaz сказал:

Но солвер не решает одну СЛАУ, перечитывать нада мессаги выше.

И многопроцессорность  и расширенные регистры и правильная работа с кешем это все задействуется в современных КЭ программах.

Ты сравни время решения одной и той же задачи в Настране или Ансисе со скоростью решения той же модели в программульках выложенных в открытом коде. 

Скорость от и до. Не только скорость решения СЛАУ.

Скорость оперативной памяти на это практически не влияет. Я говорю о скорости процессора. )

Share this post


Link to post
Share on other sites
В 11.08.2019 в 16:16, Victoria сказал:
В 11.08.2019 в 15:46, AlexKaz сказал:

Похоже пора мне выкладывать "Библиотеку LS-Dyna"

Было-бы здорово!!!

 

В 11.08.2019 в 23:11, Bnine сказал:

+ - присоединяюсь

http://cccp3d.ru/topic/96276-библиотечка-ls-dyna/

1 person likes this

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!


Register a new account

Sign in

Already have an account? Sign in here.


Sign In Now

  • Recently Browsing   0 members

    No registered users viewing this page.



  • Сообщения

    • xedex
      Должны быть и *.paf
    • Борман
      "Кто может - делает, кто не может - учит, кто не может учить - учит физкультуре"   Металлическая линейка неисчерпаема во времени и пространстве и дарит нам не самую сложную задачу. Для усложнения сформулирую с дюймах...   Длина участка линейки от точки выхода из стола до дырки для крепления шнура 19,5 дюймов. Внутри стола убрался 1 дюйм, если интересно. Сама линейка стальная с сечением 1 х 1/40 [дюйм] х [дюйм]. Нагрузка на конец линейки такова, что точка приложения силы (массы) опускается на уровень стола. В этом положении измерена частота свободных вертикальных колебаний "массы". За 30 секунд сделано 23 колебания, т.е. 1,3 сек (0.77Гц). Можно считать, что при колебаниях "масса" движется поступательно и не совершает прочих движений (я старался). Задача - получить частоту кто столько сможет.   Для тех кто в танке - это задача на определение частоты собственных колебаний для сильно деформированной конструкции.
    • drin
      @ALEX 141 контур в итоге от торца ко дну отверстия?
    • Sergei
      1. Два вида нельзя привязать в двух направлениях, одно направление будет всегда не привязано. Наверное можно как то зафиксировать, но...неудобно. 2. Нельзя поставить размер между линиями на разных видах, а на чертежах отливок это нужно обязательно для размеров, задающих величину припуска на мехобработку.   Да, условно было сделано в ГОСТ для удобства ручного рисования, НО: 1. Виды с условным отображением линий перехода хорошо читаются. 2. К линиям перехода, отображённым условно можно проставить размер, который часто бывает что никак иначе нельзя проставить ни в каких дополнительных видах и сечениях. 3. На некоторых предприятиях (я немного поработал на таком) нормоконтролёры требуют чтобы на чертежах линии перехода отображались условно. Эту тему уже обсуждали много раз.
    • Kelny
      А что мешало в ранних версиях вставить два вида, одному из низ изменить толщину линий, а потом совместить друг над другом и зафиксировать (например функцией выровнить вид), что бы случайно не сместить?   В ранних версиях так же ни чего не мешало делать такие таблички с разным текстом из свойства файла для разных конфигураций со своим текстом, а свойство файла для удобства можно было заполнять для разных конфигураций в таблице параметров.   Так условно на то и условно, что можно условно и, на мой скромный взгляд, это для удобства ручного рисования на бумаге (что бы не грузить мозг всеми переходами и кромками перехода), а можно так как на самом деле отказавшись от условного вовсе, когда программа сама просчитывает и отображает реальные переходы.         Так вроде в предыдущих версиях была добавлена возможность выбора для староверов, что вам больше нравиться. В последней версии разве эту функцию убрали?        
    • ALEX 141
    • Etutbbl
      в темпе только файлы с расширением .frd
    • Maik812
      Я вот не пойму, это меня голубые-белые значки напрягают? не внятные не черта не видно толком!!! Когда нормально сделают?
    • Нафаня
    • Entomo
      Доброго времени суток.   Я несколько лет назад смотрел видеоурок и видел как в ANSYS открывалась база данных деталей различных производителей и с такой готовой CAD геометрией уже осуществлялась дальнейшая работа. Там в качестве примера бралась ручка руля мотоцикла одной из японских фирм. Сейчас уже не найду это видео, а хотелось бы использовать такую возможность. Подскажите, пожалуйста, где в последних версиях ANSYS находится эта база