Перейти к публикации

Ansys для проектировщика КЖ-КМ


Рекомендованные сообщения

 

Ну вот, а мелкие матрицы известного персонажа скорее всего влезают в кэш процессора - отсюда и офигенные показатели скорости. В реале в кэш не влезет и весь солвер например ls-dyna, не то что все матрицы задачи.

Ссылка на сообщение
Поделиться на других сайтах


Цитата

OpenMp

Вроде ориентировано на HPC с фортраном и сями. 

На С++ на STL мьютексах или использовать /*parallel patterns*/

 

https://habr.com/ru/company/epam_systems/blog/245523/

8 часов назад, ДОБРЯК сказал:

 

ускорьте свою программу хотя бы в 10 раз.

 судя по тому, что Федор ее сделал 20 лет назад - это 2019 - 20 = 1999, тогда С++ был еще последовательным

Изменено пользователем Chardash
Ссылка на сообщение
Поделиться на других сайтах

Купил какую-то карточку с cuda  да руки не дошли попрограммировать, да и не особо интерестно когда узнал что double не обрабатывается обычно, только у очень дорогих карточек, а это уже лишает идеи доступности и массового применения.  Векторые машины были и на ЕС в восьмидесятых, но особо не использовались … :)

Да и не мкэ это. Техника на которой считаем

Ссылка на сообщение
Поделиться на других сайтах
7 часов назад, AlexKaz сказал:

Это он про разрешение СЛАУ, одной единственной слау, типа один раз получилось - и результат можно экстраполировать как в комиксе xkcd. На реальной задаче разница между SSE и AVX512 исчисляется единицами процентов, поэтому в мессаге очередной пустой трёп.

Комикс https://xkcd.ru/605/

Ты читай внимательно. Я говорил про Настран и Ансис и другие серьезные программы ...

Разница в скорости если сравнивать с программой Федора будет сотни и тысячи раз. 

AVX быстрее SSE в два раза

AVX2 быстрее AVX в два раза

AVX512 быстрее AVX2 в два раза

На каждом ядре и на одной и той же тактовой частоте.

Уже больше двух лет скорость игрового процессора 1 000 Гфл в сек. На сопроцессоре такой скорости не бывает. 

Этого компилятор сделать не может. 

Матрицы каждого КЭ вычисляются параллельно. А потом запускается решение СЛАУ.

Перестановка строк и столбцов проводится один раз для нелинейных задач. 

Федор до сих пор оптимизирует ширину ленты матрицы и решает СЛАУ складывая строки ... )) И думает что компилятор все оптимизирует.

В итоге скорость и будет в сотни и тысячи раз быстрее. 

Такие же программы в исходных кодах и в интернете. 

Никто коммерческий пакет программ в исходных кодах в интернет не выложит и тебе не подарит. )

 

 

Ссылка на сообщение
Поделиться на других сайтах

Наивный... в разы у него вырасло, ага-ага. А пацаны в мире и не в курсе событий оказываеццо

1 ГФлопс - это хреновый CPU в single float. В double float на игровом компе выше 400 не сделать - или покупай Xeon> 20 ядер и молчи в тряпочку.

 

Чтобы не холиварить, смотрите например скриншоты AIDA64 memory and cash benchmark где прямо указаны задержки памяти и кэша в наносекундах. 

Что с того что проц за такт переварит в два раза больше - пересылка в/из RAM как была в 50 раз дороже по времени так и осталась. Так что сними лапшу с ушей 

Изменено пользователем AlexKaz
Ссылка на сообщение
Поделиться на других сайтах
50 минут назад, AlexKaz сказал:

1 ГФлопс - это хреновый CPU в single float. В double float на игровом компе выше 400 не сделать - или покупай Xeon> 20 ядер и молчи в тряпочку.

У меня это только вызывает улыбку.

Не 1 Гфл, а 1 000 Гфл на игровом процессоре переменная типа double, двойная точность. На float в два раза быстрее. 18 физических ядер.

Скачай Линпак и проверь. А потом напиши свой Линпак или попроси Федора. )

На одном ядре у тебя раз в 300 будет медленнее. )

А на разреженных матрицах еще нужно оптимально переставить строки и столбцы. И в итоге скорость будет в тысячи раз меньше.

 

1 час назад, AlexKaz сказал:

Чтобы не холиварить, смотрите например скриншоты AIDA64 memory and cash benchmark где прямо указаны задержки памяти и кэша в наносекундах. 

Что с того что проц за такт переварит в два раза больше - пересылка в/из RAM как была в 50 раз дороже по времени так и осталась. Так что сними лапшу с ушей 

Скорость в Гфл AIDA64 не меряет.

Объясняю для особо упоротых еще раз. Программа Линпак от Интел. Скачай и проверь. И тогда поймешь какие глупости ты пишешь.

Ты хочешь сказать, что Интел всем вешает лапшу на уши.)))

На разреженных матрицах скорость будет процентов на 30 меньше.

 

Ссылка на сообщение
Поделиться на других сайтах
11 минуту назад, ДОБРЯК сказал:

Скорость в Гфл AIDA64 не меряет.

Повторяю, AIDA показывает задержки чтения-записи в память, и хоть обосрить от гордости - мифические ускорения в десятки раз не получить.

18 ядер - это не игровой комп. Это то же самое что и Xeon который я предложил.

13 минуты назад, ДОБРЯК сказал:

На разреженных матрицах скорость будет процентов на 30 меньше.

А ты матрицу увеличь до 1 ГБайта double, а не тот унылый набор 0 и единиц, чем тестить сейчас.

 

Мериться linpack-ом в разделе МКЭ - это верх наивности. Если реальнЫй солвер даст хотя бы треть от числа Flops в linpack- это уже мега скорость. Обычная скорость нелинейного солвера ещё ниже, процентов 15-20.

Ссылка на сообщение
Поделиться на других сайтах
Только что, AlexKaz сказал:

Повторяю, AIDA показывает задержки чтения-записи в память, и хоть обосрить от гордости - мифические ускорения в десятки раз не получить.

AIDA скорость в Гфл не меряет. Линпак программа от Интел это делает самым оптимальным образом. Специальная программа.

После этого изучи как правильно работать с кеш памятью. )

3 минуты назад, AlexKaz сказал:

18 ядер - это не игровой комп. Это то же самое что и Xeon который я предложил.

Смешной ты человек. )

https://www.intel.ru/content/www/ru/ru/products/processors/core/x-series/i9-7980xe.html

18 ядер 36 потоков. 

Ссылка на сообщение
Поделиться на других сайтах
2 минуты назад, ДОБРЯК сказал:

Смешной

От МКЭ-клоуна слышу

 

Мне даже не интересно, что ты уходишь от темы начального разговора и пытаешься пропихнуть мегаприбыль от жонглирования AVX-ами. Это твоё типичное поведение - менять темы.

Ссылка на сообщение
Поделиться на других сайтах
23 минуты назад, AlexKaz сказал:

От МКЭ-клоуна слышу

 

Мне даже не интересно, что ты уходишь от темы начального разговора и пытаешься пропихнуть мегаприбыль от жонглирования AVX-ами. Это твоё типичное поведение - менять темы.

Я как писал про скорость в Гфл так и пишу. Задержки памяти это из другой оперы. Это ты меняешь тему.

Скачай Линпак и проверь. Хоть знания в вопросе скорости решения СЛАУ появятся. )

 

Реальная модель на 10 000 000 степеней свободы.

Разреженная оптимизация и разреженный решатель на 8 ядрах с AVX2

Для решения потребовалось = 32.121 Гбайт памяти  
Скорость = 145606.41 Мфл в секунду  
Время = 23.479 сек  
 

Ленточный оптимизатор, на одном ядре, на сопроцессоре. Время решения около 45 часов.

 

 

Изменено пользователем ДОБРЯК
Ссылка на сообщение
Поделиться на других сайтах

Не понимаю о чем вы, но это мне понравилось..

 

Утверждение и ответ.

35 минут назад, ДОБРЯК сказал:
44 минуты назад, AlexKaz сказал:

Повторяю, AIDA показывает задержки чтения-записи в память...

AIDA скорость в Гфл не меряет.

 

Ссылка на сообщение
Поделиться на других сайтах
2 минуты назад, Борман сказал:

Не понимаю о чем вы, но это мне понравилось.

Все очень просто @AlexKaz говорит что нельзя решить СЛАУ на игровом процессоре со скоростью 1 000 Гфл в сек. И говорит про задержки памяти, которые показывает AIDA.

Я объясняю, что AIDA не показывает скорость решения СЛАУ в Гфл. 

Чтобы узнать скорость процессора нужно запустить Линпак. И только после этого пытаться понять как Линпак решает с такой скоростью.

Естественно размер матриц в тестах Линпак больше чем кеш память процессора. И получается что задержки памяти которые показывает AIDA это из другой оперы.

А он этого не понимает. 

 

Ссылка на сообщение
Поделиться на других сайтах

Мужик:

1) у тебя не игровой комп; типичный игровой - это до 8 ядер; да, в РФ большинство геймеров - процессорные бомжи;

2) не путай циферки линпак с реальностью;

3) ты несёшь херню уже 1530 сообщений.

 

Вывод. У тебя наблюдается явный перекос к ценностям не этой страны (за бугром геймеры таки да, имеют твою конфигурацию или чуть ниже) - ты живёшь не в этой стране и не знаешь её специфики.

Ссылка на сообщение
Поделиться на других сайтах
7 минут назад, AlexKaz сказал:

ты живёшь не в этой стране и не знаешь её специфики

Масквабад, одно слово.

Ссылка на сообщение
Поделиться на других сайтах
Цитата

Федор до сих пор оптимизирует

Оно мне надо ?  Просто других алгебраических теорий оптимизации не видел, а в сказки про особые карточки не верю. Знающие люди пробовали и просветили.  Итерационные методы , ну и близкий к ним с предобуславливателем описанный у Голуба не рассматриваю. Далеко не всем нужны машины формулы 1 для принятия проектных решений   :)

 

Цитата

под названием LINPACK часто понимают тесты производительности LINPACK[en] (решение плотной СЛАУ методом LU-декомпозиции).

https://ru.wikipedia.org/wiki/Linpack   плотные матрицы по определению мкэ не интересны :)

 

https://ru.wikipedia.org/wiki/Разреженная_матрица  если бы что-то новенькое  придумали, то было бы отражено …

Изменено пользователем Fedor
Ссылка на сообщение
Поделиться на других сайтах
10 минут назад, AlexKaz сказал:

2) не путай циферки линпак с реальностью;

Так это и есть максимальная реальная скорость современного  процессора при решении СЛАУ с использованием всех достижений науки и техники.

Ты проверь скорость решателя в Настран и проверь скорость программулек которые выложены в интернете в исходных кодах или напиши свою программу. )

Разница будет в сотни раз. 

 

 

Ссылка на сообщение
Поделиться на других сайтах
12 минуты назад, ДОБРЯК сказал:

Так это и есть максимальная реальная скорость современного  процессора при решении СЛАУ с использованием всех достижений науки и техники.

Хех, как я и писал

15 часов назад, AlexKaz сказал:

Это он про разрешение СЛАУ, одной единственной слау, типа один раз получилось - и результат можно экстраполировать как в комиксе xkcd. На реальной задаче разница между SSE и AVX512 исчисляется единицами процентов

Но солвер не решает одну СЛАУ, перечитывать нада мессаги выше.:acute:

Изменено пользователем AlexKaz
Ссылка на сообщение
Поделиться на других сайтах

Все таки тема о железобетоне, надо бы куда-нибудь весь мусор переместить. Строители народ конкретный, свалок не любят :)

Изменено пользователем Fedor
Ссылка на сообщение
Поделиться на других сайтах
48 минут назад, AlexKaz сказал:

Но солвер не решает одну СЛАУ, перечитывать нада мессаги выше.

И многопроцессорность  и расширенные регистры и правильная работа с кешем это все задействуется в современных КЭ программах.

Ты сравни время решения одной и той же задачи в Настране или Ансисе со скоростью решения той же модели в программульках выложенных в открытом коде. 

Скорость от и до. Не только скорость решения СЛАУ.

Скорость оперативной памяти на это практически не влияет. Я говорю о скорости процессора. )

Ссылка на сообщение
Поделиться на других сайтах
  • 2 недели спустя...
В 11.08.2019 в 16:16, Victoria сказал:
В 11.08.2019 в 15:46, AlexKaz сказал:

Похоже пора мне выкладывать "Библиотеку LS-Dyna"

Было-бы здорово!!!

 

В 11.08.2019 в 23:11, Bnine сказал:

+ - присоединяюсь

http://cccp3d.ru/topic/96276-библиотечка-ls-dyna/

Ссылка на сообщение
Поделиться на других сайтах

Присоединяйтесь к обсуждению

Вы можете опубликовать сообщение сейчас, а зарегистрироваться позже. Если у вас есть аккаунт, войдите в него для написания от своего имени.
Примечание: вашему сообщению потребуется утверждение модератора, прежде чем оно станет доступным.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.

  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу.




×
×
  • Создать...