Перейти к публикации

Ansys для проектировщика КЖ-КМ


Рекомендованные сообщения

 

Ну вот, а мелкие матрицы известного персонажа скорее всего влезают в кэш процессора - отсюда и офигенные показатели скорости. В реале в кэш не влезет и весь солвер например ls-dyna, не то что все матрицы задачи.

Ссылка на сообщение
Поделиться на других сайтах


Цитата

OpenMp

Вроде ориентировано на HPC с фортраном и сями. 

На С++ на STL мьютексах или использовать /*parallel patterns*/

 

https://habr.com/ru/company/epam_systems/blog/245523/

8 часов назад, ДОБРЯК сказал:

 

ускорьте свою программу хотя бы в 10 раз.

 судя по тому, что Федор ее сделал 20 лет назад - это 2019 - 20 = 1999, тогда С++ был еще последовательным

Изменено пользователем Chardash
Ссылка на сообщение
Поделиться на других сайтах

Купил какую-то карточку с cuda  да руки не дошли попрограммировать, да и не особо интерестно когда узнал что double не обрабатывается обычно, только у очень дорогих карточек, а это уже лишает идеи доступности и массового применения.  Векторые машины были и на ЕС в восьмидесятых, но особо не использовались … :)

Да и не мкэ это. Техника на которой считаем

Ссылка на сообщение
Поделиться на других сайтах
7 часов назад, AlexKaz сказал:

Это он про разрешение СЛАУ, одной единственной слау, типа один раз получилось - и результат можно экстраполировать как в комиксе xkcd. На реальной задаче разница между SSE и AVX512 исчисляется единицами процентов, поэтому в мессаге очередной пустой трёп.

Комикс https://xkcd.ru/605/

Ты читай внимательно. Я говорил про Настран и Ансис и другие серьезные программы ...

Разница в скорости если сравнивать с программой Федора будет сотни и тысячи раз. 

AVX быстрее SSE в два раза

AVX2 быстрее AVX в два раза

AVX512 быстрее AVX2 в два раза

На каждом ядре и на одной и той же тактовой частоте.

Уже больше двух лет скорость игрового процессора 1 000 Гфл в сек. На сопроцессоре такой скорости не бывает. 

Этого компилятор сделать не может. 

Матрицы каждого КЭ вычисляются параллельно. А потом запускается решение СЛАУ.

Перестановка строк и столбцов проводится один раз для нелинейных задач. 

Федор до сих пор оптимизирует ширину ленты матрицы и решает СЛАУ складывая строки ... )) И думает что компилятор все оптимизирует.

В итоге скорость и будет в сотни и тысячи раз быстрее. 

Такие же программы в исходных кодах и в интернете. 

Никто коммерческий пакет программ в исходных кодах в интернет не выложит и тебе не подарит. )

 

 

Ссылка на сообщение
Поделиться на других сайтах

Наивный... в разы у него вырасло, ага-ага. А пацаны в мире и не в курсе событий оказываеццо

1 ГФлопс - это хреновый CPU в single float. В double float на игровом компе выше 400 не сделать - или покупай Xeon> 20 ядер и молчи в тряпочку.

 

Чтобы не холиварить, смотрите например скриншоты AIDA64 memory and cash benchmark где прямо указаны задержки памяти и кэша в наносекундах. 

Что с того что проц за такт переварит в два раза больше - пересылка в/из RAM как была в 50 раз дороже по времени так и осталась. Так что сними лапшу с ушей 

Изменено пользователем AlexKaz
Ссылка на сообщение
Поделиться на других сайтах
50 минут назад, AlexKaz сказал:

1 ГФлопс - это хреновый CPU в single float. В double float на игровом компе выше 400 не сделать - или покупай Xeon> 20 ядер и молчи в тряпочку.

У меня это только вызывает улыбку.

Не 1 Гфл, а 1 000 Гфл на игровом процессоре переменная типа double, двойная точность. На float в два раза быстрее. 18 физических ядер.

Скачай Линпак и проверь. А потом напиши свой Линпак или попроси Федора. )

На одном ядре у тебя раз в 300 будет медленнее. )

А на разреженных матрицах еще нужно оптимально переставить строки и столбцы. И в итоге скорость будет в тысячи раз меньше.

 

1 час назад, AlexKaz сказал:

Чтобы не холиварить, смотрите например скриншоты AIDA64 memory and cash benchmark где прямо указаны задержки памяти и кэша в наносекундах. 

Что с того что проц за такт переварит в два раза больше - пересылка в/из RAM как была в 50 раз дороже по времени так и осталась. Так что сними лапшу с ушей 

Скорость в Гфл AIDA64 не меряет.

Объясняю для особо упоротых еще раз. Программа Линпак от Интел. Скачай и проверь. И тогда поймешь какие глупости ты пишешь.

Ты хочешь сказать, что Интел всем вешает лапшу на уши.)))

На разреженных матрицах скорость будет процентов на 30 меньше.

 

Ссылка на сообщение
Поделиться на других сайтах
11 минуту назад, ДОБРЯК сказал:

Скорость в Гфл AIDA64 не меряет.

Повторяю, AIDA показывает задержки чтения-записи в память, и хоть обосрить от гордости - мифические ускорения в десятки раз не получить.

18 ядер - это не игровой комп. Это то же самое что и Xeon который я предложил.

13 минуты назад, ДОБРЯК сказал:

На разреженных матрицах скорость будет процентов на 30 меньше.

А ты матрицу увеличь до 1 ГБайта double, а не тот унылый набор 0 и единиц, чем тестить сейчас.

 

Мериться linpack-ом в разделе МКЭ - это верх наивности. Если реальнЫй солвер даст хотя бы треть от числа Flops в linpack- это уже мега скорость. Обычная скорость нелинейного солвера ещё ниже, процентов 15-20.

Ссылка на сообщение
Поделиться на других сайтах
Только что, AlexKaz сказал:

Повторяю, AIDA показывает задержки чтения-записи в память, и хоть обосрить от гордости - мифические ускорения в десятки раз не получить.

AIDA скорость в Гфл не меряет. Линпак программа от Интел это делает самым оптимальным образом. Специальная программа.

После этого изучи как правильно работать с кеш памятью. )

3 минуты назад, AlexKaz сказал:

18 ядер - это не игровой комп. Это то же самое что и Xeon который я предложил.

Смешной ты человек. )

https://www.intel.ru/content/www/ru/ru/products/processors/core/x-series/i9-7980xe.html

18 ядер 36 потоков. 

Ссылка на сообщение
Поделиться на других сайтах
2 минуты назад, ДОБРЯК сказал:

Смешной

От МКЭ-клоуна слышу

 

Мне даже не интересно, что ты уходишь от темы начального разговора и пытаешься пропихнуть мегаприбыль от жонглирования AVX-ами. Это твоё типичное поведение - менять темы.

Ссылка на сообщение
Поделиться на других сайтах
23 минуты назад, AlexKaz сказал:

От МКЭ-клоуна слышу

 

Мне даже не интересно, что ты уходишь от темы начального разговора и пытаешься пропихнуть мегаприбыль от жонглирования AVX-ами. Это твоё типичное поведение - менять темы.

Я как писал про скорость в Гфл так и пишу. Задержки памяти это из другой оперы. Это ты меняешь тему.

Скачай Линпак и проверь. Хоть знания в вопросе скорости решения СЛАУ появятся. )

 

Реальная модель на 10 000 000 степеней свободы.

Разреженная оптимизация и разреженный решатель на 8 ядрах с AVX2

Для решения потребовалось = 32.121 Гбайт памяти  
Скорость = 145606.41 Мфл в секунду  
Время = 23.479 сек  
 

Ленточный оптимизатор, на одном ядре, на сопроцессоре. Время решения около 45 часов.

 

 

Изменено пользователем ДОБРЯК
Ссылка на сообщение
Поделиться на других сайтах

Не понимаю о чем вы, но это мне понравилось..

 

Утверждение и ответ.

35 минут назад, ДОБРЯК сказал:
44 минуты назад, AlexKaz сказал:

Повторяю, AIDA показывает задержки чтения-записи в память...

AIDA скорость в Гфл не меряет.

 

Ссылка на сообщение
Поделиться на других сайтах
2 минуты назад, Борман сказал:

Не понимаю о чем вы, но это мне понравилось.

Все очень просто @AlexKaz говорит что нельзя решить СЛАУ на игровом процессоре со скоростью 1 000 Гфл в сек. И говорит про задержки памяти, которые показывает AIDA.

Я объясняю, что AIDA не показывает скорость решения СЛАУ в Гфл. 

Чтобы узнать скорость процессора нужно запустить Линпак. И только после этого пытаться понять как Линпак решает с такой скоростью.

Естественно размер матриц в тестах Линпак больше чем кеш память процессора. И получается что задержки памяти которые показывает AIDA это из другой оперы.

А он этого не понимает. 

 

Ссылка на сообщение
Поделиться на других сайтах

Мужик:

1) у тебя не игровой комп; типичный игровой - это до 8 ядер; да, в РФ большинство геймеров - процессорные бомжи;

2) не путай циферки линпак с реальностью;

3) ты несёшь херню уже 1530 сообщений.

 

Вывод. У тебя наблюдается явный перекос к ценностям не этой страны (за бугром геймеры таки да, имеют твою конфигурацию или чуть ниже) - ты живёшь не в этой стране и не знаешь её специфики.

Ссылка на сообщение
Поделиться на других сайтах
7 минут назад, AlexKaz сказал:

ты живёшь не в этой стране и не знаешь её специфики

Масквабад, одно слово.

Ссылка на сообщение
Поделиться на других сайтах
Цитата

Федор до сих пор оптимизирует

Оно мне надо ?  Просто других алгебраических теорий оптимизации не видел, а в сказки про особые карточки не верю. Знающие люди пробовали и просветили.  Итерационные методы , ну и близкий к ним с предобуславливателем описанный у Голуба не рассматриваю. Далеко не всем нужны машины формулы 1 для принятия проектных решений   :)

 

Цитата

под названием LINPACK часто понимают тесты производительности LINPACK[en] (решение плотной СЛАУ методом LU-декомпозиции).

https://ru.wikipedia.org/wiki/Linpack   плотные матрицы по определению мкэ не интересны :)

 

https://ru.wikipedia.org/wiki/Разреженная_матрица  если бы что-то новенькое  придумали, то было бы отражено …

Изменено пользователем Fedor
Ссылка на сообщение
Поделиться на других сайтах
10 минут назад, AlexKaz сказал:

2) не путай циферки линпак с реальностью;

Так это и есть максимальная реальная скорость современного  процессора при решении СЛАУ с использованием всех достижений науки и техники.

Ты проверь скорость решателя в Настран и проверь скорость программулек которые выложены в интернете в исходных кодах или напиши свою программу. )

Разница будет в сотни раз. 

 

 

Ссылка на сообщение
Поделиться на других сайтах
12 минуты назад, ДОБРЯК сказал:

Так это и есть максимальная реальная скорость современного  процессора при решении СЛАУ с использованием всех достижений науки и техники.

Хех, как я и писал

15 часов назад, AlexKaz сказал:

Это он про разрешение СЛАУ, одной единственной слау, типа один раз получилось - и результат можно экстраполировать как в комиксе xkcd. На реальной задаче разница между SSE и AVX512 исчисляется единицами процентов

Но солвер не решает одну СЛАУ, перечитывать нада мессаги выше.:acute:

Изменено пользователем AlexKaz
Ссылка на сообщение
Поделиться на других сайтах

Все таки тема о железобетоне, надо бы куда-нибудь весь мусор переместить. Строители народ конкретный, свалок не любят :)

Изменено пользователем Fedor
Ссылка на сообщение
Поделиться на других сайтах
48 минут назад, AlexKaz сказал:

Но солвер не решает одну СЛАУ, перечитывать нада мессаги выше.

И многопроцессорность  и расширенные регистры и правильная работа с кешем это все задействуется в современных КЭ программах.

Ты сравни время решения одной и той же задачи в Настране или Ансисе со скоростью решения той же модели в программульках выложенных в открытом коде. 

Скорость от и до. Не только скорость решения СЛАУ.

Скорость оперативной памяти на это практически не влияет. Я говорю о скорости процессора. )

Ссылка на сообщение
Поделиться на других сайтах
  • 2 недели спустя...
В 11.08.2019 в 16:16, Victoria сказал:
В 11.08.2019 в 15:46, AlexKaz сказал:

Похоже пора мне выкладывать "Библиотеку LS-Dyna"

Было-бы здорово!!!

 

В 11.08.2019 в 23:11, Bnine сказал:

+ - присоединяюсь

http://cccp3d.ru/topic/96276-библиотечка-ls-dyna/

Ссылка на сообщение
Поделиться на других сайтах

Присоединяйтесь к обсуждению

Вы можете опубликовать сообщение сейчас, а зарегистрироваться позже. Если у вас есть аккаунт, войдите в него для написания от своего имени.
Примечание: вашему сообщению потребуется утверждение модератора, прежде чем оно станет доступным.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.

  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу.




  • Сообщения

    • ID_Hacker
      Не упускаю. Потому что сообщение 21612 с причиной 1 точно описывает что разрешение работы сброшено. Последующий аварийный останов от привода и ошибки контроля контура это подтверждают.   Дефекты энкодера, кабеля, разъёма приведут к своим ошибкам которых не наблюдается. Как и пропадание готовности привода приведёт к своим ошибкам.   В любом случае необходимо определять формирование DBX2.1.
    • Нурлан
      Здравствуйте.   Если были бы у нас поблизости компетентные люди разбирающиеся в током вопросе . Которые смогли бы помочь и правильно объяснить как с этой проблемой бороться, но увы таковых нет.  
    • Bot
      Об авторах: Мария Золотова — BIM-специалист строительной компании, по первому образованию — театральный режиссер, Софья Минина — BIM-менеджер, по второму образованию — психолог, Владимир Талапов — BIM-эксперт, всего одно образование — математик. См. также BIM и Театр: искусство возможного. Часть 1, BIM и Театр: искусство возможного. Часть 2, BIM и Театр: искусство возможного. Часть 3. Информационное моделирование зданий и сооружений, как творческий процесс, имеет много общего с не менее творческим процессом постановки театральных спектаклей. Поэтому изучение театрального опыта, его наработанных взаимосвязей участников и методик их взаимодействия может существенно помочь становлению и использованию BIM в строительной отрасли. В этой части речь пойдет о тех, кто вроде бы непосредственно не участвует в постановке спектакля или информационном моделировании, но от кого эти процессы существенно зависят. «Кто платит, тот и заказывает музыку» Итак, кто же [...] View the full article
    • Guhl
      Понятия не имею
    • Александр 36
      А где можно скачать русифицированную версию
    • BASH_HD
      В Москве) но вообще по мнению японцев станок в Германии) но это не точно...   Аукцон и BAFA знали куда продали.
    • Alexandr97
    • Andrey_kzn
      Логика работы у них та же самая. И интерфейсные сигналы те же. Вы упускаете из виду сигнал готовность привода. Это DB3x.DBX93.5. Выстраивайте логическую цепь событий. Формирование сигнала DDX2.1 может быть завязано на готовность привода.  Не будет готовности привода, можете сколько угодно выставлять DBX2.1, ось никуда не поедет. А готовность может пропадать из-за дефекта энкодера, кабеля, разъёмов и т.п.  Надо сделать трассировку всех этих приводных сигналов,  заодно посмотрите также DBX93.7 и DBX21.7.  И понять, что какой сигнал пропадает первым.
    • Guhl
      Опять я забыл про это меню. Оно в корне лежит, а я туплю Спасибо  
    • gudstartup
      @Guhl все это настраивается здесь
×
×
  • Создать...