Перейти к публикации

Ansys для проектировщика КЖ-КМ


Рекомендованные сообщения

 

Ну вот, а мелкие матрицы известного персонажа скорее всего влезают в кэш процессора - отсюда и офигенные показатели скорости. В реале в кэш не влезет и весь солвер например ls-dyna, не то что все матрицы задачи.

Ссылка на сообщение
Поделиться на других сайтах


Цитата

OpenMp

Вроде ориентировано на HPC с фортраном и сями. 

На С++ на STL мьютексах или использовать /*parallel patterns*/

 

https://habr.com/ru/company/epam_systems/blog/245523/

8 часов назад, ДОБРЯК сказал:

 

ускорьте свою программу хотя бы в 10 раз.

 судя по тому, что Федор ее сделал 20 лет назад - это 2019 - 20 = 1999, тогда С++ был еще последовательным

Изменено пользователем Chardash
Ссылка на сообщение
Поделиться на других сайтах

Купил какую-то карточку с cuda  да руки не дошли попрограммировать, да и не особо интерестно когда узнал что double не обрабатывается обычно, только у очень дорогих карточек, а это уже лишает идеи доступности и массового применения.  Векторые машины были и на ЕС в восьмидесятых, но особо не использовались … :)

Да и не мкэ это. Техника на которой считаем

Ссылка на сообщение
Поделиться на других сайтах
7 часов назад, AlexKaz сказал:

Это он про разрешение СЛАУ, одной единственной слау, типа один раз получилось - и результат можно экстраполировать как в комиксе xkcd. На реальной задаче разница между SSE и AVX512 исчисляется единицами процентов, поэтому в мессаге очередной пустой трёп.

Комикс https://xkcd.ru/605/

Ты читай внимательно. Я говорил про Настран и Ансис и другие серьезные программы ...

Разница в скорости если сравнивать с программой Федора будет сотни и тысячи раз. 

AVX быстрее SSE в два раза

AVX2 быстрее AVX в два раза

AVX512 быстрее AVX2 в два раза

На каждом ядре и на одной и той же тактовой частоте.

Уже больше двух лет скорость игрового процессора 1 000 Гфл в сек. На сопроцессоре такой скорости не бывает. 

Этого компилятор сделать не может. 

Матрицы каждого КЭ вычисляются параллельно. А потом запускается решение СЛАУ.

Перестановка строк и столбцов проводится один раз для нелинейных задач. 

Федор до сих пор оптимизирует ширину ленты матрицы и решает СЛАУ складывая строки ... )) И думает что компилятор все оптимизирует.

В итоге скорость и будет в сотни и тысячи раз быстрее. 

Такие же программы в исходных кодах и в интернете. 

Никто коммерческий пакет программ в исходных кодах в интернет не выложит и тебе не подарит. )

 

 

Ссылка на сообщение
Поделиться на других сайтах

Наивный... в разы у него вырасло, ага-ага. А пацаны в мире и не в курсе событий оказываеццо

1 ГФлопс - это хреновый CPU в single float. В double float на игровом компе выше 400 не сделать - или покупай Xeon> 20 ядер и молчи в тряпочку.

 

Чтобы не холиварить, смотрите например скриншоты AIDA64 memory and cash benchmark где прямо указаны задержки памяти и кэша в наносекундах. 

Что с того что проц за такт переварит в два раза больше - пересылка в/из RAM как была в 50 раз дороже по времени так и осталась. Так что сними лапшу с ушей 

Изменено пользователем AlexKaz
Ссылка на сообщение
Поделиться на других сайтах
50 минут назад, AlexKaz сказал:

1 ГФлопс - это хреновый CPU в single float. В double float на игровом компе выше 400 не сделать - или покупай Xeon> 20 ядер и молчи в тряпочку.

У меня это только вызывает улыбку.

Не 1 Гфл, а 1 000 Гфл на игровом процессоре переменная типа double, двойная точность. На float в два раза быстрее. 18 физических ядер.

Скачай Линпак и проверь. А потом напиши свой Линпак или попроси Федора. )

На одном ядре у тебя раз в 300 будет медленнее. )

А на разреженных матрицах еще нужно оптимально переставить строки и столбцы. И в итоге скорость будет в тысячи раз меньше.

 

1 час назад, AlexKaz сказал:

Чтобы не холиварить, смотрите например скриншоты AIDA64 memory and cash benchmark где прямо указаны задержки памяти и кэша в наносекундах. 

Что с того что проц за такт переварит в два раза больше - пересылка в/из RAM как была в 50 раз дороже по времени так и осталась. Так что сними лапшу с ушей 

Скорость в Гфл AIDA64 не меряет.

Объясняю для особо упоротых еще раз. Программа Линпак от Интел. Скачай и проверь. И тогда поймешь какие глупости ты пишешь.

Ты хочешь сказать, что Интел всем вешает лапшу на уши.)))

На разреженных матрицах скорость будет процентов на 30 меньше.

 

Ссылка на сообщение
Поделиться на других сайтах
11 минуту назад, ДОБРЯК сказал:

Скорость в Гфл AIDA64 не меряет.

Повторяю, AIDA показывает задержки чтения-записи в память, и хоть обосрить от гордости - мифические ускорения в десятки раз не получить.

18 ядер - это не игровой комп. Это то же самое что и Xeon который я предложил.

13 минуты назад, ДОБРЯК сказал:

На разреженных матрицах скорость будет процентов на 30 меньше.

А ты матрицу увеличь до 1 ГБайта double, а не тот унылый набор 0 и единиц, чем тестить сейчас.

 

Мериться linpack-ом в разделе МКЭ - это верх наивности. Если реальнЫй солвер даст хотя бы треть от числа Flops в linpack- это уже мега скорость. Обычная скорость нелинейного солвера ещё ниже, процентов 15-20.

Ссылка на сообщение
Поделиться на других сайтах
Только что, AlexKaz сказал:

Повторяю, AIDA показывает задержки чтения-записи в память, и хоть обосрить от гордости - мифические ускорения в десятки раз не получить.

AIDA скорость в Гфл не меряет. Линпак программа от Интел это делает самым оптимальным образом. Специальная программа.

После этого изучи как правильно работать с кеш памятью. )

3 минуты назад, AlexKaz сказал:

18 ядер - это не игровой комп. Это то же самое что и Xeon который я предложил.

Смешной ты человек. )

https://www.intel.ru/content/www/ru/ru/products/processors/core/x-series/i9-7980xe.html

18 ядер 36 потоков. 

Ссылка на сообщение
Поделиться на других сайтах
2 минуты назад, ДОБРЯК сказал:

Смешной

От МКЭ-клоуна слышу

 

Мне даже не интересно, что ты уходишь от темы начального разговора и пытаешься пропихнуть мегаприбыль от жонглирования AVX-ами. Это твоё типичное поведение - менять темы.

Ссылка на сообщение
Поделиться на других сайтах
23 минуты назад, AlexKaz сказал:

От МКЭ-клоуна слышу

 

Мне даже не интересно, что ты уходишь от темы начального разговора и пытаешься пропихнуть мегаприбыль от жонглирования AVX-ами. Это твоё типичное поведение - менять темы.

Я как писал про скорость в Гфл так и пишу. Задержки памяти это из другой оперы. Это ты меняешь тему.

Скачай Линпак и проверь. Хоть знания в вопросе скорости решения СЛАУ появятся. )

 

Реальная модель на 10 000 000 степеней свободы.

Разреженная оптимизация и разреженный решатель на 8 ядрах с AVX2

Для решения потребовалось = 32.121 Гбайт памяти  
Скорость = 145606.41 Мфл в секунду  
Время = 23.479 сек  
 

Ленточный оптимизатор, на одном ядре, на сопроцессоре. Время решения около 45 часов.

 

 

Изменено пользователем ДОБРЯК
Ссылка на сообщение
Поделиться на других сайтах

Не понимаю о чем вы, но это мне понравилось..

 

Утверждение и ответ.

35 минут назад, ДОБРЯК сказал:
44 минуты назад, AlexKaz сказал:

Повторяю, AIDA показывает задержки чтения-записи в память...

AIDA скорость в Гфл не меряет.

 

Ссылка на сообщение
Поделиться на других сайтах
2 минуты назад, Борман сказал:

Не понимаю о чем вы, но это мне понравилось.

Все очень просто @AlexKaz говорит что нельзя решить СЛАУ на игровом процессоре со скоростью 1 000 Гфл в сек. И говорит про задержки памяти, которые показывает AIDA.

Я объясняю, что AIDA не показывает скорость решения СЛАУ в Гфл. 

Чтобы узнать скорость процессора нужно запустить Линпак. И только после этого пытаться понять как Линпак решает с такой скоростью.

Естественно размер матриц в тестах Линпак больше чем кеш память процессора. И получается что задержки памяти которые показывает AIDA это из другой оперы.

А он этого не понимает. 

 

Ссылка на сообщение
Поделиться на других сайтах

Мужик:

1) у тебя не игровой комп; типичный игровой - это до 8 ядер; да, в РФ большинство геймеров - процессорные бомжи;

2) не путай циферки линпак с реальностью;

3) ты несёшь херню уже 1530 сообщений.

 

Вывод. У тебя наблюдается явный перекос к ценностям не этой страны (за бугром геймеры таки да, имеют твою конфигурацию или чуть ниже) - ты живёшь не в этой стране и не знаешь её специфики.

Ссылка на сообщение
Поделиться на других сайтах
7 минут назад, AlexKaz сказал:

ты живёшь не в этой стране и не знаешь её специфики

Масквабад, одно слово.

Ссылка на сообщение
Поделиться на других сайтах
Цитата

Федор до сих пор оптимизирует

Оно мне надо ?  Просто других алгебраических теорий оптимизации не видел, а в сказки про особые карточки не верю. Знающие люди пробовали и просветили.  Итерационные методы , ну и близкий к ним с предобуславливателем описанный у Голуба не рассматриваю. Далеко не всем нужны машины формулы 1 для принятия проектных решений   :)

 

Цитата

под названием LINPACK часто понимают тесты производительности LINPACK[en] (решение плотной СЛАУ методом LU-декомпозиции).

https://ru.wikipedia.org/wiki/Linpack   плотные матрицы по определению мкэ не интересны :)

 

https://ru.wikipedia.org/wiki/Разреженная_матрица  если бы что-то новенькое  придумали, то было бы отражено …

Изменено пользователем Fedor
Ссылка на сообщение
Поделиться на других сайтах
10 минут назад, AlexKaz сказал:

2) не путай циферки линпак с реальностью;

Так это и есть максимальная реальная скорость современного  процессора при решении СЛАУ с использованием всех достижений науки и техники.

Ты проверь скорость решателя в Настран и проверь скорость программулек которые выложены в интернете в исходных кодах или напиши свою программу. )

Разница будет в сотни раз. 

 

 

Ссылка на сообщение
Поделиться на других сайтах
12 минуты назад, ДОБРЯК сказал:

Так это и есть максимальная реальная скорость современного  процессора при решении СЛАУ с использованием всех достижений науки и техники.

Хех, как я и писал

15 часов назад, AlexKaz сказал:

Это он про разрешение СЛАУ, одной единственной слау, типа один раз получилось - и результат можно экстраполировать как в комиксе xkcd. На реальной задаче разница между SSE и AVX512 исчисляется единицами процентов

Но солвер не решает одну СЛАУ, перечитывать нада мессаги выше.:acute:

Изменено пользователем AlexKaz
Ссылка на сообщение
Поделиться на других сайтах

Все таки тема о железобетоне, надо бы куда-нибудь весь мусор переместить. Строители народ конкретный, свалок не любят :)

Изменено пользователем Fedor
Ссылка на сообщение
Поделиться на других сайтах
48 минут назад, AlexKaz сказал:

Но солвер не решает одну СЛАУ, перечитывать нада мессаги выше.

И многопроцессорность  и расширенные регистры и правильная работа с кешем это все задействуется в современных КЭ программах.

Ты сравни время решения одной и той же задачи в Настране или Ансисе со скоростью решения той же модели в программульках выложенных в открытом коде. 

Скорость от и до. Не только скорость решения СЛАУ.

Скорость оперативной памяти на это практически не влияет. Я говорю о скорости процессора. )

Ссылка на сообщение
Поделиться на других сайтах
  • 2 недели спустя...
В 11.08.2019 в 16:16, Victoria сказал:
В 11.08.2019 в 15:46, AlexKaz сказал:

Похоже пора мне выкладывать "Библиотеку LS-Dyna"

Было-бы здорово!!!

 

В 11.08.2019 в 23:11, Bnine сказал:

+ - присоединяюсь

http://cccp3d.ru/topic/96276-библиотечка-ls-dyna/

Ссылка на сообщение
Поделиться на других сайтах

Присоединяйтесь к обсуждению

Вы можете опубликовать сообщение сейчас, а зарегистрироваться позже. Если у вас есть аккаунт, войдите в него для написания от своего имени.
Примечание: вашему сообщению потребуется утверждение модератора, прежде чем оно станет доступным.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.

  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу.




  • Сообщения

    • maxx2000
      Я скорее согласен с Надеждой Януарьевной
    • Koels
      Мотора 54 градуса, что на 6 градусов больше соседнего станка, вентеляторы в норме да. Ещё хочу сравнить нагрузку координаты с соседним станком, но пока не дают. У этих двух станков проблемы с охлаждением, на соседнем стоит автомобильный радиатор для охлаждения масла. xD
    • Bot
      Dassault Systèmes Reports Solid First Quarter Results And Reaffirms Full-Year Objectives Просмотр полной статьи
    • Ninja
    • Ninja
      В зимнее время водители устанавливают на колёса специальные цепи против скольжения. В мире разработано множество видов цепей и способов их установки. Японцы применяют "цепи Абэ". Кто этот великий инженер? Это знаменитый японский писатель Кобо Абэ. Для уединенного писательского труда Абэ купил домик в горах. А в горах зима ранняя, снежная, затяжная. Без цепей на колёсах можно и улететь с обрыва. Абэ периодически заводил машину и спускался в долину. Почту получить/отправить, в магазине продукты купить, ящик рисовой водки. (Известное дело: насухую великую книгу не напишешь). В долине приходилось цепи снимать. По правилам цепи запрещается применять при отсутствии на дороге снежного покрова. В те времена для установки/снятия цепи требовалось домкратом поднимать каждое колесо. В машине 4 колеса. Товарищу Абэ приходилось корячиться с домкратом. При этом в самых нелитературных выражениях комментируя политику правящей партии и все домкраты в мире. Купил в магазине бухлишко-закусь. Поехал домой в горы. А там снег, скользко. Цепи требуются. Опять писатель и драматург Абэ домкрат крутит. Всё это насмерть надоело Абэ. Обратился к компаниям-производителям: придумайте способ установки цепей без домкрата! Но производители ничего не придумали. Или не захотели. Тогда Абэ сам придумал способ установки цепей без необходимости поднимать колесо. Послал изобретение на конкурс. И неожиданно получил призовое место и патент. Новый способ установки цепей быстро завоевал популярность. Так и пошло у японцев - "цепи Абэ". Кобо Абэ не получил Нобелевскую премию по литературе. Уже выдвигался, уже все были уверены в том, что он её получит. Но не успели, писатель умер. А это всё дурацкие цепи виноваты. Сколько времени он потерял в установке/снятии цепей? Сколько времени, вместо того чтобы писать, он крутил домкрат? Вот и не успел. https://ru.ruwiki.ru/wiki/Абэ,_Кобо
    • gudstartup
      приемлимо. температуру мотора посмотрите. если вентилятор нормально вращается и его скорость соответствует оригинальному а также контакт в разъеме нормальный а F все равно появляется то даже не знаю что у вас может быть так как привод у вас новый
    • Koels
      Хмм, я думал раз она вылазит даже в простое, то Z координата висит на тормозе и дело не в этом. Спасибо за мысль, щас узнаю. Вообще у нас рядом стоит точно такая же макина, точь в точь и там таким проблем нет. Много заказов и отсутствие специалистов сделало свое дело. :) @gudstartup, 58% нагрузка на координату
    • mrVladimir
      Что-то я немного засомневался. Если решим брать новое ЧПУ, то искать точно такое же необходимо по номеру сзади корпуса (пластикового пластмассового) - так? А если брать только плату (материнскую или как ее лучше назвать...), на которой установлена (запаена) микросхема 1 на моих фото выше, то искать плату необходимо по номеру, который указан на самой плате - так? В моем случае : ЧПУ : A02B-0321-B520. Код на плате : A20B-8201-0081/01A. Если, допустим, мы покупаем ЧПУ A02B-0321-B520 - будет ли это гарантией того, что в нем установлена плата A20B-8201-0081/01A. И можно ли будет его считать таким же. И с отдельно приобретаемой платой тоже самое - если номер на ней полностью совпадает с нашим, значит ли это, что она полностью идентична. P.S. : извиняюсь за , возможно, навязчивые вопросы. Просто не хотелось бы попасть впросак из-за своей некомпетентности. такой файл есть, но мне говорили, что после снятия архивов, его лучше вообще никогда нигде ни использовать. А на каком этапе он нам может понадобиться?. Если, как говорил Виктор, мы зальем архив SRAM на старый модуль (ROM-SRAM), установленный в новое ЧПУ, то и файл OPRMINF не нужен. Правильно же?
    • Slavdos
      Доброе. делюсь 1 внедренным китайцем. купили у ЛЛС MARVEL PRO 6000-3015.HGT , 2 шт , с автоматизацией. станки неплохие, интерфейс русские, достаточно дружелюбен. за автоматизацию зря переплатили, китай похоже в этом сильно уступает европе. из неожиданностей- резка воздухом дает неудаляемый грат, по сути необходимы зачистные станки.
    • Killerchik
      Я 4 комфорки на скоростной шпиндель поставил, в этом же качестве)))))
×
×
  • Создать...