Перейти к публикации

Производительность Flow Simulations 2014 на XEON


Рекомендованные сообщения

Доброго здравия, читающим.

 

 

Купили машину на базе 2-х процессоров XEON E5-2650 v2 (2cpu x 8ядер +Hiper Trading(HT)=32 потока) / 64Gb-8ch / SATA-reid / Quadro K4000 / w7 sp1

MB ASUS Z9PE-D8 WS, BIOS последний.

 

У меня стоят:

1-  i7-4930K (6 ядер +HT=12 потоков) / 32Gb-4ch / Quadro 600 / w7 sp1

2-  i7-2600K (4 ядра +HT=8 потоков) / 16G-2ch / Quadro-410 / w7 sp0

 

 

Производительность I7-х, приближенно соотведствует, их статусу, на одинаковых задачах, 

а вот производительность станции на XEON-ах...на уровне 2600K.

SW 2014 sp2., на всех станциях. Пробывал 2014 sp3.

 

т.е. в цифрах, одна задача прощета в Flow simulations, вкладывается в 14GB при прощете(~3,5 ячеек):

 

XEON  -  12ч 22мин (sw14 sp3 - 11ч 20мин)

4930K -    8ч 05мин

2600K -  14ч 10мин

 

В Photoworks, картина иная:

XEON  -  12мин  34с

4930K -  22мин  21с

2600K -  36мин  10с

 

Зная опыт предидущих опытов HT, помогает редко, а иногда мешает (не значительно), но в тестах в Photoworks, дает прирост 10-30%. 

По этому не отключал. 

Станция покупалась, для расчетов Flou Sim, но в чем причина ее тормознутости?

 

Может кто сталкивался, с такими проблеммами, подскажите. 


На XEON-е, восновном, при прощете, все потоки в диспетчере задач на максимуме, а время ядра по всем потокам ~20-30%, кроме первого потока, там 40-60%.
Ссылка на сообщение
Поделиться на других сайтах


Почитай тут.

ИМХО Основная мысля после прочтения по диагонали - что не шибко скалируется производительность с ростом числа ядер. Подозреваю, что в FS реализован сингл-треадед алгоритм. Производительность которого зависит от Мгц ядра. Соответсвенно - самые ушастые мегагерцы у 4930K. 2600K - на втором месте. И Xeon замыкает тройку со своими 2.6 Ghz на ядро. Но выигрывает у 2600K на кэше, а может за счет большей пропускной способности памяти (частота RAM?).

PhotoWorks параллелится на ура, что и видно по циферкам.

Ссылка на сообщение
Поделиться на других сайтах

Спасибо за оперативность, жаль, по ангийски, я плохо читаю.

Да возможно вы и правы, но почему в диспетчере задач,  задействованы все потоки?....

А вот частота RAM везде 1600Мгц. 

Но канальность, не зависит от количества ядер, на XEONе 8ch... Буду официалов мучить.

Ссылка на сообщение
Поделиться на других сайтах

Спасибо за оперативность, жаль, по ангийски, я плохо читаю.

Да возможно вы и правы, но почему в диспетчере задач,  задействованы все потоки?....

А вот частота RAM везде 1600Мгц. 

Но канальность, не зависит от количества ядер, на XEONе 8ch... Буду официалов мучить.

dimusikald,  есть новая информация по вашей проблеме?

Ссылка на сообщение
Поделиться на других сайтах

Запустил проект на 16-х потоках через 12часов, время одной итерации 8мин 49сек.,

остановил продолжил проект на 8-х потоках, время одной итерации 9мин 11сек.,

остановил продолжил проект на 4-х потоках, время одной итерации 8мин 57сек.

Да, он долго раскачивается, на первую итерцию уходит 20-30 минут, но цифры!!! поражают.

 

Времени тестировать нет. Но БЛ-10 мне в... ЧТО за ЧУШь.

Завтра попробую на 1-м )))

 

Я разговаривал с другом, он на их (FloEFD) семинаре был, он сказал, что они твердят что прирост кратен ядрам.

 

Но он посоветовал попробывать FloEFD, возможно FS поддерживает многоядерность не на таком уровне...

Ссылка на сообщение
Поделиться на других сайтах

FlowSimulation многопоточный. 

Производительность зависит от количества реальных потоков, от частоты и от пропускной способности памяти.

Гипертрейдинг  - надо исследовать его влияние. На это надо один раз потратить час времени на типичной вашей задаче.

Скорее он ухудшит ситуацию, т.к. съест пропускную способность памяти. Гипертрейдинг хорош, если много вычислений без нагрузки на память.

 

2600K - 3.4ГГц*4 ядра = 13,6

4930K - 3.4ГГц*6 ядер = 20,4

машина на базе 2-х процессоров XEON E5-2650 v2 - 2,6ГГц*8 ядер = 20,8

 

Вроде по суммарной частоте чуть лучше, но  вопрос в памяти. Как я понял, у вас миллионные сетки? А значит влияет пропускная способность памяти.

 

Не делаете ли вы в ходе расчета адаптаций сетки каждый шаг?

 

Сколько ячеек на поток получается?

 

В двухпроцессорной машине надо гонять данные между процессорами. Это тоже надо учитывать.

Ссылка на сообщение
Поделиться на других сайтах

Bonusfrag, dimusikald, давайте выясним тормознутость ксеона и влияние гипертрейдинга.

У меня маячат такие же проблемы, пытаюсь сконфигурировать рабочее место под CAE.

Коллеги, ваша информация будет чрезвычайно полезна.

Ссылка на сообщение
Поделиться на других сайтах

Я уже достаточно давно не работаю во FlowSimulation,

но это мой первый CFD, и много что помню.

Уже года два как в нем не работаю.

Пользуюсь FlowVision, т.к. функционал шире.

FlowSimulation пользовался на Q9550, зависимость производительности от количества ядер в задачах была не супер-линейная на тот момент,

но потом вроде код у них поменялся и стало близко к линейному для ~10 ядер. В тот момент я почти перестал использовать SW FS.

 

Сейчас считаю на i7-3930 во FV, гипертрейдинг пока некогда потестировать. Не отключаю, т.к. разработчики говорят, что есть толк в больших задачах, когда много ячеек на ядро.


danzas,

всё зависит от размерности задачи. Если размерность позволяет органичиться однопроцессорной машиной,

то лучшая машина - это 6ти-ядерник с высокой частотой.

Или 2  6ти ядерника - на каждом своя задача (SW FS не параллелится по сети, но допускает расчет на удаленной машине).

И в эти 6ти ядерники поставить оверклокерскую память с хорошими частотами. И естественно, в 4х-канальном режиме память должна работать.

 

6ти ядерники имею ввиду i7-4930K или  i7-3930 

Ссылка на сообщение
Поделиться на других сайтах

Запустил проект на 16-х потоках через 12часов, время одной итерации 8мин 49сек.,

остановил продолжил проект на 8-х потоках, время одной итерации 9мин 11сек.,

остановил продолжил проект на 4-х потоках, время одной итерации 8мин 57сек.

Да, он долго раскачивается, на первую итерцию уходит 20-30 минут, но цифры!!! поражают.

 

Времени тестировать нет. Но БЛ-10 мне в... ЧТО за ЧУШь.

Завтра попробую на 1-м )))

 

Я разговаривал с другом, он на их (FloEFD) семинаре был, он сказал, что они твердят что прирост кратен ядрам.

 

Но он посоветовал попробывать FloEFD, возможно FS поддерживает многоядерность не на таком уровне...

На 1-ом потоке одна итерация через 4 часа занимала 23 минуты. 

Получатся оптимально 4 потока задействовать.

Ссылка на сообщение
Поделиться на других сайтах

Маленький тест: тепловой

 

i7-4930K / 32Gb-4ch / Quadro 600 / w7 sp1/sw14 sp2

Ячейки в текучей среде:113852

Ячейки в твердом теле: 14375

Частичны ячейки:161,611

Общее число:289838

efsolver брал около 1,4 Гб, на всех расчетах

 

6 ядер HT(12 потоков): сетка - 36с. расчет - 6м 44с

6 ядер HT-off (6 потоков): сетка - 39с расчет - 6м 18с

6 ядер HT-off (4 потока): сетка - 40с расчет - 6м 48с

6 ядер HT-off (2 потока): сетка - 57с расчет - 10м 21с

 

Делайте выводы. Надо FloEFD потестировать.

Ссылка на сообщение
Поделиться на других сайтах

Не надо FloEFD тестировать. Это он и есть. Просто привязанный к SW. 

Для FloEFD потребуется другой КАД.

 

10 минут на 300000 ячеек это что-то не то.

Что конкретно вы измеряете?


Вот старая тема: http://cccp3d.ru/topic/32941-chto-novogo-vo-flow-simulation-2010/

Как минимум, должно быть не хуже, чем там.

Ссылка на сообщение
Поделиться на других сайтах

Хотя м.б. я выдал желаемое за действительное.

 

Взял проект из тутора - шаровой кран. Ничего не менял, кроме сетки - сделал сетку на автомате, но не 2й, а 8й уровень ползунка.

Это получается ~50000 ячеек.

На одном ядре на Q9550 получил CPU Time = 5:18

На 4х ядрах = 2:30

Т.е. ускорение чуть более чем в 2 раза. 

 

вообще, маловато ячеек. но в целом, как на графиках из старой темы, примерно, получается масштабирование. 

 

Поэтому надо думать, что делать: например, ставить одновременно несколько задач.

По графикам из старой темы - нет смысла использовать более 4х ядер на задачу.

 

Или надо смотреть в сторону другого ПО 

 

PS Тесты делал на Flow Simulation 2013 SP2

Ссылка на сообщение
Поделиться на других сайтах
  • 2 недели спустя...
Поэтому надо думать, что делать: например, ставить одновременно несколько задач.

Это врятли, шина памяти используется очень плотно, да и объемы занятой памяти, больше 70% всей памяти.

 

По графикам из старой темы - нет смысла использовать более 4х ядер на задачу.

В итоге, я тоже пришел к выводу, что использовать лучше не более 4-х процессов.

Как показала практика, при всех включенных ядрах и HT(на i7-4930K ),  что 4 ядра, что просто 4 потока, разница не заметна.

За то реально паралельно открыть другую версию SW и копаться с моделями, подтормаживает на открытии, а так юзабельно... Единственное, пока идет подготовка модели, перед расчетом... все вешается)


10 минут на 300000 ячеек это что-то не то. Что конкретно вы измеряете?

Температуру, микросхем. Я взял реальный прект и сделал сетку на автоматических настройках на 2. Данные отличаются от реальных на 20-30%. Но проекты одинаковые. 

Ссылка на сообщение
Поделиться на других сайтах
  • 2 недели спустя...

Какой смысл брать 6-ти ядерный и дороой ай7 ???  8голов  и ксеон однозначно так как надежность памяти и всего остального выше!!!

638631.jpg

Изменено пользователем Maik812
Ссылка на сообщение
Поделиться на других сайтах

У меня была машина с  XEON ,ее работой остался недоволен .   Столкнулся с той же проблемой , Flow simulations работал плохо и очень медленно  . Наверное это связано с структурой ядра . 

Ссылка на сообщение
Поделиться на других сайтах

Maik812, Yuriy_GR,

прошу вас расширить комментарии к вашим последним постам.

Я выбираю комплектацию рабочего места под САЕ,

и мне необходимо сделать выбор между I7 или XEON.

Буду весьма признателен за ваши соображения и личный опыт.

Ссылка на сообщение
Поделиться на других сайтах

конечно, i7 - 6 ядер

8ми ядерный ксеон в большинстве случаев будет иметь меньше частоту, и в итоге аналогичную или меньшую производительность.

под какой именно кае вы выбираете пк?

под Flow simulations можно брать 4х ядерный i7.

Ссылка на сообщение
Поделиться на других сайтах
конечно, i7 - 6 ядер 8ми ядерный ксеон в большинстве случаев будет иметь меньше частоту, и в итоге аналогичную или меньшую производительность.

Полностью согласен . Из личного опыта скажу что I7 работает намного лучше . 

Пробовал разные варианты компоновки железа , подобрал  то что на мой взгляд выдает оптимальную производительность .  У меня стоит I7 / 3.5 GHZ , операционная память 8Х8GB 2133GHZ  , Операционную память разбивай по всем слотам , не ставь одну или две но с большим объемом . Лучше больше и с маленьким объемом ,  не забывай про рабочую чистоту  . Подбери материнку  с большим количеством слотов под  операционную память .

под Flow simulations можно брать 4х ядерный i7.

Можно и четырех ядерный I7 , работать будет , и довольно таки не плохо . Тут все зависит уже от того  чего хотим мы  добиться от работы системы . 

Ссылка на сообщение
Поделиться на других сайтах

это хорошо когда процессор реализует 6/12 потоков, но также и программное обеспечение должно использовать всю вычислительную мощь, чтобы почувствовать  разницу между 6/12 поточными процессорами.

Ссылка на сообщение
Поделиться на других сайтах
  • 2 недели спустя...

Maik812, Yuriy_GR,

прошу вас расширить комментарии к вашим последним постам.

Я выбираю комплектацию рабочего места под САЕ,

и мне необходимо сделать выбор между I7 или XEON.

Буду весьма признателен за ваши соображения и личный опыт.

Я остановился на 4-х потоках из 12 (i7-4930K), 4 канальная память 32Gb(4Gb x 8). Думаю если есть возможность 8 канальной памяти и побольше частоты, то это только плюс. Не мудрите с рейдами, толку мало. Но это конфигурация, оптимальна лишь для Flow Sim. Остальные CAE, в многоядерности больше приуспели.

Я был на форуме FlowEFD 2013, они очень много говорили о ускорении построении сетики при использовании многоядерности, по сравнению с 12-й версией, но об ускорении расчетов отвечали неуверенно...

 

Хотя возможно, FS задушен по сравнению с FlowEFD, по части вычислительной мощности не могу сравнить (нет у меня FlowEFD 2013), а по функциональности - факт. 

Всего не помню, но в SW Flow sim отсутствует, один из оптических модулей, нельзя закрыть CAD во время расчетов, это далеко не все.

Вот если бы на FlowEFD протестировать, тогда можно было бы утверждать, про  многояденость.

Ссылка на сообщение
Поделиться на других сайтах

Присоединяйтесь к обсуждению

Вы можете опубликовать сообщение сейчас, а зарегистрироваться позже. Если у вас есть аккаунт, войдите в него для написания от своего имени.
Примечание: вашему сообщению потребуется утверждение модератора, прежде чем оно станет доступным.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.

  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу.



×
×
  • Создать...