Jump to content

Сравнение скорости Fluent на 1-2-3-4 ядрах и 32 и 64 битах.


Игорь (Москва)

Recommended Posts

Игорь (Москва)

Добрый день!

Разжился четырехядерным компом - решил поэкспериментировать.

Итак. Начальные условия.

Intel Core2Quad 2.4 ГГц

RAM 4Гб

Fluent 6.3.26

Задача: Ступенчатое концевое уплотнение турбины. 2D.

Level Cells Faces Nodes Partitions

0 167037 338133 171052 1

16 cell zones, 169 face zones.

Поставил на комп Win XP, Win XP x64, Vista x64.

На Win XP х64, 64-х битный Флюент почему-то не запустился. Выдал сразу же ошибку. На Висте - все ОК.

Засчекал время расчета 100 итераций (мин:сек), потому что неизвестно сколько нужно для сходимости - не моя задача.

Кол-во ядер | Vista 64 | Win XP 32

-------------------------------------------

1 | 4:50 | 5:10

2 | 2:53 | 2:55

3 | 2:08 | 2:13

4 | 1:52 | 1:56

______________________________

Таким образом видим, что использование 4-х ядер ускоряет процесс в 2.6 раз, трех в 2.27, двух - в 1.68.

Далее попробовал разогнать процессор - .

Частота, ГГц | Vista 64, 4 ядра.

---------------------------

2.4 | 1:52

3.0 | 1:44

3.13 | 1:39

___________________

Выводы и фантазии.

1. Два ядра гораздо лучше одного. А три существенно лучше двух. (Привет фирме АМД с их Phenom X3!)

2. 64-х битность заметно улучшает погоду тольrо на одноядерниках - надо учесть тем, кто не пересел на Core2.

3. Частота. 30% рост частоты приводит к уменьшению времени счета на 13%. Так что многоядерность нам важней чем частота.

Перспективы.

Любопытно посмотреть как что изменится при более тяжелых задачах, на больших сетках.

Также наверное задачи вычислительной гидродинамики можно как-то классифицировать по тому насколько хорошо они распараллеливаются.

Вроде бы все.

Приветствуются комментарии, дололнения и т.п... :)

Edited by Игорь (Москва)
Link to post
Share on other sites


64-битность нужна не для скорости а для больших задач (>4 ГБ, хотя это от бедности - на ядро эффективнее порядка 0.5ГБ).

Как изменится и т.п. - см. <noindex>http://www.fluent.com/software/fluent/fl5bench/index.htm</noindex> и <noindex>http://www.fluent.com/software/fluent/fl5bench/new.htm</noindex>

Link to post
Share on other sites
Игорь (Москва)

Да.... с 64-х битностью это разумеется основное. Правда у меня пока нет таких задач - поэтому сейчас был интересен именно скоростной аспект. И хотелось именно самому пощупать - ведь те машины которые описаны на сайте Флюента обычному человеку малодоступны. А сейчас уже нечто почти суперкомпьютерное :) можно собрать и у себя на столе.

Было описание интересной системы - четыре платы с двухядерными АМД закреплены на одной стойке. Соединены гигабитным ethernet. Получилась шустрая вещь. И наращиваемая. И ДЕШЕВАЯ!

С уважением,

Игорь

Link to post
Share on other sites
a_schelyaev

4хядреный от интел эффективен именно при разбиении задачи на две части, т.к. в этом случае задача может рахместиться внутри одного камня внутри кристалла. Если задача будет жить на ядрах соседних камней внутри кристалла, то будут друг с другом осуществлять обмен через оперативную память и это является его узким горлышком.

Где-то в сети валялись тесты по параллельной эфективности вычислений на камнях от Интела и АМД.

Оптерон с ростом количества ядер выше двух Зеона на лопатки кладет именно по указанной выше причине.

Поэтому пока на интелах лучше иметь два двухядерных компа. Это будет куда лучше, чем один четырехядерный.

Или на одной материнке два гнезда иметь, но только если они там не на одной шине сидят, как это у интела всегда раньше было.

Link to post
Share on other sites

Перспективы.

Любопытно посмотреть как что изменится при более тяжелых задачах, на больших сетках.

Также наверное задачи вычислительной гидродинамики можно как-то классифицировать по тому насколько хорошо они распараллеливаются.

Чем больше размерность сетки, тем меньше (в процентах от общего количества) ячеек приходится на границы декомпозиционных блоков, тем эффективнее распараллеливание. Имеется даже некое исследование на эту тему. Я исследовал в том числе и свой код таким образом. Более того, во-первых, ядро можно считать отдельным процессором. Пробовал запускать задачу как на разных ядрах, так и на физически разных процессорах в пределах одного узла. Время счета не отличается. Во-вторых, на сетках высокой размерности передача данных занимает незначительное время по сравнению с объемом вычислений, то есть возможно использование низкоскоростной сети (Gigabit Ethernet) между узлами. В-третьих, значительное время занимает подготовка пересылок, ее имеет смысл посадить на отдельный процессор.

Link to post
Share on other sites

Таким образом видим, что использование 4-х ядер ускоряет процесс в 2.6 раз, трех в 2.27, двух - в 1.68.

........

Приветствуются комментарии, дололнения и т.п... :)

Истинное ускорение, при расчете конкретной задачи будет несколько отличаться, от тех чисел которые вы привели.

При расчете на 2-х и более ядрах, затрачивается дополнительное кол-во итераций на сшивку решения.

К примеру если у меня на одном ядре сходимость 10-3 достигалась за 104 итерации, то на двух уже за 125, при этом выйгрыш по времени достигал 1.6

По поводу мнения Ara, передача данных и счет - операции чисто последовательные, поэтому чем больше пересылок, тем больше общее время задачи.

Link to post
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

  • Recently Browsing   0 members

    No registered users viewing this page.



  • Сообщения

    • LazyBitch
      Не могу понять, это у вас юмор такой или вы серьезно предлагаете удалённо считать на десятилетних процессорах с трёхканальной DDR3?
    • Мастеровой
      Вспомнились заводские легенды про года 1955-е  на заводе .  Про " Инженерскую столовую ".  Где и пиво , и винцо , и покрепче продавалось к обеду . " Пьян , да умён - два умения в нём " . Отец друга рассказывал , тонувший в Чёрном  море в 1942 году при торпедировании  сторожевика .  Мастер участка в инструментальном  корпусе цехов  в 1988-м ..
    • Мастеровой
      Обычно накопившиеся комья стружки  под кабель каналом . Любят операторы  рабочую зону станка сжатым воздухом в конце смены , не взирая на запрещение в должностной инструкции пообдувать . Но опять - разовые переломы кабелей. Найти их дело не быстрое . С парочку смен " кверху задом " , откинув все защиты, пролезая пальцами по кабелю . Это в двигателе . А про тепловое расширение ШВП ?   Забейте , если линейки стоят и  микронов ловить не надо ...
    • GS
    • piden
    • an_rushin
      любопытство, мною движет любопытство. необычно это.  
    • Ветерок
      Эта суперспособность появится у тебя, когда наберешь десять сообщений на форуме.
    • Petrovich73
      У меня не работает, только первая строка отображается. Через свойства всё работает хорошо, но текст сдвинут вниз.
    • GalielO
      Это называется 3-х осевая обработка. При полноценной 5-ти осевой обработке неважно где установлена деталь. Сдаётся мне пост у вас выдаёт зажим стола, поэтому и трясётся.   Что программируете, то и делает.
    • Victoria
      Пытаясь выполнить расчет с учетом движущейся нагрузки (давления) в цилиндре (аналог - пара "поршень-цилиндр", где нагрузка прикладывается на зоны,  протяженность которых изменяется с движением поршня) я не нашел ни одной опции в LS-DYNA, которая позволяет учесть движущуюся нагрузку.  Или плохо искал. Надеюсь на подсказку участников форума.  
×
×
  • Create New...