Перейти к публикации

большая размерность задачи.


Рекомендованные сообщения

Старые квады не параллеятся в принципе, когда количество загружаемых ядер превышает два.

Все что на базе Нехалема куда лучше.

Ну про АМД и говорить не стоит - там тоже все на уровне.

Ссылка на сообщение
Поделиться на других сайтах


какой-то странный ответ...

при чем тут старый или новый?

квад он и есть квад. нормальные, заточенный проги, типа кодирования видео, жрут все 4 ядра с удовольствием,

а SW явно не всё умеет делать параллельно, т.к очевидно, что часть идёт только на одном ядре. От того и оф.график такой нерадостный.

Часть вычислений идёт явно на всех 4х ядрах судя по загрузке проца, так что зависимость от модели мне не оч.понятна.

Ссылка на сообщение
Поделиться на других сайтах

Старый квад, кстати, это слепленые на одном кристалле 2 коры2дуо. Так что вести себя будет аналогично им, т.е. должен параллелиться нормально.

Другой вопрос, что не все операционные системы линукс умеют использовать гипертретинг.

Изменено пользователем Apologist
Ссылка на сообщение
Поделиться на других сайтах

QuadCore на базе CoreDuo ядрышек есть фуфел в области инженерных вычислений.

Все что на ядре Нехалем уже солидный шаг у Интела по пути АМД.

:)

Ссылка на сообщение
Поделиться на других сайтах

Сегодня IBM представила свежие процессоры. Самые быстрые на текущий момент.

<noindex>http://lenta.ru/news/2010/02/09/processor/</noindex>

Ссылка на сообщение
Поделиться на других сайтах

QuadCore на базе CoreDuo ядрышек есть фуфел в области инженерных вычислений.

Все что на ядре Нехалем уже солидный шаг у Интела по пути АМД.

:)

откуда такая уверенность? м.б. есть какая ссыль на статью итд?

Все многоядерные тесты, которые я видел - ну шило на мыло... не более.

Ссылка на сообщение
Поделиться на других сайтах

откуда такая уверенность? м.б. есть какая ссыль на статью итд?

Все многоядерные тесты, которые я видел - ну шило на мыло... не более.

Тесты есть. Ссылок нет.

Будем показывать на одной из следующих конференций по инженерным системам пример тестирования одного европейского кластера.

Ссылка на сообщение
Поделиться на других сайтах

Тесты есть.

Тесты на каком-то конкретном продукте?

Наш опыт показывает, что STAR нормально параллелится даже на первых Корах2Дуо. Прирост не двойка конечно, но это ожидаемо из-за общего кэша для обоих ядер и узкой шины.

Я сейчас активно использую i7 девятисотой серии, STAR демонстрирует прирост производительности при использовании до 7 ядер (на процессоре напомню 4 "реальных" ядра с гипертретингом). Так что их на данный момент считаю самыми хорошими по цене/производительности.

В последнее время совсем перестал следить за АМД. У них есть что-то лучше?

Ссылка на сообщение
Поделиться на других сайтах

Тесты на каком-то конкретном продукте?

Продукт - FlowVison.

Но вообще это не зависит для CFD продукта, т.к. все наши продукты характеризуются одними и теми же качествами - массовый обмен информацией.

Наш опыт показывает, что STAR нормально параллелится даже на первых Корах2Дуо. Прирост не двойка конечно, но это ожидаемо из-за общего кэша для обоих ядер и узкой шины.

Если речь идет о двухядерном процессоре, то вопросов нет - он показывает нормальную масштабируемость, т.к. ширины канала памяти хватает, чтобы прокормить оба его ядрышка. Однако если говорить о четырехядерном процессоре, построенном на базе двух Core2Duo в одном кристале, то тут все плачевно в силу его архитектуры.

Я сейчас активно использую i7 девятисотой серии, STAR демонстрирует прирост производительности при использовании до 7 ядер (на процессоре напомню 4 "реальных" ядра с гипертретингом). Так что их на данный момент считаю самыми хорошими по цене/производительности.

А какова размерность задачи?

В последнее время совсем перестал следить за АМД. У них есть что-то лучше?

Ядра у них хилые, а масштабируемость была изначально лучше, чем на КвадКорах старых.

С появлением Нехалема АМД отстал, но ненамного в скорострельности, однако он лучше в плане энергоэффективности.

Ссылка на сообщение
Поделиться на других сайтах

Я сейчас активно использую i7 девятисотой серии, STAR демонстрирует прирост производительности при использовании до 7 ядер (на процессоре напомню 4 "реальных" ядра с гипертретингом). Так что их на данный момент считаю самыми хорошими по цене/производительности.

В последнее время совсем перестал следить за АМД. У них есть что-то лучше?

то есть, в star-ccm имеет смысл включать hyperthreading? Обычно расчеты (на прочность провеяли в ansys) лучше идут без него

У AMD есть дешевле, но не лучше.

Кстати, а на i7 восьмисотойсерии не пробовали? У них частота вроде повыше, че у 9-сотой. За счет этого может быть выигрыш

Ссылка на сообщение
Поделиться на других сайтах

Просто частота процессора в отрыве от частоты памяти ничего не говорит. Чем память относительно процессора ниже, тем по идее хуже.

Ссылка на сообщение
Поделиться на других сайтах

Если речь идет о двухядерном процессоре, то вопросов нет - он показывает нормальную масштабируемость, т.к. ширины канала памяти хватает, чтобы прокормить оба его ядрышка. Однако если говорить о четырехядерном процессоре, построенном на базе двух Core2Duo в одном кристале, то тут все плачевно в силу его архитектуры.

Да, действительно это так. Не совсем верно истолковал ваш предыдущий пост.

А какова размерность задачи?

Тесты проводили на разных задачах. Прямо сейчас под рукой есть тесты моделейна 150К, 1.9М и 4.4М ячеек (хотя рекомендуется по разным источникам считать не менее 50-200К ячеек на процесс). До 4-х ядер прирост скорости близок к идеальному, от 4-х до 7-и прирост замедляется но всё же есть, на 8-и уже перегруз и производительность падает.

Такое поведение никак не связано с производительностью самого солвера, только с архитектурой системы. На кластере при распараллеливании на 8 и больше узлов его мастабируемость близка к идеальной.

то есть, в star-ccm имеет смысл включать hyperthreading?

На примере связки i7 и STAR-CCM+ - однозначно стоит. Но не используйте все 8 ядер, оставьте 1-2 ядра на работу системы и всего остального.

Имхо, i7 вообще идеален для workstation. Можно спокойно считать на 5-6 ядрах и на фоне счета работать с отчетами, почтой или подготовкой сетки. Для кластеных решений - хз.

Кстати, а на i7 восьмисотойсерии не пробовали?

Я уже писал здесь по этому поводу. Если мне не изменяет память, у восьмисотой серии двухканальный контролер памяти со всеми вытекающими последствиями. На большой задаче упретесь в пропускную способность шины памяти и никакой гипертретинг не поможет. Если у кого-то есть опыт использования восьмой серии - делитесь, был бы рад услышать.

ЗЫ А можно попросить администратора перенести тему в общий раздел? Я просто не знаю как.

Мы же не в рамках одного продукта сейчас обсуждение ведем.

Изменено пользователем Apologist
Ссылка на сообщение
Поделиться на других сайтах

И что я ничего подобного не нашел летом, когда собирал конфиг... была возможность взять i7...

ЗЫ А можно попросить администратора перенести тему в общий раздел? Я просто не знаю как.

Мы же не в рамках одного продукта сейчас обсуждение ведем.

а попросить просто - вон кнопочка "жалоба" светится) Изменено пользователем Bonusfrag
Ссылка на сообщение
Поделиться на других сайтах

Тесты проводили на разных задачах. Прямо сейчас под рукой есть тесты моделейна 150К, 1.9М и 4.4М ячеек (хотя рекомендуется по разным источникам считать не менее 50-200К ячеек на процесс). До 4-х ядер прирост скорости близок к идеальному, от 4-х до 7-и прирост замедляется но всё же есть, на 8-и уже перегруз и производительность падает.

А можно вопросы:

1. Тип сетки (тетра или ортогональная)?

2. Двухмерная или трехмерная?

3. Многокомпонентная или однокомпонентная?

4. Явный или неявный решатель?

:)

Ссылка на сообщение
Поделиться на других сайтах

Можно, только еще больше запутаемся. Общий тренд и без уточнений видно, а сделать какие-то выводы по солверу/сеткам всё равно не получится.

1. 150К - призмы и тетры, смесь

1.9М - гекса, почти однородная

4.4М - гексы, неоднородная

2. Во всех случаях 3D

3. Кто? Среда?

4. не принципиально, все три задачи разные по многим параметрам, не только решатели.

А вы почему спрашиваете, у вас коэф распараллеливания сильно зависит от этих параметров?

Ссылка на сообщение
Поделиться на других сайтах

А оно везде зависит.

Двухмерные задачи параллелятся идеально. Явные решатели параллелятся лучше неявных. Любая проадаптируемая сетка параллелится хуже сетки начального уровня и т.п.

Ссылка на сообщение
Поделиться на других сайтах
  • 3 недели спустя...

Приветствую!

есть статья Алямовского, в которой приводится график "ускорения" от кол-ва процессоров.

Так вот для одного проца - соотв-но единица,

для 4х - 1,78

для 8 - 1,82

да и посмотреть на график загрузки - видно, что для одной итерации 30-40% времени работает одно ядро и 70-60% - все 4 вместе.

А можно ссылку на эту статью? Хотелось бы почитать первоисточник.

Просто сейчас рассчеты веду на 2-х ядерной машине, но есть возможность использовать 8 ядер. Интересно, стоит ли заморачиваться с внутриорганизационными разрешениями и настройкой.

Ссылка на сообщение
Поделиться на других сайтах

А можно ссылку на эту статью? Хотелось бы почитать первоисточник.

Просто сейчас рассчеты веду на 2-х ядерной машине, но есть возможность использовать 8 ядер. Интересно, стоит ли заморачиваться с внутриорганизационными разрешениями и настройкой.

Статья эта относится начальным вариантам 2009 версии. Сейчас (2010 sp2) для 4-х ядерного процессора ускорение для относительно большой размерности достигает в среднем примерно 2,5. Ну, то-есть если задействовано строго одно ядро, то все они в сумме задействованы на 25%, если полноценно работают 4, то 100%. А по жизни (в зависимости от размерности задачи, однородности сетки, учёта/неучёта теплообмена излучением, ...) получается 50 - 75%.

У многоядерных процессоров (и многоголовых пользователей :rolleyes: ) есть ещё одно (в контексте FloWorks) преимущество. можно одновременно решать несколько задач. Тогда они, при наличиии достаточного объёма оперативной памяти, решаются практически независимо - можно для каждой задачи назначить число используемых ядер.

Ссылка на сообщение
Поделиться на других сайтах

Ребята, выеще учитывайте такой момент. Все что начинается с Нехалемовского ядра имеет ТурбоБуст на борту, т.е. в рамках общего тепловыделения, процессор может ядра разгонять. Если вы считаете на одном ядре и ТБ включен, то он вам это ядро еще подразгонит.

А когда вы начнете в паралелльном режиме считать, то ядра будут работать на штатных частотах.

В итоге это дает перекос в определении ускорения в зависимости от количества ядер в худшую сторону.

Ссылка на сообщение
Поделиться на других сайтах

А когда вы начнете в паралелльном режиме считать, то ядра будут работать на штатных частотах.

В итоге это дает перекос в определении ускорения в зависимости от количества ядер в худшую сторону.

Немножко не так.

Взависимости от типа процессора на данной архитектуре ускорения для разного числа ядер - разное.

То есть, 4 ядра одновременно в турбобусте не будут работать на штатной частоте - частота будет выше, чем штатная. Но при этом ниже, чем для работы в бусте только одного ядра.

Причем для разных процессоров верхняя планка при разном числе ядров - разная. Чем дороже проц, тем выше эта планка для 4-х ядер.

Ссылка на сообщение
Поделиться на других сайтах

Присоединяйтесь к обсуждению

Вы можете опубликовать сообщение сейчас, а зарегистрироваться позже. Если у вас есть аккаунт, войдите в него для написания от своего имени.
Примечание: вашему сообщению потребуется утверждение модератора, прежде чем оно станет доступным.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.

  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу.




×
×
  • Создать...