большая размерность задачи.

9 февраля 2010

Старые квады не параллеятся в принципе, когда количество загружаемых ядер превышает два.

Все что на базе Нехалема куда лучше.

Ну про АМД и говорить не стоит - там тоже все на уровне.

9 февраля 2010

какой-то странный ответ...

при чем тут старый или новый?

квад он и есть квад. нормальные, заточенный проги, типа кодирования видео, жрут все 4 ядра с удовольствием,

а SW явно не всё умеет делать параллельно, т.к очевидно, что часть идёт только на одном ядре. От того и оф.график такой нерадостный.

Часть вычислений идёт явно на всех 4х ядрах судя по загрузке проца, так что зависимость от модели мне не оч.понятна.

9 февраля 2010

Старый квад, кстати, это слепленые на одном кристалле 2 коры2дуо. Так что вести себя будет аналогично им, т.е. должен параллелиться нормально.

Другой вопрос, что не все операционные системы линукс умеют использовать гипертретинг.

Изменено 9 февраля 2010 пользователем Apologist

9 февраля 2010

QuadCore на базе CoreDuo ядрышек есть фуфел в области инженерных вычислений.

Все что на ядре Нехалем уже солидный шаг у Интела по пути АМД.

:)

9 февраля 2010

Сегодня IBM представила свежие процессоры. Самые быстрые на текущий момент.

<noindex>http://lenta.ru/news/2010/02/09/processor/</noindex>

9 февраля 2010

QuadCore на базе CoreDuo ядрышек есть фуфел в области инженерных вычислений.

Все что на ядре Нехалем уже солидный шаг у Интела по пути АМД.

:)

откуда такая уверенность? м.б. есть какая ссыль на статью итд?

Все многоядерные тесты, которые я видел - ну шило на мыло... не более.

10 февраля 2010

откуда такая уверенность? м.б. есть какая ссыль на статью итд?

Все многоядерные тесты, которые я видел - ну шило на мыло... не более.

Тесты есть. Ссылок нет.

Будем показывать на одной из следующих конференций по инженерным системам пример тестирования одного европейского кластера.

10 февраля 2010

Тесты есть.

Тесты на каком-то конкретном продукте?

Наш опыт показывает, что STAR нормально параллелится даже на первых Корах2Дуо. Прирост не двойка конечно, но это ожидаемо из-за общего кэша для обоих ядер и узкой шины.

Я сейчас активно использую i7 девятисотой серии, STAR демонстрирует прирост производительности при использовании до 7 ядер (на процессоре напомню 4 "реальных" ядра с гипертретингом). Так что их на данный момент считаю самыми хорошими по цене/производительности.

В последнее время совсем перестал следить за АМД. У них есть что-то лучше?

10 февраля 2010

Тесты на каком-то конкретном продукте?

Продукт - FlowVison.

Но вообще это не зависит для CFD продукта, т.к. все наши продукты характеризуются одними и теми же качествами - массовый обмен информацией.

Наш опыт показывает, что STAR нормально параллелится даже на первых Корах2Дуо. Прирост не двойка конечно, но это ожидаемо из-за общего кэша для обоих ядер и узкой шины.

Если речь идет о двухядерном процессоре, то вопросов нет - он показывает нормальную масштабируемость, т.к. ширины канала памяти хватает, чтобы прокормить оба его ядрышка. Однако если говорить о четырехядерном процессоре, построенном на базе двух Core2Duo в одном кристале, то тут все плачевно в силу его архитектуры.

Я сейчас активно использую i7 девятисотой серии, STAR демонстрирует прирост производительности при использовании до 7 ядер (на процессоре напомню 4 "реальных" ядра с гипертретингом). Так что их на данный момент считаю самыми хорошими по цене/производительности.

А какова размерность задачи?

В последнее время совсем перестал следить за АМД. У них есть что-то лучше?

Ядра у них хилые, а масштабируемость была изначально лучше, чем на КвадКорах старых.

С появлением Нехалема АМД отстал, но ненамного в скорострельности, однако он лучше в плане энергоэффективности.

10 февраля 2010

Я сейчас активно использую i7 девятисотой серии, STAR демонстрирует прирост производительности при использовании до 7 ядер (на процессоре напомню 4 "реальных" ядра с гипертретингом). Так что их на данный момент считаю самыми хорошими по цене/производительности.

В последнее время совсем перестал следить за АМД. У них есть что-то лучше?

то есть, в star-ccm имеет смысл включать hyperthreading? Обычно расчеты (на прочность провеяли в ansys) лучше идут без него

У AMD есть дешевле, но не лучше.

Кстати, а на i7 восьмисотойсерии не пробовали? У них частота вроде повыше, че у 9-сотой. За счет этого может быть выигрыш

10 февраля 2010

Просто частота процессора в отрыве от частоты памяти ничего не говорит. Чем память относительно процессора ниже, тем по идее хуже.

10 февраля 2010

Если речь идет о двухядерном процессоре, то вопросов нет - он показывает нормальную масштабируемость, т.к. ширины канала памяти хватает, чтобы прокормить оба его ядрышка. Однако если говорить о четырехядерном процессоре, построенном на базе двух Core2Duo в одном кристале, то тут все плачевно в силу его архитектуры.

Да, действительно это так. Не совсем верно истолковал ваш предыдущий пост.

А какова размерность задачи?

Тесты проводили на разных задачах. Прямо сейчас под рукой есть тесты моделейна 150К, 1.9М и 4.4М ячеек (хотя рекомендуется по разным источникам считать не менее 50-200К ячеек на процесс). До 4-х ядер прирост скорости близок к идеальному, от 4-х до 7-и прирост замедляется но всё же есть, на 8-и уже перегруз и производительность падает.

Такое поведение никак не связано с производительностью самого солвера, только с архитектурой системы. На кластере при распараллеливании на 8 и больше узлов его мастабируемость близка к идеальной.

то есть, в star-ccm имеет смысл включать hyperthreading?

На примере связки i7 и STAR-CCM+ - однозначно стоит. Но не используйте все 8 ядер, оставьте 1-2 ядра на работу системы и всего остального.

Имхо, i7 вообще идеален для workstation. Можно спокойно считать на 5-6 ядрах и на фоне счета работать с отчетами, почтой или подготовкой сетки. Для кластеных решений - хз.

Кстати, а на i7 восьмисотойсерии не пробовали?

Я уже писал здесь по этому поводу. Если мне не изменяет память, у восьмисотой серии двухканальный контролер памяти со всеми вытекающими последствиями. На большой задаче упретесь в пропускную способность шины памяти и никакой гипертретинг не поможет. Если у кого-то есть опыт использования восьмой серии - делитесь, был бы рад услышать.

ЗЫ А можно попросить администратора перенести тему в общий раздел? Я просто не знаю как.

Мы же не в рамках одного продукта сейчас обсуждение ведем.

Изменено 10 февраля 2010 пользователем Apologist

10 февраля 2010

И что я ничего подобного не нашел летом, когда собирал конфиг... была возможность взять i7...

ЗЫ А можно попросить администратора перенести тему в общий раздел? Я просто не знаю как.

Мы же не в рамках одного продукта сейчас обсуждение ведем.

а попросить просто - вон кнопочка "жалоба" светится) Изменено 10 февраля 2010 пользователем Bonusfrag

10 февраля 2010

Тесты проводили на разных задачах. Прямо сейчас под рукой есть тесты моделейна 150К, 1.9М и 4.4М ячеек (хотя рекомендуется по разным источникам считать не менее 50-200К ячеек на процесс). До 4-х ядер прирост скорости близок к идеальному, от 4-х до 7-и прирост замедляется но всё же есть, на 8-и уже перегруз и производительность падает.

А можно вопросы:

1. Тип сетки (тетра или ортогональная)?

2. Двухмерная или трехмерная?

3. Многокомпонентная или однокомпонентная?

4. Явный или неявный решатель?

:)

10 февраля 2010

Можно, только еще больше запутаемся. Общий тренд и без уточнений видно, а сделать какие-то выводы по солверу/сеткам всё равно не получится.

1. 150К - призмы и тетры, смесь

1.9М - гекса, почти однородная

4.4М - гексы, неоднородная

2. Во всех случаях 3D

3. Кто? Среда?

4. не принципиально, все три задачи разные по многим параметрам, не только решатели.

А вы почему спрашиваете, у вас коэф распараллеливания сильно зависит от этих параметров?

10 февраля 2010

А оно везде зависит.

Двухмерные задачи параллелятся идеально. Явные решатели параллелятся лучше неявных. Любая проадаптируемая сетка параллелится хуже сетки начального уровня и т.п.

26 февраля 2010

Приветствую!

есть статья Алямовского, в которой приводится график "ускорения" от кол-ва процессоров.

Так вот для одного проца - соотв-но единица,

для 4х - 1,78

для 8 - 1,82

да и посмотреть на график загрузки - видно, что для одной итерации 30-40% времени работает одно ядро и 70-60% - все 4 вместе.

А можно ссылку на эту статью? Хотелось бы почитать первоисточник.

Просто сейчас рассчеты веду на 2-х ядерной машине, но есть возможность использовать 8 ядер. Интересно, стоит ли заморачиваться с внутриорганизационными разрешениями и настройкой.

26 февраля 2010

А можно ссылку на эту статью? Хотелось бы почитать первоисточник.

Просто сейчас рассчеты веду на 2-х ядерной машине, но есть возможность использовать 8 ядер. Интересно, стоит ли заморачиваться с внутриорганизационными разрешениями и настройкой.

Статья эта относится начальным вариантам 2009 версии. Сейчас (2010 sp2) для 4-х ядерного процессора ускорение для относительно большой размерности достигает в среднем примерно 2,5. Ну, то-есть если задействовано строго одно ядро, то все они в сумме задействованы на 25%, если полноценно работают 4, то 100%. А по жизни (в зависимости от размерности задачи, однородности сетки, учёта/неучёта теплообмена излучением, ...) получается 50 - 75%.

У многоядерных процессоров (и многоголовых пользователей :rolleyes: ) есть ещё одно (в контексте FloWorks) преимущество. можно одновременно решать несколько задач. Тогда они, при наличиии достаточного объёма оперативной памяти, решаются практически независимо - можно для каждой задачи назначить число используемых ядер.

27 февраля 2010

Ребята, выеще учитывайте такой момент. Все что начинается с Нехалемовского ядра имеет ТурбоБуст на борту, т.е. в рамках общего тепловыделения, процессор может ядра разгонять. Если вы считаете на одном ядре и ТБ включен, то он вам это ядро еще подразгонит.

А когда вы начнете в паралелльном режиме считать, то ядра будут работать на штатных частотах.

В итоге это дает перекос в определении ускорения в зависимости от количества ядер в худшую сторону.

27 февраля 2010

А когда вы начнете в паралелльном режиме считать, то ядра будут работать на штатных частотах.

В итоге это дает перекос в определении ускорения в зависимости от количества ядер в худшую сторону.

Немножко не так.

Взависимости от типа процессора на данной архитектуре ускорения для разного числа ядер - разное.

То есть, 4 ядра одновременно в турбобусте не будут работать на штатной частоте - частота будет выше, чем штатная. Но при этом ниже, чем для работы в бусте только одного ядра.

Причем для разных процессоров верхняя планка при разном числе ядров - разная. Чем дороже проц, тем выше эта планка для 4-х ядер.

Войти

большая размерность задачи.

Рекомендованные сообщения

a_schelyaev 366

Ссылка на сообщение

Поделиться на других сайтах

Bonusfrag 104

Ссылка на сообщение

Поделиться на других сайтах

Apologist 0

Ссылка на сообщение

Поделиться на других сайтах

a_schelyaev 366

Ссылка на сообщение

Поделиться на других сайтах

Apologist 0

Ссылка на сообщение

Поделиться на других сайтах

Bonusfrag 104

Ссылка на сообщение

Поделиться на других сайтах

a_schelyaev 366

Ссылка на сообщение

Поделиться на других сайтах

Apologist 0

Ссылка на сообщение

Поделиться на других сайтах

a_schelyaev 366

Ссылка на сообщение

Поделиться на других сайтах

vl 327

Ссылка на сообщение

Поделиться на других сайтах

a_schelyaev 366

Ссылка на сообщение

Поделиться на других сайтах

Apologist 0

Ссылка на сообщение

Поделиться на других сайтах

Bonusfrag 104

Ссылка на сообщение

Поделиться на других сайтах

a_schelyaev 366

Ссылка на сообщение

Поделиться на других сайтах

Apologist 0

Ссылка на сообщение

Поделиться на других сайтах

a_schelyaev 366

Ссылка на сообщение

Поделиться на других сайтах

The_Sin 0

Ссылка на сообщение

Поделиться на других сайтах

a_a_a+ 11

Ссылка на сообщение

Поделиться на других сайтах

a_schelyaev 366

Ссылка на сообщение

Поделиться на других сайтах

vl 327

Ссылка на сообщение

Поделиться на других сайтах

Присоединяйтесь к обсуждению

Сейчас на странице 0 пользователей

Сообщения