Перейти к публикации

большая размерность задачи.


Рекомендованные сообщения

Старые квады не параллеятся в принципе, когда количество загружаемых ядер превышает два.

Все что на базе Нехалема куда лучше.

Ну про АМД и говорить не стоит - там тоже все на уровне.

Ссылка на сообщение
Поделиться на других сайтах


какой-то странный ответ...

при чем тут старый или новый?

квад он и есть квад. нормальные, заточенный проги, типа кодирования видео, жрут все 4 ядра с удовольствием,

а SW явно не всё умеет делать параллельно, т.к очевидно, что часть идёт только на одном ядре. От того и оф.график такой нерадостный.

Часть вычислений идёт явно на всех 4х ядрах судя по загрузке проца, так что зависимость от модели мне не оч.понятна.

Ссылка на сообщение
Поделиться на других сайтах

Старый квад, кстати, это слепленые на одном кристалле 2 коры2дуо. Так что вести себя будет аналогично им, т.е. должен параллелиться нормально.

Другой вопрос, что не все операционные системы линукс умеют использовать гипертретинг.

Изменено пользователем Apologist
Ссылка на сообщение
Поделиться на других сайтах

QuadCore на базе CoreDuo ядрышек есть фуфел в области инженерных вычислений.

Все что на ядре Нехалем уже солидный шаг у Интела по пути АМД.

:)

Ссылка на сообщение
Поделиться на других сайтах

Сегодня IBM представила свежие процессоры. Самые быстрые на текущий момент.

<noindex>http://lenta.ru/news/2010/02/09/processor/</noindex>

Ссылка на сообщение
Поделиться на других сайтах

QuadCore на базе CoreDuo ядрышек есть фуфел в области инженерных вычислений.

Все что на ядре Нехалем уже солидный шаг у Интела по пути АМД.

:)

откуда такая уверенность? м.б. есть какая ссыль на статью итд?

Все многоядерные тесты, которые я видел - ну шило на мыло... не более.

Ссылка на сообщение
Поделиться на других сайтах

откуда такая уверенность? м.б. есть какая ссыль на статью итд?

Все многоядерные тесты, которые я видел - ну шило на мыло... не более.

Тесты есть. Ссылок нет.

Будем показывать на одной из следующих конференций по инженерным системам пример тестирования одного европейского кластера.

Ссылка на сообщение
Поделиться на других сайтах

Тесты есть.

Тесты на каком-то конкретном продукте?

Наш опыт показывает, что STAR нормально параллелится даже на первых Корах2Дуо. Прирост не двойка конечно, но это ожидаемо из-за общего кэша для обоих ядер и узкой шины.

Я сейчас активно использую i7 девятисотой серии, STAR демонстрирует прирост производительности при использовании до 7 ядер (на процессоре напомню 4 "реальных" ядра с гипертретингом). Так что их на данный момент считаю самыми хорошими по цене/производительности.

В последнее время совсем перестал следить за АМД. У них есть что-то лучше?

Ссылка на сообщение
Поделиться на других сайтах

Тесты на каком-то конкретном продукте?

Продукт - FlowVison.

Но вообще это не зависит для CFD продукта, т.к. все наши продукты характеризуются одними и теми же качествами - массовый обмен информацией.

Наш опыт показывает, что STAR нормально параллелится даже на первых Корах2Дуо. Прирост не двойка конечно, но это ожидаемо из-за общего кэша для обоих ядер и узкой шины.

Если речь идет о двухядерном процессоре, то вопросов нет - он показывает нормальную масштабируемость, т.к. ширины канала памяти хватает, чтобы прокормить оба его ядрышка. Однако если говорить о четырехядерном процессоре, построенном на базе двух Core2Duo в одном кристале, то тут все плачевно в силу его архитектуры.

Я сейчас активно использую i7 девятисотой серии, STAR демонстрирует прирост производительности при использовании до 7 ядер (на процессоре напомню 4 "реальных" ядра с гипертретингом). Так что их на данный момент считаю самыми хорошими по цене/производительности.

А какова размерность задачи?

В последнее время совсем перестал следить за АМД. У них есть что-то лучше?

Ядра у них хилые, а масштабируемость была изначально лучше, чем на КвадКорах старых.

С появлением Нехалема АМД отстал, но ненамного в скорострельности, однако он лучше в плане энергоэффективности.

Ссылка на сообщение
Поделиться на других сайтах

Я сейчас активно использую i7 девятисотой серии, STAR демонстрирует прирост производительности при использовании до 7 ядер (на процессоре напомню 4 "реальных" ядра с гипертретингом). Так что их на данный момент считаю самыми хорошими по цене/производительности.

В последнее время совсем перестал следить за АМД. У них есть что-то лучше?

то есть, в star-ccm имеет смысл включать hyperthreading? Обычно расчеты (на прочность провеяли в ansys) лучше идут без него

У AMD есть дешевле, но не лучше.

Кстати, а на i7 восьмисотойсерии не пробовали? У них частота вроде повыше, че у 9-сотой. За счет этого может быть выигрыш

Ссылка на сообщение
Поделиться на других сайтах

Просто частота процессора в отрыве от частоты памяти ничего не говорит. Чем память относительно процессора ниже, тем по идее хуже.

Ссылка на сообщение
Поделиться на других сайтах

Если речь идет о двухядерном процессоре, то вопросов нет - он показывает нормальную масштабируемость, т.к. ширины канала памяти хватает, чтобы прокормить оба его ядрышка. Однако если говорить о четырехядерном процессоре, построенном на базе двух Core2Duo в одном кристале, то тут все плачевно в силу его архитектуры.

Да, действительно это так. Не совсем верно истолковал ваш предыдущий пост.

А какова размерность задачи?

Тесты проводили на разных задачах. Прямо сейчас под рукой есть тесты моделейна 150К, 1.9М и 4.4М ячеек (хотя рекомендуется по разным источникам считать не менее 50-200К ячеек на процесс). До 4-х ядер прирост скорости близок к идеальному, от 4-х до 7-и прирост замедляется но всё же есть, на 8-и уже перегруз и производительность падает.

Такое поведение никак не связано с производительностью самого солвера, только с архитектурой системы. На кластере при распараллеливании на 8 и больше узлов его мастабируемость близка к идеальной.

то есть, в star-ccm имеет смысл включать hyperthreading?

На примере связки i7 и STAR-CCM+ - однозначно стоит. Но не используйте все 8 ядер, оставьте 1-2 ядра на работу системы и всего остального.

Имхо, i7 вообще идеален для workstation. Можно спокойно считать на 5-6 ядрах и на фоне счета работать с отчетами, почтой или подготовкой сетки. Для кластеных решений - хз.

Кстати, а на i7 восьмисотойсерии не пробовали?

Я уже писал здесь по этому поводу. Если мне не изменяет память, у восьмисотой серии двухканальный контролер памяти со всеми вытекающими последствиями. На большой задаче упретесь в пропускную способность шины памяти и никакой гипертретинг не поможет. Если у кого-то есть опыт использования восьмой серии - делитесь, был бы рад услышать.

ЗЫ А можно попросить администратора перенести тему в общий раздел? Я просто не знаю как.

Мы же не в рамках одного продукта сейчас обсуждение ведем.

Изменено пользователем Apologist
Ссылка на сообщение
Поделиться на других сайтах

И что я ничего подобного не нашел летом, когда собирал конфиг... была возможность взять i7...

ЗЫ А можно попросить администратора перенести тему в общий раздел? Я просто не знаю как.

Мы же не в рамках одного продукта сейчас обсуждение ведем.

а попросить просто - вон кнопочка "жалоба" светится) Изменено пользователем Bonusfrag
Ссылка на сообщение
Поделиться на других сайтах

Тесты проводили на разных задачах. Прямо сейчас под рукой есть тесты моделейна 150К, 1.9М и 4.4М ячеек (хотя рекомендуется по разным источникам считать не менее 50-200К ячеек на процесс). До 4-х ядер прирост скорости близок к идеальному, от 4-х до 7-и прирост замедляется но всё же есть, на 8-и уже перегруз и производительность падает.

А можно вопросы:

1. Тип сетки (тетра или ортогональная)?

2. Двухмерная или трехмерная?

3. Многокомпонентная или однокомпонентная?

4. Явный или неявный решатель?

:)

Ссылка на сообщение
Поделиться на других сайтах

Можно, только еще больше запутаемся. Общий тренд и без уточнений видно, а сделать какие-то выводы по солверу/сеткам всё равно не получится.

1. 150К - призмы и тетры, смесь

1.9М - гекса, почти однородная

4.4М - гексы, неоднородная

2. Во всех случаях 3D

3. Кто? Среда?

4. не принципиально, все три задачи разные по многим параметрам, не только решатели.

А вы почему спрашиваете, у вас коэф распараллеливания сильно зависит от этих параметров?

Ссылка на сообщение
Поделиться на других сайтах

А оно везде зависит.

Двухмерные задачи параллелятся идеально. Явные решатели параллелятся лучше неявных. Любая проадаптируемая сетка параллелится хуже сетки начального уровня и т.п.

Ссылка на сообщение
Поделиться на других сайтах
  • 3 недели спустя...

Приветствую!

есть статья Алямовского, в которой приводится график "ускорения" от кол-ва процессоров.

Так вот для одного проца - соотв-но единица,

для 4х - 1,78

для 8 - 1,82

да и посмотреть на график загрузки - видно, что для одной итерации 30-40% времени работает одно ядро и 70-60% - все 4 вместе.

А можно ссылку на эту статью? Хотелось бы почитать первоисточник.

Просто сейчас рассчеты веду на 2-х ядерной машине, но есть возможность использовать 8 ядер. Интересно, стоит ли заморачиваться с внутриорганизационными разрешениями и настройкой.

Ссылка на сообщение
Поделиться на других сайтах

А можно ссылку на эту статью? Хотелось бы почитать первоисточник.

Просто сейчас рассчеты веду на 2-х ядерной машине, но есть возможность использовать 8 ядер. Интересно, стоит ли заморачиваться с внутриорганизационными разрешениями и настройкой.

Статья эта относится начальным вариантам 2009 версии. Сейчас (2010 sp2) для 4-х ядерного процессора ускорение для относительно большой размерности достигает в среднем примерно 2,5. Ну, то-есть если задействовано строго одно ядро, то все они в сумме задействованы на 25%, если полноценно работают 4, то 100%. А по жизни (в зависимости от размерности задачи, однородности сетки, учёта/неучёта теплообмена излучением, ...) получается 50 - 75%.

У многоядерных процессоров (и многоголовых пользователей :rolleyes: ) есть ещё одно (в контексте FloWorks) преимущество. можно одновременно решать несколько задач. Тогда они, при наличиии достаточного объёма оперативной памяти, решаются практически независимо - можно для каждой задачи назначить число используемых ядер.

Ссылка на сообщение
Поделиться на других сайтах

Ребята, выеще учитывайте такой момент. Все что начинается с Нехалемовского ядра имеет ТурбоБуст на борту, т.е. в рамках общего тепловыделения, процессор может ядра разгонять. Если вы считаете на одном ядре и ТБ включен, то он вам это ядро еще подразгонит.

А когда вы начнете в паралелльном режиме считать, то ядра будут работать на штатных частотах.

В итоге это дает перекос в определении ускорения в зависимости от количества ядер в худшую сторону.

Ссылка на сообщение
Поделиться на других сайтах

А когда вы начнете в паралелльном режиме считать, то ядра будут работать на штатных частотах.

В итоге это дает перекос в определении ускорения в зависимости от количества ядер в худшую сторону.

Немножко не так.

Взависимости от типа процессора на данной архитектуре ускорения для разного числа ядер - разное.

То есть, 4 ядра одновременно в турбобусте не будут работать на штатной частоте - частота будет выше, чем штатная. Но при этом ниже, чем для работы в бусте только одного ядра.

Причем для разных процессоров верхняя планка при разном числе ядров - разная. Чем дороже проц, тем выше эта планка для 4-х ядер.

Ссылка на сообщение
Поделиться на других сайтах

Присоединяйтесь к обсуждению

Вы можете опубликовать сообщение сейчас, а зарегистрироваться позже. Если у вас есть аккаунт, войдите в него для написания от своего имени.
Примечание: вашему сообщению потребуется утверждение модератора, прежде чем оно станет доступным.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.

  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу.




  • Сообщения

    • ID_Hacker
      Первое что надо смотреть это состояние сигналов с датчиков приводного инструмента. В каких то револьверах на валу приводного инструмента плоский паз, а на блоке приводного инструмента хвостовик лопаткой. В таком случае стоит индуктивный датчик, срабатывающий на положение вала в определённой ориентации. Есть револьверы с зубчатой муфтой, там стоит датчик отведённого состояния муфты приводного инструмента. После проверки этих сигналов можно переходить к проверке разжатия цилиндра диска.
    • Bot
      В Москве 29 мая состоялось ежегодное мероприятие компании «Топ Системы» Форум T-FLEX PLM. Во второй части пленарной сессии генеральный директор компании «Топ Системы» Кураксин Сергей Анатольевич и его заместитель по развитию PLM-технологий Кочан Игорь Николаевич впервые продемонстрировали участникам Форума кроссплатформенные версии клиента T-FLEX DOCs 18 (система управления инженерными данными) и САПР T-FLEX CAD 18. Показ проводился в «нативном» режиме, без использования Wine или подобных компонентов. Для демонстрации использовалась ОС Astra Linux. Также была продемонстрирована новая версия T-FLEX CAD 18, базовая функциональность которой реализована на отечественном геометрическом ядре RGK 2.0, разрабатываемом компанией «Топ Системы». Смотреть ВК Видео Смотреть на Rutube View the full article
    • Jesse
      Удачно помучиться..)) Если есть возможность, скидывайте картинки сюда)
    • Lmstr
      Решили писать производителю в итоге...
    • Cefius
      Большое спасибо!!! Очень помогли. Взял необходимые строки из вашего макроса и заменил, как вы сказали, название папки, получилось, все работает! Осталось только сохранение техкарт в пдф сделать. 
    • Andrey_kzn
      Вы зря переставляли блоки со станка на станок. Не знаю, что у вас за револьверка, но в наших дупломатиках датчик поворота диска револьверки - резольвер (абсолютный) - работает только со своим приводным блоком. Если меняется привод, нужно выполнить процедуру юстировки этого резольвера при помощи программы от дупломатика через ком-порт.  Кстати, на приводе есть индикатор, и можно посмотреть код ошибки при зависании смены инструмента. Далее, так как у вас револьверка с приводным инструментом,  привод должен позиционироваться перед  поворотом диска определённым образом, чтобы не снести шлицы на инструментальном блоке. Это будет видно, если заглянуть в отверстие под инструментальный блок в диске револьверки.  Может быть ЧПУ ждёт, когда там двигатель приводного инструмента закончит позиционироваться.  Следующий момент: сигналы от привода револьверки в ЧПУ.  (чётность, зажим диска, индексность).  Сейчас не помню все, но перед сменой они должны быть выставлены совершенно определённым образом. Иначе привод не воспримет команду на смену, которая идёт от ЧПУ. Это всё есть в документации на привод револьверки.  Ну и ещё один момент: команда на смену должна иметь строго определённую длительность (формирование команды происходит в PLC). также, есть комбинации входных сигналов, по которым диск может  вращаться по часовой стрелке, против часовой, или по кратчайшему пути.  Есть выбор скорости поворота диска. В общем, все сигналы нужно проверять.
    • davidovka
      только начало автоматизации всей рутины)  Рад, что помогло
    • maxx2000
      @davidovkaда, спасибо. уже поигрался с цветными циферками. Ещё раз спасибо. Это решение сильно сбережёт мою нервную систему.
    • davidovka
      dx=30 #шаг между видами x=30 #координата по х первого вида  
    • maxx2000
      @davidovka Заработало. С видами всё понятно.  Может ещё подскажешь как сделать чтобы не лепило один на один, а в шеренгу выстраивало
×
×
  • Создать...