Перейти к публикации

Fluent на Core i7 920. Сравнение с Q6600.


Игорь (Москва)

Рекомендованные сообщения

Всех с новым годом!

Итак... дошли руки до уже знаменитого Core i7 - и спешу поделиться с общественностью результатами.

Начиналось все вот здесь - тут результаты тестирования Q6600.

http://fsapr2000.ru/index.php?showtopic=20613

Сейчас удалось протестировать Core i7 920 - частота 2.6 ГГц

Система:

ASUS P6T

Core i7 920 - 2.66 ГГц

12Гб DDR3

(две GTX280 на результат думаю не повлияли :)

Vista x64

Fluent 6.3.26 x64

Задача та же самая - ступенчатое уплотнение турбины.

Поскольку до сходмости далеко - засекалось время ста итераций.

Вот результаты:

С включенным гипертредингом (HT) в системе видно восемь процессоров (ядер).

1 процесс 3:17 (мин:сек)

4 процесса 1:23

8 процессов 1:00

без HT

1 процесс 3:18

4 процесса 1:11

Результаты для одного процесса приведены скорее для контроля за распараллеливаемостью :)

Что любопытно - включение гипертрединга и запуск Флюента с параметром -t8 - приводит к существенному росту скорости - на целых 18%.

Результат для четырех процессов приведен опять таки для справки - я не очень понимаю, что такое четыре процесса на четырехядерном процессоре с включенными восемью потоками. :)

Вспомним, что было на Q6600 на четырех ядрах.

Частота 2.4 ГГц - время: 1:52

Частота 3.0 ГГц - время: 1:44

По моему результаты 920-го весьма впечатляют :) Процентные сравнения наверное можно не приводить, с одной минутой сравнивается весьма хорошо и так.

1:00 для 920 и где-то 1:50 для Q6600. (Уж до 2.6ГГц наверное любой Q6600 разгонится).

Другой вопрос почем обходится эта система.

По хорошему еще надо сравнить с чем-то распространенным сейчас типа Core 2 Quad Q9300 2.5 ГГц.

СВЕЖЕЕ (хотя и не очень актуальное) ДОПОЛНЕНИЕ:

AMD Phenom X4 9500 -2.2 ГГц - время: 2:28

Ждем для теста Phenom II X4 Deneb.

Приветствуются дополнения и здоровая/нездоровая критика.

С уважением,

Игорь

Изменено пользователем Игорь (Москва)
Ссылка на сообщение
Поделиться на других сайтах


"С включенным гипертрейдингом (HT) в системе видно восемь процессоров (ядер).

1 процесс 3:17 (мин:сек)

4 процесса 1:23

8 процессов 1:00

без HT

1 процесс 3:18

4 процесса 1:11

Результаты для одного процесса приведены скорее для контроля за распараллеливаемостью :)

Что любопытно - включение гипертрейдинга и запуск Флюента с параметром -t8 - приводит к существенному росту скорости - на целых 18%.

"

Ничего не понял про 18%, особенно если временя сопоставимые для 4х?

Можно пояснить?

Ссылка на сообщение
Поделиться на других сайтах

А... все просто.

Гипертрединг – процессор может исполнять два потока команд одновременно.

Опция включается в биосе, и тогда диспетчер показывает ВОСЕМЬ графиков загрузки CPU.

Запускаем Флюент как будто на восьмиядерном процессоре (ключ -t8) - получаем время расчета одну минуту.

Отключаем в биосе гипертрединг - запускаем Флюент с ключом -t4 - и получаем время счета на 18% большее.

Ну примерно... там же еще важно, что от чего отнимать, от чего проценты считать... Ну суть, что гипертрединг ЗНАЧИТЕЛЬНО увеличивает производительность.

С уважением,

Игорь

Изменено пользователем Игорь (Москва)
Ссылка на сообщение
Поделиться на других сайтах

А можно прогнать тоже на 2х и 3х ядрах для того чтобы понять какая зависимость от роста количества ядер?

Как-то большой победы не видно - почти в рамках ускорения Xeon (для 4х ядер).

Те же 2.4-2.8... с гипертредингом конечно интереснее - 3.3, но ведь, чёрт побери, на это надо (в реальных условиях) на 4 лицензии больше...

Ссылка на сообщение
Поделиться на других сайтах

Нормальное ускорение можно получить только в степени 2. Тлько если там конечно не OpenMP.

Ссылка на сообщение
Поделиться на других сайтах

Как-то большой победы не видно - почти в рамках ускорения Xeon (для 4х ядер).

Те же 2.4-2.8... с гипертредингом конечно интереснее - 3.3, но ведь, чёрт побери, на это надо (в реальных условиях) на 4 лицензии больше...

Добрый день!

А... не очень ясно - что имеется ввиду - сравнение с Xeon?

Xeon существенно дороже. Ну его нафиг :)

А насчет лицензий... ну да. Вообще по моему это странная политика. Или это просто Microsoft такая добрая, что не просит две-три-четыре лицензии за одну Windows? (Кстати вопрос о кол-ве лицензий на Win задавался представителям MS как только появились первые двухядерники).

Ссылка на сообщение
Поделиться на других сайтах

MS пока вроде выдает лицензию на один узел в сети. Сколько там внутри него ядер им по барабану.

Вроде...

Ссылка на сообщение
Поделиться на других сайтах

А насчет лицензий... ну да. Вообще по моему это странная политика. Или это просто Microsoft такая добрая, что не просит две-три-четыре лицензии за одну Windows?

Речь идёт не о лицензиях на операционку, а о лицензиях на софт.

Параллельные лицензии на флюэнт, CFX итд. чего-то стоят.

Причём небольшие количества стоят довольно-таки ощутимо.

Что касается майкрософта то им, так сказать, не за что брать дополнительные деньги - без прикладного софта использующего многоядерность операционка ничто. Флюэнт ведь автоматом не будет использовать все ядра...

А... не очень ясно - что имеется ввиду - сравнение с Xeon?

Хотя бы с Q6600.

Если брать результаты бенчмарка с флюэнтовского сайта то получается на оптеронах рост почти идеальный, а на Xeon (4 ядра) примерно такой же показатель. Я тоже экспериментировал с Q6600 и получил примерно такие же цифры.

Причём ещё прогонял то же на CFX, но в нём всё было ещё хуже.

Надеялся что встроенный контроллер памяти сделает i7 более близким к показателям оптерона.

ps. Кстати меня удивило то что двухядерные ксеоны стоят больше чем четырёхядерные. Но если смотреть на результаты то логика понятна...

Изменено пользователем deLuther
Ссылка на сообщение
Поделиться на других сайтах

Считай задачу на только двух ядрах твоего четырехяддерного процессора и логика вновь отвернется от тебя.

:)

Ссылка на сообщение
Поделиться на других сайтах

Присоединяйтесь к обсуждению

Вы можете опубликовать сообщение сейчас, а зарегистрироваться позже. Если у вас есть аккаунт, войдите в него для написания от своего имени.
Примечание: вашему сообщению потребуется утверждение модератора, прежде чем оно станет доступным.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.

  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу.




  • Сообщения

    • Алексей 1977
      Кто знает подскажите как отключить этот ненужный набор букв и символов в готовой УП? Я так думаю надо редактировать постпроцессор? Заранее спасибо ( Общая длина: 130.0) ( Заготовка:) ( MIN X: -10.970) ( MIN Y: -10.970) ( MIN Z: -6.500) ( MAX X: 10.970) ( MAX Y: 10.970) ( MAX Z: 0.000) ( COORDINATE SYSTEM: Глобальная СК) ( Кончик инструмента:) (   X: -0.000) (   Y: 0.000) (   Z: 10.000) ( Рекомендованная длина: 50.000) ( Количество кромок: 4) ( Инструмент:   Концевая фреза) ( DIAMETER: 10.000) ( Безопасность:) ( Рабочие ходы инструмента: Безопасная БЕЗ зарезов) ( Подводы инструмента: Безопасная БЕЗ зарезов) ( Переходы инструмента: Безопасная БЕЗ зарезов) ( Рабочие ходы патрона: Столкновения НЕ проверялись) ( Подводы патрона: Столкновения НЕ проверялись) ( Переходы патрона: Столкновения НЕ проверялись) ( Траектория: Шаблон) ( STEPOVER: 5.000) ( ДОПУСК:0.100) ( THICKNESS:0.000) ( Статистика:) ( LENGTH: 95.318)( LIFTS: ( TIME: 0/00/05) 1) G0X0Y0 G43Z10.H13 X4.75Y-8.227 Z5. G1Z0F500 X9.5Y-5.485F1000 Y5.485 X0Y10.97 X-9.5Y5.485 Y-5.485 X0Y-10.97 X4.75Y-8.227 G0Z10.
    • gudstartup
      считывание происходит при помощи вх\вых сигналов контроллера plc 
    • gudstartup
      @Maks Horhe так все таки скиньте бэкап эмулируем ваше чпу в cncguide и посмотрим куда поедет?  можете снять видео с фиксацией координатных позиций после каждого кадра. Выложу вашу программу пусть программисты посмотрят все ли в ней ок. %O0002 G40 G17 G94 G90 G49 G80 N1 G91 G28 Z0.0 N2 G91 G28 X0.0 Y0.0 N3 G91 G28 B0.0 C0.0 N4 M03 S200 N5 G90 G0 G53 B0.0 C0.0 N6 G54 N7 X0.0 Y0.0 N8 G90 G43 H01 N9 G90 G0 X0.0 Y0.0 N10 G90 G0 Z200.0 N11 G01 Z10.0 F1500. N12 M00 N13 G00 Z200.0 N14 G40 G49 G69 N15 G00 G53 Z0.0 N16 G00 G54 B0.0 C0.0 N17 G68.2 X0.0 Y0.0 Z0.0 1135. J39.2044 K-129.2315 N18 G53.1 N19 G01 X0.0 Y0.0 F1500 N20 G90 G43 H01 N21 G90 G01 X0.0 Y0.0 F1500 N22 G90 G01 Z200. F1500 N24 M00 N25 G00 Z200. N26 G40 G49 G69 N27 G91 G28 Z0.0 N28 G28 X0.0 Y0.0 N29 G91 G28 B0.0 C0.0 N30 M5 N31 M30
    • gudstartup
      @karlf 530 считывает ключ по специальному протоколу при помощи plc и получает его серийный номер а из него определяет возможные режимы доступа. там нет драйвера а есть plc модуль или несколько эти модули написаны на питоне  надпись smartkey исчезает с экрана при запуске чпу??
    • ДОБРЯК
      Для того, чтобы получить правильные высшие) формы при виртуальном эксперименте, нужно сделать грамотную КЭ модель. От разговора на эту тему вы постоянно уклоняетесь.  То нет компьютера под рукой, сделать простейший тест, то теряете интерес. :=) Сходимости энергии деформации при расчетах статики, недостаточно для точного определения высших собственных форм и частот.  Для того, чтобы грамотно использовать метод конечных элементов, нужно сделать много-много тестов в статике, динамике и ... Одной кнопки и двух конечных элементов в 3Д программе недостаточно для определения высших собственных форм...  У вас в качестве инструмента всего два конечных элемента, шести узловая несовместная оболочка Тимошенко и десяти узловой тетраэдр. И еще контакты при решении задачи на собственные числа. Вам ли говорить про правильность определения высших собственных форм для сложных изделий... :=)    
    • vad0000
      Покажите схему с разрешением на движение
    • vad0000
      Вход, а не выход Вытащить Аналоговый вход и все, как будто туда ничего не подключено И если мы подключим сигнал к энкодеру оси Х, то он стнтет одинаковый с аналоговым входом, который не подключен?
    • Snake 60
      @waze4534  Посмотрите вверх и прочитайте текст на красной полоске...
    • kkk
      Я так понимаю, что предупреждение про "касательные" не просто так выскакивает. Если скруглить прямую стыковку отрезков эскиза (минимальным радиусом) то все работает даже без объединенной кривой, достаточно эскиза.
    • karlf
      Подскажите пожалуйста, может кто сталкивался. Станок DMU-50 на стойке TNC 530, перестал определяться ключ доступа. Сам ключ вроде работает, если переключать на нём режимы, то в шкафу на соответствующих блоках лампочки тоже переключаются. Но изначально был уровень доступа 4, а теперь уровни доступа не активны. Ключ только один, запасных нет. Есть какой-то старый бэкап, пробовал его накатить, но какой-то он непонятный - станок грузится, но почти в конце загрузки выдаёт какую-то ошибку по параметрам. Может кто знает в каком из разделов и в какой папке искать установленные драйверы ключа?
×
×
  • Создать...