Перейти к публикации

Сопроцессоры и GPU для вычислений


Рекомендованные сообщения

Intel Xeon Phi уже достаточно активно продается в России

С одной стороны, не дешево, от 135000 р

С другой, ценник на i7 близок... и мне вот интересно, есть ли выигрыш в скорости счета,  если сравнивать вычислительные единицы одинаковой стоимости:

а) Один ПК с такой картой б) Несколько ПК на i7 + Гиг-лан в) Один многопроцессорный сервер

 

Интересно, есть уже реальные пользователи такого девайса для CAE и в частности для CFD?

 

Память в устройстве своя, GDDR 6 Гиг всего. Т.е. оно применимо только для задач небольшой размерности? (~1млн ячеек)

Ссылка на сообщение
Поделиться на других сайтах


Intel Xeon Phi уже достаточно активно продается в России

С одной стороны, не дешево, от 135000 р

С другой, ценник на i7 близок... и мне вот интересно, есть ли выигрыш в скорости счета,  если сравнивать вычислительные единицы одинаковой стоимости:

а) Один ПК с такой картой б) Несколько ПК на i7 + Гиг-лан в) Один многопроцессорный сервер

 

Интересно, есть уже реальные пользователи такого девайса для CAE и в частности для CFD?

 

Память в устройстве своя, GDDR 6 Гиг всего. Т.е. оно применимо только для задач небольшой размерности? (~1млн ячеек)

in-house CFD код на MIC уже считают, про промышленные (коммерческие) CFD не слышал (но и особо не интересовался)

Все как обычно упирается в код. Из плюсов _теоретически_ переделка обычного MPI/OpenMP кода минимальна (обычно просто перекомпиляция)

 

Вообще же GPU будет и быстрее (за те-же деньги) и CFD коды под него уже есть и коммерческие(Fluent) и опенсорс(OpenFOAM,PyFR,HiFiLES), но переделка существующего кода под ту же CUDA сильно сложнее будет.

Ссылка на сообщение
Поделиться на других сайтах

Какова роль собственной памяти такого девайса? Правильно ли считать, что размерность задачи на неё завязана?

Ссылка на сообщение
Поделиться на других сайтах
Вообще же GPU будет и быстрее (за те-же деньги) и CFD коды под него уже есть и коммерческие(Fluent) и опенсорс(OpenFOAM,PyFR,HiFiLES), но переделка существующего кода под ту же CUDA сильно сложнее будет.

обсуждалась уже на форуме переделка под GPU

вроде как затык идет в передаче данных - идут большие потери на передачу и итоговая скорость хуже, чем на многоядерном CPU 

Ссылка на сообщение
Поделиться на других сайтах

Какова роль собственной памяти такого девайса? Правильно ли считать, что размерность задачи на неё завязана?

По сути это компьютер внутри компьютера. Массив ядер MIC/GPU имеет доступ только к внутренней памяти. Данные во внутреннюю память копируются из памяти хоста и обратно.

обсуждалась уже на форуме переделка под GPU

вроде как затык идет в передаче данных - идут большие потери на передачу и итоговая скорость хуже, чем на многоядерном CPU 

Ну я как бы не обсуждал :) Я просто код писал под GPU. Насчет "скорость хуже" это мягко говоря не так :) Проблема в том что приходится гонять данные между хостом и девайсом и обратно, но скорость такой перекачки вполне приличная (если не злоупотреблять). "Хуже" имеется ввиду другое. CPU выигрывает у GPU в достижении "теоретического пика производительности в %" но проигрывает по абсолютному значению если сравнивать 1 GPU vs 1 CPU

Ссылка на сообщение
Поделиться на других сайтах

Чтобы 2 раза не бегать  :smile:

 

Чем меньше сетка тем меньше выигрыш GPU (для достижения пиковых значений в GPU желательно как можно сильнее заполнять локальную память ускорителя)

post-34943-0-62307600-1456847668.png

post-34943-0-79796700-1456847760.gif

Изменено пользователем HFL
Ссылка на сообщение
Поделиться на других сайтах
  • 4 месяца спустя...

обсуждалась уже на форуме переделка под GPU

вроде как затык идет в передаче данных - идут большие потери на передачу и итоговая скорость хуже, чем на многоядерном CPU 

Тадам! Встречайте Radeon Pro SSG - всего за 10000$

http://www.ixbt.com/news/2016/07/26/3d-amd-radeon-pro-ssg-ssd.html

Производитель показал образец Radeon Pro SSG с двумя SSD накопителями Samsung 950 Pro объемом по 512 ГБ каждый.

Для повышения скорости передачи данных они были объединены в массив RAID 0. 

 

Я себе представлял это чуть по-другому - как возможность к GPU в будущем подключать доп.планки памяти, но производитель пошел другим путем...

 

Что скажут профи? Поможет ли SSD решить затык?

Ссылка на сообщение
Поделиться на других сайтах

Тадам! Встречайте Radeon Pro SSG - всего за 10000$

http://www.ixbt.com/news/2016/07/26/3d-amd-radeon-pro-ssg-ssd.html

Производитель показал образец Radeon Pro SSG с двумя SSD накопителями Samsung 950 Pro объемом по 512 ГБ каждый.

Для повышения скорости передачи данных они были объединены в массив RAID 0. 

 

Я себе представлял это чуть по-другому - как возможность к GPU в будущем подключать доп.планки памяти, но производитель пошел другим путем...

 

Что скажут профи? Поможет ли SSD решить затык?

 

 

Это очень специфичный девайс:

 

SSD имеет прямой интерфейс к GPU через PCI-E мост

 

Один из минусов это отсутствие стандарта (чтобы это заюзать нужен будет вендор-специфичный API)

 

Ну и вообще задача где требуется быстрый I/O в паре с GPU тоже весьма специфичная.

 

Например это обработка сейсмоданных в нефтянке.

Ссылка на сообщение
Поделиться на других сайтах
  • 2 месяца спустя...

Это очень специфичный девайс:

 

Вот апгрейд:

https://hi-tech.mail.ru/news/amd-dracarys/?frommail=1

 

Инсайдеры утверждают, что новая видеокарта будет построена на базе 14-нанометрового процессора Vega 10 производительностью 20 ТФЛОПС – возможно, чипов будет установлено несколько. Объем локальной видеопамяти составит 1 ТБ. При этом 16 ГБ памяти будут собраны из многослойных модулей HBM2, остальной же объем, вероятно, составят NAND-чипы.

 

Ссылка на сообщение
Поделиться на других сайтах

По моему последние Интеловские многоядерники столько же флопсов имеют, а стоимость куда ниже будет.

Ссылка на сообщение
Поделиться на других сайтах
стоимость куда ниже будет.

купил hp z800  

xeonx2 5630 2.6ггц 

2Х8гб

70 тыс рублей :) сегодня,

буду тестить и думать что и как..

думаю как лучше памити докупить или райд на ssd поставить? 

у меня 4 hdd samsung eva 850 pro.. скорость супер они в память закидывают и через нее пишут.

 

если надо такое или похожее заказывайте в личку..

Изменено пользователем Maik812
Ссылка на сообщение
Поделиться на других сайтах

нет отпечатки. посмотрел еес память 8 гб стоит 1500руб в среднем на авите. но 5-6 рублей купил ssd 512 gb.

винда сбросит в вирт памТь на диск если много займет. вот и делема вирт память сделать быстрой или увеличить оперативуу. у памяти пропускная скорость 10 гб /сек  !

Изменено пользователем Maik812
Ссылка на сообщение
Поделиться на других сайтах

две разнонаправленные.. первое  расчет симуляция , магнитные поля, вентиляция работа в Солиде и симулейшене.

вторая и основная-архив файлов около 1 миллиона файлов 4-10 Тб и поиск данных по ним. систему не выбрал еще .. пока Тоталом ищу данные по pdf,doc, dvj, . распознавание текстов и тд.

встал вопросс вернуть пару процов 2.6ггц и поставить один 3.2 ггц. что лучше? потом по требованию и нехватки поставить второй топовый. х5690 ,щас стоит 5640х2

Изменено пользователем Maik812
Ссылка на сообщение
Поделиться на других сайтах
  • 1 месяц спустя...
В 25.10.2016 в 17:09, Maik812 сказал:

х5690

а вы не считали сколько будут потреблять електро мощности два таких проца совместно с памятью и видеокартой?

Ссылка на сообщение
Поделиться на других сайтах
В 25.10.2016 в 03:50, Maik812 сказал:

купил hp z800  

xeonx2 5630 2.6ггц 

2Х8гб

70 тыс рублей :) сегодня,

буду тестить и думать что и как..

думаю как лучше памити докупить или райд на ssd поставить? 

у меня 4 hdd samsung eva 850 pro.. скорость супер они в память закидывают и через нее пишут.

 

если надо такое или похожее заказывайте в личку..

А вот Квадры топовые по полляма стоят. Вот и думайте.

Ссылка на сообщение
Поделиться на других сайтах
12 часа назад, a_schelyaev сказал:

А вот Квадры топовые по полляма стоят. Вот и думайте

HP Z800 тоже стоит под пол лям.. смотря какой конфиг , щас райд делаю по 6 ТБ дисков купил 8 штук.(Биг дат по науки и техники делать буду) Чем данные накрыть и какую систему ставить?!   Как покупать или у кого от этого цена.

На ебее или авите Nvideo K2  65тыс рублей, а так 200-300 тыс. И главное так как поддерживает софт эти GPU ?

Изменено пользователем Maik812
Ссылка на сообщение
Поделиться на других сайтах
12 часа назад, Maik812 сказал:

HP Z800 тоже стоит под пол лям.. смотря какой конфиг , щас райд делаю по 6 ТБ дисков купил 8 штук.(Биг дат по науки и техники делать буду) Чем данные накрыть и какую систему ставить?!   Как покупать или у кого от этого цена.

На ебее или авите Nvideo K2  65тыс рублей, а так 200-300 тыс. И главное так как поддерживает софт эти GPU ?

 

Вам чтобы Квадрик поставить по любому нужно иметь обвязку - ЦП, мать, жесткий диск. Если РЗЯ800 без топового квадрика много стоит, то с ним он будет стоить еще больше. А рельный выхлоп?

Ссылка на сообщение
Поделиться на других сайтах

Присоединяйтесь к обсуждению

Вы можете опубликовать сообщение сейчас, а зарегистрироваться позже. Если у вас есть аккаунт, войдите в него для написания от своего имени.
Примечание: вашему сообщению потребуется утверждение модератора, прежде чем оно станет доступным.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.

  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу.




  • Сообщения

    • anykeyto
      Ага, спасибо... А в связке с G07.1 это как работает? Есть детали ,кольца, на которых надо делать по 4 паза. Сейчас программист написал прогу под шаровую фрезу. Там рабочие движеня происходят через одновременное смещение по оси Х и Z... фреза убивается буквально на третьем кольце, да и обработка получаестя фиговой.. На сколько я понимаю надо стремиться к тому, чтобы на 5ти осном станке фреза всегда была перпендикулярна касательной ли самой поверхности. Мне посоветовал как раз цилндрческую интерполяцию, когда ось С преобразуется в плоскость. В мануале к HNC описано эт криво, но в примерах программ как раз сначала включается CTOS и потом G07.1. но дальше как запрограммировать понимания пока нет...  P.S. хочу добавить, что на 5-снике раньше работал только как оператор по готовым программам  на Хенденхайне. А сейчас на новом предприятии на новой для меня стойке нужно все делать с нуля и самостоятельно. С одной стороны интересно, с другой стороны спросить не у кого, в инете инфы по стойке нет от слова совсем, уж тем более видео....  чем это отличается от просто G0 C180? Или это уже будет шпиндель позиционироваться, а не стол?
    • AlexKaz
      Различают жёсткие и гибкие ротора. В данном случае вал жёсткий. Для него соответствуюшая формула. 4000 об/мин = 66.67 Гц, это ни о чём, эффекты для такой частоты почти не скажутся на жёстком роторе. Но проблема в том, что в лопаточных машинах (а насос на скрине наверное лопаточная?) собственные кратны числу лопаток. Я не разбирался в вопросе чтобы что-то здесь советовать. Лучше не спешить и внимательно почитать про модальный в лопаточных. Заодно проверить, а какое нагружение идёт в деталях насоса чтобы корректно выполнить престресс.
    • ДОБРЯК
      Хотите еще и матрицу масс изменить. :=) И сколько килограмм воды будете присоединять?  Опыт правильного моделирования, опыт расчета таких конструкций накапливается десятилетиями. Маловероятно, что кто-то на форуме будет вам объяснять как правильно моделировать, какие КЭ использовать, какие граничные условия задавать и т. д. Вы же всегда уклоняетесь от разговора на эти темы, даже для простых моделей.  Даже если перейдете на Ансис и не разберётесь в том, что он считает это не поможет вам написать грамотный отчет и объяснить грамотному заказчику, что вы там насчитали. Считает расчетчик, а программа это инструмент. Это только в рекламе пишут, что купите программу трехмерного моделирования, сделайте трехмерную модель, потом нажмите одну кнопку и на обычном игровом компьютере все посчитаете. Только в жизни все немножко иначе...:=)
    • Jesse
      Вот что у Биргера: Центробежные силы и индуцированный гироскопический момент зависят от квадрата частоты вращения вала   Хотя уже сама критическая частота зависит только от момента инерции колеса (альфа, бэта, гамма - это прогибы, углы поворота и прочая шелуха), т.е. частота вращения в формулу не входит, а всё определяется только моментом инерции Jm Ну у него рассматривается простая одномассовая система (фактически грузик на пружинке). Думаю поискать публикации.. мб где то раскопали аналитическую зависимость первой и высшей СЧ от частоты вращения для сложных систем. Хотя если выяснится что зависит,  всё равно обоснование придумывать придётся.  Эхх...
    • Fedor
      https://www.litres.ru/book/v-n-faddeeva/vychislitelnye-metody-lineynoy-algebry-65999878/  Ну и классику жанра :) 
    • Jesse
      4000 об/мин при наружном диаметре колеса 380 мм. Думаете, на больших оборотах вилка всё равно может разойтись и могут появиться гироскопические эффекты? Даже несмотря на вышеприведенные массово-инерционные оценки и расположение опор?   да я влияние престресс (вращение) особо не увидел... Думал обычным модальником прогнать, Ланцошом (он пошустрее).   Ещё мои раздумья направлены в сторону присоединённой массы воды, что по идее должно занижать частоты. Хотя для такого массивного вала как у меня даже на это дело можно забить, наверно...
    • Handrusik
      Maxx2000 - благодарю Павлуха - это не фриланс Утомлённый солнцем - приятно, что меня помнят
    • Борман
      Я так понимаю, что обороты не особо большие. ДК - это чисто высокооборотистая тема.   Просто мысли вслух... Если вилка будет сильно расходится, то всегда будет точка пересечения любого луча с кривой BW. Причем точка будет на меньших оборотах по сравнению с обычным престресс-модальником. Какие дальше действия ? С чем тут нужно дополнительно бороться по сравнению с тем, с чем нужно было бы бороться по результатам обычного престресс-модальника Если вилка не сильно расходится (от кривой обычного престресс-мобальника), то смысла стоить строгую ДК большого нет.    
    • boomeeeer
      На сименсе параметрами настраивается многое, что связано с менеджером иснструмента. Вызов возможен как по номерам, так и по именам инструментов. Через равно вроде как по имени вызывается (Т="имя"), а по номеру можно было, например, Т1 M6, а первый корректор подтянулся бы автоматически. И не всегда М6 на смену. Производитель мог нагородить чего угодно. Параметры надо смотреть
    • Den4ik85
      P.S этой ошибки не было при запуске,она возникла при выполнении команды смены инструмента "T=.." d1m6. (так учили на курсах) возможно,не тот номер ввел или не соответствовало название инструмента его номеру?
×
×
  • Создать...