Bonusfrag

Сопроцессоры и GPU для вычислений

Intel Xeon Phi уже достаточно активно продается в России

С одной стороны, не дешево, от 135000 р

С другой, ценник на i7 близок... и мне вот интересно, есть ли выигрыш в скорости счета,  если сравнивать вычислительные единицы одинаковой стоимости:

а) Один ПК с такой картой б) Несколько ПК на i7 + Гиг-лан в) Один многопроцессорный сервер

 

Интересно, есть уже реальные пользователи такого девайса для CAE и в частности для CFD?

 

Память в устройстве своя, GDDR 6 Гиг всего. Т.е. оно применимо только для задач небольшой размерности? (~1млн ячеек)

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах


Intel Xeon Phi уже достаточно активно продается в России

С одной стороны, не дешево, от 135000 р

С другой, ценник на i7 близок... и мне вот интересно, есть ли выигрыш в скорости счета,  если сравнивать вычислительные единицы одинаковой стоимости:

а) Один ПК с такой картой б) Несколько ПК на i7 + Гиг-лан в) Один многопроцессорный сервер

 

Интересно, есть уже реальные пользователи такого девайса для CAE и в частности для CFD?

 

Память в устройстве своя, GDDR 6 Гиг всего. Т.е. оно применимо только для задач небольшой размерности? (~1млн ячеек)

in-house CFD код на MIC уже считают, про промышленные (коммерческие) CFD не слышал (но и особо не интересовался)

Все как обычно упирается в код. Из плюсов _теоретически_ переделка обычного MPI/OpenMP кода минимальна (обычно просто перекомпиляция)

 

Вообще же GPU будет и быстрее (за те-же деньги) и CFD коды под него уже есть и коммерческие(Fluent) и опенсорс(OpenFOAM,PyFR,HiFiLES), но переделка существующего кода под ту же CUDA сильно сложнее будет.

2 пользователям понравилось это

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Какова роль собственной памяти такого девайса? Правильно ли считать, что размерность задачи на неё завязана?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
Вообще же GPU будет и быстрее (за те-же деньги) и CFD коды под него уже есть и коммерческие(Fluent) и опенсорс(OpenFOAM,PyFR,HiFiLES), но переделка существующего кода под ту же CUDA сильно сложнее будет.

обсуждалась уже на форуме переделка под GPU

вроде как затык идет в передаче данных - идут большие потери на передачу и итоговая скорость хуже, чем на многоядерном CPU 

2 пользователям понравилось это

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Какова роль собственной памяти такого девайса? Правильно ли считать, что размерность задачи на неё завязана?

По сути это компьютер внутри компьютера. Массив ядер MIC/GPU имеет доступ только к внутренней памяти. Данные во внутреннюю память копируются из памяти хоста и обратно.

обсуждалась уже на форуме переделка под GPU

вроде как затык идет в передаче данных - идут большие потери на передачу и итоговая скорость хуже, чем на многоядерном CPU 

Ну я как бы не обсуждал :) Я просто код писал под GPU. Насчет "скорость хуже" это мягко говоря не так :) Проблема в том что приходится гонять данные между хостом и девайсом и обратно, но скорость такой перекачки вполне приличная (если не злоупотреблять). "Хуже" имеется ввиду другое. CPU выигрывает у GPU в достижении "теоретического пика производительности в %" но проигрывает по абсолютному значению если сравнивать 1 GPU vs 1 CPU

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Чтобы 2 раза не бегать  :smile:

 

Чем меньше сетка тем меньше выигрыш GPU (для достижения пиковых значений в GPU желательно как можно сильнее заполнять локальную память ускорителя)

post-34943-0-62307600-1456847668.png

post-34943-0-79796700-1456847760.gif

Изменено пользователем HFL
3 пользователям понравилось это

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

обсуждалась уже на форуме переделка под GPU

вроде как затык идет в передаче данных - идут большие потери на передачу и итоговая скорость хуже, чем на многоядерном CPU 

Тадам! Встречайте Radeon Pro SSG - всего за 10000$

http://www.ixbt.com/news/2016/07/26/3d-amd-radeon-pro-ssg-ssd.html

Производитель показал образец Radeon Pro SSG с двумя SSD накопителями Samsung 950 Pro объемом по 512 ГБ каждый.

Для повышения скорости передачи данных они были объединены в массив RAID 0. 

 

Я себе представлял это чуть по-другому - как возможность к GPU в будущем подключать доп.планки памяти, но производитель пошел другим путем...

 

Что скажут профи? Поможет ли SSD решить затык?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Тадам! Встречайте Radeon Pro SSG - всего за 10000$

http://www.ixbt.com/news/2016/07/26/3d-amd-radeon-pro-ssg-ssd.html

Производитель показал образец Radeon Pro SSG с двумя SSD накопителями Samsung 950 Pro объемом по 512 ГБ каждый.

Для повышения скорости передачи данных они были объединены в массив RAID 0. 

 

Я себе представлял это чуть по-другому - как возможность к GPU в будущем подключать доп.планки памяти, но производитель пошел другим путем...

 

Что скажут профи? Поможет ли SSD решить затык?

 

 

Это очень специфичный девайс:

 

SSD имеет прямой интерфейс к GPU через PCI-E мост

 

Один из минусов это отсутствие стандарта (чтобы это заюзать нужен будет вендор-специфичный API)

 

Ну и вообще задача где требуется быстрый I/O в паре с GPU тоже весьма специфичная.

 

Например это обработка сейсмоданных в нефтянке.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Это очень специфичный девайс:

 

Вот апгрейд:

https://hi-tech.mail.ru/news/amd-dracarys/?frommail=1

 

Инсайдеры утверждают, что новая видеокарта будет построена на базе 14-нанометрового процессора Vega 10 производительностью 20 ТФЛОПС – возможно, чипов будет установлено несколько. Объем локальной видеопамяти составит 1 ТБ. При этом 16 ГБ памяти будут собраны из многослойных модулей HBM2, остальной же объем, вероятно, составят NAND-чипы.

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

По моему последние Интеловские многоядерники столько же флопсов имеют, а стоимость куда ниже будет.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
стоимость куда ниже будет.

купил hp z800  

xeonx2 5630 2.6ггц 

2Х8гб

70 тыс рублей :) сегодня,

буду тестить и думать что и как..

думаю как лучше памити докупить или райд на ssd поставить? 

у меня 4 hdd samsung eva 850 pro.. скорость супер они в память закидывают и через нее пишут.

 

если надо такое или похожее заказывайте в личку..

Изменено пользователем Maik812

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
2Х8гб

Тут нет опечатки?? Тогда

лучше памити

:wink:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

нет отпечатки. посмотрел еес память 8 гб стоит 1500руб в среднем на авите. но 5-6 рублей купил ssd 512 gb.

винда сбросит в вирт памТь на диск если много займет. вот и делема вирт память сделать быстрой или увеличить оперативуу. у памяти пропускная скорость 10 гб /сек  !

Изменено пользователем Maik812

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
винда сбросит в вирт памТь на диск если много займет

Для каких задач комп брали?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

две разнонаправленные.. первое  расчет симуляция , магнитные поля, вентиляция работа в Солиде и симулейшене.

вторая и основная-архив файлов около 1 миллиона файлов 4-10 Тб и поиск данных по ним. систему не выбрал еще .. пока Тоталом ищу данные по pdf,doc, dvj, . распознавание текстов и тд.

встал вопросс вернуть пару процов 2.6ггц и поставить один 3.2 ггц. что лучше? потом по требованию и нехватки поставить второй топовый. х5690 ,щас стоит 5640х2

Изменено пользователем Maik812

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
В 25.10.2016 в 17:09, Maik812 сказал:

х5690

а вы не считали сколько будут потреблять електро мощности два таких проца совместно с памятью и видеокартой?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
В 25.10.2016 в 03:50, Maik812 сказал:

купил hp z800  

xeonx2 5630 2.6ггц 

2Х8гб

70 тыс рублей :) сегодня,

буду тестить и думать что и как..

думаю как лучше памити докупить или райд на ssd поставить? 

у меня 4 hdd samsung eva 850 pro.. скорость супер они в память закидывают и через нее пишут.

 

если надо такое или похожее заказывайте в личку..

А вот Квадры топовые по полляма стоят. Вот и думайте.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
12 часа назад, a_schelyaev сказал:

А вот Квадры топовые по полляма стоят. Вот и думайте

HP Z800 тоже стоит под пол лям.. смотря какой конфиг , щас райд делаю по 6 ТБ дисков купил 8 штук.(Биг дат по науки и техники делать буду) Чем данные накрыть и какую систему ставить?!   Как покупать или у кого от этого цена.

На ебее или авите Nvideo K2  65тыс рублей, а так 200-300 тыс. И главное так как поддерживает софт эти GPU ?

Изменено пользователем Maik812

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Кстати HP Z400 /Z 420 вообще копейки стоит :) 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
12 часа назад, Maik812 сказал:

HP Z800 тоже стоит под пол лям.. смотря какой конфиг , щас райд делаю по 6 ТБ дисков купил 8 штук.(Биг дат по науки и техники делать буду) Чем данные накрыть и какую систему ставить?!   Как покупать или у кого от этого цена.

На ебее или авите Nvideo K2  65тыс рублей, а так 200-300 тыс. И главное так как поддерживает софт эти GPU ?

 

Вам чтобы Квадрик поставить по любому нужно иметь обвязку - ЦП, мать, жесткий диск. Если РЗЯ800 без топового квадрика много стоит, то с ним он будет стоить еще больше. А рельный выхлоп?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

"В 2008 году компания Siemens объявила о рекорде в скорости инженерных вычислений: менее чем за сутки решатель NX Nastran выполнил расчет прочности для модели крыла самолёта, содержащей полмиллиарда уравнений " - http://www.popmech.ru/technologies/334092-bez-chego-nelzya-postroit-kosmicheskii-korabl/   интересно, а какой на сегодня рекорд по мкэ уравнениям ?  :)

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

За такие деньги не проще купить время на суперЭВМ?

http://www.vniitf.ru/vse-kommercheskie-predlozheniya/1106-o-276

 

или

 

https://cloud.google.com/compute/pricing

Изменено пользователем frei

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Есть даже возможность опробовать бесплатно Microsoft Azure- Высокопроизводительные вычисления

https://azure.microsoft.com/ru-ru/pricing/details/virtual-machines/windows/#

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Спортивного интереса ради скомпилил CalculiX-Extras с поддержкой CUDA (после глубого погружения в дебри linux-way programming возникает ощущение, что бинарник получили только двое авторов, я, а также один японец в 2015-м очень близко подобрался к финалу, но сдался на третьи сутки анализа библиотечных зависимостей =) ) . Выше уже писали

В 01.03.2016 в 20:00, vl сказал:

вроде как затык идет в передаче данных - идут большие потери на передачу и итоговая скорость хуже, чем на многоядерном CPU

 

В 01.03.2016 в 20:27, HFL сказал:

Проблема в том что приходится гонять данные между хостом и девайсом и обратно, но скорость такой перекачки вполне приличная (если не злоупотреблять).

, но OpenSource добавляет свою изюминку: библиотека CUSP неторопливо выгружает матрицы из RAM в GPU-RAM. Тестовая задача с матрицей ~ 500 МБ на разложении Холецкого  в CPU решается за доли секунды, а библиотека CUDACUSP пережёвывает её 36 секунд, т.е. 15 МБ за секунду. Триумф CPU состоялся адназначна. Можно заключить, что непопулярность кода объясняется его тормознутостью. А ещё оно не компилится под Win, хотя авторы дают понять обратное, но подробного рецепта не раcписывают.

 

Листинг решения для спортсменов:

Скрытый текст
Цитата

# ~/CalculiX/ccx/test_simplebeam $ ./ccx_2.12 -i static

************************************************************

CalculiX Version 2.12, Copyright(C) 1998-2017 Guido Dhondt
CalculiX Extras version 2.12, Copyright(C) 2013-2017 Peter Gustafson
CalculiX comes with ABSOLUTELY NO WARRANTY. This is free
software, and you are welcome to redistribute it under
certain conditions, see gpl.htm

************************************************************

You are using an executable made on Вс июл 9 23:33:08 YEKT 2017

The numbers below are estimated upper bounds

number of:

nodes: 12133
elements: 5583
one-dimensional elements: 0
two-dimensional elements: 0
integration points per element: 4
degrees of freedom per node: 3
layers per element: 1

distributed facial loads: 0
distributed volumetric loads: 0
concentrated loads: 75
single point constraints: 450
multiple point constraints: 1
terms in all multiple point constraints: 1
tie constraints: 0
dependent nodes tied by cyclic constraints: 0
dependent nodes in pre-tension constraints: 0

sets: 4
terms in all sets: 30074

materials: 1
constants per material and temperature: 2
temperature points per material: 1
plastic data points per material: 0

orientations: 0
amplitudes: 2
data points in all amplitudes: 2
print requests: 0
transformations: 0
property cards: 0


STEP 1

Static analysis was selected

Decascading the MPC's

Determining the structure of the matrix:
number of equations
35949
number of nonzero lower triangular matrix elements
1158492

Using up to 1 cpu(s) for the stress calculation.

Using up to 1 cpu(s) for the symmetric stiffness/mass contributions.

Using CUDA based on CUSP CG SOLVER
CUDA v8.0
Thrust v1.8
Cusp v0.4
Assembled stiffness matrix on CUDA device in = 0.469202 seconds

Diagnonal preconditioner
Preconditioning time = 0.000263 seconds

CUDA iterative solver time = 36.0767 seconds

Solver converged to 1e-06 relative tolerance after 19364 iterations
Using up to 1 cpu(s) for the stress calculation.


Job finished

# ~/CalculiX/ccx/test_simplebeam $

 

 

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Создайте аккаунт или войдите для комментирования

Вы должны быть пользователем, чтобы оставить комментарий

Создать аккаунт

Зарегистрируйтесь для получения аккаунта. Это просто!


Зарегистрировать аккаунт

Войти

Уже зарегистрированы? Войдите здесь.


Войти сейчас

  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу



  • Реклама

  • Сообщения

    • Изерлонер
      В процессе работы изменилось отображение точек на то что ниже. Что и как я там поправил не знаю, на тот момент было не до точек. Тем более что на принтер выводится все без них. Сейчас все настройки перерыл, так и не понял как вернуть обратно звездочки... ну или хоть квадратики. Поможите люди добрыя! Ибо эти кракозябры глаз режут.  
    • Romario03
      Странно, а на какую кнопку вы жмакаете? В демо версии лицензия Премиум, там практически все есть.
    • Checker
      В визуализации что стоит по настройкам? Если грубый, то поменяйте точный или еще выше.
    • Bully
      @A.U. всегда есть нюансы. Как правильно выше сказали, зависит всё от конструкции детали. Про отрицательную усадку слышу в первый раз, хотя и допускаю такое. Это как раз говорит о том, что расплавленный пластик это не несжимаемая жидкость. Разница в давлении впрыска дает даже на ТПА разные результаты. Тут не только заполняемость полости и отсутствие пор, тут много факторов. Не зря всегда рекомендуется после заливки ещё и держать давление выдержки нужное. Это как раз чтобы получить равномерную плотность по объему детали. Если этого не обеспечить, то будут локальные утяжины, где плотности не хватило.   Я бы на вашем месте глубоко не углублялся. На факторах литья можно не одну докторскую защитить. Смотрите по самой детали. Если она обеспечивает эксплуатационные свойства + нормальный внешний вид, то считайте, что разницы нет. Но имейте ввиду, что в будущем некоторые детали вы не сможете получить аналогичными, как с ТПА. нет. Увеличение сечения литников позволяет уменьшить потери давления, это да. Но если сама деталь с сечениями, при которых нельзя обеспечить нужное давление в полости для заполнения, то ни сечения литников, ни выпары не помогут. Выпары вообще не облегчают заливку, они только для того, чтобы воздух не запирался в полости, если по разъему ему сложновато выйти.
    • Frezer_PU
    • lexx174
      Вот поднимут пенсионный возраст окончательно - тогда посмотрим,то еще начнется.   Насчет программиста - вы возможно в радужном свете все видите. Сразу скажу - действительно большие зарплаты у программистов - у тех - кто действительно хорошо знает математику и помимо этого умеет мыслить определенным образом и реализовать математические законы посредством программирования. На сегодня процентов 70 программистов - это обычные прикладные программисты, которым зачастую не требуются в работе глубокие знания вышей математики и пр.    
    • Frezer_PU
      Если через MACH 3. то должен подойти но не факт что точно, так как в том посте что вы скачали могут быть учитаны особенности того станка и к вашему не подойдет , а чтобы это проверить надо вывести уп и затестить на своем станке !  Обычно для таких станков как ваш и для хоббийных под управлением MACH 3. LinuxCNC и прочих за базу берут пост и стандартной базы солидкам gMilling_3x.gpp и доводят его до ума под свои нужды и функционал станка !
    • Bully
      @tm-ares первые двое не видны, и по URL "page not found".   По третьей прикола не понял. Это что, окно в другую реальность? Где хвост автобуса? 
    • ILL
        Нет такой возможности.. Только если длл-ки ковырять.. Или материалы делать на каждый шаг штриховки..     Никак.. После сборки обработать напильником авто-штриховки править ручками..
    • bri
      1) да, иногда спасает. 2) расширяет же во все стороны, приходится обрезать с боков. думал есть решения связанные с точками трассировки ( как с фрезами для фасок)