Перейти к публикации

Сопроцессоры и GPU для вычислений


Рекомендованные сообщения

"В 2008 году компания Siemens объявила о рекорде в скорости инженерных вычислений: менее чем за сутки решатель NX Nastran выполнил расчет прочности для модели крыла самолёта, содержащей полмиллиарда уравнений " - http://www.popmech.ru/technologies/334092-bez-chego-nelzya-postroit-kosmicheskii-korabl/   интересно, а какой на сегодня рекорд по мкэ уравнениям ?  :)

Ссылка на сообщение
Поделиться на других сайтах
  • 4 недели спустя...


За такие деньги не проще купить время на суперЭВМ?

http://www.vniitf.ru/vse-kommercheskie-predlozheniya/1106-o-276

 

или

 

https://cloud.google.com/compute/pricing

Изменено пользователем frei
Ссылка на сообщение
Поделиться на других сайтах

Есть даже возможность опробовать бесплатно Microsoft Azure- Высокопроизводительные вычисления

https://azure.microsoft.com/ru-ru/pricing/details/virtual-machines/windows/#

Ссылка на сообщение
Поделиться на других сайтах
  • 3 месяца спустя...

Спортивного интереса ради скомпилил CalculiX-Extras с поддержкой CUDA (после глубого погружения в дебри linux-way programming возникает ощущение, что бинарник получили только двое авторов, я, а также один японец в 2015-м очень близко подобрался к финалу, но сдался на третьи сутки анализа библиотечных зависимостей =) ) . Выше уже писали

В 01.03.2016 в 20:00, vl сказал:

вроде как затык идет в передаче данных - идут большие потери на передачу и итоговая скорость хуже, чем на многоядерном CPU

 

В 01.03.2016 в 20:27, HFL сказал:

Проблема в том что приходится гонять данные между хостом и девайсом и обратно, но скорость такой перекачки вполне приличная (если не злоупотреблять).

, но OpenSource добавляет свою изюминку: библиотека CUSP неторопливо выгружает матрицы из RAM в GPU-RAM. Тестовая задача с матрицей ~ 500 МБ на разложении Холецкого  в CPU решается за доли секунды, а библиотека CUDACUSP пережёвывает её 36 секунд, т.е. 15 МБ за секунду. Триумф CPU состоялся адназначна. Можно заключить, что непопулярность кода объясняется его тормознутостью. А ещё оно не компилится под Win, хотя авторы дают понять обратное, но подробного рецепта не раcписывают.

 

Листинг решения для спортсменов:

Скрытый текст
Цитата

# ~/CalculiX/ccx/test_simplebeam $ ./ccx_2.12 -i static

************************************************************

CalculiX Version 2.12, Copyright(C) 1998-2017 Guido Dhondt
CalculiX Extras version 2.12, Copyright(C) 2013-2017 Peter Gustafson
CalculiX comes with ABSOLUTELY NO WARRANTY. This is free
software, and you are welcome to redistribute it under
certain conditions, see gpl.htm

************************************************************

You are using an executable made on Вс июл 9 23:33:08 YEKT 2017

The numbers below are estimated upper bounds

number of:

nodes: 12133
elements: 5583
one-dimensional elements: 0
two-dimensional elements: 0
integration points per element: 4
degrees of freedom per node: 3
layers per element: 1

distributed facial loads: 0
distributed volumetric loads: 0
concentrated loads: 75
single point constraints: 450
multiple point constraints: 1
terms in all multiple point constraints: 1
tie constraints: 0
dependent nodes tied by cyclic constraints: 0
dependent nodes in pre-tension constraints: 0

sets: 4
terms in all sets: 30074

materials: 1
constants per material and temperature: 2
temperature points per material: 1
plastic data points per material: 0

orientations: 0
amplitudes: 2
data points in all amplitudes: 2
print requests: 0
transformations: 0
property cards: 0


STEP 1

Static analysis was selected

Decascading the MPC's

Determining the structure of the matrix:
number of equations
35949
number of nonzero lower triangular matrix elements
1158492

Using up to 1 cpu(s) for the stress calculation.

Using up to 1 cpu(s) for the symmetric stiffness/mass contributions.

Using CUDA based on CUSP CG SOLVER
CUDA v8.0
Thrust v1.8
Cusp v0.4
Assembled stiffness matrix on CUDA device in = 0.469202 seconds

Diagnonal preconditioner
Preconditioning time = 0.000263 seconds

CUDA iterative solver time = 36.0767 seconds

Solver converged to 1e-06 relative tolerance after 19364 iterations
Using up to 1 cpu(s) for the stress calculation.


Job finished

# ~/CalculiX/ccx/test_simplebeam $

 

 

 

Ссылка на сообщение
Поделиться на других сайтах
  • 4 недели спустя...

Этапы сборки CalculiX + CUDA закинул в статью https://geektimes.ru/post/291475/

Ссылка на сообщение
Поделиться на других сайтах
  • 2 года спустя...

Есть хороший сервис. Предлагаем GPU сервера для машинного обучения в аренду по привлекательным ценам.
Конфигурация сервера: 2 x Nvidia Tesla K80 24GB, 32-64Gb RAM, от CPU — от 6 cores + поддержка гипертрейдинга. Выделенный IP.
За подробностями dda@ipeye.ru или info@ipeye.ru

Ссылка на сообщение
Поделиться на других сайтах

Присоединяйтесь к обсуждению

Вы можете опубликовать сообщение сейчас, а зарегистрироваться позже. Если у вас есть аккаунт, войдите в него для написания от своего имени.
Примечание: вашему сообщению потребуется утверждение модератора, прежде чем оно станет доступным.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.

  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу.



  • Сообщения

×
×
  • Создать...