Перейти к публикации

Сопроцессоры и GPU для вычислений


Рекомендованные сообщения

"В 2008 году компания Siemens объявила о рекорде в скорости инженерных вычислений: менее чем за сутки решатель NX Nastran выполнил расчет прочности для модели крыла самолёта, содержащей полмиллиарда уравнений " - http://www.popmech.ru/technologies/334092-bez-chego-nelzya-postroit-kosmicheskii-korabl/   интересно, а какой на сегодня рекорд по мкэ уравнениям ?  :)

Ссылка на сообщение
Поделиться на других сайтах
  • 4 недели спустя...


За такие деньги не проще купить время на суперЭВМ?

http://www.vniitf.ru/vse-kommercheskie-predlozheniya/1106-o-276

 

или

 

https://cloud.google.com/compute/pricing

Изменено пользователем frei
Ссылка на сообщение
Поделиться на других сайтах

Есть даже возможность опробовать бесплатно Microsoft Azure- Высокопроизводительные вычисления

https://azure.microsoft.com/ru-ru/pricing/details/virtual-machines/windows/#

Ссылка на сообщение
Поделиться на других сайтах
  • 3 месяца спустя...

Спортивного интереса ради скомпилил CalculiX-Extras с поддержкой CUDA (после глубого погружения в дебри linux-way programming возникает ощущение, что бинарник получили только двое авторов, я, а также один японец в 2015-м очень близко подобрался к финалу, но сдался на третьи сутки анализа библиотечных зависимостей =) ) . Выше уже писали

В 01.03.2016 в 20:00, vl сказал:

вроде как затык идет в передаче данных - идут большие потери на передачу и итоговая скорость хуже, чем на многоядерном CPU

 

В 01.03.2016 в 20:27, HFL сказал:

Проблема в том что приходится гонять данные между хостом и девайсом и обратно, но скорость такой перекачки вполне приличная (если не злоупотреблять).

, но OpenSource добавляет свою изюминку: библиотека CUSP неторопливо выгружает матрицы из RAM в GPU-RAM. Тестовая задача с матрицей ~ 500 МБ на разложении Холецкого  в CPU решается за доли секунды, а библиотека CUDACUSP пережёвывает её 36 секунд, т.е. 15 МБ за секунду. Триумф CPU состоялся адназначна. Можно заключить, что непопулярность кода объясняется его тормознутостью. А ещё оно не компилится под Win, хотя авторы дают понять обратное, но подробного рецепта не раcписывают.

 

Листинг решения для спортсменов:

Скрытый текст
Цитата

# ~/CalculiX/ccx/test_simplebeam $ ./ccx_2.12 -i static

************************************************************

CalculiX Version 2.12, Copyright(C) 1998-2017 Guido Dhondt
CalculiX Extras version 2.12, Copyright(C) 2013-2017 Peter Gustafson
CalculiX comes with ABSOLUTELY NO WARRANTY. This is free
software, and you are welcome to redistribute it under
certain conditions, see gpl.htm

************************************************************

You are using an executable made on Вс июл 9 23:33:08 YEKT 2017

The numbers below are estimated upper bounds

number of:

nodes: 12133
elements: 5583
one-dimensional elements: 0
two-dimensional elements: 0
integration points per element: 4
degrees of freedom per node: 3
layers per element: 1

distributed facial loads: 0
distributed volumetric loads: 0
concentrated loads: 75
single point constraints: 450
multiple point constraints: 1
terms in all multiple point constraints: 1
tie constraints: 0
dependent nodes tied by cyclic constraints: 0
dependent nodes in pre-tension constraints: 0

sets: 4
terms in all sets: 30074

materials: 1
constants per material and temperature: 2
temperature points per material: 1
plastic data points per material: 0

orientations: 0
amplitudes: 2
data points in all amplitudes: 2
print requests: 0
transformations: 0
property cards: 0


STEP 1

Static analysis was selected

Decascading the MPC's

Determining the structure of the matrix:
number of equations
35949
number of nonzero lower triangular matrix elements
1158492

Using up to 1 cpu(s) for the stress calculation.

Using up to 1 cpu(s) for the symmetric stiffness/mass contributions.

Using CUDA based on CUSP CG SOLVER
CUDA v8.0
Thrust v1.8
Cusp v0.4
Assembled stiffness matrix on CUDA device in = 0.469202 seconds

Diagnonal preconditioner
Preconditioning time = 0.000263 seconds

CUDA iterative solver time = 36.0767 seconds

Solver converged to 1e-06 relative tolerance after 19364 iterations
Using up to 1 cpu(s) for the stress calculation.


Job finished

# ~/CalculiX/ccx/test_simplebeam $

 

 

 

Ссылка на сообщение
Поделиться на других сайтах
  • 4 недели спустя...

Этапы сборки CalculiX + CUDA закинул в статью https://geektimes.ru/post/291475/

Ссылка на сообщение
Поделиться на других сайтах
  • 2 года спустя...

Есть хороший сервис. Предлагаем GPU сервера для машинного обучения в аренду по привлекательным ценам.
Конфигурация сервера: 2 x Nvidia Tesla K80 24GB, 32-64Gb RAM, от CPU — от 6 cores + поддержка гипертрейдинга. Выделенный IP.
За подробностями dda@ipeye.ru или info@ipeye.ru

Ссылка на сообщение
Поделиться на других сайтах

Присоединяйтесь к обсуждению

Вы можете опубликовать сообщение сейчас, а зарегистрироваться позже. Если у вас есть аккаунт, войдите в него для написания от своего имени.
Примечание: вашему сообщению потребуется утверждение модератора, прежде чем оно станет доступным.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.

  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу.




  • Сообщения

    • lem_on
      ну с дуру известно что сломать можно.
    • Viktor2004
      руку привязки так сломать легко
    • lem_on
      По моему вполне логично если станок вывалится в ошибку если рука не доехала до места. У меня так же если кулачки или деталь на пути, просто пихаеш ее до места и станок опять активен. Но нынешние пановья даже не могут написать модель станка.
    • Viktor2004
      Я согласен что скорее всего проблема механическая Но если логика прописана криво и возможно не предусмотрела остановку в промежуточном состоянии, разве не логично будет попробовать принудительно подав напряжение дернуть эту руку вверх-вниз? Возможно то что туда попало выпадет  
    • Guhl
      Если оставить за скобками вопрото том, что до м19 работает нормально, а после нет, то вы не считали сколько у него реально импульсов на оборот? с помощью стороннего плк, например  А если ориентацию м5 снимать, а не м20?
    • lem_on
      Что это за станок такой в котором сразу ладер ковырять надо, даже не смотря на возможность механической проблемы? Или профдеформация?
    • Viktor2004
      не сразу я понял в чем вопрос. Долго соображал что такое режим управления скоростью. При завершении ориентации PMC снимает сигнал G70.6 ? И если он после снятия сигнала продолжает удерживать шпиндель, при каких условиях эта ориентация все же снимается? После нажатия аварийного грибка или еще как?
    • Viktor2004
      Ладдер пришлите. Будем принудительно пробовать поднимать и опускать
    • streamdown
      Коллеги приветствую! IPS 8. Подскажите пожалуйста, кто какое серверное железо использует? Интересуют параметры при одновременной работе, ну например, 400 пользователей онлайн
    • gudstartup
      так он так и позиционируется по m19 pmc выдает g70.6 а чпу отвечает f45.7 но ориентацию и смещение в 4077 он отрабатывает нормально шпиндель встает ровно и смена происходит хорошо. вопрос почему после ввода команды управления скоростью он все еще продолжает контролировать число импульсов между нуль метками хотя в принципе уже должен отменить позиционный контроль и просто считать обороты по 0 метке как он это делает без М19? это все понятно но почему оно продолжает проверять это после завершения ориентации мне непонятно
×
×
  • Создать...