При работе в Visual-Environment столкнулся с такой проблемой, как точность расчета, т.е. с крупной сеткой (>1*10^6 элементов) - точность отстойная, с мелкой сеткой (< 3*10^6 элементов) - время расчета переваливает за трое суток. Система такая: процессор восьмиядерный i7-2,2ГГц, 16Гб ОЗУ OS Win8.1Pro.
Есть графический процессор Nvidia GF730M 4Гб с поддержкой CUDA и OpenCL.
На сайте Nvidia уже есть готовые библиотеки под распараллеливание вычислений по схеме CPU+GPU или полной передачи части процессов на GPU, но в Delcam-Ural сказали, что решатель ProcastDMP пока не поддерживает передач