Chardash

Суперкомпьютер своими руками для расчетов в ansys и 3d приложениях

1 309 сообщений в этой теме

Кстати, не смог найти в исходных кодах Линпак от Интела. Итерационные алгоритмы нашел.

мне кажется, он лежит на той же странице, что и линпак.

мне сейчас сложно проверить - с очень медленного инета всю неделю буду.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах


"Если я постоянно говорю про SSE и AVX, а вы не слышите" - <noindex>http://ru.wikipedia.org/wiki/SSE</noindex> мое мнение, что этим должны разработчики компиляторов заниматься. Страуструп тоже об этом писал. Это не имеет отношения к алгоритмам, только к их реализациям, они меняются часто, а алгоритмы стабильны :unsure:

МКЭ не меняется, а Ansys каждый год :unsure:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Да он же не о железе писал, а о программировании. Низкоуровневое программирование он и отнес к задачам тех кто пишет компиляторы. Прикладные программы редко затачивают под марку проца, это считается неэффективным в целом. Даже под операционки стараются не делать :unsure:

Я вообще обычно работаю на виртуальных машинах :unsure:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Я считаю, что лезть в это пустая трата времени и сил если не компилятор пишешь :unsure:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

<noindex>http://ru.wikipedia.org/wiki/SSE</noindex> да вон их сколько разных, выбирайте на вкус :unsure:

Это фрагменты перехода к 128 разрядным операционным системам о которых писал когда-то Рихтер в Windows для профессионалов :unsure:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Да под них вообще не вижу особого смысла программировать, мелкий вопрос Это же не система реального времени, где такое может быть критично :unsure:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

"Следующий пример демонстрирует перемножение четырёх пар чисел с плавающей точкой одной инструкцией " видите 4 float значит 2 double плюс накладные на вызов функции. Ну и где тут в 15 раз ? Максимум в полтора на умножениях... :unsure:

DPPD xmm1, xmm2/m128, imm8 — (Dot Product of Packed Double Precision Floating-Point Values) может эта команда что-то дает...

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Не, я что-то не догоняю. Ну так объясните на какой функции и почему происходит ускорение. Или Вы в чудеса верите ? Так тут не все чайники, вопрос то пустяковый :unsure:

Вон у Голуба и Ван Лоуна <noindex>http://www.twirpx.com/file/87886/</noindex> алгоритмы описываются через условную функцию gaxpy для векторизации и векторные обмены подсчитывают.

"Конечно управление обменами с памятью не является чем-то особенно новым в научных вычислениях. При решении матричных задач на самых первых электронных машинах приходилось продумывать обмен данными с бумажными лентами и другими примитивными устройствами хранения информации " так они пишут :rolleyes:

Или вы компьютерным фетишизмом занимаетесь ? Помню как расстроил когда-то одного коллегу. Он писал программку по смазке и она считала часа два, он этим очень гордился. Я предложил пропустить через оптимизирующий PL/1 и повключал всякую оптимизацию. Стала проскакивать меньше чем за пять минут. После этого несколько лет руки мне не подавал обиженный :unsure:

Пишут же, что и от компиляторов и операционных систем тоже скорость решения зависит. Это давно известно. Ну очень давно. Но при чем здесь математика и ее концепты ? :rolleyes:

Где-то видел табличку, что Ansys на юниксовых операционках вообще намного быстрее работает...

"Включите все опции по оптимизации и SSE и AVX" я что, похож на идиота чтобы подключить то, чего в 486 заведомо нет ? По себе то всех не равняйте :rolleyes:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Ближе к суперкомпьютеру, а не к программам, на нем выполняемым...

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Ну как бы помягче это сказать?

Ваш пост никакого отношения к теме не имеет.

Спорить на эту тему не буду.

Последующие сообщения не по теме буду удалять.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Ну как бы помягче это сказать?

Ваш пост никакого отношения к теме не имеет.

Вы только скажите.

Я сам все посты из данной темы удалю.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Перелистал тему. :unsure:

По теме нет ни одного сообщения.

Можно все спокойно удалить. :unsure:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Последние тоже не по теме - можно смело удалять.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Ближе к суперкомпьютеру, а не к программам

Так компьютер покупают под программы. Для решения тех или иных задач.

А чтобы по теме писать нужно знать о какой версии программы речь идет. Нет смысла платить деньги за 16 ядер, если матрица жесткости составляется на 1 ядре. Например.

Опять же нужно знать задачи какой размерности будут решаться.

И уже только потом своими руками компьютер собирать. :unsure:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Последующие сообщения не по теме буду удалять.

Я считаю, что это неправильно.

Как тут выше заметили, суперкомпьютер без суперпрограммы - бесполезная вещь.

Поэтому лучше тему переименовать в "Суперкомпьютеры и HPC-приложения".

Суперкомпьютеры тут обсуждались любые: кластеры, многопроцессорные системы, сетевое распараллеливание, многоядерные современные процессоры, GPU-системы.

кластеры - только для крупных организаций.

многопроцессорные системы - при необходимости, один из самых доступных профессиональных вариантов

сетевое распараллеливание - если в ограничения не упираться, то может быть полезным, но гигабита много где недостаточно. Полезнее на двух машинах запустить две задачи, чем одну задачу параллелить по сети.

многоядерный ПК - это даже домашний вариант на данный момент и по производительности может быть сравним со старыми кластерами

GPU - при поддержке софтом можно добавить в систему адекватные игровые ВК, но с GPU как-то всё затухает, реальных программ - по пальца пересчитать. Саш, в бета-тесте не будет, случаем, GPU-примочек для пробы?

Ну еще я забыл интеловские-Xeon Phi-карточки..., но там что-то очень специфичное... недоГПУ... памяти - кот наплакал.

На этом железо кончается, и начинаются нюансы его использования и реализации софта под него.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Ну еще я забыл интеловские-Xeon Phi-карточки..., но там что-то очень специфичное... недоГПУ... памяти - кот наплакал.

8 Гб памяти, 60 ядер, 240 потоков.

30 Мб кэша 2-го уровня.

Линпак должен показать 1200 Гфл/сек для double. В спавнении с обычным сопроцессором - это космическая скорость.

А больше и не нужно для ОДНОГО ускорителя. :unsure:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

8 Гб памяти

как я понимаю, это самое узкое место, и варианта для наращивания нету.

Хотя 8 Гб в CFD это не так уж мало - это 2 млн точек, мне почти для всего хватало.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

как я понимаю, это самое узкое место, и варианта для наращивания нету.

Ставите 100 ускорителей в один ряд. Вот вам и настоящий суперкомпьютер.

А скорость будет около 100 000 Гфл.

А один ускоритель предназначен для ускорения узких мест в программе. У него 4 режима работы. Выбираете нужный и работаете. :unsure:

И не нужно его путать с Квадро ускорителем. :unsure:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Вообще-то главное быстро решать стоящие задачи, если собрать 9 беременных женщин, ребенок через месяц не родится :unsure:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

На мой взгляд непросто будет полность загрузить все ядра процессора и Xeon Phi.

Программы опять придется переписать. :unsure:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Fedor

Вам, уважаемый, бан на недельку, просто от скуки мне так захотелось.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Вообще-то главное быстро решать стоящие задачи, если собрать 9 беременных женщин, ребенок через месяц не родится :unsure:

Данная аналогия в данном случае неуместна.

Десять ускорителей решают стоящие задачи в 8 раз быстрее. :unsure:

По этому принципу и собирают суперкомпьютеры.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Задачи решает человек, а не компьютер :rolleyes:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Задачи решает человек

Тема про суперкомпьютеры, а не про Суперчеловека.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Любая техника в руках героя одноименного романа Достоевского - груда лома. Если мы многого хотим от техники, то от себя должны потребовать еще большего :unsure:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

как я понимаю, это самое узкое место, и варианта для наращивания нету.

Хотя 8 Гб в CFD это не так уж мало - это 2 млн точек, мне почти для всего хватало.

У Вас вероятно задачи в основном в 2D. Для 3D 8 Гб маловато.

PS: в том же CFX тестовая задачка размером 100x100x100 (1 млн. ко) съесть примерно 2 Гб

в нашей внутренней решалке это будет около 1.6 Гб. - 4Гб за 1 млн. ко это весьма дорого

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

PS: в том же CFX тестовая задачка размером 100x100x100 (1 млн. ко) съесть примерно 2 Гб

Поставьте в нем Дабл пресижн в решалке и будет как у всех.

:)

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Купил таки комплектующие на новый комп, два процессора Intel Xeon E5-2695V2, quadro k6000, много памяти, SuperMicro сервер и тп. Если все устроит с quadro, рассмотрим tesla k40c (которые в текущих событиях неожиданно резко пропали и цена, на которые, так же неожиданно выросла почти на 20%). Надеюсь соберу компьютер без неожиданностей. 

ps пока квадро к6000 поставил на свою старую сборку, о которой писал выше, честно говоря пока эффекта вау нет, да, графические вроде стали работать живее, но времени разобраться и нормально посмотреть пока нет. Будет два компьютера, сравню. Мануал по новому серверу великоват правда, надеюсь, разберусь.

Всем спасибо!

 

 

:smile:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
Гость
Эта тема закрыта для публикации сообщений.

  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу



  • Реклама

  • Сообщения

    • artem-nafanya
      Родной документации нет. Но в сети нашёл. В разделе 7.4 описан синтаксис. В разделе 9.5 пример 4х осевой УП, которая похожа на те, по которым мы обычно работаем. Пример 4х осевой УП   N00001 G00 X2.5 Y-14.3 Z0.0
      G00 X2.5 Y-20.882625 Z50.0 ;
      N00002 G01 X2.7
      G01 X2.7 ;
      N00003 G02 X3.0 Y-14.6 J-0.3
      G02 X3.0 Y-21.182625 J-0.3 ;
      N00004 G01 Y-14.7
      G01 Y-21.282625 ;
      N00005 G03 X3.3 Y-15.0 I0.3
      G03 X3.3 Y-21.582625 I0.3 ;
      N00006 G01 X14.8
      G01 X21.382625 ;
      N00007 G03 X15.0 Y-14.8 J0.2
      G03 X21.582625 Y-21.382625 J0.2 ;
      N00008 G01 Y14.8
      G01 Y21.382625 ;
      N00009 G03 X14.8 Y15.0 I-0.2
      G03 X21.382625 Y21.582625 I-0.2 ; N00010 G01 X-14.8
      G01 X-21.382625 ;
      N00011 G03 X-15.0 Y14.8 J-0.2
      G03 X-21.582625 Y21.382625 J-0.2 ;
      N00012 G01 Y-14.8
      G01 Y-21.382625 ;
      N00013 G03 X-14.8 Y-15.0 I0.2
      G03 X-21.382625 Y-21.582625 I0.2 ;
      N00014 G01 X-3.3
      G01 X-3.3 ;
      N00015 G03 X-3.0 Y-14.7 J0.3
      G03 X-3.0 Y-21.282625 J0.3 ;
      N00016 G01 Y-14.6
      G01 Y-21.182625 ;
      N00017 G02 X-2.7 Y-14.3 I0.3
      G02 X-2.7 Y-20.882625 I0.3 ;
      N00018 G01 X2.5
      G01 X2.5 ;
      N00019 M02 ;
      Только у нас в приращениях координаты. Hide   agie_vision2_manual.7z
    • rad
      Добрый день !   В нашей программе FieryCut реализована специальная последовательность резки, сохраняющая жесткость листа в течение всего процесса резки.  Подробные сведения о программе FieryCut Вы найдете на сайте ООО "Хайтек" (Ярославль)
    • Xugack
      Вы не выбираете опцию читать в 3d файл. У вас даже на скришнотах видно что будет создан файл фрагмента. Файл - открыть - выбрать тип файла dxf - выбрать опцию читать в модель - выбрать нужный файл - нажать открыть Это ваши домыслы, не знаю где вы увидели издевку и похвальбу
    • Bilbo
      Господа хорошие возник такой вопрос, я в этой сфере не так давно и дельной информацией не владею, поэтому нужна ваша помощь. Пытаюсь проставить на чертеже позицию "на полке" однако эта функция не активна ISO leader (на полке). что делать в таком случаи иначе все выноски получаются в кружке, сорян если вопрос не уместе но очень нужна помощь
    • ILL
        Это потому, что в Солиде заложено несколько стандартов.. И по умолчанию стоит, по моему, ISO.. Нужно в настройках указать ГОСТ.. Правда, потом ещё кое-какие настройки надо подправить и сохранить шаблон чертежа..
    • Slot555
      Поворачивает сам NX, к примеру когда на другой грани обрабатывать второе отверстие. Вот только я не могу понять как пост будет пересчитывать все координаты перемещений инструмента если они будут совсем другие? Пересчитывать и их? Каждую? О_о   Есть вариант создать несколько геометрий(угловых положений не так много - где то 20 - 25 штук) и запихнуть в каждую нужные операции. Не ужели ни кто в NX не делал обработку с поворотом при автоматическом базировании щупом?
    • vicebear
      А в документации что? Помню на какой-то стойке XY выводился в абсолюте, а UV в инкременте.
    • SAPRonOff
      131 стр с новыми возможностями - http://www.tflex.ru/downloads/V16/T-FLEX CAD 16 Release Notes.pdf 
    • vicebear
    • vik_q
      хмм... а вот интересно. Из какого материала выполнен кофр...