Перейти к публикации

Суперкомпьютер своими руками для расчетов в ansys и 3d приложениях


Рекомендованные сообщения

В оболочке ИСПА пункт Процессор далее Статика далее Решение уравнений

ммм.... я сначала должен открыть проект, затем разово запустить на счет через макрокоманды-статика(прямой метод), а затем, после окончания решения, запустить "Процессор далее Статика далее Решение уравнений"?

так?

Ссылка на сообщение
Поделиться на других сайтах


и еще момент - через "решение уравнений" - как задать количество решений подряд? или только вручную перезапускать?

Ссылка на сообщение
Поделиться на других сайтах

Какого размера файл подкачки у вас в виндах установлен?

В итоге вчера я дошел до следующей настройки - с которой нормально прошел стадии подготовки:

С: по выбору системы

D: 10-12Гиг

E: 10-20Гиг

Все три диска - физические разные диски. Итого 28 Гиг на данный момент при рекомендуемых 12Гиг.

Изначально было ~ 12 Гиг, т.е. порядка рекомендуемого.

Ссылка на сообщение
Поделиться на других сайтах

У вас просто мало памяти. И каждый раз матрица читается по новой с диска.

ну памяти 8 Гиг, я об этом сказал. Во время самого решения (в этих тестах) матрица полностью в память помещается.

а с временами я не понимаю:

с проекта пример КЭМ:

Для решения потребовалось = 4.541 Гбайт памяти

Скорость = 25144.98 Мфл в секунду

Время = 14.471 сек

Время работы 0 час 1 мин 21 сек

Реальное время работы 0 час 2 мин 16 сек

с проекта тест на скорость:

Для решения потребовалось = 2.477 Гбайт памяти

Скорость = 24162.86 Мфл в секунду

Время = 34.526 сек

Время работы 0 час 2 мин 24 сек

Реальное время работы 0 час 0 мин 41 сек

как так, реальное больше времени работы... что за времена...

для 3930 предложите проект, чтоб влезал в 16 гиг. посмотрю потом.

Ссылка на сообщение
Поделиться на других сайтах

А в 16 Гб у вас любая их этих задач влезет.

ну эти и в 8 гиг влезают (сам счет, но не подготовка матрицы)
Ссылка на сообщение
Поделиться на других сайтах

В оперативную память должны влезать ВСЕ матрицы задачи и все вектора.

ну и? тут влезали. Память свободная оставалась во время счета.
Ссылка на сообщение
Поделиться на других сайтах

ISPA,

Я прогнал тесты на х64 версии на 3930 / 6 ядер / 3,5ГГц

Максимальный результат - Пример КЭМ 20

Для решения потребовалось = 4.586 Гбайт памяти

Скорость = 86500.60 Мфл в секунду

Время = 4.179 сек

Для "тест на скорость" максимум:

Для решения потребовалось = 2.500 Гбайт памяти

Скорость = 82495.19 Мфл в секунду

Время = 10.077 сек

С "Газокомпрессор" что-то не так:

Диагностика нагружения края давлением

Количество ошибок при диагностике 484

В линпаке при задаче размером 4,5Гиг результат при этих же настройках такой:

Size LDA Align. Time(s) GFlops Residual Residual(norm) Check

25500 25500 4 76.223 145.0430 5.235407e-010 2.862859e-002 pass

25500 25500 4 76.218 145.0516 5.235407e-010 2.862859e-002 pass

(но линпак пару минут жарит, а ИСПА - 3-4 секунды, и результаты в ИСПА прилично плавают)

И у меня вопрос: в презентациях, что я выкладывал ранее, написано, что определение наличия AVX осуществляется через специальный запрос (не просто по CPU_id), т.к. не только процессор, но и операционная система должна поддерживать AVX.

Так вот - я предполагаю, что в оверклокерской оболочке LinX для linpack используется именно этот запрос. Но оболочка мне пишет "просто линпак", а не "avx-линпак". Т.е. есть шанс, что у меня AVX не работает?? Как реализована у вас проверка наличия AVX?

тест_на_скорость.txt

Пример_КЭМ_20.txt

Кран.txt

Газокомпрессор.txt

Ссылка на сообщение
Поделиться на других сайтах

При запуске макрокоманды поставьте галочку Отмена диагностики модели.

помогло. но результат не интересный.

Проверьте еще ИСПА с включенным гипертрейдинком.

Пример КЭМ-20 с гип.:

Для решения потребовалось = 4.586 Гбайт памяти

Скорость = 55171.86 Мфл в секунду

Время = 6.552 сек

при этом ИСПА использовала 50% процессора :(

т.е. то же, что и с Линпаком - он большую часть времени использует 50% и иногда 100%. И результат тоже ниже, чем без ГТ.

Ссылка на сообщение
Поделиться на других сайтах

Я старался провести всё аккуратно и объективно.

Результаты в приложении...

Потом сделаю картинку и добавлю в это сообщение.

В общем, я чего-то большего ждал от линпак+испа....

Саш, м.б. в FV включена AVX-оптимизация в компиляторе ?

тест_скорости.zip

Ссылка на сообщение
Поделиться на других сайтах

А в ванну с касторкой не пробовали засунуть ? Один мужик так сделал и стал чемпионом мира по разгону в каком-то году :rolleyes:

Интересный метод разгона процессора... :clap_1:
Ссылка на сообщение
Поделиться на других сайтах

Ispa, я четко проговорил условия: avx против не-авх на одинаковой частоте и количестве ядер. Все три программы прекрасно масштабируются как по частоте так и по количеству ядер, и поэтому результат того, что вы просите, очевиден.

Я бы и проверил - так было бы проще - но у меня лицензия fv только на 4 потока.

Вообще, уважайте и меня, и себя. Очевидно, что линпак тестирует любую конфигурацию процессора.

Для 3930 я в биос отключил 2 ядра и понизил частоту множителем, чтоб уравнять процесоры.

Ссылка на сообщение
Поделиться на других сайтах

Понимаете, какая штука - вы определитесь - вы про итерационный алгоритм или про AVX?

По проведенному тесту видно, что ИСПЕ и Линпаку новая архитектура дала такой же прирост, что и FV. Хотя в FV AVX скорее всего нету, а в первых двух есть.

Этого говорит о чем - от том, что не так уж и крут этот AVX, прирост от его использования не велик.

Было бы интересно в чистом виде увидеть разницу между ИСПА или Линпаком с/без AVX. Но для этого либо нужны "галочки" в программах, либо два ПК - Win7 без SP1 (=без AVX) и Win7 с SP1 (с AVX).

Косвенно это можно посмотреть по результатам оверклокеров - там есть как циферки старые, еще до SP1, так и новые. Хорошо ести в 1,5 раза прирост....

Ссылка на сообщение
Поделиться на других сайтах

В общем, я чего-то большего ждал от линпак+испа....

Саш, м.б. в FV включена AVX-оптимизация в компиляторе ?

Не знаю. Я сейчас с ними не особо общаюсь в виду беготни с родами, болезнями и мероприятиями различными.

На форуме за пуговичку поймаем и спросим.

Я им интеловскую методичку от тебя скинул на всякий случай ибо сейчас они на другие компиляторы переходят и фетиши всяческие от Интела закупают софтверные.

Понимаете, какая штука - вы определитесь - вы про итерационный алгоритм или про AVX?

Он там о чем-то своем, как обычно.

Сперва Испа обвинил разработчиков в том, что они скрывают что-то:

Да это понятно, что скорость разработчики скрывают. Им, чтобы измерить скорость ТЗ нужно. :unsure:

Ему попытались намекнуть, что скрывать тут нечего (у нас то все итерационное да разреженное).

На прямом методе скорость сама в руки и идет.

А на разряженных, да итерационных ... разработчики отказались в свое время заниматься садомазо.

Пользователи тестят решалку на своих тестовых задачах. Оно им понятнее. А у нас свои тестовые задачи.

Но Испа в гневе страшен.

Такие слова ни один разработчик не напишет. :unsure:

Такие слова может написать только человек далекий от программирования.

Но потом, видимо сходил потыкался у себя в коде и выдал:

На итерационном алгоритме для разреженной матрицы нельзя протестировать AVX и SSE.

Испа это наше все!

Ссылка на сообщение
Поделиться на других сайтах

Скорость итерационного алгоритма ИСПА 1.8 Гфл в сек, а прямого метода ИСПА 18 Гфл в сек. На одном ядре.

А этом то и заключается вся фишка SSE и AVX. :unsure:

вы хотите сказать, что прямой алгоритм нельзя переписать с использованием SSE и AVX?
Ссылка на сообщение
Поделиться на других сайтах

Вот из этого сравнения <noindex>http://entropiya-blog.ru/sravnitelnyj-anal...-uravnenij.html</noindex> получается, что итерационный - это не всегда плохо.

Ссылка на сообщение
Поделиться на других сайтах

Да это не то чтобы плохо, а порой это единственная возможность для решения задачи большой размерности. Собственно это и есть самый важный признак.

Ссылка на сообщение
Поделиться на других сайтах

Известно, что итерационные методы разные бывают. Наши методы пока что только решают задачи, там где другие не решают.

А прямой метод решает только те задачи, на которые ему памяти хватает.

Ссылка на сообщение
Поделиться на других сайтах

У меня есть вопрос.

Что означает <noindex>отсутствие у процессоров Intel Xeon X56XX</noindex> технологии Thermal Monitoring Technologies?

В принципе догадываюсь что это такое есть.

И не может это быть связано с появлением синего экрана BSOD при перегрузке процессора?

Столкнулся с тем, что при одновременном запуске теста LinX и еще одной расчетной задачи (.exe)

- бац и синий экран.

Без еще одной расчетной задачи тест LinX (linpack) проходит без ошибок.

А если это падение связано с перегревом процессора (и нет Thermal Monitoring Technologies), тогда как это лечить?

Выставить ограничения по напряжению??

Ссылка на сообщение
Поделиться на других сайтах
  • MFS открепил тему
Гость
Эта тема закрыта для публикации сообщений.
  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу.




  • Сообщения

    • Горыныч
      Только Вы решаете. Я Вам из собственного опыта привел рекомендации. Если страшно, то не берите, только и всего. Сломать можно все что угодно. 
    • Orchestra2603
      Ладно. Я примерно понял, что вы имеете в виду. В теории, даже чтобы выделить n-ный базис нужно зафиксировать какие-то значения n раз. Только надо так их задавать, чтобы каждый раз получались линейно-независимые вектора. Я бы не называл это "закреплением", потому что возникает ложная кажущаяся параллель со статическим решением, где мы ищем единственное решение и для этого фиксируем какие-то компоненты, хотя здесь цель расчета принципиально иная. Это, как по мне, приводит к путанице, но если вам нравится это так называть, то - пожалуйста. Кто я такой, чтобы вам запрещать)   Я не могу сказать, что решать нужно всегда. В моем понимании в определенных итерационных схемах собственные вектора получаются полседовательными приближениями сами по себе. Применяя всякие манипуляции к матрицам (сдвиги и т.д.) можно контролировать сходимость к наибольшему, наименьшему, i-му и т.д. собственному вектору. Я не прав?   Что касается факторизаций, то для любых квадратных матриц существует разложение Шура, где ортогональными преобразованиями матрица приводится к треугольной форме. В частности, для обобщенной задачи, вот выдержка из статьи. Алгоритм получаения такого разложения для обобщенной задачи называется QZ алгоритм. Он вовсю используется в Матлабею Я не вижу никаких препятствий принципиальных, чтобы получить такую факторизацию матриц.     Т.е. похоже, что, да, все же приходится решать СЛАУ, в общем случае для треугольной матрицы A-lambda*B. И покуда lambda будет собственным значением, вся матрица A-lambda*B будет вырождена. В частности, для нулевых СЗ A-lambda*B = A, и А, сама собой, вырождена.   Но.. не могу пока сказать точно, но вроде как если A и B - симметричны, то QAZ и QBZ из треугольных превращаются в диагональные, и тогда столбцы Q становятся автоматически собственными векторами (разложение Шура переходит в спектральное), т.е. и решать ничего не приходится. Но где-то пишут, что нужна положительная определенность, где-то пишут, что только симметрии достаточно... не могу пока точно сказать.  
    • ДОБРЯК
      Я вижу, что вы не поняли. А говорили, что это знали еще в детском саду... https://ru.wikipedia.org/wiki/%D0%9C%D0%B5%D1%82%D0%BE%D0%B4_%D0%93%D0%B0%D1%83%D1%81%D1%81%D0%B0 Читайте внимательно. :=)   Ме́тод Га́усса — классический метод решения системы линейных алгебраических уравнений (СЛАУ). Назван в честь немецкого математика Карла Фридриха Гаусса. Это метод последовательного исключения переменных, когда с помощью элементарных преобразований система уравнений приводится к равносильной системе треугольного вида, из которой последовательно, начиная с последних (по номеру), находятся все переменные системы.  
    • Shura762
      (дисклеймер ) не взлетит... особенно учитывая его отношение, как человека колбасит, и почему в ТФ "узел" а не точка... перепутано местами "ты" , "на" и пропустили слово "пошёл" ... можно сказать я работаю в таком коллективе, и ЧЁ, плевали на ТФ с высокой колокольни, если молодежь можно еще как-то замотивировать, показать как надо работать, то старшее поколение делает на "отвали моя черешня" чертежи выдали тяп-ляп и что тебе надо то еще .... (дальше идиоматические выражения в рамках законодательства) p.s. я догадываюсь почему "узел" и считаю что правильное название дали.
    • lem_on
      Термообработка намного эффективнее, но из за размеров можно использовать локальное воздействие на сварочные швы вибрацией либо "проковкой" 
    • maxx2000
      так хозяин-барин, ты же деньги плотишь
    • lem_on
    • Павлуха
      Да повесть на команду S и не париться.
    • gudstartup
      та и ломают не от ума! так их не ремонтируют а просто новые устанавливают
    • lem_on
      Та хз, мне ехать а не шашечки. Жалоб нет , значить всех все устраивает.    С дуру можно много чего сломать, а по цене ремонта направляющие качения нам ного больше стоят чем скольжения. 
×
×
  • Создать...