Этого треда уже нет.
Это копия, сохраненная 19 февраля 2023 года.

Скачать тред: только с превью, с превью и прикрепленными файлами.
Второй вариант может долго скачиваться. Файлы будут только в живых или недавно утонувших тредах. Подробнее

Если вам полезен архив М.Двача, пожертвуйте на оплату сервера.
FAHBenchv1.2.0 OpenCL тред #2 /bench/ # OP 4222227 В конец треда | Веб
Прошлый утонул >>4079579

Расчехляем свои веги\нави\теслы\квадры\печи и прочие OpenCL девайсы.
Продолжаем меримся жезезками с помощью бенчмарка от стенфордских ботаников изучающих протеины. Последняя версия 2.2 оного полное говно с ненужными настройками и отсутствием пресетов. Потому легетимна только версия 1.2.0

Берем FAHbench v1.2.0 от сюда:
https://nofile.org/v/f91642
http://dl.free.fr/getfile.pl?file=/wZ0TvyXt
https://anonfile.com/jd1693G3na/FAHBench_1_2_0_zip

Распаковываем, отмечаем галочками как на пикрелетед, тестим, скрин результата заливаем сюда.
На данный момент:
-Ждем результата Radeon VII
-Ждем результаы Tesla V100, Quadroo GV100
-Ждем результаы Tesla P4, Tesla T4, Tesla K40\K80

FAQ:
Q: Нахуй оно надо?
А: Среднеанону - прост, или поднять ЧСВ. Мне - для работы, быстро определить какой девайс быстрее в OpenCL, особенно среди разных поколений.
Q: Почему именно этот бенч?
А: Удобный, мнималистичный, да и больше ничего нормального и нет. На работе столкнулся с задачей юзать crarck\hashcat для взлома старых паролей в архиве и много чего еще. Задался поиском быстрого средства диагностики производительности разного железа в OpenCL, ибо этого говна у меня полный склад. Был удивлен что на сегодня кроме хитрожопого\ проплаченного Geekbench, раздутого SiSoft Sandra и кривых с анальной телеметрией LuxMark с CompuBench нету нихуя. Хотелось что-то простого, работающего из коробки, без установки и выдающий однозначный результат. Я вспомнил что лет 5-6 назад я дрочил на "Folding at Home". И что у них был свой бенчмарк с тем ядром которое они юзали в соей программе расчетов. Текущий оказался ботанским говном, с кучей настроек, а вот старый, что валялся у меня в архиве, самое то - простой, маленький, но весьма точный. Данные пункта "implicit" хорошо коррелируют с показателями crarck.

Q: Что показывает бенчмарк? Что за наносекунды?
A: Показывает сколько наносекунд моделирования процесса сворачивоемости белка осилит девайс в течении 24 часов работы.
Q: Я счастливый обладатель Nvidia карт, почему во время теста не работает буст? Частота гпу стоковая и не хочет подниматься.
A: Нужно отключить принудительный P2-стейт для куды, иначе она занижает частоты памяти для чистых куда/опенцл приложений. Качаем утилиту "nvidia profile inspector" -> пункт "CUDA - Force P2 State" -> выбираем значение "OFF" -> Apply changes. Все, карта бустит как надо.
RX590.png12 Кб, 502x352
2 4222270
1080Ti.png41 Кб, 518x365
3 4222492
Vega64.png10 Кб, 502x352
4 4223267
>>4222492
Vega64
ifcwIuQ[1].png11 Кб, 502x352
5 4223397
Radeon R9 Fury X.png19 Кб, 513x363
6 4223736
R9 Fury X
image.png17 Кб, 504x355
7 4223766
1070

Скину завтра результаты Radeon VII если не забуду.
GTX 970.png9 Кб, 502x352
8 4225272
>>4223766
Ждем.
Снимок.PNG81 Кб, 1292x945
9 4226162
10 4226561
>>4226162
Разочаровывающе мало. Думал будет в районе RTX2070S, а нет, даже HBM не помогла. Даже RTX 2060 в стоке сливает. Проблема в драйверах?
RTX2060441.66.PNG17 Кб, 515x357
11 4226563
12 4226588
>>4226561
Хз, дрова на актуальные обновил.
Загрузка ГП нулевая была правда.
RTX2060 SUPER.png18 Кб, 506x352
13 4231138
GTX 1080.png11 Кб, 502x352
14 4233498
1580446243026.png17 Кб, 487x351
15 4233563
Rx480. Ожидаемый результат относительно 590
GTX780.png12 Кб, 507x350
16 4235397
GTX1650.PNG16 Кб, 504x359
17 4237155
Tahiti.png8 Кб, 516x359
18 4240204
Tesla K20c.jpg27 Кб, 515x358
19 4242157
Bonaire.jpg44 Кб, 511x352
20 4244636
GTX TITAN.gif44 Кб, 516x359
21 4247336
560 Ti.png37 Кб, 519x364
22 4250671
RX550.png29 Кб, 517x358
23 4256350
RX550
1650ZALUPER.png10 Кб, 516x358
24 4256387
25 4262689
>>4256387
Драва свежие?
По эксплициту ты RX580, а по имплициту Radeon VII
красные сгорают в труху от зеленой бюджетки
26 4262825
>>4222227 (OP)

> Продолжаем меримся жезезками с помощью бенчмарка от стенфордских ботаников изучающих протеины



Лучше бы hashcat'ом долбили. От этого хотя бы польза есть, да и загрузка получше будет.
27 4262878
>>4262825
Тогда все зелёные затычки а-ля 1650Ы/1060 будут сосать у древних рыкс, не говоря уже о вегах.
28 4262887
>>4262878
А эти ботаники че, тоже подкрутили софтину, как Unreal Engine, чтобы она за зеленых тащила?
29 4262901
>>4262887
Она же древняя как говно мамонта. Плюс, может иметь специфичную оптимизацию под архитектуры тех лет.
Tahiti.png8 Кб, 516x359
30 4263032
>>4262887

>А эти ботаники че, тоже подкрутили софтину, как Unreal Engine, чтобы она за зеленых тащила?


Лол софтина Декабря 2012 года, в те времена как раз зеленые ныли что дескать бенч специально сделан под красные карты и только их и любит. HD7970 бодро навешивал GTX680, выдавая чуть меньше первого титана, чей ценник улетал за горизонт. Теперь ноют красные. Но тем бенч и хорош, есть с чем сравнить насколько ушел прогресс в перед у тех и у других (пусть даже со скидкой на особенности архитектуры).

>>4262825

>Лучше бы hashcat'ом долбили


Прогонял разные карты под вычет rar и 7z хэшей, да имеет место оптимизации, но относительно показателей этого бенча разброс максимум 15%, и то не всегда. Сам тест имеет конкретную оптимизацию под различные архитектуры. То что думаю более менее объективную производительность он передает. Тем более OpenCL расчет это OpenCL расчет, если заявлено что делает, значит должен делать, каким бы он хитровыдуманным не был бы. Причем разброс от версии к версии драйвера точно такой же как здесь.
31 4263037
>>4263032

>Сам тест имеет


Сам hashcat* fix
32 4263554
>>4263032

>Прогонял разные карты под вычет rar и 7z хэшей



Какой командой запускал?

> Сам hashcat имеет конкретную оптимизацию под различные архитектуры



О чем речь? Можешь привести пример оптимизации под архитектуру?

> Тем более OpenCL расчет это OpenCL расчет



Ну хз. Загрузить-то его работой можно сильно по-разному.
Tesla K20c.jpg27 Кб, 515x358
33 4263562
>>4263554

>Какой командой запускал?


Вроде рабочее для rar юзал: hashcat64.exe -a 3 -m 13000 -i --increment-min=1 --increment-max=10 -1 ?u?l?d?s :\путь\к\файлу.txt ?1?1?1?1?1?1?1?1?1

>О чем речь? Можешь привести пример оптимизации под архитектуру?


Ну всякие отдельные фичи вроде
--optimized-kernel-enable
Конечно софтина годнейшая, она по моему единственная бесплатная которая может в multi GPU, причем там до 28 штук вроде поддерживает. Вот только одна проблема - нормальных инструментов вы выдиранию хэшей таки нет. Везде какие то обоссаные софтины с ораниченной функциональностью.
34 4263568
>>4263562
Забыл -w 4 в конце.
35 4263585
>>4263562

> Вроде рабочее для rar юзал



А рар это медленные хеши? И, как анон уже сказал, юзай -w4 для максимального потребления.

> разброс максимум 15%



Разве это не дохуя?

> и то не всегда



От маски сильно зависит и прочих всяких штук. В приведенной команде вроде норм, маска жирная, но вообще если ты реальные хеши ставишь брутить (а не встроенный бенч), то сделай вывод --status и мониторь, что загрузка все время сотка. Там легко недогрузить видяху "неоптимизированной" задачей. Номинальную скорость для выбранного режима потребления и хеша можно глянуть встроенным бенчем (-b): hashcat64 -m13000 -b -w4

Алсо, сборка свежая? Там в релизах вроде до сих пор 5.1.0 с прошлой зимы лежит, в текущих билдах для многих хешей скорость увеличили примерное на десять процентов, что, наверное, означает и лучшую загрузку гпу.

> Ну всякие отдельные фичи вроде --optimized-kernel-enable



Дык это внутренняя хуйня. Имхо, к архитектуре видяхи они имеет ноль отношения.

> нормальных инструментов вы выдиранию хэшей таки нет.


Выдиранию откуда? Из рара? В хк только встроенных модулей разных хешей 308 штук. Думаю, как минимум треть этих хешей являются общеупотребимыми и могут быть получены из сотни разных источников. Словосочетание "выдрать хеш" звучит немного абстрактно.
fahbench3930k.png44 Кб, 516x358
36 4263654
>>4263585

>А рар это медленные хеши?


Ну как сказать, 7z медленее в 6 раз где то.

>И, как анон уже сказал, юзай -w4 для максимального потребления.


Это я сам дописал.

>Разве это не дохуя?


Разница в пределах версий драйверов.

> Там в релизах вроде до сих пор 5.1.0


Таки да, он самый. Поюзаю новую версию.

>Дык это внутренняя хуйня


Или не оно, но в листе фиксов вроде упоминались что то про оптимизации под конкретные серии GPU.

>Выдиранию откуда? Из рара? В хк только встроенных модулей разных хешей 308 штук


А вот тут поподробней. ХК позволяет находить значение (ключ) который использовался при создании "объекта" с известным методом(алгоритмом). Для этого нужна хэш-сумма полученная от уже созданного объекта. Ее получают имея конечный файл и зная метод (алгоритм) его создания. Это эталонное значение. Программа при переборе сравнивает получаемый результат с этим эталонным значением. Когда совпадет - ключ найден. Вроде все верно? Самая большая проблема у меня это вытащить этот самый хэш имея конечный файл или представление оного и зная точно какой алгоритм использовался при создании. Что за модули? Модули вычета? Или модули анализа?
А у тебя какая видеокарта?
GT710M.PNG19 Кб, 517x358
37 4266747
GTX660 Ti.png15 Кб, 508x347
38 4269307
GTX1070Ti.png9 Кб, 500x350
39 4273594
40 4278843
.
41 4282312
.
42 4283745
>>4226561
Охладопроблемы, при перегреве по датчику хотспота - частота снижается до 1300 MHz и потом колбасится частой пилой от 1300 до 1750. Нужон андервольт без поднятия частоты и/или вода или другой радиатор, как его, на 4 слота ебалда такая.
43 4283799
>>4226561
На воде и в реальном клиенте - на самых жирных F@H тасках RVII на уровне 2080-2080 Super, на самых нежирных - на уровне между стоковыми 2070 и 2070 Super под шиндовс. И в отличии от Тютюрингов - не требует линуха для полного раскрытия F@H патанцевала, т.к. реальная по GPU-Z утилизации чипа под шиндовсом повыше чем у Нвидий. Но требует подбора штабильного андервольта и хорошего охлада.
А полоса видеопамяти в F@H не решает, т.к. загрузка ПСП у 1070 - % 30-40 и выше не поднимается.
44 4284555
.
45 4286395
.
46 4287584
>>4283799
Если ты реально этим занимаешься, то объясни нахуя оно тебе надо?
Тратить свои деньги и время на счет каких-то абстрактных данных. Никогда не понимал эту секту.
44ed.jpg35 Кб, 512x512
47 4288147
15823926653360.jpg34 Кб, 600x614
48 4288259
Эээ, вы чО, ебнутые кичиться 7 сука летним бенчмарком ?
Вы хоть блять обновитесь, ебланы из 2013-го года.

http://fahbench.github.io
classic.png145 Кб, 500x462
49 4288302
50 4288500
>>4288259
Не легитимный. Истинные олдфаги гоняют v1.2.0
51 4290676
>>4288500

> Не легитимный


> расчётное ядро из 1.2 давно не используется


> Используемый OpenMM обновился до 6й версии, скоро перекатят на 7ю


> легетимна только версия 1.2.0, РРРРЯЯЯ!111


Совсем там каловых масс до делирия обкушались?
Легитимная только 2.2, поэтому:
https://www.youtube.com/watch?v=zddj4BA_7OM
1370968250744.jpg103 Кб, 320x404
52 4290991
>>4290676

>расчётное ядро из 1.2 давно не используется


насрать,

>Используемый OpenMM обновился до 6й версии, скоро перекатят на 7ю


насрать
53 4293032
.
ffs.jpg38 Кб, 372x287
54 4293718
55 4294198
>>4293718

>программы


Файлхостинги

>цп


Там много что еще лежит, как и на остальных долгоживущих хостингов, но это не для вас.
56 4294393
>>4294198
Ты оп? Мне просто на секунду показалось, что он так вычурно пошутил, оформив софт для процессора (я не вчитывался, что графического) в таком виде. Но, очевидно, я поторопился, т.к. он не пошутил, не имел это ввиду - это просто случайность. Просто сразу запилил страйк из трех самых популярных педохостов. Ну да, долгоживущих безусловно, лол.
57 4294653
>>4294393

>Ты оп?


Нет.

>Мне просто на секунду показалось, что он так вычурно пошутил, оформив софт для процессора (я не вчитывался, что графического) в таком виде.


Ну ясен хуй если у этого чувака бенчмарк семилетней давности "завалялся", то он явный дядька с бородой видавший многое даже первую опву и первые i2p шары

>он не пошутил, не имел это ввиду


Может просто наковырял в рейтинге хостов, ибо за последние два такое можно сказать, а вот первый нет.
Тащи результат своей видюхи епт.
Безымянный.png9 Кб, 503x353
58 4295473
59 4295493
>>4295473
Правда частота памяти была немного не на максимуме (-300 мгц), может и ядра тоже, и загрузка было написано 93-95% , но я не хочу никаких инспекторов устанавливать
60 4295560
>>4295493
P2 state отрубал? А так бал таки нормальный.
61 4300341
.
62 4302937
.
63 4309409
.
Quadro K4000.png13 Кб, 518x360
64 4311219
65 4318383
>>4226162
Антош у тебя еще карта на руках? Если да то сделай тест Hashcat c -w 4 на 7z, rar3, rar5. Спасибо.
66 4318406
>>4318383
hashcat64.exe -m 11600 -b -w 4
hashcat64.exe -m 12500 -b -w 4
hashcat64.exe -m 13000 -b -w 4
67 4318704
>>4318383
На работе стоит, напиши что именно сделать и завтра будет.
68 4319014
>>4318704
Ок
1. Скачай бинарники отсюда: https://hashcat.net/hashcat/ - (если у тебя еще винда)
2. Распакуй и зайдя в распакованную папку в адресной строке набери CMD
3. Вставь вот эту строчку: hashcat64.exe -b --benchmark-all -w 4
4. Подожди около получаса.
5. Результат тестов всевозможных хэшей принеси сюда нам. Анон сам найдет что ему интересно смотреть.
69 4319040
70 4319073
>>4319014

>hashcat64.exe -b --benchmark-all -w 4


C -w 4 работает как то медленее, лучше без него
hashcat64.exe -b --benchmark-all
71 4319120
>>4319073
Нет, параметр -w 4 как раз реально рабочий вариант который показывает реальную производительность при переборе. Без него всего лишь пиковое значение которое в реальных задач плавает и ограничивает длину пароля перебора. То что правильно именно:
hashcat64.exe -b --benchmark-all -w 4
72 4319412
>>4319014

>Скачай бинарники отсюда:


Там годовалой давности бинарники. За это время для сложных хешей скорость подняли на 10-20%, ввели новые режимы (раз уж ты анона заставляешь электричество жечь ради отчета по _всем режимам_), плюс в декабрьском релизе есть баги, с которыми бенч иррелевантен для группы карт. Если на венде, то пусть в цигвине компилит свежак.

>>4319120

>Нет, параметр -w 4 как раз реально рабочий вариант который показывает реальную производительность при переборе.



Нет. Параметр -w 4 всего лишь задает условную загрузку гпу. Бенч на в4 покажет пиковую производительность для реального перебора на в4, а бенч на в3 покажет пиковую производительность для реального перебора на в3, и т.д.

> Без него всего лишь пиковое значение которое в реальных задач плавает



Если у тебя плавает нагрузка, добираясь при этом до пика, значит ты недостаточно загрузил видяху. В факе есть инструкции о том, как минимизировать просадки.

> и ограничивает длину пароля перебора.



лолшта?
73 4320215
>>4319412

>то пусть в цигвине компилит свежак.


Ждем свежак от тебя. А то что то я не вижу исходников нигде.

>лолшта?


>Note: Using optimized kernel code limits the maximum supported password lengt


>To disable the optimized kernel code in benchmark mode, use the -w option.

74 4321148
>>4320215

> Ждем свежак от тебя.



Тесты все за анона прогони, бинарники скомпилируй... На электричестве экономишь?

> А то что то я не вижу исходников нигде.



https://github.com/hashcat/hashcat

> ограничивает длину пароля перебора


> in benchmark mode



Какое это имеет отношение к результатам бенча? И почему именно в4, который даже не дефолтный профиль? А если тип использует кастом и в реальной работе? Имхо, бенчить надо с дефолтным в3.

Ты прав в том, что его надо вручную указать, тут я прост привык хуй забивать, потому что в моих режимах один хрен кастом в бенче не работает, так что hc -mX -b равен hc -mX -b -w3.
image.png19 Кб, 502x352
75 4323236
Ноутбушная 2070
76 4323608
>>4321148

> бинарники скомпилируй


Я ленивый, пиши как под виду компилить... пошагово.
77 4324930
>>4323236
Даже лучше настольной RTX2060.
78 4330361
>>4318704
Анон мы ждем, очень интересный у тебя девайс.
hashcat64.exe -b --benchmark-all -w 4

Сделай так же и выложи на pastebin. Спасибо.
Моя старая квадра:
https://pastebin.com/3BnJZq0q
79 4330388
>>4323608
Go to https://www.cygwin.com , get the setup-x86_64 file and follow the instructions on the website.

Make sure to install additional dependencies necessary for hashcat compilation by selecting the following packages during cygwin installation

libiconv-devel
gcc-core
make
git
Building
Once all that is done, open the cygwin bash (cygwin\cygwin.bat) and type the following command to copy the latest master revision of hashcat repository into cygwin\home\username\hashcat

$ git clone https://github.com/hashcat/hashcat.git
Switch to the newly created folder by running

$ cd hashcat
Now type "make" to start compiling hashcat

$ make
The process may take a while, please be patient. Once it's finished, run hashcat by typing "./hashcat.exe"

$ ./hashcat.exe
Notes
While hashcat will run fine from cygwin bash, running it from a windows shell will require cygwin1.dll and cygiconv-2.dll to be in the same folder with hashcat.exe (the files can be found in cygwin\bin folder).
80 4333226
>>4330388

>Go to https://www.cygwin.com , get the setup-x86_64 file and follow the instructions on the website.


Так и сразу пиши что нужна бубунта, а под винду софта нет. Придется ставить виртуалку. Осилю, выложу сюда.
81 4338705
.
789.JPG11 Кб, 504x12
82 4340729
>>4330388
Ну вот, ну немного новее сборка, но версия вся та же 5.1. Нету исходников шестой версии пока.
83 4345098
.
84 4345144
>>4330361

Сорри пацаны, проебался тут временно с организацией удаленок и прочей рабочей парашей. Завтра сделаю вам тесты.
85 4346847
>>4333226

>Так и сразу пиши что нужна бубунта, а под винду софта нет



Че несешь? cygwin.com.

Cygwin is:

1. a large collection of GNU and Open Source tools which provide functionality similar to a Linux distribution on Windows.
2. a DLL (cygwin1.dll) which provides substantial POSIX API functionality.

>>4340729

>Нету исходников шестой версии пока.



Все норм, сборка 1755 и оригинальный релиз 5.1.0 это день и ночь.
86 4347847
Сильно хэшкот потеряет в производительности если видяхи через райзеры подключить?
87 4347918
>>4347847
Не должен. Скорость общения с CPU не так критична. По идее любая майнинг ферма должна выдавать на гора.
88 4347991
>>4347918

> Скорость общения с CPU не так критична



Мож я глючу, но чет у меня из головы не выходит мысль, что Атом где-то таки писал о случаях, когда шина становится горлышком. Ща, правда, ищутся только иррелевантные треды времен оцл.

> По идее любая майнинг ферма должна выдавать на гора.



Майнеры рапортуют, например, о просадках до 20% в некоторых упоротых клиентах (1/16).
89 4350048
.
90 4352259
.
91 4355692
.
FAHBenchmark 2080ti 1935@0.9@1200.PNG182 Кб, 1486x752
92 4355784
2080ti

1935мгц 0,9в +1200 к памяти
93 4357379
>>4355784
Мощь. Вот бы такую карточку
94 4367851
>>4357379
Зачем тебе геймерское дрочево в треде про расчеты? Она на энергоэффективности будет два года отбивать разницу между своей ценой и стоимостью пары карт постарше, дающих такой же результат.
ocl.PNG14 Кб, 509x356
95 4367886
>>4355784
норм.
hc.PNG24 Кб, 1064x432
96 4367891
>>4367886
туда же..
97 4367931
>>4367851

>Зачем тебе геймерское дрочево в треде про расчеты? Она на энергоэффективности будет два года отбивать разницу между своей ценой и стоимостью пары карт постарше, дающих такой же результат.


Ну если вопрос о такой производительности единичного девайса, то да, а если вопрос запихать в сервер 10 карт теслы V100 или 2080Ti, то я скорее выберу последнее, так как на разницу в цене куплю еще один такой же сервер или бодрый сервер виртуализации. Разница в цене уж больно убойная, особенно у местных барыг. А вычисления в DP64 мне и моей конторе как то не упали особо. А с Radeon VII будет еще дешевле.

>>4367891
Скинь полный результат в pastebin. Спасибо.
588a58baca62d7d62ba082c499a0e322.jpg61 Кб, 500x435
98 4367937
>>4367886
Вы в лидерах.
99 4367945
Посаны, поясните как поставить опенсл на вин/прыщи. Или как заставить хешкет работать с куда. Я прост в соседский вайфай хочу, а на проце прогнозируемый подбор 8 символов составляет 150 дней, я же охуею.
100 4368034
>>4367931

> Ну если вопрос о такой производительности единичного девайса, то да



Да, но все-таки не так просто. Там значения попугая на ватт/ч на платежную единицу хоть и поддерживаются производителями уже много лет в одном и том же коридоре, но коридор этот допускает вариации и с бОльшим количеством устройств, а не только с одним и даже не только с двумя.

> а если вопрос запихать в сервер 10 карт теслы V100 или 2080Ti, то я скорее выберу последнее, так как на разницу в цене куплю еще один такой же сервер .



А с чего вдруг это ты исключение делаешь для пары 2080/в100? К ним применяется ровно те же правила, которые ты сам в первом параграфе обозначил. Как раз таки чем больше у тебя карт в массиве, тем выгоднее становится собирать из тесел. Если одна-две-три карты в100 будет отбивать стоимость внедрения и эксплуатации порядке десяти лет, то, например, двадцать карт за счет меньшего потребления и затрат отобьют разницу в цене заметно меньше чем через полгода (это еще без учета экономии на инфраструктуре, т.к. одна тесла, это примерно две с половиной 2080ти). Т.е. если ты стремишься к недостижимому максимуму расчетов и у тебя в принципе есть оборотные средства и остальные ресурсы на это дело, то чем больше массив, тем выгоднее брать как раз в100 (да и вообще делать переход на ступень выше). Именно поэтому единственным неизымаемым и всегда играющим фактором в решении о переходе на следующую технологическую ступень является только фактически необходимый тебе нижний предел попугаев, который должна обеспечить твоя сборка. Все остальное является функцией от него или обстоятельств (средства, место, энергообеспечение и пр.) и, что называется, "надо посмотреть" в каждом конкретном случае.

> или бодрый сервер виртуализации



В какой конторе ты там вычислениями занимаешься и сколь малыми объемами, что вам внезапно стал выгоден покупной сервер? В прошлый раз когда я проверял, у самого дешевого был коэффициент наценки почти 100 за попугая.
101 4368213
>>4367945

>Или как заставить хешкет работать с куда


Куда вещь проприетарная, в те далекие времена когда Куртка двигал сегмент вычислений он давал много чего в плане инвестиций - куча библиотек, поддержка доступного обучения, сообщества кодеров, не тухлый toolchain. По скольку зеленые и были самыми активными инициаторами данного направления в вычислениях, все это дало не плохой код, который по началу давал не плохую фору OpenCL в производительности на том же железе. Не сказать что научные сообщества и вендоры забили болт на OpenCL и сегмент доедал последний хуй без соли, но инвестиций получили куда меньше чем CUDA. Прошли годы, кодеры "подросли" и стало не особо видно разницы в производительности между двумя CL. Да остались привычки тех кто вкатывался первым, но это начало уступать место возможностям совместимости, особенно когда AMD начал выпускать карты с HBM памятью. На горизонте маячат карты интел, большая часть вендоров поддерживает OpenCL. Да в узких задачах производительность\ватт по прежнему за CUDA, но многие из тех кого я знаю лично, заебались поддерживать разные версии софта на два языка и перекатились только на OpenCL. Думаю тенденция продолжится, особенно когда появятся серьезные вычислительные девайсы от других контор. Куртке надо было делать технологи открытой, но жадность.

>т.к. одна тесла, это примерно две с половиной 2080ти


>то чем больше массив, тем выгоднее брать как раз в100


Господин хуанг вы на цены то свои взгляните, и на производительность в FP32. У теслы, которая на архитектуры паскаль, производительность в большинстве задач едва более будет чем у 2080Ti. А стоимость тупо в 10 раз больше. Вместо 10 карт, я позволю себе 1 теслу. Смысл? Мне плевать на энергопотребление, оно обычно покрывается условием договора на услуги расчетов. Да я понимаю что бывают задачи когда нужно много видеопамяти, в таком случае ты прав, но 95% задач у нас с лихвой хватает и 4 GB на карту.

>что вам внезапно стал выгоден покупной сервер?


Внезапно 19" стойка. Внезапно всеравно собирать по отдельности не дешевле (из за растаможки). Единственно что SSD покупаем отдельно, ибо пока там наклейчный кретинизм.
101 4368213
>>4367945

>Или как заставить хешкет работать с куда


Куда вещь проприетарная, в те далекие времена когда Куртка двигал сегмент вычислений он давал много чего в плане инвестиций - куча библиотек, поддержка доступного обучения, сообщества кодеров, не тухлый toolchain. По скольку зеленые и были самыми активными инициаторами данного направления в вычислениях, все это дало не плохой код, который по началу давал не плохую фору OpenCL в производительности на том же железе. Не сказать что научные сообщества и вендоры забили болт на OpenCL и сегмент доедал последний хуй без соли, но инвестиций получили куда меньше чем CUDA. Прошли годы, кодеры "подросли" и стало не особо видно разницы в производительности между двумя CL. Да остались привычки тех кто вкатывался первым, но это начало уступать место возможностям совместимости, особенно когда AMD начал выпускать карты с HBM памятью. На горизонте маячат карты интел, большая часть вендоров поддерживает OpenCL. Да в узких задачах производительность\ватт по прежнему за CUDA, но многие из тех кого я знаю лично, заебались поддерживать разные версии софта на два языка и перекатились только на OpenCL. Думаю тенденция продолжится, особенно когда появятся серьезные вычислительные девайсы от других контор. Куртке надо было делать технологи открытой, но жадность.

>т.к. одна тесла, это примерно две с половиной 2080ти


>то чем больше массив, тем выгоднее брать как раз в100


Господин хуанг вы на цены то свои взгляните, и на производительность в FP32. У теслы, которая на архитектуры паскаль, производительность в большинстве задач едва более будет чем у 2080Ti. А стоимость тупо в 10 раз больше. Вместо 10 карт, я позволю себе 1 теслу. Смысл? Мне плевать на энергопотребление, оно обычно покрывается условием договора на услуги расчетов. Да я понимаю что бывают задачи когда нужно много видеопамяти, в таком случае ты прав, но 95% задач у нас с лихвой хватает и 4 GB на карту.

>что вам внезапно стал выгоден покупной сервер?


Внезапно 19" стойка. Внезапно всеравно собирать по отдельности не дешевле (из за растаможки). Единственно что SSD покупаем отдельно, ибо пока там наклейчный кретинизм.
102 4368240
>>4368213

>Господин хуанг вы на цены то свои взгляните, и на производительность в FP32.



Ну несите же их скорее сюда, зачем вы скромничаете?

> У теслы, которая на архитектуры паскаль, производительность в большинстве задач едва более будет чем у 2080Ti.



Несите большинство задач, посчитаем предметно.

> А стоимость тупо в 10 раз больше.



А вот и не тупо. Ровнехонько укладывается в предсказанный коридор в расчете на используемые мною попугаи.

> Вместо 10 карт, я позволю себе 1 теслу.



Вместо десяти хд5500 разве что.

> Смысл?



> Мне плевать на энергопотребление, оно обычно покрывается условием договора на услуги расчетов.



Шта? Начни с простого: кто кому платит?

>Внезапно 19" стойка.



Охуеть. Что это качественно меняет-то?

> Внезапно всеравно собирать по отдельности не дешевле (из за растаможки).



Бля, понятно все.
102 4368240
>>4368213

>Господин хуанг вы на цены то свои взгляните, и на производительность в FP32.



Ну несите же их скорее сюда, зачем вы скромничаете?

> У теслы, которая на архитектуры паскаль, производительность в большинстве задач едва более будет чем у 2080Ti.



Несите большинство задач, посчитаем предметно.

> А стоимость тупо в 10 раз больше.



А вот и не тупо. Ровнехонько укладывается в предсказанный коридор в расчете на используемые мною попугаи.

> Вместо 10 карт, я позволю себе 1 теслу.



Вместо десяти хд5500 разве что.

> Смысл?



> Мне плевать на энергопотребление, оно обычно покрывается условием договора на услуги расчетов.



Шта? Начни с простого: кто кому платит?

>Внезапно 19" стойка.



Охуеть. Что это качественно меняет-то?

> Внезапно всеравно собирать по отдельности не дешевле (из за растаможки).



Бля, понятно все.
103 4368243
>>4367886
Кокой разгон?
104 4368423
>>4368240

>Бля, понятно все.


Охох, любители брать в аренду подъехали. В облако, сразу кидайтесь в облако, и у вас все будет хорошо.....правда.
105 4369313
>>4368423
Хуле ты мне-то это пишешь.
106 4369818
>>4368240

>Ну несите же их скорее сюда, зачем вы скромничаете?


Да особо не сложно в тех спеки залезть и узнать потолок:
Titan RTX - 16.3 TFLOPS
Titan V - 13.8 TFLOPS
RTX 2080 Ti - 14.2 TFLOPS
Tesla V100 (PCIe) - 14 TFLOPS
Но это потолок, понятно что разный софт будет юзать очень по разному возможности железа, но по моему опыту средняя температура будет примерно такая же как показано на графике машинного обучения. Ну и конечно прямота драйверов.

>Ну несите же их скорее сюда, зачем вы скромничаете?


Цена на V100 PCIe что я нашел около $5000, дешевле не видел, цена на 2080Ti чуть выше $1000.

>Вместо десяти хд5500 разве что.


Не ну я серьезно.
>Несите большинство задач, посчитаем предметно.
Коммерческая тайна, лол. Предметно не получится, но сейчас тренд на обработки контента с интеллектуальных видеокамер, распознавание, геодезия, моделирование физических процессов, климат и проч.

>Шта? Начни с простого: кто кому платит?


У нас проекты от 5 до 100 M рублей. Сроки от 3 месяцев до 3 лет. Платит в основном государство. Цена электричества по промышленному тарифу, раза в три ниже чем с домашней розетки. Не особо напрягает, чтобы это учитывать.

>Охуеть. Что это качественно меняет-то?


Да, тупо нет места собрать себе ферму какую хочешь, вот стойка место, будь добр вписаться. Это что касается вычислений на картах.

>Бля, понятно все.


Ну пиши свое виденье как делать правильно.
fp32-2080ti-1.png65 Кб, 1024x445
107 4369821
>>4369818
отклеилось
108 4370951
>>4369818

> понятно что разный софт будет юзать очень по разному возможности железа



Флопсы заебись, но даже на "графике обучения" в100 дает уже почти полторашку. На всякой там криптографии люди рапортуют коэффициент более двух к 2080ти. Отсюда и вполне очевидный график, где с ростом объемов вычислений в100 вполне себе "выгодна" уже при годовом расчете на 10-20 картах. При всем том, что попугаи у всех разные, криптография поразительно стабильно бьется с коридором цен, устанавливаемых производителями карт, что лично мне дает основания рассматривать ее как вполне себе годный эталон. Я не знаю, что там под капотом и почему именно так получается, но эта черная коробка даже на предсказание отпускных цен работает, чего нельзя сказать о флопсах.

> тупо нет места собрать себе ферму какую хочешь, вот стойка место, будь добр вписаться.



Понятно. Я прочитал так, как будто ты про аренду виртуализации написал ранее. Непонятно было, при чем тут формат стойки.
Езжайте к дерипаске, у него места дохуя.

> Ну пиши свое виденье как делать правильно.



Коммерческая тайна, лол.
109 4383319
.
110 4389363
.
111 4393819
.
112 4397606
.
113 4401735
.
114 4410411
.
115 4421692
.
116 4432734
.
117 4440701
.
118 4456680
.
119 4461085
.
120 4470769
.
2020-05-26 185859-Folding@Home Benchmark v1.2.0 w OpenMM 5.1.png10 Кб, 502x352
121 4471011
GT230.PNG16 Кб, 514x357
122 4473937
GF 840A.PNG18 Кб, 515x358
123 4490422
124 4495034
.
125 4499648
.
126 4510592
.
127 4517496
.
128 4520804
.
129 4530240
.
gpu.png264 Кб, 772x532
130 4531143
131 4532777
>>4531143
Если твое, то спасибо.
Прошу протестировать
Hashmode: 11600 - 7-Zip (Iterations: 16384) при Iterations: 524288
Hashmode: 13000 - RAR5 (Iterations: 32799) при Iterations: 32767
А лучше конечно прогнать полностью командой hashcat64.exe -b --benchmark-all -w 4.
Спасибо.
132 4533112
>>4532777

>А лучше конечно прогнать полностью командой hashcat64.exe -b --benchmark-all -w 4.


https://pastebin.com/kUyi4iHa

-w4 работает без оптимизированного ядра, и в моём случае актуально только на AMD Radeon HD 6990 и AMD Radeon HD 5970 - они у меня отдельными вычислителями работают. в случае с nvidia turing и pascal -O лучший вариант.
https://pastebin.com/aQLmuWmF

>Hashmode: 11600 - 7-Zip (Iterations: 16384) при Iterations: 524288


>Hashmode: 13000 - RAR5 (Iterations: 32799) при Iterations: 32767


мало сталкиваюсь с итерациями и не совсем понимаю, как сделать то, что тебе нужно, подскажи конфиг - сделаю.
photo2020-06-2110-16-14.jpg92 Кб, 1280x584
133 4533114
>>4533112
не та фотка кота)
134 4533421
>>4533112
>>4533112

>-w4 работает без оптимизированного ядра, и в моём случае актуально только на AMD Radeon HD 6990 и AMD Radeon HD 5970 - они у меня отдельными вычислителями работают. в случае с nvidia turing и pascal -O лучший вариант.


Кстати да, я заметил, но не для всех хэшей. В некоторых выигрыш есть. Но большинство лучше -O

>мало сталкиваюсь с итерациями и не совсем понимаю, как сделать то, что тебе нужно, подскажи конфиг - сделаю.


Хм, хороший вопрос, нагуглить я не смог, пятая версия бенчмарка при команде hashcat64.exe -b выдавала небольшой список хэшей где 7-zip iterations: 524288, RAR5 iterations: 32767. Как это поменять в ручную я не нашел. Тут важно что для 7-zip 524288 и rar5 32767 соответствует скоростям которые показывают crarck и accent rar\zip password recovery. Тесты не полные у тебя походу, с аргументом --benchmark-all и не до конца. Но все равно спасибо.

Моя трудяга:
https://pastebin.com/NtP7CRyf
135 4533975
>>4533421
на 6-м коте

-O
Hashmode: 13000 - RAR5 (Iterations: 32799)
Speed.#1.........: 111.4 kH/s (75.63ms) @ Accel:4 Loops:1024 Thr:1024 Vec:1

Hashmode: 11600 - 7-Zip (Iterations: 16384)
Speed.#1.........: 987.0 kH/s (63.15ms) @ Accel:4 Loops:4096 Thr:1024 Vec:1

-w4
Hashmode: 13000 - RAR5 (Iterations: 32799)
Speed.#1.........: 110.7 kH/s (313.59ms) @ Accel:16 Loops:1024 Thr:1024 Vec:1

Hashmode: 11600 - 7-Zip (Iterations: 16384)
Speed.#1.........: 811.4 kH/s (161.45ms) @ Accel:32 Loops:1024 Thr:1024 Vec:1

======================================================================================

>Моя трудяга


Сейчас делаю реорганизацию. Итогом будет 24xP104-100 + 8xGTX1080 на одной системной плате под двумя ксеонами. в теории возьму 500GH/s по MD5 бругом, но на практике хз ещё как выйдет.
136 4534514
>>4533975
на 5-м коте

-O
Hashmode: 13000 - RAR5 (Iterations: 32767)
Speed.#1.........: 107.0 kH/s (81.03ms) @ Accel:128 Loops:128 Thr:256 Vec:1

Hashmode: 11600 - 7-Zip (Iterations: 524288)
Speed.#1.........: 24216 H/s (89.43ms) @ Accel:128 Loops:512 Thr:256 Vec:1
я не могу этого объяснить, может пятый кон не оптимизирован под этот алгоритм

-w4
Hashmode: 13000 - RAR5 (Iterations: 32767)
Speed.#1.........: 109.9 kH/s (315.72ms) @ Accel:128 Loops:512 Thr:256 Vec:1

Hashmode: 11600 - 7-Zip (Iterations: 524288)
Speed.#1.........: 24968 H/s (173.67ms) @ Accel:128 Loops:1024 Thr:256 Vec:1
image-000000.jpg91 Кб, 750x550
137 4534598
>>4533975

>24xP104-100 + 8xGTX1080


Не плохо, подключение через PCIe Switch?
138 4534669
>>4534598
Asus b250 mining editio, контроллер pciex16 -> 8 pciex1, + i7 7700K, 32Gb
Убираюсь в пропускную способность pcie
139 4534793
>>4534669

>Убираюсь


упираюсь*

собственно 1Гигахеш эфира вычислитель делает вполне легко, но когда дело касается то-го же MD5 то потолок 380гигахеш и всё, дальше не идёт.
Проблема в проце конечно и в целом раздробленной системе. openmpi оказался не самым лучшим решением.
140 4546372
.
141 4550988
>>4533975
>>4534514
Короче тут все нормально, значение результата 7zip iterations 524288 и 16386 бьется в те-же 32 раза. То есть если хочешь узнать реальную скорость перебора нужно результат теста делить на 32.
142 4557445
.
143 4566520
.
Снимок.PNG13 Кб, 515x357
144 4566612
ебать ржака
145 4568497
>>4566612
Да, флагманы лучше скидывать через 3-4 года, раньше он стоил около $1000, а сейчас и за цену 1650 не продаж.
146 4580023
.
sage 147 4583683
148 4589753
.
149 4600543
.
150 4608772
.
151 4614217
.
152 4623286
.
153 4634898
.
1596445766542.png47 Кб, 723x867
154 4635388
>>4222227 (OP)

> Задался поиском быстрого средства диагностики производительности разного железа в OpenCL, ибо этого говна у меня полный склад.



Ебать ты. Ну и что помешало встроенный бенчмарк hashcat использовать?
155 4637540
>>4635388
Ну, hashcat тут тоже легитимен, в следующей шапке добавлю пункт про него, просто хочется чтобы одной кнопкой все мерить, одной, ибо хомяки то ленивые, в консоль не хотят. А у них порой и топы бывают. Сам бенч не привязан к железу, и работает на всем что может в OpenCL 2.0. Пусть не абсолютно показательно к средним по больнице OpenCL задачам (оба теста весьма специфичны), но зато просто и удобно.
156 4645092
.
157 4653857
.
158 4659772
.
159 4662001
Обновил карту на стенде, для замены старой квадры (кулер подыхает). Хотя она и бустит до 1.9 GHz, но всеже меньше чем было у анона выше. Осталось прикупить пару А100 или 3080Ti.

Тест обеих в Hashcat:
https://pastebin.com/kpx8R6Fe

Драва:
451.67
160 4669171
.
161 4674861
162 4684737
.
163 4696717
.
164 4708965
.
165 4723559
.
166 4742787
.
167 4756490
.
168 4775336
.
169 4782028
.
170 4796208
.
171 4807162
.
172 4807208
Высрали целый тред для некроверсии 1.2 с давно дохлым 18-м ядром, в то время когда 21-е ядро почти ушло из продакшена.
Вместо того чтобы сделать пару сборочек FAHBench 2.3.1 с 22 ядром в его 0.10 и 0.13 подверсиях, соответственно в вариантах с OpenCL и с CUDA.

ICQ критического мышления не выше 100, анамнез поциэнтов - считают себя "анонасами", прогноз развития обдвачевания - негативный.
GTX1650S.JPG31 Кб, 517x360
173 4809093
>>4807208
А вот и F@H дрочер пожаловал. Ну че там, раскодировали COVID ??
Тут не дрочат на F@H и его функционал, тут дрочат на его старый бенчмарк беря его как синтетику, ну и HashCat.
174 4815323
.
175 4833138
.
176 4850134
Бамп, ждем RTX3080
177 4863600
.
sage 178 4869443
test test. teste.

test test. test.
179 4879124
.
180 4886509
.
181 4896268
.
182 4911636
.
183 4923986
.
184 4924084
Разница с p2=off(1пик) не особо заметна
185 4924132
>>4924084
fix: перепутал местами картинки, второй пик - с p2=off
186 4925644
>>4924084
Ну я даже не знаю, >>4233498
Частота то какая по ядру?
188 4928243
>>4926064

>Всё так печально с 3080?


Можно пока списать на драва.
189 4937419
.
190 4950493
.
192 4969834
.
193 4983829
.
194 4991179
.
195 5001804
.
196 5008036
.
197 5027349
.
изображение.png11 Кб, 501x346
198 5028060
6800XT
199 5033077
>>5028060

>6800XT


Уф, а в игорях дает чуть выше 2080Ti. Частоты?
Нынешняя архитектура красных явно под игры пилилась. Интересно, сколько новый ампер выдает? Если тот же 2080Ti переваливал за 200 и 1000 соответственно.
200 5043354
.
201 5046957
.
202 5056934
.
203 5064460
.
204 5070094
.
205 5084555
.
206 5092313
.
207 5100324
.
Снимок экрана 2021-01-01 221053.png15 Кб, 499x352
208 5103884
209 5103985
>>5103884
Частоты низкие. Имплицит не ниже ~1250 должен быть на 1.8 GHz
210 5104187
>>5103985
Проверил. Да, ты прав, тест какой то хуеватый, не может нормально видеокарту нагрузить. Она работает в стоке, хотя даже даже аида гпу и прочие 3дмарки работа.т с нормальным разгоном до 2.2.
Снимок экрана 2021-01-01 22105333.png15 Кб, 494x347
211 5104195
>>5104187
Короче погонял, раз на раз не приходится.
Хз короче.думается прога и вправду кривовата, по крайней мере для нового железа
212 5104489
>>5104195
>>5104187
Тест нормальный, в шапке анон же написал про P2 State:

>Q: Я счастливый обладатель Nvidia карт, почему во время теста не работает буст? Частота гпу стоковая и не хочет подниматься.


>A: Нужно отключить принудительный P2-стейт для куды, иначе она занижает частоты памяти для чистых куда/опенцл приложений. Качаем утилиту "nvidia profile inspector" -> пункт "CUDA - Force P2 State" -> выбираем значение "OFF" -> Apply changes. Все, карта бустит как надо.

213 5104875
>>5104489
Выходит это я косоглазый, спасибо, попробую.
214 5105262
>>5104187
>>5104195

>думается прога и вправду кривовата


С прогой все нормально. Дело в том, что она крайне простая, и работает без готовых профилей на 100% через драйвер карты. Потому режимы исполнения идут через дефолтный профиль (сет) драйвера, в котором как правило включено куча энергосберегающих функций.
Десяток лет назад режимы работы видеокарт были "по проще" чем сегодня, с новыми же режимами старый софт не знаком. Например, если тестировать старыми 3DMark 03/05/06 новое железо, в большинстве случаев будет тоже самое, если в драйверах отдельно не прописаны сеты на исполнения конкретного софта. Зато это явление полностью отсутствует в современных "марках". Там встроенные профили к большинству поддерживаемых на сегодня веток драйверов, и во время теста карты работают так, как хочет 3DMark.
Тут требуется всего лишь более тонкая настройка.
215 5114601
.
216 5127639
.
217 5136619
.
218 5147144
.
219 5158545
.
220 5170581
.
221 5180411
.
222 5192086
.
nhuPNG.PNG1,2 Мб, 886x684
224 5207595
>>5205989

>Hashmode 0


>Hashmode 1400


>Hashmode 1700


>Hashmode 11600


>Hashmode 12500


>Hashmode 13000


Эта карта может в хэш.
А фах по прежнему на низких частотах тестирован.
225 5208086
>>5207595
Да, fah полную чушь показывает.
А вот в хешкете мне непонятно почему говорит что 40MCU, если их вообще-то 80 должно быть.
226 5208817
>>5208086

>Да, fah полную чушь показывает.


Нет, просто карта не хотит в буст во время теста.
227 5217386
.
228 5228729
.
229 5239639
.
230 5249297
.
231 5262508
.
232 5281746
.
233 5295159
.
234 5316062
.
235 5329751
.
изображение.png61 Кб, 1127x795
236 5329789
237 5336943
.
238 5342939
.
239 5357203
.
240 5364694
.
241 5373828
.
242 5380347
.
19.04.21.JPG66 Кб, 653x297
243 5385608
>>5205989
Мужик, пройдись хэшкэтом в -m 17220, сейчас ломаю zip архив один, интересно. Спасибо.
1618775976094.png40 Кб, 767x551
244 5385637
>>5385608
ошибку выдаёт
если зафорсить то 3737Mh
245 5385651
>>5385637
Фигня какая-то. Видимо с дравами проблема. У тебя девайс мощнее моей 1650 раз в 6-7 должен быть. Вон 3090 выдает под 23.1 GH/s
https://gist.github.com/Chick3nman/e4fcee00cb6d82874dace72106d73fef
246 5385696
>>5385651
ну хз, очевидно ошибка да
когда мне надо было rar3 считать, на одних драйверах работало, на других нет

по ссылке на 3090 в md5 65079.1 MH/s против моих 62069 MH/s
а в rar3-hp 145.6 kH/s против моих 186.9 kH/s

хотя по идее в этом поколении амперы раза в два числодробильнее чем rdna2, но выходит что в хешкете примерно то на то
247 5395208
.
248 5400946
.
249 5407717
.
250 5419640
.
251 5429335
Пришло то самое время - переустанавливать Убунту вместо Шиндовса.
252 5429562
>>5429335
Пойду в бенч поиграю.
253 5434244
.
254 5441287
.
255 5448581
.
256 5457123
.
257 5460665
.
Mint 201 1070 2025 2000.jpg56 Кб, 846x441
258 5463360
FahBench 2.3.2, хотя и он с просроченным легаси-ядром и тестовым проектом, GTX 1070 @2025 MHz 8000 MHz, Linux Mint 20.1, NV Xserver 460.39. C актуальным CUDA-ядром будет около 160 ns|day.
259 5468120
>>5463360

>FahBench 2.3.2


>легетимна только версия 1.2.0

260 5474558
.
261 5480771
.
262 5486071
.
263 5490419
.
264 5495980
.
265 5495991
https://folding.extremeoverclocking.com/team_list.php?s=
https://folding.extremeoverclocking.com/team_summary.php?s=&t=234980

Эта команда платит ~5к банана-ублей в месяц с 1070 под линухом, эфир соснул.
266 5503213
.
267 5506593
.
268 5517323
.
269 5522418
.
270 5526629
.
271 5532537
.
272 5535298
.
273 5540008
.
274 5543958
.
275 5548057
.
276 5555646
.
277 5559414
.
278 5565171
.
279 5568127
.
280 5568188
>>4222227 (OP)

>Q: Я счастливый обладатель Nvidia карт, почему во время теста не работает буст? Частота гпу стоковая и не хочет подниматься.


>A: Нужно отключить принудительный P2-стейт для куды, иначе она занижает частоты памяти для чистых куда/опенцл приложений. Качаем утилиту "nvidia profile inspector" -> пункт "CUDA - Force P2 State" -> выбираем значение "OFF" -> Apply changes. Все, карта бустит как надо.


Тебе тесты-нетесты надо с этим или без этого?
281 5570971
>>5568188

>Тебе тесты-нетесты надо с этим или без этого?


С бустом.
282 5577286
.
283 5583738
.
image.png41 Кб, 524x366
284 5585108
1660s
285 5592844
.
286 5596240
.
287 5603586
.
308080.png13 Кб, 502x352
288 5603718
3080 мобильная на 80 ватт
image.png19 Кб, 495x356
289 5604444
Мобильная 1660ti.
290 5614828
.
291 5617650
.
292 5624476
.
293 5629614
.
294 5634424
.
2021-09-22202410.png27 Кб, 510x350
295 5634455
Сделал чтобы опу скучно не было, карта с прижатым поверлимитом.
Долго же он задачу генерирует.
296 5635933
>>5634455
Спасибо. Максвеллы не часто тестят.
297 5643337
.
298 5647158
.
299 5652505
.
300 5658573
.
301 5659956
Потестил свою печь, для разнообразия обычная и двойная точность.
а еще я узнал что у меня дросселя на имплиците пищат сука
302 5669215
.
303 5678413
.
304 5682312
.
ChR-YZozyCc.jpg37 Кб, 500x320
305 5686423
Бля, что то мало
DxwKmm0[1].png14 Кб, 502x352
306 5686686
>>5686423
Выключил куду - лучше не стало.
>>5585108
>>5604444
Мобильные и то лучше.
2021-10-28.png15 Кб, 496x346
307 5687351
Quadro T600
308 5687449
Антуаны, вам вопрос.
Как так получается, что более старые карты в этом opencl бенче вроде >>5659956 выдают перформанс на уровне 40вт квадр типа >>5687351, хотя мощности в тфлопс у них совсем не одинаковые?
Какие факторы в самих архитектурах могут на это влиять?
309 5688506
>>5687449
Ну с одной стороны у Титана почти всего больше - и шейдеров (транзисторного бюджета) и пропускной способности памяти. Но у Тьюринга на голову эффективней архитектура работы куда ядер, и частота выше. В те времена куртка не зря свой хлеб ел. Они крупнее, и у них больше своего кэша. Чем меньше нужды обращаться за данными в видеопамять карты, тем быстрее идет обработка. Также большое влияние видео драйвера.
В конкретном случае склоняюсь что не было выключено P2State в драйвере у Титана.

>>5686423

>Бля, что то мало


Аналогично, выруби P2State для буста карты во время теста.
310 5688513
>>5687351
>>5659956
Выложите прогонку HashCat 6.2.4
https://hashcat.net/hashcat/

hashcat64.exe -b --benchmark-all

Разница в среднем будет такой же.
311 5689404
>>5688506
Как сказатб, демонстрация 7 лет технологического прогресса.
У титана правда еще по мелочи есть двойная точность, которой сейчас могут похвастать только печи ценой в однокомнатную квартиру, но с учетом возраста это скорее всего не особо большой бонус.
Драйвер 451.58, мизерный разгон до штабильных 1150 мгц.

>не было выключено P2State


Ну карта вроде бустилась нормально, может приколы со стейтами это удел более новых карт.
>>5688513
Завтра мб будет, немало там тестов в бенче имеется.
312 5702750
.
313 5702751
.
314 5704036
>>5688513
Чет не запускается эксешник
315 5705164
>>5704036

>Чет не запускается эксешник


Идешь в папку где распакован hashcat. Открываешь CMD (написав cmd в адресной строке этой папки + enter), вставляешь hashcat64.exe -b --benchmark-all
И ждешь.
316 5705507
>>5705164
./hashcat.hctune: No such file or directory
317 5705715
>>5705507

>hashcat64.exe -b --benchmark-all


hashcat.exe -b ну у меня так работает.
318 5711878
.
319 5715559
.
320 5720036
.
321 5728190
.
322 5734585
.
323 5742139
.
324 5746967
.
325 5753940
.
326 5759361
.
327 5762286
>>5687449
Бенч с некроядром, которое уже давно не используется - года как 3, причём Nvidia давно перекатили на CUDA с OpenCL.
И с маленьким некропроектом - всего на около 28-30к атомов, такие маленькие проекты от 5к до 30к на том старом некроядре не могли прям хорошо нагружать карты с большим числом CU и это было видно даже по низкому ваттажу.
Вопщем карты с большим число CU наиболее раскрывались на проектах с большим числом атомов. А память по ПСП на малоатомных проектах - загружена тоже довольно слабо.

На новом 22 ядре - оно стало получше с такой мелочью, но самих таких мелкопроектов стало довольно мало.
328 5762288
>>5687449
Бенч с некроядром, которое уже давно не используется - года как 3, причём Nvidia давно перекатили на CUDA с OpenCL.
И с маленьким некропроектом - всего на около 28-30к атомов, такие маленькие проекты от 5к до 30к на том старом некроядре не могли прям хорошо нагружать карты с большим числом CU и это было видно даже по низкому ваттажу.
Вопщем карты с большим число CU наиболее раскрывались на проектах с большим числом атомов. А память по ПСП на малоатомных проектах - загружена тоже довольно слабо.

На новом 22 ядре - оно стало получше с такой мелочью, но самих таких мелкопроектов стало довольно мало.
329 5764208
>>5762286

>причём Nvidia давно перекатили на CUDA с OpenCL.


Не везде, а кое-где наоборот.

>такие маленькие проекты от 5к до 30к на том старом некроядре не могли прям хорошо нагружать карты с большим числом CU


Ну тут для этого есть Stress Test как ты можешь видеть. Что бы по дольше и вдумчивее затестить.
А то что тут некроядро, то это не важно. Тест на сегодня можно считать чисто синтетическим.
330 5773886
.
331 5791928
.
332 5794950
.
333 5798664
.
334 5817589
.
sage 335 5817941
>>4222227 (OP)

> изучающих протеины


Шёл 2022 год, а шизоиды всё верили в вычисление протеинов. Как будто история SETI@Home ничему не научила. Когда у американских спецслужб появились свои суперкомпьютеры, использование пеки Сычова стало ненужным.
336 5828994
>>5817941
Ты внимательно прочитай шапку, чтоли.
337 5833850
.
16139599704240.mp482 Кб, mp4,
450x256, 0:02
338 5834070
>>4222227 (OP)

>ssd


>производительность


В терафлопсах на гигабайт? Что за хуйня у вас в шапке, шизики?
339 5834073
>>5834070
Что за хуйня, абу
340 5836239
>>4222227 (OP)
Дайте рабочую ссылку на бенчмарк. Те, что в шапке - все битые.
У меня как раз Radeon VII, а я смотрю вам нужен для коллекции такой.
Screenshot 2022-01-20 175736.png23 Кб, 519x374
342 5838627
>>5836738
Radeon VII
343 5838826
>>5838627
Частота ядра в бусте была во время теста? Или в стоке? По идее больше может этот чип.
344 5839394
>>5838826
1739-1750Мгц ядро, правда потребление при этом 135Вт (у меня по умолчанию все настройки драйвера, т.е. даунвольта или других ограничений нет). Например в ведьмаке 3 у меня те же 1750Мгц на 250Вт либо 210-215Вт с даунвольтом до 1010мВ со штатных 1145мВ.

Могу сказать, что для Radeon VII это плохой тест. Какая то проблема в бенчмарке не дает карте показать нормальные цифры. Потребление в 2 раза ниже нормы - отсюда такие цифры плачевные.

У меня работа связана с вычислениями на GPU. Могу сказать, что CUDA и OpenCL позволяют одинаково эффективно выжимать из карт их террафлопсы. У бенча реальные проблемы в эффективности кода. Тут уже соревнование кто быстрей прожует быдлокод.
Впрочем, всем похуй.
RTX3090.png8 Кб, 494x347
345 5839881
>>5839394

>У бенча реальные проблемы в эффективности кода


Нет, тут вопрос в настройке драйверов, если потребление в два раза ниже чем обычная нагрузка, значит что то не дает работать в полную силу. У той же nvidia на сегодня выявлен P2state при отключении которого карта работает как надо. Да код старый и специфичный. Но на сегодня синтетика как синтетика.
Вот к примеру 3090
Если время есть анон, прогони свою карточку последним hashcat'ом.
https://hashcat.net/hashcat/ там и видно будет.
346 5840237
>>5839881
hashcat (v6.2.5) starting in benchmark mode

Benchmarking uses hand-optimized kernel code by default.
You can use it in your cracking session by setting the -O option.
Note: Using optimized kernel code limits the maximum supported password length.
To disable the optimized kernel code in benchmark mode, use the -w option.

hipDeviceGetAttribute(): 1

HIP API (HIP 4.4)
=================
Device #1: AMD Radeon VII, skipped

OpenCL API (OpenCL 2.1 AMD-APP (3354.13)) - Platform #1 [Advanced Micro Devices, Inc.]
======================================================================================
Device #2: AMD Radeon VII, 16256/16368 MB (13695 MB allocatable), 60MCU

Benchmark relevant options:
===========================
--optimized-kernel-enable

-------------------
Hash-Mode 0 (MD5)
-------------------

Speed.#2.........: 30020.4 MH/s (33.26ms) @ Accel:256 Loops:1024 Thr:64 Vec:1

----------------------
Hash-Mode 100 (SHA1)
----------------------

Speed.#2.........: 11509.5 MH/s (87.14ms) @ Accel:64 Loops:1024 Thr:256 Vec:1

---------------------------
Hash-Mode 1400 (SHA2-256)
---------------------------

Speed.#2.........: 4581.7 MH/s (54.66ms) @ Accel:64 Loops:1024 Thr:64 Vec:1

---------------------------
Hash-Mode 1700 (SHA2-512)
---------------------------

Speed.#2.........: 1235.7 MH/s (50.63ms) @ Accel:128 Loops:128 Thr:64 Vec:1

-------------------------------------------------------------
Hash-Mode 22000 (WPA-PBKDF2-PMKID+EAPOL) [Iterations: 4095]
-------------------------------------------------------------

Speed.#2.........: 524.1 kH/s (57.79ms) @ Accel:16 Loops:1024 Thr:128 Vec:1

-----------------------
Hash-Mode 1000 (NTLM)
-----------------------

Speed.#2.........: 49991.7 MH/s (19.87ms) @ Accel:64 Loops:1024 Thr:256 Vec:1

---------------------
Hash-Mode 3000 (LM)
---------------------

Speed.#2.........: 28618.0 MH/s (34.83ms) @ Accel:64 Loops:1024 Thr:256 Vec:1

--------------------------------------------
Hash-Mode 5500 (NetNTLMv1 / NetNTLMv1+ESS)
--------------------------------------------

Speed.#2.........: 30924.9 MH/s (32.26ms) @ Accel:128 Loops:1024 Thr:128 Vec:1

----------------------------
Hash-Mode 5600 (NetNTLMv2)
----------------------------

Speed.#2.........: 2184.2 MH/s (57.18ms) @ Accel:64 Loops:256 Thr:128 Vec:1

--------------------------------------------------------
Hash-Mode 1500 (descrypt, DES (Unix), Traditional DES)
--------------------------------------------------------

Device #2: Skipping (hash-mode 1500)
This is due to a known CUDA/HIP/OpenCL runtime/driver issue (not a hashcat issue)
You can use --force to override, but do not report related errors.

------------------------------------------------------------------------------
Hash-Mode 500 (md5crypt, MD5 (Unix), Cisco-IOS $1$ (MD5)) [Iterations: 1000]
------------------------------------------------------------------------------

Speed.#2.........: 12756.5 kH/s (72.81ms) @ Accel:64 Loops:1000 Thr:256 Vec:1

----------------------------------------------------------------
Hash-Mode 3200 (bcrypt $2$, Blowfish (Unix)) [Iterations: 32]
----------------------------------------------------------------

Speed.#2.........: 13454 H/s (72.30ms) @ Accel:128 Loops:32 Thr:8 Vec:1

--------------------------------------------------------------------
Hash-Mode 1800 (sha512crypt $6$, SHA512 (Unix)) [Iterations: 5000]
--------------------------------------------------------------------

Speed.#2.........: 185.9 kH/s (69.06ms) @ Accel:2048 Loops:512 Thr:64 Vec:1

--------------------------------------------------------
Hash-Mode 7500 (Kerberos 5, etype 23, AS-REQ Pre-Auth)
--------------------------------------------------------

Speed.#2.........: 211.0 MH/s (74.12ms) @ Accel:32 Loops:256 Thr:32 Vec:1

-------------------------------------------------
Hash-Mode 13100 (Kerberos 5, etype 23, TGS-REP)
-------------------------------------------------

Device #2: Skipping (hash-mode 13100)
This is due to a known CUDA/HIP/OpenCL runtime/driver issue (not a hashcat issue)
You can use --force to override, but do not report related errors.

---------------------------------------------------------------
Hash-Mode 15300 (DPAPI masterkey file v1) [Iterations: 23999]
---------------------------------------------------------------

Device #2: Skipping (hash-mode 15300)
This is due to a known CUDA/HIP/OpenCL runtime/driver issue (not a hashcat issue)
You can use --force to override, but do not report related errors.

---------------------------------------------------------------
Hash-Mode 15900 (DPAPI masterkey file v2) [Iterations: 12899]
---------------------------------------------------------------

Speed.#2.........: 29998 H/s (80.91ms) @ Accel:32 Loops:256 Thr:64 Vec:1

------------------------------------------------------------------
Hash-Mode 7100 (macOS v10.8+ (PBKDF2-SHA512)) [Iterations: 1023]
------------------------------------------------------------------

Speed.#2.........: 368.9 kH/s (72.88ms) @ Accel:32 Loops:127 Thr:128 Vec:1

---------------------------------------------
Hash-Mode 11600 (7-Zip) [Iterations: 16384]
---------------------------------------------

Speed.#2.........: 586.8 kH/s (48.74ms) @ Accel:32 Loops:4096 Thr:64 Vec:1

------------------------------------------------
Hash-Mode 12500 (RAR3-hp) [Iterations: 262144]
------------------------------------------------

Speed.#2.........: 74614 H/s (102.36ms) @ Accel:8 Loops:16384 Thr:256 Vec:1

--------------------------------------------
Hash-Mode 13000 (RAR5) [Iterations: 32799]
--------------------------------------------

Speed.#2.........: 58698 H/s (65.14ms) @ Accel:32 Loops:512 Thr:128 Vec:1

-----------------------------------------------------------------------
Hash-Mode 6211 (TrueCrypt RIPEMD160 + XTS 512 bit) [Iterations: 1999]
-----------------------------------------------------------------------

Speed.#2.........: 383.0 kH/s (77.86ms) @ Accel:8 Loops:512 Thr:256 Vec:1

-----------------------------------------------------------------------------------
Hash-Mode 13400 (KeePass 1 (AES/Twofish) and KeePass 2 (AES)) [Iterations: 24569]
-----------------------------------------------------------------------------------

Speed.#2.........: 98082 H/s (52.02ms) @ Accel:256 Loops:128 Thr:64 Vec:1

----------------------------------------------------------------
Hash-Mode 6800 (LastPass + LastPass sniffed) [Iterations: 499]
----------------------------------------------------------------

Speed.#2.........: 3531.1 kH/s (65.40ms) @ Accel:64 Loops:499 Thr:64 Vec:1

--------------------------------------------------------------------
Hash-Mode 11300 (Bitcoin/Litecoin wallet.dat) [Iterations: 200459]
--------------------------------------------------------------------

Speed.#2.........: 5668 H/s (58.88ms) @ Accel:1024 Loops:512 Thr:128 Vec:1

Started: Fri Jan 21 11:32:37 2022
Stopped: Fri Jan 21 11:36:30 2022

>на сегодня выявлен P2state


Честно говоря хз. Порылся в драйвере - подобного ничего не нашел.
346 5840237
>>5839881
hashcat (v6.2.5) starting in benchmark mode

Benchmarking uses hand-optimized kernel code by default.
You can use it in your cracking session by setting the -O option.
Note: Using optimized kernel code limits the maximum supported password length.
To disable the optimized kernel code in benchmark mode, use the -w option.

hipDeviceGetAttribute(): 1

HIP API (HIP 4.4)
=================
Device #1: AMD Radeon VII, skipped

OpenCL API (OpenCL 2.1 AMD-APP (3354.13)) - Platform #1 [Advanced Micro Devices, Inc.]
======================================================================================
Device #2: AMD Radeon VII, 16256/16368 MB (13695 MB allocatable), 60MCU

Benchmark relevant options:
===========================
--optimized-kernel-enable

-------------------
Hash-Mode 0 (MD5)
-------------------

Speed.#2.........: 30020.4 MH/s (33.26ms) @ Accel:256 Loops:1024 Thr:64 Vec:1

----------------------
Hash-Mode 100 (SHA1)
----------------------

Speed.#2.........: 11509.5 MH/s (87.14ms) @ Accel:64 Loops:1024 Thr:256 Vec:1

---------------------------
Hash-Mode 1400 (SHA2-256)
---------------------------

Speed.#2.........: 4581.7 MH/s (54.66ms) @ Accel:64 Loops:1024 Thr:64 Vec:1

---------------------------
Hash-Mode 1700 (SHA2-512)
---------------------------

Speed.#2.........: 1235.7 MH/s (50.63ms) @ Accel:128 Loops:128 Thr:64 Vec:1

-------------------------------------------------------------
Hash-Mode 22000 (WPA-PBKDF2-PMKID+EAPOL) [Iterations: 4095]
-------------------------------------------------------------

Speed.#2.........: 524.1 kH/s (57.79ms) @ Accel:16 Loops:1024 Thr:128 Vec:1

-----------------------
Hash-Mode 1000 (NTLM)
-----------------------

Speed.#2.........: 49991.7 MH/s (19.87ms) @ Accel:64 Loops:1024 Thr:256 Vec:1

---------------------
Hash-Mode 3000 (LM)
---------------------

Speed.#2.........: 28618.0 MH/s (34.83ms) @ Accel:64 Loops:1024 Thr:256 Vec:1

--------------------------------------------
Hash-Mode 5500 (NetNTLMv1 / NetNTLMv1+ESS)
--------------------------------------------

Speed.#2.........: 30924.9 MH/s (32.26ms) @ Accel:128 Loops:1024 Thr:128 Vec:1

----------------------------
Hash-Mode 5600 (NetNTLMv2)
----------------------------

Speed.#2.........: 2184.2 MH/s (57.18ms) @ Accel:64 Loops:256 Thr:128 Vec:1

--------------------------------------------------------
Hash-Mode 1500 (descrypt, DES (Unix), Traditional DES)
--------------------------------------------------------

Device #2: Skipping (hash-mode 1500)
This is due to a known CUDA/HIP/OpenCL runtime/driver issue (not a hashcat issue)
You can use --force to override, but do not report related errors.

------------------------------------------------------------------------------
Hash-Mode 500 (md5crypt, MD5 (Unix), Cisco-IOS $1$ (MD5)) [Iterations: 1000]
------------------------------------------------------------------------------

Speed.#2.........: 12756.5 kH/s (72.81ms) @ Accel:64 Loops:1000 Thr:256 Vec:1

----------------------------------------------------------------
Hash-Mode 3200 (bcrypt $2$, Blowfish (Unix)) [Iterations: 32]
----------------------------------------------------------------

Speed.#2.........: 13454 H/s (72.30ms) @ Accel:128 Loops:32 Thr:8 Vec:1

--------------------------------------------------------------------
Hash-Mode 1800 (sha512crypt $6$, SHA512 (Unix)) [Iterations: 5000]
--------------------------------------------------------------------

Speed.#2.........: 185.9 kH/s (69.06ms) @ Accel:2048 Loops:512 Thr:64 Vec:1

--------------------------------------------------------
Hash-Mode 7500 (Kerberos 5, etype 23, AS-REQ Pre-Auth)
--------------------------------------------------------

Speed.#2.........: 211.0 MH/s (74.12ms) @ Accel:32 Loops:256 Thr:32 Vec:1

-------------------------------------------------
Hash-Mode 13100 (Kerberos 5, etype 23, TGS-REP)
-------------------------------------------------

Device #2: Skipping (hash-mode 13100)
This is due to a known CUDA/HIP/OpenCL runtime/driver issue (not a hashcat issue)
You can use --force to override, but do not report related errors.

---------------------------------------------------------------
Hash-Mode 15300 (DPAPI masterkey file v1) [Iterations: 23999]
---------------------------------------------------------------

Device #2: Skipping (hash-mode 15300)
This is due to a known CUDA/HIP/OpenCL runtime/driver issue (not a hashcat issue)
You can use --force to override, but do not report related errors.

---------------------------------------------------------------
Hash-Mode 15900 (DPAPI masterkey file v2) [Iterations: 12899]
---------------------------------------------------------------

Speed.#2.........: 29998 H/s (80.91ms) @ Accel:32 Loops:256 Thr:64 Vec:1

------------------------------------------------------------------
Hash-Mode 7100 (macOS v10.8+ (PBKDF2-SHA512)) [Iterations: 1023]
------------------------------------------------------------------

Speed.#2.........: 368.9 kH/s (72.88ms) @ Accel:32 Loops:127 Thr:128 Vec:1

---------------------------------------------
Hash-Mode 11600 (7-Zip) [Iterations: 16384]
---------------------------------------------

Speed.#2.........: 586.8 kH/s (48.74ms) @ Accel:32 Loops:4096 Thr:64 Vec:1

------------------------------------------------
Hash-Mode 12500 (RAR3-hp) [Iterations: 262144]
------------------------------------------------

Speed.#2.........: 74614 H/s (102.36ms) @ Accel:8 Loops:16384 Thr:256 Vec:1

--------------------------------------------
Hash-Mode 13000 (RAR5) [Iterations: 32799]
--------------------------------------------

Speed.#2.........: 58698 H/s (65.14ms) @ Accel:32 Loops:512 Thr:128 Vec:1

-----------------------------------------------------------------------
Hash-Mode 6211 (TrueCrypt RIPEMD160 + XTS 512 bit) [Iterations: 1999]
-----------------------------------------------------------------------

Speed.#2.........: 383.0 kH/s (77.86ms) @ Accel:8 Loops:512 Thr:256 Vec:1

-----------------------------------------------------------------------------------
Hash-Mode 13400 (KeePass 1 (AES/Twofish) and KeePass 2 (AES)) [Iterations: 24569]
-----------------------------------------------------------------------------------

Speed.#2.........: 98082 H/s (52.02ms) @ Accel:256 Loops:128 Thr:64 Vec:1

----------------------------------------------------------------
Hash-Mode 6800 (LastPass + LastPass sniffed) [Iterations: 499]
----------------------------------------------------------------

Speed.#2.........: 3531.1 kH/s (65.40ms) @ Accel:64 Loops:499 Thr:64 Vec:1

--------------------------------------------------------------------
Hash-Mode 11300 (Bitcoin/Litecoin wallet.dat) [Iterations: 200459]
--------------------------------------------------------------------

Speed.#2.........: 5668 H/s (58.88ms) @ Accel:1024 Loops:512 Thr:128 Vec:1

Started: Fri Jan 21 11:32:37 2022
Stopped: Fri Jan 21 11:36:30 2022

>на сегодня выявлен P2state


Честно говоря хз. Порылся в драйвере - подобного ничего не нашел.
347 5840381
348 5855307
.
349 5874487
.
350 5882881
.
351 5894783
.
352 5915216
.
353 5926094
.
354 5931582
.
Безымянный.jpg44 Кб, 500x350
355 5934068
356 5944080
.
357 5950327
.
358 5956153
.
359 5962126
.
360 5975483
.
361 5981799
.
362 5989090
.
363 5996144
>>4222227 (OP)

> юзать crarck


Что такое 'crarck' ?
364 5997722
>>5996144

>Что такое 'crarck' ?


https://www.crark.net/
365 5998146
366 6006324
.
367 6014784
.
368 6034029
.
369 6050168
.
370 6056664
.
371 6063769
.
372 6073779
.
373 6073870
>>4368213

> Вместо 10 карт, я позволю себе 1 теслу.


Аналогично и Quadro не нужны в большинстве случаев, поскольку есть RTX 3090 и Titan RTX.
374 6090434
.
375 6102179
.
376 6109732
.
377 6116804
.
378 6131761
.
379 6143154
.
380 6158823
.
381 6168397
.
383 6187528
.
384 6191717
.
385 6201024
Амуда таки починила свой OpenCL в 22.7.1 https://foldingforum.org/viewtopic.php?p=356772#p356772
Овер двойной буст PPD для 6000-й серии.
386 6208307
.
387 6235024
.
2022-10-14123543.png8 Кб, 508x347
388 6235061
>>5634455
Прогнал амперку, правда, фиксы-хуиксы в профиль инспекторе не крутил - итак весьма правдоподобно.
Эксплисит в цп что ли упирается?
RTX3090.png8 Кб, 494x347
389 6237142
>>6235061

>Эксплисит в цп что ли упирается?


Нет. Особенность работы с дравами, про процессор больше юзает, да.

>фиксы-хуиксы в профиль инспекторе не крутил


А зря. Режимы энергосбережения все дела, не дают карте работать в полную с этим тестом.
16585936327240.jpg686 Кб, 1609x1362
390 6243900

> овер 2 года как 22-е Нвидия-ядро переведено на CUDA


> Нвидия давно угандошила OpenCL, зайдя в топ-менеджмент Кронос-Групп и переписав спеки хитрожёпым образом что теперь OpenCL 3.0 теперь можно невозбранно делать со фичерсетом OpenCL 1.3


> ретардии всё продолжали бенчить сдохший OpenCL давно отправленного на пенсию некроядра

flick-artist-Magnus-The-Red-Primarchs-3124583.jpeg160 Кб, 811x377
391 6246310
>>6243900
Да, это так.
392 6255169
.
393 6261575
.
394 6261586
Опчик, а ты всю инфу в табличку складываешь?
Чтобы потом сделать большую картинку с картами, отсортироваными по мощности?
395 6262155
>>6261586

>Опчик, а ты всю инфу в табличку складываешь?


В папку складываю. Ибо по каждой карте нужно более менее усредненное значение найти, потом можно и табличку запилить.
396 6268308
как же этот тред хочет жить
397 6295446
.
398 6301895
.
399 6310270
.
400 6323608
.
401 6328136
.
402 6354406
.
403 6361487
.
404 6386977
.
Тред утонул или удален.
Это копия, сохраненная 19 февраля 2023 года.

Скачать тред: только с превью, с превью и прикрепленными файлами.
Второй вариант может долго скачиваться. Файлы будут только в живых или недавно утонувших тредах. Подробнее

Если вам полезен архив М.Двача, пожертвуйте на оплату сервера.
« /hw/В начало тредаВеб-версияНастройки
/a//b//mu//s//vg/Все доски