НЕЙРОНОЧКИ И МАШОБ ТРЕД №35 - Программирование

Этого треда уже нет.
Это копия, сохраненная 12 мая 2021 года.

Скачать тред: только с превью, с превью и прикрепленными файлами.
Второй вариант может долго скачиваться. Файлы будут только в живых или недавно утонувших тредах. Подробнее

Если вам полезен архив М.Двача, пожертвуйте на оплату сервера.

НЕЙРОНОЧКИ И МАШОБ ТРЕД №35 /ai/ 24 янв, 16:36 1920026 В конец треда | Веб

775 Кб, 1386x881

137 Кб, 200x284

359 Кб, 623x1280

Очередной тред про хипстерские технологии, которые не работают

Я ничего не понимаю, что делать?
Без петросянства: смотри программу стэнфорда CS229, CS231n https://see.stanford.edu/Course/CS229 (классика) и http://cs231n.stanford.edu/ (введение в нейроночки) и изучай, если не понятно - смотри курсы prerequisites и изучай их. Как именно ты изучишь конкретные пункты, типа линейной алгебры - дело твое, есть книги, курсы, видосики, ссылки смотри ниже.

Почему такой фокус на нейронки?
Потому что остальные чистят вилкой данные в банках с помощью LGBTboost и им некогда предлагать обновления в шапку

Какая математика используется?
В основном линейная алгебра, теорвер, матстат, базовый матан и matrix calculus

Как работает градиентный спуск?
https://cs231n.github.io/optimization-2/

Почему python?
Исторически сложилось

Можно не python?
Никого не волнует, где именно ты натренируешь свою гениальную модель. Но при серьезной работе придется изучать то, что выкладывают другие, а это будет, скорее всего, python, если работа последних лет

Что почитать для вкатывания?
http://www.deeplearningbook.org/
Николенко "Глубокое обучение" - на русском, есть примеры, но меньше охват материала
Франсуа Шолле - Глубокое обучение на Python
https://d2l.ai/index.html

В чем практиковаться нубу?
http://www.deeplearning.net/tutorial/
https://www.hackerrank.com/domains/ai
https://github.com/pytorch/examples
https://github.com/ChristosChristofidis/awesome-deep-learning#tutorials

Где набрать первый самостоятельный опыт?
https://www.kaggle.com/ | http://mltrainings.ru/
Стоит отметить, что спортивный deep learning отличается от работы примерно так же, как олимпиадное программирование от настоящего. За полпроцента точности в бизнесе борятся редко, а в случае проблем нанимают больше макак для разметки датасетов. На кагле ты будешь вилкой чистить свой датасет, чтобы на 0,1% обогнать конкурента.

Где работать?
https://www.indeed.com/q-deep-learning-jobs.html
Вкатывальщики могут устроиться программистами и дальше попроситься в ML-отдел

Есть ли фриланс в машобе?
Есть, https://www.upwork.com/search/jobs/?q=machine+learning
Но прожить только фриланся сложно, разве что постоянного клиента найти, а для этого нужно не быть тобой

Где узнать последние новости?
https://www.reddit.com/r/MachineLearning/
http://www.datatau.com/
https://twitter.com/ylecun
На реддите также есть хороший FAQ для вкатывающихся

Где посмотреть последние статьи?
http://www.arxiv-sanity.com/
https://paperswithcode.com/
https://openreview.net/
Версии для зумеров (Килхер): https://www.youtube.com/channel/UCZHmQk67mSJgfCCTn7xBfew

Количество статей зашкваливающее, поэтому все читают только свою узкую тему и хайповые статьи, упоминаемые в блогах, твиттере, ютубе и телеграме, топы NIPS и прочий хайп. Есть блоги, где кратко пересказывают статьи, даже на русском

Где посмотреть must read статьи?
https://github.com/ChristosChristofidis/awesome-deep-learning#papers
https://huggingface.co/transformers/index.html
То, что обозревает Килхер тоже зачастую must read

Где ещё можно поговорить про анализ данных?
http://ods.ai/

Нужно ли покупать видеокарту/дорогой пека?
Если хочешь просто пощупать нейроночки или сделать курсовую, то можно обойтись облаком. Google Colab дает бесплатно аналог GPU среднего ценового уровня на несколько часов с возможностью продления, при чем этот "средний уровень" постоянно растет. Некоторым достается даже V100.
Иначе выгоднее вложиться в GPU https://timdettmers.com/2019/04/03/which-gpu-for-deep-learning/ Заодно в майнкрафт на топовых настройках погоняешь

Когда уже изобретут AI и он нас всех поработит?
На текущем железе - никогда, тред не об этом

Кто нибудь использовал машоб для трейдинга?
Никто не использовал, ты первый такое придумал. Готовь камаз для бабла.

Список дедовских книг для серьёзных людей:
Trevor Hastie et al. "The Elements of Statistical Learning"
Vladimir N. Vapnik "The Nature of Statistical Learning Theory"
Christopher M. Bishop "Pattern Recognition and Machine Learning"
Взять можно тут: http://libgen.io/

Напоминание ньюфагам: немодифицированные персептроны и прочий мусор середины прошлого века действительно не работают на серьёзных задачах.
Предыдущие:
https://2ch.hk/pr/res/1902462.html (

М)
https://2ch.hk/pr/res/1881607.html (

М)
https://2ch.hk/pr/res/1868191.html (

М)
https://2ch.hk/pr/res/1847673.html (

М)
https://2ch.hk/pr/res/1832580.html (

М)
https://2ch.hk/pr/res/1817320.html (

М)
https://2ch.hk/pr/res/1785952.html (

М)
https://2ch.hk/pr/res/1758961.html (

М)
https://2ch.hk/pr/res/1734710.html (

М)
https://2ch.hk/pr/res/1704037.html (

М)
https://2ch.hk/pr/res/1665515.html (

М)

Ответы23142 23636 30601 31153 31704 32829 33783 33918 34031 34802 35065 38145 39151 40808 41109 44533 47112 79141

2 24 янв, 17:00 1920046

Это правда, что тянучки массово вкатываются в дата саенс?

Ответы20853

3 24 янв, 17:02 1920048

Насчёт используемой в машобчике математики, в первом appendix'е https://d2l.ai/index.html есть все нужное.

Ответы20077

4 24 янв, 17:40 1920077

>>20048
Этой математики достаточно, если в кликере работать планируешь.
Тервер заканчивается на матожидании и дисперсии, линал - на умножении матриц.

Ответы20089 20130

5 24 янв, 17:48 1920089

>>20077
Этой математики достаточно, чтобы понять что к чему в алгоритмах машобчика и использовать их хотя бы не методом тыка. Т.е. 100% пользователей, особенно всяким вкатышам, этого за глаза.

Ответы20109 20130 20810

6 24 янв, 18:00 1920109

>>20089
Этой математики достаточно, но освоить ее по одной книжке нереально. Надо поебать мозги задачками

7 24 янв, 18:12 1920130

>>20077
>>20089
А, там ещё Appendix с математикой есть. Тогда ещё более-менее. Математики из preliminaries точно не хватит.

8 25 янв, 10:00 1920810

>>20089
Вкатышам - только за щеку

9 25 янв, 10:39 1920842

10 25 янв, 10:44 1920853

>>20046
Да. Хорошие девочки-отличницы учили статистику и матан. Хули им делать еще в декрете?

11 25 янв, 14:22 1921098

аноны, а насколько работают сетки с облаками точек/кддеревьями и прочим 3д отребьем в контексте pose estimation? Все чаще нахожу инфу, что пока решения очень сырые

Ответы21112

12 25 янв, 14:28 1921112

>>21098

>Все чаще нахожу инфу, что пока решения очень сырые

Дедоотрицания. Всё работает. За сетками будущее.

Ответы21122

13 25 янв, 14:33 1921122

>>21112
а какая из них считается норм для такой задачи?

14 25 янв, 14:42 1921135

бля
короче у меня задача типа определить есть ли объект на картинке или нет, а также его положение
нужна ли мне в таком случае нейронка? или дедовские методы ок справятся? по сути ведь тут нет никакой многоклассовости и пр

Ответы21381

29 Кб, 600x300

15 25 янв, 15:06 1921166

Кто-нибудь работал с предсказаниями (например, будущих продаж по текущим продажам)?
Надо ли шкалировать и признаки, и метки? Или только признаки? А если после шкалирования только признаков они с метками различаются на порядки?

Ответы21381

16 25 янв, 16:59 1921329

аноны
увидел, короче, такую тему как озон мастерс - аля ШАД короче
и возник вопрос
действительно ли такие места дают сильный буст? Действительно ли дело обстоит так, что, если ты не из МФТИ/ШАД/Вышка/ВМК, то тебе нечего делать в областях, связанных в даса сайенсом (нлп, цв, мл и пр)? Я просто работаю в своем маня стартапе цвшником, и думаю, что из-за отсутствия чистого дата саенс образования на рынке труда буду сосать хуй

Ответы21485

17 25 янв, 17:33 1921381

>>21135
Нужны серьезные обоснования чтобы object detection в 2021 решать дедовскими методами. В 99% тебе нужна нейронка, а там смотри на yolo/ssd/faster rcnn/efficientdet.
>>21166
Возьми градиентный бустинг и всё должно заработать из коробки, без шкалирования. Если у предсказываемых значений очень всратые распределения, то можешь попробовать предсказывать их логарифм, но обычно это не нужно.

Ответы21491 21762

18 25 янв, 18:12 1921445

Когда уже мы получим озвученную сеточкой легендарную пасту "Трьтего дня...." ?

Ответы23781

19 25 янв, 18:48 1921485

>>21329
да нет, в целом то
тем более цв - это не совсем классический дс - тут нужно и прогать хорошо, и знать именно алгоритмы. А быть генинем матана не обязательно (хотя хорошую базу иметь надо)

20 25 янв, 18:54 1921491

>>21381

> Нужны серьезные обоснования чтобы object detection в 2021 решать дедовскими методами.

И чо терь, чтобы найти белое гавно на черном фоне, нейронку обучать?

21 25 янв, 19:28 1921539

Кстати, на тему тупых дедов, не принимающих Прогресс.
Большая половина статей по рекомендациям с использованием диплёрнинга не воспроизводятся, а те что воспроизводятся побились обычными эвристиками и дедовскими методами https://arxiv.org/pdf/1907.06902.pdf

Ответы21884

22 25 янв, 22:52 1921762

13 Кб, 445x285

18 Кб, 433x286

>>21381

>Возьми градиентный бустинг и всё должно заработать из коробки, без шкалирования.

Получилась какая-то херня.

Ответы26584

23 26 янв, 01:47 1921840

Сяп, хз где писать, напишу здесь. Есть кафка с дохуя транзакций по игрекуча разных ивентов от разных игроков. Нужно сообразить модель для аномали детекшн и приблизительно на чём её можно построить тех. решение для её реализации. Я не ленивая свинья и в гугле не забанили, но попрошу помощи и здесь, есть ли у кого может примеры реализации.
инб4: ленивый дебил вкатышь

24 26 янв, 05:41 1921884

>>21539
Весь современный машоб это либо прямо достижение дедов из 50-60х, либо их развитие. Бустинг это теория статистического обучения, сверточные сети, и весь диплернинх таким образом, это структура по типу зрительной коры кошки, Нобелевская премия Хьюбела и Визеля, мультихед аттеншен это кернел регрессия Надарайи - Уотсона на максималках, трансформеры это дальнейшее развитие сетей Хопфилда итд. Градиентный спуск туда же. Все это - середина прошлого века.

Ответы21908 21911

25 26 янв, 08:01 1921908

>>21884
то есть есть и реально крутая хуйня, а не эти сверточные распознавалки?, ну я догадывался конечно, хуево это как то, тем более у корпораций такие ебанутые мощности вычислительные.

26 26 янв, 08:10 1921911

>>21884
Умножение и сложение - древние египтяне. Весь машоб - достижения 5000летней давности

Ответы21926

27 26 янв, 08:43 1921926

>>21911

> Умножение и сложение - древние египтяне. Весь машоб - достижения 5000летней давности

Так глубоко копать смысла нет. Я и не об этом. История машобчика идёт по спирали, одни и те же идеи воплощаются на разных уровнях развития железа и софта. Поэтому, кукареканья "Х - устаревшее дедовское говно" есть бред. Просто пока применения не нашлось / ньюфаги не знают, олдфаги забыли / т.д и всё. Никуда от теорем Жопеншмульцера не уйти. Сойбои - дебилы, в отличие от дедов, поэтому ничего нового создать не способны. Я уже говорил, в 60е этой темой занимались академики, сейчас - всякий сброд с петушиными бородами. Итог немного предсказуем.

Ответы21944 22826

28 26 янв, 09:44 1921944

>>21926

>История машобчика идёт по спирали, одни и те же идеи воплощаются...

Только если натягивать сову на глобус.

>Итог немного предсказуем.

Итог - ты копротивляешься и орёшь "ваш прогресс не прогресс, ганы изобрели в 1963"

Ответы22087

233 Кб, 1200x781

29 26 янв, 12:42 1922087

>>21944

>ваш прогресс не прогресс, ганы изобрели в 1963

Тот анон прав, наш прогресс это какие то всратые котики и дипфейки, где что нибуть практическое и полезное хотя бы уровня MYCIN?

Ответы22139 22826

30 26 янв, 13:29 1922139

>>22087

>практическое и полезное

>хотя бы уровня mycin

Если оно настолько практическое и полезное, то почему про него забыли буквально через пару лет. Литералли ничем не отличается от какого-нибудь IBM watson.
От DLSS больше практичности и пользы будет.

Ответы22183

31 26 янв, 14:14 1922183

>>22139

>то почему про него забыли

Потому, что медикипедики прихуели и начали торпедировать проджек, ты почитал бы как у докторов пердаки подорвало от того что их могут пидорнуть на мороз

Ответы22211

32 26 янв, 14:25 1922211

>>22183
Хуйня это всё. Можешь ты представить, чтобы медики или вообще кто угодно мог хотя бы требовать прикрыть гпт3, 4? Это бред ебучий.

Ответы22265

33 26 янв, 14:57 1922265

>>22211

> гпт3, 4?

Так это говно никому конкуренцию не составляет, помнишь как чувак на коленке написал приложуху которая составляет типовые судебные иски и как разорвало пердаки у пендоюристов?

34 26 янв, 18:42 1922466

анончики, подскажите плез
короче 4 года работал байтоебом в цв (писал на микроконтроллерах зрение промышленного софта - в основном в задачах object detection дедовскими методами)
Сейчас хочу перекатиться в современный цв с сетками и блекджеками
Прошел курс от самсунга по зрению (и по обработке текстов), так что приблизительно понимаю о чем речь, но нужна хорошая практика
Отсюда вопрос: посоветуйте плз, какой проект по зрению можно запилить, чтобы лучше прочуствовать нейроночки (а то на котиках да мнисте итак все понятно), да и чтобы работодателю было бы интересно со мной поговорить
Алсо, если сможете такой же совет дать по nlp, то буду благодарен) тк, несмотря на бекграунд, тема тоже интересная
спасибо)

Ответы22768 22825

35 26 янв, 18:47 1922471

привет, аноны
я тот чел, который уже писал про задачу распознавания в облаке точек кубиков
короче тема такая: я реализовал определение ориентации облака точек (напомню, что у меня камера стоит сверху и снимает кубики\прямоугольники) через РСА
но чет задумался: а собственные вектора ковариационной матрицы прям честно дают мне локальные х у и з кластера? По идее ведь ничего общего с внешней системой координат х у и з эти оси не имеют, тк они всего лишь вектора, на которые дисперсия максимальна
Значит по идее, я ведь не могу их считать полноценными осями ориентации объекта? А то что заработало, выходит, не более чем удачный набор данных
Я прав?

Ответы22822

36 26 янв, 21:21 1922601

Антоны, какие нейронки сейчас можно использовать для парсера языка? Нужно обрабатывать предложение и разбирать его на части речи, частицы и все прочее.

Ответы22719 22720

37 26 янв, 23:16 1922719

>>22601

>Нужно обрабатывать предложение и разбирать его на части речи, частицы и все прочее.

Соснешь, тебе нужен морфологический анализатор хуяндекса https://yandex.ru/dev/mystem/
Ну или васянский PyMorphy

23 Кб, 764x188

38 26 янв, 23:16 1922720

>>22601
Литералли любые seq2seq. Для русского предобученную придется поискать, но английский берт для pos-теггинга ищется за 3 секунды.
https://huggingface.co/vblagoje/bert-english-uncased-finetuned-pos

Ответы22721 22971

39 26 янв, 23:18 1922721

>>22720

>берт

Лол, это же говно даже для английского

Ответы22723

40 26 янв, 23:23 1922723

>>22721
Мне всё за тебя искать?

Ответы22724

41 26 янв, 23:26 1922724

>>22723

>искать

Это говно даром не нужно

42 27 янв, 00:06 1922768

>>22466
очевидный kaggle, сейчас там есть несколько сорев по CV

43 27 янв, 01:12 1922807

аноны, какие видите перспективы нлп в следующие лет 5-10?

Ответы22809

44 27 янв, 01:19 1922809

>>22807

>нлп в следующие лет 5-10

Оч туманные, нейроговно с ним не справляется, а все типа
https://www.link.cs.cmu.edu/link/
не модно

Идет целенаправленной отвод прогрессивных разработок, который заменяется модными и хайповыми штуками. Иллюзия.

Ответы23031

45 27 янв, 01:57 1922822

>>22471

> то что заработало, выходит, не более чем удачный набор данных

Ну кубик как раз и есть удачный набор данных.
Если бы у тебя были шестиугольники, то PCA бы уже не помог

46 27 янв, 01:59 1922825

>>22466

>Отсюда вопрос: посоветуйте плз, какой проект по зрению можно запилить, чтобы лучше прочуствовать нейроночки

super resolution с помощью собственного датасета

>Алсо, если сможете такой же совет дать по nlp, то буду благодарен

зафайнтюнь что-нибудь

47 27 янв, 02:03 1922826

>>21926
>>22087

>Тот анон прав

Нечеткий, ну мы же знаем, что ты тут семенишь

48 27 янв, 09:26 1922971

>>22720
Я знаю про берт, думал, может что новее выпустили уже

Ответы23203

49 27 янв, 11:21 1923031

>>22809
рили? я думал, что как раз-таки нейроночки новую жизнь всему этому дали

Ответы23211

50 27 янв, 12:35 1923076

Анончики, есть тут кто-нибудь, кто внедрял аналитику и мл в бизнес, сидя на другой должности?

У меня ситуация следующая. Работаю маркетолухом, нет, не дрочилой яндекс-метрики в хипстерском стартапе. В нашей нише вообще контекстной рекламы и таргета нет. Тут дедовский маркетинг с наружной рекламой, мерчом и акциями 2 говна по цене 3.

Люблю копаться в циферках, постоянно ковыряю эксель. Умею в панды, склерн, все вот эти катбусты, более менее в статистику, когда-то мог поворочать датасетами и модельками на R, но уже все забыл. В нейросети пока не могу (да и не хочу особо). Хочу намекнуть кабанчику, что можно взять большие данные и на их основе делать выводы. Но пока руководитель отдела не дает этим заниматься и постоянно грузит какой-то хуйней, начиная от "посмотри акции конкурентов" и заканчивая "надо коробки в архив отнести".

С чего у вас в компании начиналось внедрение аналитики? В какую сторону смотреть в первую очередь и какие мл-инструменты в первую очередь реализуют в бизнесе. Из подручных средств есть разраб, занимающийся сайтами, но много чего помимо веба умеющий. Ну и говнобаза на 1С.

Ответы23095 23646 24068

51 27 янв, 12:53 1923095

>>23076
тебе такое в ods надо

52 27 янв, 13:28 1923142

>>20026 (OP)
Сап
Подскажите есть ли универсальные гайды по работе с дейтой любой?
Допустим у нас есть пара таблиц числовых данных (не важно что это за данные). Что можно с ними сделать использую питон, пандус и прочие библиотеки. Мне на ум приходит только корреляция каждого из столбов друг с другом.

Ответы23170 23209 23254

53 27 янв, 13:43 1923170

>>23142

А цель какая? Ты хочешь модель построить?

Ответы23180

54 27 янв, 13:48 1923180

>>23170
Цель - из набора цифр получить данные.
Вопрос именно про работу с дейтой, не про нейронки и модели.

Ответы23186 23197

55 27 янв, 13:55 1923186

>>23180
Пришли хоть скрин, а то "как из данных получить данные"

Ответы23294

56 27 янв, 14:01 1923197

>>23180
Тебе надо понять, какая колонка чему соответствует?

Ответы23294

57 27 янв, 14:04 1923203

>>22971
Так открой хаггинфейс и посмотри, что ещё есть

58 27 янв, 14:10 1923209

>>23142
Тебе нужен data mining. Гугли, конкретных алгоритмов полно, как и готовых инструментов.

Ответы23294 24065

59 27 янв, 14:13 1923211

>>23031
Это местный шизик, не обращай внимание

60 27 янв, 15:11 1923254

>>23142
Можешь кластеризацию ебануть

Ответы23294

61 27 янв, 15:41 1923294

>>23186
>>23197
>>23209
Представь таблицу с данными. В ней 4 столбца (или колонки) - a,b,c,d. В каждом из них floats, то бишь числа. И ты хочешь из этого непонять чего найти что-то интересное. Например вдруг окажется что a(d) на промежутке от [n,k]. Я о таких вещах.
>>23254
Ебанул тебе регрессий по башке.

Ответы23492 23500

62 27 янв, 17:24 1923492

>>23294

> Например вдруг окажется что a(d) на промежутке от [n,k]. Я о таких вещах.

И как ты это себе представляешь для произвольного датасета? Чтобы выявить что y = f(x), нужно ко всем парам элементов датасета применить все возможные f с оценкой каждого результата. Не считая того, что возможны варианты с композициями функций, тогда придется считать что-то типа y = fn(fn-1(...(f(x)...) + как-то сортировать результаты, короче, ты какую-то неведомую хуйню хочешь с запредельной вычислительной сложностью.

63 27 янв, 17:26 1923500

>>23294
Присылай датасет, будем ковырять всем форумом

64 27 янв, 19:37 1923636

>>20026 (OP)
Кокие там в ИИ достижения в 2021?

Ответы23743 23874 24008

65 27 янв, 19:41 1923646

>>23076
Ну это сильно зависит от твоего босса. Работал в финансах и околофинансах. На одной из моих позиций босс запрещала использовать VBA, потому что мол "ты съебешь, а поддерживать это никто не сможет, много работы - передай на подчиненных" не говоря уже про BI-системы, более серьезную автоматизацию и моделирование. В таком случае я просто не афишировал, а просто делал для себя - если видел, что могу сэкономить время свое / коллег, например, или извлечь еще какую-то ценность. А в другом месте боссу самому были интересны такие приколы и он меня дергал, мол "а можешь вот наших клиентов на кластеры разбить, есть же алгоритмы специальные".
Т.е. в определенных случаях, даже если ты сможешь продемонстрировать ценность чего-то (моделирования \ автоматизиции \ интерактивных отчетов), человек на это не пойдет из-за
1. собственного консерватизма
2. нежелания самому потом хотя бы поверхностно разбираться в том, что ты там наворотил (потому что руководитель должен)
3. опасений, что ты съебешь и придется прикрыть эту активность из-за того, что в команде не найдется тех, кто будет в этом шарить и придется упразднить какую-то связанную с этим активность / отчет, к которым вышестоящее начальство успеет привыкнуть. Соответственно твоему руководителю придется держать ответ за это или искать человека со скиллами, которых у самого твоего руководителя нету - соотвественно при найме ему будет трудно их оценить у претендента на должность

66 27 янв, 20:52 1923702

Насколько хорошо трансформер будет игнорировать опечатки в словах если не брать в расчёт эмбеддинги?

67 27 янв, 21:22 1923743

>>23636
DALL-E
Нашли ошибку в реализации алгоритма 2013 года.
Новая сота на imagenet с использованием мета-псевдолейблинга на неразмеченных данных, лучше предыдущей sota и по качеству, и по времени сходимости.
Это только за январь.

68 27 янв, 21:58 1923781

>>21445
Для голоса самое важное это желание голосоделов. Несколько часов гоблопидора на руках, теперь надо обучить

69 27 янв, 22:46 1923852

Чего делать с бустингами когда любая фича может быть наном, при этом в тренировочных данных естественно не все такие случаи отражены? Если типа "аугментировать", размножая строки и рандомно заменяя фичи на наны получается слабая фигня.

Ответы23958

70 27 янв, 23:01 1923874

>>23636
4 недели ещё не прошло, ты о чём?

71 28 янв, 01:09 1923958

>>23852
Заполнять наны очевидно, и в train и в test.
Иногда ты можешь грубо прикинуть какое именно значение в нанах - если хорошо знаешь данные с которыми работаешь (например, помнишь, что до года n столбец m не заполнялся - и тупо заполняешь годом n-1).
Иногда ты можешь понять из датасета или особенностей сферы (в каких-то случаях, например, nan корректно заменить на 0).
Можешь попробовать заполнять построив по модельке для каждого столбца с наном, даже тупо регрессией.
Или поставить какое-нибудь чиловое значение (если это числовой столбец), которое будет явно экстремальным для данного столбца - GLM это бы поднасрало, а для всяких деревьев решений и бустингов будет приемлимо.

77 Кб, 650x254

72 28 янв, 03:12 1924008

>>23636
switch transformer

Ответы24574

81 Кб, 628x752

73 28 янв, 09:12 1924064

Ну спасибо, Абу.

Ответы24191

74 28 янв, 09:17 1924065

>>23209
ну и пиздец. и ведь постоянно кто-то пишет советы уровня нейросети.

75 28 янв, 09:25 1924068

>>23076
Раз времени мало, может ты и есть идеальный клиент для Orange и Knime ?

в Orange есть простой виджет outliers - загрузил клиентов - вот тебе и первая выгода (c)
Любой классификатор позволяет вычислить расхождение с предсказанием - это быстрая выборка нестандартных клиентов/контрагентов - вот и вторая выгода.
Тексты сайтов-доноров рекламы спарсил, загнал в bag of words, прикрепил эффективность по логистической регрессии, посмотрел важные слова - вот и третья выгода (но откровенно говоря, выглядит очень уж наивной моделью)

Тут местные илитарии не любят Orange, потому что он обесценивает их макакичную работу по копированию питон-мануалов из Гугла. Но ты то должен понимать суть.

Ответы24076 27200 27211 27213

76 28 янв, 09:51 1924076

>>24068

>Тут местные илитарии не любят Orange, потому что он обесценивает их макакичную работу по копированию питон-мануалов из Гугла

Шиз, опять ты выходишь на связь? Orange, как и любое GUI-говно, создает больше проблем, чем решает.

Ответы24197

77 28 янв, 12:20 1924191

>>24064
чо делать если пайтон знаешь норм а инглиш ниже среднего блять...

Ответы24200 24201

78 28 янв, 12:28 1924197

>>24076
тебе при трудоустройстве создает больше проблем. И конфузирует новичков-вкатывальщиков.

А людям Orange строить и жить помогает!

79 28 янв, 12:28 1924200

>>24191
Учи инглиш

80 28 янв, 12:29 1924201

>>24191
вообще-то дохрена книг переводится.
Но давай чтобы не провоцировать илитариев, предложу
читать Николенко. Ведь это единственный российский ученый написавший книгу , которая, очевидно, не могла быть испорчена переводом.

Ответы24211

35 Кб, 461x414

81 28 янв, 12:42 1924211

>>24201

> вообще-то дохрена книг переводится.

Проблема в том, что они устаревают быстрее, чем переводятся. Предметная область такая, ничего не поделаешь. Единственный путь тут - постоянно обновляемые онлайн учебники типа https://d2l.ai/index.html В 2021 не знаешь англюсика = официально неграмотный, без вариантов.

Ответы24214 24293

82 28 янв, 12:45 1924214

>>24211

>Единственный путь тут - постоянно обновляемые онлайн учебники

По ссылке "современные сверточные сети" заканчиваюся на densenet (16 год). Ничем не отличается от любого другого учебника того же времени.

Ответы24227

83 28 янв, 13:11 1924227

>>24214
А что в свертках с денснетов с тех пор вышло? Squeeze and excite?

Ответы24714

117 Кб, 820x675

84 28 янв, 14:48 1924293

>>24211

>Проблема в том, что они устаревают быстрее, чем переводятся.

Ты кого тут ебать собрался?

И кого же наш гипотетический вкатывальщик, не понимающий азов статистики, собрался обгонять? Пятерочку и гарвардских профессоров?

Ответы24299

85 28 янв, 14:51 1924299

>>24293
это моя свалка, но вот Шпигелхалтер и Уэс Маккини 2020 реально полезные и охуенные.

Ответы24524

86 28 янв, 17:54 1924466

Bitterlesson это круто! Это так же круто, как наконец купить сто сникерсов (I trust you).

87 28 янв, 18:43 1924524

>>24299
Спасибо за подгон

88 28 янв, 19:58 1924570

Анчоусы, нужна помощь. Есть временной ряд из 4 переменных с шагом в 24 часа. Как по одной записи получать прогноз на следующие 12 дней по изменению этих 4 параметров? Это возможно или нужно для каждого по отдельности делать модельки?

sage 89 28 янв, 20:02 1924574

>>24008
Вроде недавно общели FPGA трансфоремеры?

90 28 янв, 22:36 1924714

>>24227
В том числе и SaE.
Ещё split-transform-merge (resnext), depthwise separable convolutions (мобайлнет), архитектурный поиск (efficientnet).

Ответы24761

91 28 янв, 23:35 1924761

>>24714

>split-transform-merge (resnext)

Хуитка

> depthwise separable convolutions

Топчик

>efficientnet

Хуита теоретическая

В целом по мне эти вещи не достойны учебника. Так, пару параграфов может.

Вообще по мне изучать лучше UNet и производные fully convolutional сети, а классификаторы уже унылы и в целом уже на этапе resnet довольно неплохие

92 29 янв, 22:00 1925592

>>1903293 →
Анон, у тебя получилось что по эмбеддингам? Хочу попробовать с DETR OCR модель сделать.

93 30 янв, 03:00 1925735

антоны, есть ли тут кто из cv? В этом году защищаю диплом по зрению и хочу пойти на работу в эту область (до этого работал в бэке), но часто слышу, что работа в цв это просто "ну вот у нас модель работает на 80 процентов точность, накидай еще данных шоб повысить" и так все время. Будешь делать что угодно, кроме самого цв, а моделька будет та, которую деды выбрали лет 10 назад и менять ее не нужно
Так еще у себя в видео Антоха Мальцев говорил (не знаю, катируется ли он на двачах или нет)
Это так или знакомым по ебалу за такую дезу дать?

Ответы25760

94 30 янв, 06:06 1925760

>>25735

>работа в цв это просто "ну вот у нас модель работает на 80 процентов точность, накидай еще данных шоб повысить" и так все время. Будешь делать что угодно, кроме самого цв, а моделька будет та, которую деды выбрали лет 10 назад и менять ее не нужно

Не понимаю проблемы. Ты можешь параллельно подбирать другую модель даже если тебе не говорили это делать. Получишь точность лучше - придешь к своему тимлиду, покажешь модель, и скорее всего ее запустят в прод. Только вот я тебе гарантирую, что через год работы у тебя пропадет весь энтузиазм, и ты будешь работать по минимуму.

Ответы25902

95 30 янв, 12:50 1925902

>>25760
Вот и вопрос
Стоит ли туда идти вообще? я ведь хочу не хуйней страдать а работать

Ответы25964

96 30 янв, 13:46 1925964

>>25902

>не хуйней страдать а работать

Трясун начал что то подозревать

Ответы26023

97 30 янв, 14:27 1926023

>>25964
че?

98 30 янв, 17:12 1926247

Есть полтора года до выпуска. Как лучше всего вкатиться?

Ответы26519

99 30 янв, 21:10 1926519

>>26247
Что нравится, туда и вкатывайся. Всё равно будешь в итоге другим заниматься.

100 30 янв, 22:14 1926581

У меня есть домашняя машина, к ней по ssh подключаюсь с ноута иногда и запускаю Жупитер Блокнот. Ну и по прокинутому порту уже захожу в браузере на ноутбуке. Там и работаю, но когда нужно поставить что-то на обучение, то после закрытия соединения эта хреновина потом фиг даст посмотреть прогресс. Открываю его заново, захожу на сайт, но информация в окошках вывода старая, не обновляется и вообще Жупитер не подает признаков, собственно, обучения модели. Что делать? Можно, конечно, просто писать питоновские скрипты с модельками, как белый человек, и запускать их фоном, тогда их выполнение точно не останавливается, но как тогда узнать прогресс обучения?

Ответы26786 26843

71 Кб, 473x521

101 30 янв, 22:19 1926584

>>21762
Бамп вопросу.

Ответы26781

102 31 янв, 10:39 1926781

>>26584
Что за говно происходит? "Будущие значения по прошлым через градиентный бустинг"?
В чем твоя идея? Что на что похоже?
Какие были выбраны фичи и какой y?

Пиздец, элитарные трясуны в худшем виде. Термины увидел и сразу их в код написал и получил мусор?

Ответы26988

103 31 янв, 11:00 1926786

>>26581
Попробуй вкладку браузера не закрывать. Там какая-то хитрая штука с этим.

Ответы26829

104 31 янв, 12:22 1926829

>>26786
Да, это работает. Но как тогда разработку ведут в крупных компаниях? Читал еще, что удаленный интерпреттор подключают по тому же ssh к pyCharm, но он за деньги, а пиратить не хочется.
В общем, пока что для экспериментов тунель ssh + Жупитер , а для долговременных вычислений: засовывание модели в .py . Но геморно это все как-то, должно быть готовое решение.

Ответы26831 26846

105 31 янв, 12:22 1926831

>>26829
PyCharm PROFFESSIONAL
*fix

106 31 янв, 12:36 1926843

>>26581
Vnc/rdp/nomachine-nx/teamviewer/etc

107 31 янв, 12:40 1926846

>>26829

> Но как тогда разработку ведут в крупных компаниях?

комп включил оставленным и пошел. назавта пришел. как, как, блять...
tensorboard какой-нибудь еще есть.

Да по сути это и не разработка, а черновой поиск решений. Разработку кодомакаки ведут.

есть запусти man screen, если дружишь с консолью и ipython

64 Кб, 433x601

108 31 янв, 15:13 1926988

>>26781
Есть фейкопочта?

Ответы27078

109 31 янв, 15:51 1927035

Аноны, загорелся датасаенсом, реально переключиться с веба, если в матане вообще околонулевой? Имею ввиду задрочить математику до необходимого уровня самому или это реально только при вузике сделать?

Ответы27372 27377 27382 27560

53 Кб, 811x608

110 31 янв, 16:13 1927078

>>26988
нет, конечно. О чем мне общаться с фейкопрограммистом?

Иди, блядь, снимай ролики о том как ты вкатываешься и имитируйте там вместе датасаспенс в камертах.
Люди делом заняты.

Тебе просто написал кто-то довольно общее (и верное) замечание, о том, что градиентный бустинг не требует шкалирования. Никто не обещал что что-то получится.

Ответы27091 27455

111 31 янв, 16:34 1927091

>>27078
Извини, пропустил на треде табличку "Только для опытных датасаентистов, чье ЧСВ не пролазит в тред".

>Люди делом заняты.

Как скажешь.
Не забудь вовремя поливать дерево, на котором специалисты растут.
Всего хорошего.

Ответы27093 28769

112 31 янв, 16:40 1927093

>>27091

>Не забудь вовремя поливать дерево, на котором специалисты растут.

а я и поливаю:
выкладывай всю историю своих страданий публично чтобы тебе могли помочь публично и чтобы опытные датасаентисты повысили свое ЧСВ.
нахрена им твоя фейкопочта?

Ответы27105

113 31 янв, 16:49 1927105

>>27093

>выкладывай всю историю

Подразумевая, что тут же появятся толпы желающих помочь.

>нахрена им твоя фейкопочта?

Потому что итт заняты по большей частью мерянием пиписьками старые технологии/новые технологии, предсказанием где будет машобчик через 5 лет и вопросами типа "сап, решил вкатитья в машоб".
Не особо хочется разбавлять эту атмосферу своими проблемами и вопросами.

Ответы27112

114 31 янв, 16:51 1927109

Ну и какого хуя антоху подрезали, он был о делу вообщето. Моча соевая пригоревшая.

115 31 янв, 16:53 1927112

>>27105
а было бы неплохо.
заебали своим SOTA от Жопеншмульцера.
Конкретная задача (предположительно) решаемая градиентными деревьями показывает из чего на самом деле состоит машоб.

Ответы27169

116 31 янв, 17:45 1927169

>>27112
У меня есть набор временных рядов (пик1).
Признаки я почистил, посмотрел корреляцию, выделил значимые, проверил на стационарность тестом Дики-Фуллера, убрал у некоторых нестационарность, посмотрел автокорреляцию, добавил новых признаков в виде лагов (пик 2). Где значения 900+ - это целевой результат.
Поделил данные через TimeSeriesSplit, засунул в линейную регрессию, случайный лес, xgboost, а у меня везде примерно получается пик3. А должен быть пик4.
Что может быть не так?

Ответы27311 28292 33500

117 31 янв, 18:14 1927200

>>24068
Погуглил оранж. Это вообще законно?

253 Кб, 543x543

118 31 янв, 18:24 1927211

>>24068

>не любят Orange, потому что он обесценивает их макакичную работу

РИСОВАТЬ РАНДОМФОРЕСТЫ В ТЕТРАДКЕ ВАЖНО

ЭТО ДРУГОЕ

119 31 янв, 18:28 1927213

>>24068
Суть я более-менее понимаю, не могу именно вытянуть полезное для бизнеса. Посчитать и модель построить я могу, не знаю вот только нахуя

Ответы27219 27315

120 31 янв, 18:34 1927219

>>27213
А в Единственном русскоязычном курсе по Оранж об этом рассказывают. Рассказываю нахуя. Начинают с CRISP-DM. Дают всякие исторические примеры и тд. Представляешь?

А у Жопенцмуллеров сразу питон и керас.

Ответы27223

121 31 янв, 18:37 1927222

Посочувствуйте курс или книжку по статистике (не Жопеншмульцера)

Ответы27224 27561

122 31 янв, 18:38 1927223

>>27219
Спасибо, анон. Теперь хоть знаю, в какую сторону гуглить. А то вокруг одни душные деды с их матаном

123 31 янв, 18:38 1927224

>>27222
карпов на степике

Ответы27305 27561

124 31 янв, 20:16 1927305

>>27224
Это тот которого обоссали настолько, что он вынужден был переснимать курс в прошлом году? Ну такой себе совет

Ответы27307 27559

125 31 янв, 20:18 1927307

>>27305
За что был обоссан, кроме ЦПТ?

126 31 янв, 20:25 1927311

>>27169

> У меня есть набор временных рядов (пик1).

Ну так и сделай pip install fbprophet.

Вообще плохо понимаю как ты мыслишь и с чего тут xgboost должен был дать что-то полезное кроме шума.

У prophet нет признаков. Он на основе сезонности себя рисует ряд.

Ответы27326

127 31 янв, 20:28 1927315

>>27213

> Суть я более-менее понимаю, не могу именно вытянуть полезное для бизнеса. Посчитать и модель построить я могу, не знаю вот только нахуя

А ты не пиздишь? Не понятно как такие люди возникают. Ты математик в вакууме?

Ответы27335

128 31 янв, 20:43 1927326

>>27311

>Вообще плохо понимаю как ты мыслишь и с чего тут xgboost должен был дать что-то полезное кроме шума.

Какава примерама такава решенияма.
Вот тут, например, регрессии используются для решения схожих задач:
https://towardsdatascience.com/5-machine-learning-techniques-for-sales-forecasting-598e4984b109
И вот тут, как не посмотришь, регрессии с randomforest'ами, xgboost'aми и прочими LGBM'ами:
https://www.kaggle.com/c/walmart-recruiting-store-sales-forecasting/code
https://www.kaggle.com/c/competitive-data-science-predict-future-sales/notebooks

>prophet

Т.е. baseline не нужен? Делать так?
От стационарности тоже отказаться?

Ответы27339

129 31 янв, 20:57 1927335

>>27315
Научили так. Хуевертить фичами и моделями умею, сделать полезно нет

130 31 янв, 21:11 1927339

>>27326

>Вот тут, например, регрессии используются для решения схожих задач:

https://towardsdatascience.com/5-machine-learning-techniques-for-sales-forecasting-598e4984b109

И закончили они на дедовской ARIMA, которая и выигрывает.
И ты ееможешь в prophet получить.

по поводу остального не знаю и не готов за тебя вычитывать насколько хорошо повторил Кагл.

131 31 янв, 22:07 1927372

>>27035
Там математики на полтора месяца тебе.

Ответы27377 27382

132 31 янв, 22:10 1927377

>>27372
>>27035
Потому что то, что машиннообучаторы называют математикой, к математике имеет мало отношения. Это инженерно-алгоритмически-вычислительная хуита, а не математика.

Ответы27549

133 31 янв, 22:17 1927382

>>27035
>>27372
Хотя я хуй его знает, конечно, какие у тебя там способности.

134 31 янв, 23:37 1927455

>>27078
Ты уже можешь больше 80% треда

135 1 фев, 06:27 1927549

>>27377

> машиннообучаторы называют математикой, к математике имеет мало отношения.

Ты модульный петух чтоле? Математика это, успокойся да выпей ещё этих таблеток.

Ответы27550 27811

136 1 фев, 06:42 1927550

>>27549
Импортировать катбуст для решения титаника на кагле это не математика

137 1 фев, 07:48 1927559

>>27305
Для вката достаточно, остальное сам нагуглит. Отличать нормальное распределение от слона в удаве можно научиться и у Карпова. Тут не надо иметь глубинные знания о решениях уравнений по теореме Пьера д'Ачелло-Сосницкого

Ответы27561

138 1 фев, 07:51 1927560

>>27035
Задрачивай статистику. Можешь еще пару видосов про линал посмотреть, чтобы знать, что такое вектор.

на самом деле, значительная часть терминов во всей этой хуйне, который мы занимаемся - это матеша за 10-11 класс, но длинными умными словами

325 Кб, 900x900

139 1 фев, 08:13 1927561

>>27222

> Посочувствуйте курс или книжку по статистике (не Жопеншмульцера)

Какая тебе статистика, зумер, ты шапку осилить не можешь. https://d2l.ai/index.html первый appendix. Там все, нужное для машоба, не только статистика.
>>27224
>>27559
Ноунейм параша без задач.

140 1 фев, 13:48 1927811

>>27549
Да там и "прикладной" математики не особо.

141 1 фев, 17:36 1928131

поцоны
иду через неделю на собес по зрению
что могут спросить? На какие моменты обратить внимание?

Ответы28168 28753 30366

142 1 фев, 18:23 1928168

>>28131
в последней строчке написано ИМШЫНБМК

Ответы28244

143 1 фев, 19:19 1928244

>>28168
ну от анонов этого треда я ничего и не ожидал особо
рил самый душный тред

Ответы28264

144 1 фев, 19:33 1928264

>>28244
так вы бесите своим наивным подходом к довольно сложной области.

Ответы28277

145 1 фев, 19:46 1928277

>>28264
мань, по порядку
1) поинтересовать какие вопросы могут быть на собесе - это не "наивный" подход. Почему-то в ods нормально отвечают на такие вопросы, хотя они тоже варятся в этой (о боже) сложнейшей области за пределами человеческого понимания
ты там не МФТИ заканчивал? У них все, как и ты, ассоциальные
Можно просто написать пару примеров что у тебя лично спрашивали или что спрашивали у друзей и не выебваться (или помолчать)
2) > довольно сложной области
тебе либо 15, либо ты просто зарвавшийся какой-то
в программировании все области сложные. Я абсолютно уверен, что написание многопоточных прилог на с++ не сильно проще клепания моделей в жупитере

Ответы28278 28341 28388

146 1 фев, 19:48 1928278

>>28277
мимо не ОП вопроса

147 1 фев, 20:04 1928292

>>27169
Анончик, очень сложно подсказать тебе, если ты боишься конкретно сказать, что у тебя за данные и что за задача. Вот например нихуя непонятно, что ты хотел сказать под "А должен быть пик4." - пик 4 это твой таргет?

Судя по твоим постам, ты пытаешься предсказывать некие временные ряды с некоторым количеством внешних переменных. Хорошо, что ты сделал тесты на стационарность и смотрел автокорреляцию. Для бейслайна я бы предложил тебе SARIMAX из statsmodels, закинешь туда нужный порядок, возможную сезонность, ну и внешние данные.

Ответы28440

148 1 фев, 20:48 1928341

>>28277
Хуя рванулась манюня "не автор вопроса" которой не подскачили тут же кабанчиком варианты накидывать забесплатно.

Ответы28355

149 1 фев, 21:02 1928355

>>28341
ой бля иди нахуй вообще

Ответы28454

217 Кб, 640x640

150 1 фев, 21:35 1928388

>>28277

>Я абсолютно уверен, что написание многопоточных прилог на с++

Вот тебе совет для собеса : не пытайся делать вид , что написание типовых прог на хуевом языке - вершина Айти и что ты якобы познал все.

151 1 фев, 23:01 1928440

>>28292
Данные могу скинуть
на почту
сейчас опять кто-нибудь сагрится

Ответы28478

152 1 фев, 23:25 1928454

>>28355
ОЙ ВСЬО

153 2 фев, 00:22 1928478

>>28440
че тут агриться - не ты первый с гениальными идеями поработать Форекс.

Ответы28488

154 2 фев, 00:32 1928488

>>28478
Иногда данные из задачи - это просто данные из задачи.

155 2 фев, 10:35 1928607

Xi Цзиньпинь мужчина горький урок половой член

156 2 фев, 11:18 1928648

Почему баб так много в датасаенсе? Неужели он такой простой?

Ответы28722 29474 29611

1,6 Мб, webm,
1280x720, 0:11

157 2 фев, 12:31 1928722

>>28648
проще пареной репы

Ответы28724 28757

158 2 фев, 12:32 1928724

412 Кб, webm,
1280x720, 0:11

2,9 Мб, webm,
1280x720, 0:49

>>28722
ойбля извините

Ответы28757

159 2 фев, 13:05 1928753

>>28131

>мелкобуква

>иду через неделю на собес

Не трать время зря, иди сразу в пятерочку

160 2 фев, 13:19 1928757

>>28722
>>28724
мистер аношин из амазона опять раскручивает свою местечковую тусовку с бесполезными персонажами?

Ответы28762

161 2 фев, 13:26 1928762

>>28757
- он уже в Microsoft перехантился.
- просто хотел показать анонам грани пиздеца

Ответы28765

162 2 фев, 13:33 1928765

>>28762
бля, там под видом невротъебенных возможностей просто надувают число подписоты
за исключением нескольких грамотных людей, большая часть этих типа спецов, которые ведут вебинары, - просто напонтованные пустышки. как собственно и сам этот чел, за счёт супер навыков самопрезентации и нетворкинга добравшийся до вот уже микрософта.

163 2 фев, 13:36 1928769

>>27091

>поливать дерево, на котором специалисты растут

>сап двач, а как какать

Такое дерево в индустрии не нужно

Ответы28832

164 2 фев, 14:38 1928832

>>28769
А на чем тогда "специалистов" вешать? Как без дерева то?

61 Кб, 1064x524

165 2 фев, 14:57 1928858

Ябать, эти ваши трансформеры сила... Стандартный пайплайн для вопрос-ответ задачи, из нейроночек выбрал дистилберт, файнтюненный на SQUAD, в контекст просто скопипастил верхнюю часть (до оглавления) статьи с педевикии про комплексные числа. Результат пикрелейтед. Шок, реально. Отвечает осмысленнее любого зумера.

Ответы28889

166 2 фев, 15:12 1928867

Аноны, как вы представляете свой kaggle / github в резюме. Просто даете ссылки или расписываете в самом резюме про кейсы \ проекты с которыми работали / соревнования, в которых принимали участие?
Алсо, если расписываете, упоминаете ли пэт-проекты не связанные непосредственно с анализом данных / ML?

167 2 фев, 15:36 1928889

>>28858
Попроси два комплексных числа умножить

168 2 фев, 19:12 1929041

Анончики, у меня назрел вопрос. Вот эта вся хипстерская хуйня, которой вы тут занимаетесь, машинлернинги, нейросети и прочее троганье себя за место на каггле – какое оно может возыметь прикладной смысл для B2B? Ну, скажем, есть у вас ООО ХуйСтройМонтаж, которое собирает поддоны из деревяшек, чтобы продавать их транспортным компаниям. Или, например фирма, торгующая стройматериалами, скажем, цементом. Как все выше обсуждаемое может помочь ему, простому быдлобизнесу, стоящему на кабанчиках, где твой основной продукт – это цена на твое барахло, ведь у твоих конкурентов оно точно такое же.

Неужели все это модное говно работает только на интернет-магазинах с фалосами или заводах с ебанутейшим оборудованием, в которое можно запихать компьютер вижн?

Ответы29093 29108 29122 29402

43 Кб, 800x600

169 2 фев, 20:17 1929093

>>29041
проблема в том, что кабанчики даже не начали накапливать данные.
Даже не пытались анализировать данные с помощью людей, чтобы потом на основе их знаний, сделать следующий шаг.

Но это постепенно меняется.

Ну рассказывай, Михал Палыч, че там с рогами?

Ответы30708

170 2 фев, 20:28 1929108

>>29041
ах да, вторая ступень - данные накопили, но они все еще поддаются анализу офисным быдлом. Кое-как в экселе повертели и готово решение.
С этой точки зрения, становится понятно как именно Пятерочка стала школой МЛ - их данные просто ни в один эксель не помещались. Пришлось что-то писать и упорядочивать.

171 2 фев, 20:40 1929122

>>29041
Может помочь "простому быдлобизнесу" или нет зависит от его простоты, очевидно. Совсем простому наверное нет, другое дело что сам простой быдлобизнес экономике не очень-то и нужен.

172 3 фев, 03:57 1929402

>>29041

> Как все выше обсуждаемое может помочь ему, простому быдлобизнесу, стоящему на кабанчиках, где твой основной продукт – это цена на твое барахло, ведь у твоих конкурентов оно точно такое же.

Никак. Суть того наебизнеса, о котором ты пишешь - связи и знакомства в теме такого наебизнеса. Грубо говоря, Вася с улицы купит бульдозер и останется при своих интересах. А Петр Иванович, проработавший в этой теме 20 лет, и знающий всех в городе, с таким же бульдозером легко будет получать тендеры и контракты как подрядчик. Машобчик в таких схемах не решает ничего.

Ответы29437

173 3 фев, 08:21 1929437

>>29402
вот пока ты так думаешь, так и будешь кошкодевочек раздевать и в кагл дрочить.

174 3 фев, 10:23 1929474

>>28648
Ну да. На начальных этапах уж точно. Выучил стандартные решения стандартных задач и вперёд. Даже нормально кодить уметь не надо. Для второго-третьего курса говновуза самое то.

Ответы29496

175 3 фев, 10:58 1929496

>>29474

>и вперёд

на ютубчик, учить других

Ответы29525

176 3 фев, 11:48 1929525

>>29496
Авотхуй. Лично знаю несколько примеров, которые, нихуя по сути не понимая ни в программировании, ни в дотасаентистской «математике», устраивались на работу в дота саенс. Это тебе не пхд в области интеллектуального анализа данных в нормальном вузе, а работка в типичном бизнесе.

Ответы29528 29580

177 3 фев, 11:55 1929528

>>29525
ну мало ли
бывает

178 3 фев, 13:49 1929580

>>29525
Эти примеры по пуси-пассу прошли?

Ответы29615 29809

179 3 фев, 14:20 1929611

>>28648
Датасаентисту, который связан с бизнесом нужно быть больше бизнес-аналитиком. Модели все написаны, успевай только импортировать модули, а вот присобачить эти модули к бизнесу, чтобы они профит приносили - это самое сложное и необходимое бизнесу. Чтобы понимать бизнес, нужно понимать менеджеров и потребителей, т. е. необходимы вкачанные софтскиллы, которые у самок обычно лучше развиты.

Ответы29636

180 3 фев, 14:23 1929615

>>29580
бывает, что навыки софт-скиллз, умение достигать целей и глубокое погружение в бизнес-часть ценятся больше, чем пресловутое умение кодить

ДА

181 3 фев, 14:41 1929636

>>29611

>Чтобы понимать бизнес, нужно понимать менеджеров и потребителей, т. е. необходимы вкачанные софтскиллы, которые у самок обычно лучше развиты.

Так это просто не дата-саентист, а даун-аутист.

Как можно изучить нейронки, не изучив сути ?
Для кого во всех этих датасетах пишут подробные описания данных?

Ответы29651

182 3 фев, 15:01 1929651

>>29636
В том-то и суть. Нужно самому для себя сделать исчерпывающее описание для датасета, который сам же и собираешь. Чтобы потом уже фит-предикт сделать.

Ответы29654

356 Кб, 1280x720

183 3 фев, 15:03 1929654

>>29651
тогда что это за тред профнепригодных ?

184 3 фев, 17:47 1929809

>>29580
Извинитеможнопорузге.

Ответы29812

185 3 фев, 17:50 1929812

>>29809
киска проход

Ответы29865 29919

186 3 фев, 18:55 1929865

>>29812
Аааа ну возможно. Я таких знаю штук 6 минимум, 5 из них тянки.

146 Кб, 1863x120

187 3 фев, 19:29 1929898

инфоцыгане заспамили

Ответы29907 29993

188 3 фев, 19:39 1929907

>>29898
Что за курсы? ШАД на минималках?

Ответы29923

189 3 фев, 19:49 1929919

>>29812
лучший переводчик этого треда!

190 3 фев, 19:52 1929923

>>29907
https://sochisirius.ru/obuchenie/graduates/smena830/3970

Ответы29996

191 3 фев, 21:59 1929993

>>29898
РДЖ?

192 3 фев, 22:04 1929996

>>29923
ии ага, назвали бы реалистичней системы таргетной рекламы, как всучить вам товар порелевантнее

193 3 фев, 22:52 1930033

Аноны, как существенно увеличить зп или просто доход, если не хочу и не могу уезжать из ДС?

Ответы30043

194 3 фев, 23:05 1930043

>>30033
удаленка на барина из калифорнии

Ответы30062

195 3 фев, 23:22 1930062

>>30043
Сколько стоит ожидать среднему джуну?

Ответы30086

196 4 фев, 00:03 1930086

>>30062

>джуну

>удаленка

Ответы30096

197 4 фев, 00:28 1930096

>>30086
Да я уже посмотрел сам и нашел все. Около 50 баксов в час.

Ответы30097

198 4 фев, 00:34 1930097

>>30096
джун на удаленке нахуй не упал никому

Ответы30098

199 4 фев, 00:37 1930098

>>30097
Ну это ты так думаешь. Много кому нужны простые быстрые модельки на один раз, а я еще и код нормальный писать умею. У меня уже был похожий опыт, но здесь, не догадался перенести его на все.

Ответы30102

200 4 фев, 00:51 1930102

>>30098

>Ну это ты так думаешь

бгг думает что чет могёт

201 4 фев, 11:01 1930232

https://www.youtube.com/watch?v=X74HrvGevXY
Что скажете по этому поводу?

Ответы30262

202 4 фев, 11:50 1930262

>>30232
где текстовый конспект высера? тезисы? с чем именно не согласен ?
вообще, ты как к вечно занятой илите айти обращаешься?

Ответы30267 30284

203 4 фев, 12:06 1930267

>>30262
А что, слабо написать нейронку которая тебе краткий конспект видео составит раз ты такой ленивый?

Ответы30481

204 4 фев, 12:45 1930284

>>30262

> ты как к вечно занятой илите айти обращаешься?

Ахахаха посрал тебе за воротник, илитка ты наша.

205 4 фев, 13:59 1930366

>>28131
Как вкатился? Программист, математик? Какой опыт?

158 Кб, 1919x941

206 4 фев, 15:56 1930481

>>30267

>писать код бесплатно

207 4 фев, 17:33 1930601

>>20026 (OP)
Есть тут люди, мутившие небольшие стартапы в мл и дс?

Ответы30690

208 4 фев, 19:24 1930690

>>30601
Антоха Мальцев чем-то таким занимается

209 4 фев, 19:35 1930708

>>29093
У меня затык на первой стадии. Я не могу сам себе задач нарезать.

210 5 фев, 00:17 1930883

привет пацаны
работаю в чистом ML пару лет, но хочу перейти в NLP или CV - ну нравятся мне эти области
если отбросить "ну куда больше нравится туда и иди" (потому что привлекает оба варианта, а поработать год там - год там не очень хотелось бы), то куда бы вы посоветовали пойти?
С точки зрения перспектив / количества вакансии / амбициозности задач какое из направлений лучше?
Также вопрос: в случае чего насколько сложно совершить перекать из одного в другое?
Поделки делал и там и там, так что о чем области примерно понимаю, но если есть серьезные дяди тут, то интересно послушать ваг опыт

Ответы30918 31047

211 5 фев, 01:21 1930918

>>30883
Что такое "чистое мл" ?
Рейтинги кредитные из экселя в бустинг загружать ты имеешь ввиду?

Ответы31008 31047 31099

212 5 фев, 07:43 1931008

>>30918
Нажимает кнопку "Регрессия" в экселе, наверное

72 Кб, 1399x966

213 5 фев, 08:33 1931018

Требования для тимлида.
https://hh.ru/vacancy/42156528

Ответы31043 31050

214 5 фев, 10:03 1931043

>>31018
Это много или мало?

215 5 фев, 10:09 1931047

>>30883
>>30918
А почему кстати CV часто стоит как бы особняком от ML в общем?
В вакансиях, например.
Или это у меня когнитивное искажение?

Ответы31059

216 5 фев, 10:16 1931050

>>31018
Що таке Data Lake?

Ответы31062

217 5 фев, 10:31 1931059

>>31047
Наверное потому что крутится вокруг эвристики if (тут пятно) then деталь_упала()
для чего нужно просто писать на c++.

Ответы31082

218 5 фев, 10:32 1931062

>>31050
Хадуп и все виды беспорядочно накапливаемых данных, которые мы пока не знаем как обработать, а тимплид требует 300 в мес

219 5 фев, 10:49 1931082

>>31059
Т.е. фактически там никакого машоба и нет, что ли?
Точнее, оно там есть лишь в виде готовых библиотек обученных моделей распознавания образов на картиночках, а ты фактически работаешь как обычный программист?

Ответы31101

220 5 фев, 11:15 1931099

>>30918
угу, типа того.
ток сюда студента и взяли - я на 3 курсе

221 5 фев, 11:17 1931101

>>31082
ну фифти фифти
есть иногда очень замудренные задачи, для которых либо сетки в целом не нужны, либо их переучивать надо

Ответы31151

222 5 фев, 12:09 1931151

>>31101
Спасибо, понятно.
А есть еще подобные ниши в машобе?

223 5 фев, 12:13 1931153

>>20026 (OP)
Уважаемые, используется ли еще сейчас классический машоб, или все везде давно на разных продвинутых нейронках?

Ответы31195 31232

224 5 фев, 12:50 1931195

>>31153
Нейронки в CV в основном. И для них с++ очень желательно знать. В других местах помимо навыка перебора гиперпараметров нужно быть бизнес-аналитиком, или дата-инженером-девопсом для регулярно падающего хадупа.
https://www.youtube.com/watch?v=Cs3ae65tmKA

Ответы31198 31268 31269

225 5 фев, 12:52 1931198

>>31195

>И для них с++ очень желательно знать

С++ машобщику вообще не нужен.

Ответы31233

226 5 фев, 13:41 1931229

Есть возможность по дешёвке взять 2х2080тишек и поставить в слай для нейроночек. Насколько 3к серия лучше прежней и не проебусь ли я?

Ответы31252

227 5 фев, 13:44 1931232

>>31153
Работаю в одной из консервативных забюрократизированных сфер, где словосочетание "data science" редко используется неиронично, используем в основном дедовский generalized linear model с табличными данными из-за его максимальной интерпретируемости в сравнении с другими моделями. В редких NLP задачах DL тоже не используем, только более явные и понятные методы типа cosine similarity. CV проекты отсутствуют в принципе.
Вообще если, например, пойдешь рисковиком в банк и другие подобные места - в основном будешь работать именно с самыми консервативными из дедовских методов, хотя сейчас у многих банков появляются позиции DS для, в том числе, CV проектов, + есть микрокредиты, где обычно более лояльно относятся к более прогрессивным технологиям, так что и в консервативных сферах типа финансовой помимо дедовских методов надодится место и всяким новомодным вещам. Вообще, гораздо больше мест, где используются дедовские методы, просто обычно они не называются модными словосочетаниями типа data scientist.

Ответы31370

228 5 фев, 13:44 1931233

>>31198
С++ не нужен бизнес-аналитикам, которым софт-скиллы важнее понимания машоба, а для нормального МЛ разработчика это вообще основной язык.

Ответы31247 31337

229 5 фев, 13:53 1931247

>>31233
ну ты людей то не пугай
все от поля деятельности зависит
вон, тот же Антоха Мальцев говорил, что они почти не пишут на крестах. Хотя его команда пилила 3д сканирование с помощью ЮАРОВ (робот такой промышленный)
Также в ОДС часто спрашивали насколько нужен с++ для зрения, и ответ тоже не то что бы был однозначным - большенство как раз-таки сошлись на мнении, что он нахуй не нужон
алсо друган устроится цвшников на питоне
короче я вижу так: где нужная какая-то прям дико оптимальная хутиа - там кресты (правда вопрос, занимаются ли цвшники оптимизацией на крестах - все таки тоже огромная область). В остальных случаях - может вытянуть питон (может си шарп)
в любом случае нормальный программист хотя бы 1 си подобный язык должен примерно знать
и ты, прежде чем бросать такие фразы, хоть пруфани, а

Ответы31256 31401

230 5 фев, 13:58 1931252

>>31229
2080ти==3070

Ответы31258

231 5 фев, 14:00 1931256

>>31247

>цвшников на питоне

Больше видявакарт!!! Хотя что еще ожидать от трясунов.

Ответы31267

232 5 фев, 14:00 1931258

>>31252
А если их будет две то я опережу 2 поколения?

Ответы31312

233 5 фев, 14:09 1931267

>>31256
еще раз
я не говорю о том, что все так делают
если есть такие конторы, и у них все ок ( а у некоторых и правда все ок) просто закупая видюхи и напиливая продукт дальше - то это НОРМАЛЬНО, как бы твой манямирок не сопротивлялся, дедуль
как будто идея закупать доп видюхи для цв (как и сервера для классического проганья) это что то новое и вообще зумеры заебали лезут к нам ууу ряяя какой я злой раньше было лучше
лично я , конечно же, за подход - цвшники делают алгоритмы (оптимальные с точки зрения алгоритма) - прогеры их оптимизируют (с токи зрения кода\архитектуры и пр)
но опять же ничего не имею против первых

Ответы31313

234 5 фев, 14:10 1931268

>>31195
блин, клевый видос
прям лукас

Ответы31269

235 5 фев, 14:11 1931269

>>31195
>>31268
вообще очень приятно слушать не диких задротов (чувак явно и себе время уделяет, помимо работы)
сразу слышишь более адекватные мысли

Ответы31340

236 5 фев, 14:17 1931274

Вышмата не знаю, статистики не знаю. Кодирую на крестах. Хочу стать топовым млщиком, с чего начать?

Ответы31279

237 5 фев, 14:19 1931279

>>31274
подумать, точно ли ты хочешь перекат в мл
также подумать, чего ты ждешь от работы
глянь видос выше, там неплохо это рассказывают
если ты прям кодируешь, а не лабы делаешь, то твои скилы уж точно в мире данных пригодятся
а если кратко: учи вышмат питон и эскюэль - на степике все есть

Ответы31289

238 5 фев, 14:25 1931288

>подумать, точно ли ты хочешь перекат в мл

Ну конечно. Перспективная сфера же.

>питон

Читал что на нём ничего сложнее бота для шахмат не написать.

Ответы31289 31300

239 5 фев, 14:25 1931289

>>31279
>>31288
Ну ты понял

240 5 фев, 14:32 1931300

>>31288

> Читал что на нём ничего сложнее бота для шахмат не написать

нет

241 5 фев, 14:37 1931312

>>31258
Нет, 2 видюхи примерно на 60%, а не на 100% быстрее чем одна, из-за оверхеда на пересылку данных по шине.
Но памяти побольше будет

242 5 фев, 14:38 1931313

>>31267

>то это НОРМАЛЬНО

Нет, маня, это не нормально

Ответы31317

243 5 фев, 14:44 1931317

>>31313
лол
нет, маня, это нормально
у нетфликса модельки в проде в юпитере вертятся

Ответы31332

244 5 фев, 15:04 1931332

>>31317
Потому что в нетфликсе работают сжв-петухи.

Ответы31335 31336

245 5 фев, 15:06 1931335

>>31332
ну я вот его смотрю и мне збс
не чувствую НЕОПТИМАЛЬНОСТИ их кода
ве быстро и круто
и ты, дед, сиди и дальше байты еби

Ответы31350

246 5 фев, 15:06 1931336

>>31332
но про сжв петухов я с тобой согласен

Ответы31350

247 5 фев, 15:07 1931337

>>31233

>для нормального МЛ разработчика это вообще основной язык

Тензорфлоу написан на крестах и оптимизирован до максимума, так что лучше ты все равно не напишешь. Всякие библиотеки для CV и работы с данными тоже сделаны на крестах, и могут быть использованы в многопоточном режиме. Подсчет метрик, построение графиков и прочее производительности не требует. Ну и зачем машобщику кресты?

Ответы31341 31343

248 5 фев, 15:08 1931340

>>31269
В чём они более адекватные?

Ответы31342

249 5 фев, 15:08 1931341

>>31337
плюсую молодому человек (или человекине)

250 5 фев, 15:09 1931342

>>31340
да я выебнулся, забей)

Ответы31355

251 5 фев, 15:09 1931343

>>31337

> Ну и зачем машобщику кресты?

Зачем машобщику математика?

Ответы31351 31367

252 5 фев, 15:12 1931350

>>31336
Спасибо.
>>31335
А я его не смотрю, и мне тоже збс.
И я не дед.

253 5 фев, 15:12 1931351

>>31343

>Зачем машобщику математика?

Чтобы уметь воспроизводить модели из SOTA пейперов и использовать их для решения задач бизнеса.

Ответы31384

254 5 фев, 15:16 1931355

>>31342
Я предвидел это!

255 5 фев, 15:25 1931367

>>31343
Это смотря что считать математикой.

Ответы31385

256 5 фев, 15:29 1931370

>>31232

>где словосочетание "data science" редко используется неиронично

А в научном сообществе вообще всегда это звучит иронично. Потому что дота саенс не наука.

257 5 фев, 15:53 1931384

>>31351

>воспроизводить модели

Кокие модели? Ведь нужно трясти ящик и крутить пимпы

258 5 фев, 15:53 1931385

>>31367

>считать математикой

Все что оторванно от реальности

Ответы31396

259 5 фев, 16:09 1931396

>>31385
Философия тоже оторвана от реальности.

Ответы31402 31420

20 Кб, 1810x234

260 5 фев, 16:16 1931401

>>31247
Для моделей в пандасе не нужен, а в OpenCV очень даже нужен. Питон, хоть и оперирует либами на С, но однопоточный GIL никто не отменял.

Ответы31413 33917

261 5 фев, 16:16 1931402

>>31396
Чел, ты...математика и философия это неразрывные вещи.

Ответы31408 31417

262 5 фев, 16:26 1931408

>>31402
Это как посмотреть.

263 5 фев, 16:29 1931413

>>31401
чет пикрил не понял

Ответы31438

264 5 фев, 16:37 1931417

>>31402
Чистая математика находится на границе познаваемого, далее начинается философия, в которой уже нет никаких критериев истинности.
Ну а вообще да, они связаны, наверное.
Забавно, что согласно критерию Поппера математика наукой не является.

Ответы31421

265 5 фев, 16:37 1931419

Зашел на апворк, почему ставка по 50 баксов у всяких пхд и прочих серьезных людей, а кто-то согласен и за 5 долларов в час работать? Речь про ДСов, там не только индусы.

Ответы31424

266 5 фев, 16:38 1931420

>>31396

>Философия

Она как раз и пытается обьяснить реальность, скорее математика = теология

Ответы31458

267 5 фев, 16:38 1931421

>>31417

>Забавно

Так а что тебя удивляет, математика не наука.

Ответы31446 31469

268 5 фев, 16:39 1931424

>>31419

>а кто-то согласен и за 5 долларов в час работат

Там и за 3 есть, демпингующие макаки

Ответы31431

269 5 фев, 16:43 1931431

>>31424
А они реально что-то умеют? Или нужно искать барина на постоянной основе.
Посмотрел заказы. То, что я с двумя такими же джунами делал 3 месяца хотят купить за 45к рублей. Это буржуйская народная забава такая, покупать и продавать говно?

Ответы31433 31445

270 5 фев, 16:46 1931433

>>31431

>А они реально что-то умеют

Нет конечно, просто те кто умеют они просят 5 и сосут писю

Ответы31434

271 5 фев, 16:46 1931434

>>31433

>5

50, фикс

272 5 фев, 16:50 1931438

>>31413
Топ тегов из вакансий хх по запросам из первой строчки.

Ответы31440

273 5 фев, 16:51 1931440

>>31438
Гит, лол

274 5 фев, 16:54 1931445

>>31431
https://www.youtube.com/watch?v=3HWocUXL91g

Ответы31447

67 Кб, 800x445

275 5 фев, 16:54 1931446

>>31421

276 5 фев, 16:55 1931447

>>31445
Как же он заебал. В последних видосах уже прямо говорит, что не знает о чем снимать и просто про все говорит.

277 5 фев, 17:07 1931458

>>31420
Философия пытается, но у неё нихрена не получается.
Естественные науки философию не используют, только математику.
В общественных и гуманитарных, да, философия нужна, однако, вполне возможно, только до тех пор, пока использование математики в них затруднительно.
Для использования математики нужны базовые экспериментальные постулаты, которые можно было бы положить в основание теории в качестве аксиом, иначе польза от математики может быть только локальной. Например, как теория аукционов в экономике, при этом сама современная экономика имеет вид скорее кулинарной книги с кучей рецептов, чем цельной теории.
В общественных науках воспроизводимые эксперименты ставить не получается (по крайней мере, пока), поэтому и теорию не построить, именно поэтому приходится обращаться к домысливанию, т.е. к философии.
Лично я думаю, что прорыв в теоретических разработках общественных наук будет возможен только после глобальной цифровизации всего общества, и когда в этой огромной мешанине бигдаты будут найдены некоторые инварианты общественных отношений (если они вообще существуют), которые и будут положены в основание теории как аксиомы.
Чувствую, математика там будет совершенно упоротая.
Пиздец, вот же где машоб развернётся на всю катушку.

Ответы31496 31498 31593 31780

278 5 фев, 17:18 1931469

>>31421
Ну тут опять смотря что считать наукой.
По Попперу научная теория должна быть принципиально опровержимой, а в математике теоремы это не предмет споров. Теорема это теорема, и всё тут.

279 5 фев, 17:47 1931496

>>31458

>только математику.

Перестань, никто твою математику не использует, это она плетется и подбирает все что придумывают для решения прикладных задач

Ответы31516

280 5 фев, 17:49 1931498

>>31458

>глобальной цифровизации всего общества,

Говно без задач, даже твои кампутепы до 2021 не совершили никакого общечеловеческого прогресса и не совершат.

Ответы31520 31557

281 5 фев, 18:05 1931516

>>31496
Кто придумывает?

282 5 фев, 18:07 1931520

>>31498
А он никому и нахой не нужон, прогресс ваш. Нужны только деньги.

283 5 фев, 18:57 1931557

>>31498
маньк, ты ебнутый? компухтеры не совершили прогересса? тебе 10?

Ответы31566

284 5 фев, 19:06 1931566

>>31557

>компухтеры не совершили прогересса

Как там КПД ДВС двигателей выше 40% стал? Или может жечь жижу перестали?

Ответы31598 31888

285 5 фев, 19:40 1931593

>>31458
Философия, что в гуманитарных, что в технических науках - первородная наука, из которого произрастает методология научных исследований + букет социальных наук типа социологии, психологии и т.д. Без философии в естественных науках не будешь понимать некоторые вещи в методологии научных исследований, а без адекватной методологии не сможешь эффективно провести исследование, правильно оформить все, опубликовать результаты, и не быть обоссаным редакцией и научным сообществом. Т.е. можно обойтись и без именно философии, но некоторые вещи будут хуже восприниматься.
Вне науки, в прикладных сферах, применения ей вообще нету, ну кроме удовольствия от знания разве что.

Ответы31658 33116

286 5 фев, 19:44 1931598

>>31566
чеее
какой еще кпд двс? тебе нахуя двс в 2021?

Ответы31606

287 5 фев, 20:01 1931606

>>31598
Дурак что ли?

Ответы31612

288 5 фев, 20:04 1931612

>>31606
а может ты дурак? какой нахуй двс
Мы о компах, мань
О К О М П А Х

Ответы31618 31680

289 5 фев, 20:08 1931618

>>31612
А, ну тогда ладно.

290 5 фев, 20:57 1931658

>>31593
Ну хрен знает. С одной стороны вроде и правильно, а с другой...

>Вне науки, в прикладных сферах, применения ей вообще нету, ну кроме удовольствия от знания разве что.

Это, очевидно, верно.

291 5 фев, 21:05 1931680

>>31612

>Мы о компах, мань

>О К О М П А Х

Ну так и расскажи какой от них толк кроме развлечений?

292 5 фев, 21:43 1931704

>>20026 (OP)
Аноны, поясните за топологический анализ данных. Эта тема уже вошла в индустрию, или еще только на уровне научных наработок?

293 5 фев, 23:32 1931780

>>31458
Ты не ту философию учил. В вузах есть отдельный курс " Философия науки".

294 6 фев, 02:26 1931888

>>31566
Видел этого шиза в пораше. Возможно это бот

295 6 фев, 16:04 1932324

чем отличается DBSCAN от Fuzzy-C-Means?
чем DBSCAN похож на K - Means?

Ответы32688

296 6 фев, 22:28 1932688

>>32324
Тем, что нахуй не нужны. Just stack more layers, bitch!

Ответы32689

67 Кб, 592x532

297 6 фев, 22:36 1932689

>>32688

>Тем, что нахуй не нужны. Just stack more layers, bitch!

Ответы32798

298 7 фев, 00:24 1932754

Бля, придумайте мне пожалуйста задачу, которую можно решить с помощью графа знаний, желательно внутри Российского рынка, но можно и внутри зарубежного, похуй в принципе.
А то диплом надо писать, а в голову нихуя не идёт вообще

Ответы32769

299 7 фев, 00:36 1932769

>>32754

>диплом надо писать

>придумайте мне пожалуйста задачу

блин, твой диплом это уровень детишек с лопатками в песочнице

Ответы32784

300 7 фев, 00:41 1932784

>>32769
Так и хули, писать то всё равно его надо, иначе из шараги пидорнут

Ответы32793 32800

301 7 фев, 00:45 1932793

>>32784

>писать то всё равно его надо

Генератор времени лекция для сдутепедерастов, ну что бы время с разными группами не пересекалось, что бы преподы могли кофе попить и всем было удобно.

Ответы32796

302 7 фев, 00:48 1932796

>>32793
а графы знаний тут нахуя?

Ответы32799

303 7 фев, 00:50 1932798

>>32689
Здарова, Жопеншмульцер

Ответы32829

304 7 фев, 00:51 1932799

>>32796
Что бы пересечений не было

Ответы32817

305 7 фев, 00:51 1932800

>>32784

>иначе из шараги пидорнут

Ты это заслужил
сасай

Ответы32817

306 7 фев, 01:01 1932807

Очередная победа машобчика над битерлессоновыми дедами
https://thisanimedoesnotexist.ai/

Ответы32821 32829

307 7 фев, 01:15 1932817

>>32800
не заслужил, я всё закрыл кроме ебучего диплома
>>32799
всё равно это как то не очень для диплома магистра

308 7 фев, 01:17 1932821

>>32807
Какие то пиздоглазые уебища

309 7 фев, 01:27 1932829

>>20026 (OP)
>>32798
>>32807
А кто такие жопеншмульцер, битерлессон и вапникошиз, которых тут вечно форсят? И почему между ними вечный срач?

Ответы33009

310 7 фев, 11:46 1933009

>>32829
Жопеншмульцер - пародия на термины (конкретно - на фамилии учёных, в честь которых эти термины названы), которые современные машобообезьяны не знают.
Bitter lesson - статья какого-то жопеншмульцера о том, что нужно не пытаться добавить к модели знания о предметной области, а собрать побольше данных и настакать слоёв.
Вапник - древний дед, один из разработчиков теории Вапника-Червоненкиса, ещё из тех времён, когда в машобе доказывали теоремы, а не просто гоняли модели на датасетах и хвастались, что побили сота.

Ответы33026

311 7 фев, 12:07 1933026

>>33009
Спасибо!
Про теорию Вапника-Червоненкиса я знаю.
А вапникошиз, получается, это тип, который форсит эту теорию и вообще научный подход в машобе?
А остальные ему в ответ: «Пишол нахой, ябучий учонодед»?

312 7 фев, 13:42 1933116

>>31593
Методологию исследования придумывают всё же никак не профессиональные философы, а всё те же учёные.

Ответы33263

313 7 фев, 15:34 1933263

>>33116
Поддерживаю. Философы, фактически, просто констатируют методологию, которая складывается в научном сообществе.

Ответы33280

314 7 фев, 15:41 1933280

>>33263

>Философы, фактически, просто констатируют методологию, которая складывается в научном сообществе

Ну так и математики то же самое делают. Математика сорт философии.

Ответы33341

315 7 фев, 16:21 1933341

>>33280
Нет.

Ответы33425

4,3 Мб, mp4,
480x480, 0:52

316 7 фев, 17:01 1933388

https://archive.org/details/mapdreamer

317 7 фев, 17:17 1933406

А как с патентированием в мле? Можно затюненную модельку запатентовать и сидеть пердеть получая бабосики?

Ответы33680

318 7 фев, 17:36 1933425

>>33341
Да

Ответы33515

319 7 фев, 18:23 1933482

https://twitter.com/calamardh/status/1151863654205333506

Ответы33485

320 7 фев, 18:25 1933485

>>33482
https://twitter.com/i/status/1153865113570594817

67 Кб, 640x640

321 7 фев, 18:43 1933500

>>27169
Всё ещё ревестирую знатоков временных рядов.

Ответы33608

322 7 фев, 19:00 1933515

>>33425
Нет.

Ответы33528

323 7 фев, 19:10 1933528

>>33515
Дп

Ответы33651

324 7 фев, 20:16 1933608

>>33500
Попробуй не сами эти числа, а их логарифмы

Ответы33646

325 7 фев, 21:12 1933646

>>33608
Спасибо.

>а их логарифмы

Они не стационарны. Равно как и их квадраты/квадратные корни.
Проблемы засунуть оригинальные признаки в модель нет.
Проблема в том, что полученные стационарные признаки дают на выходе какую-то шнягую.
Вот и вопрос, что делать.

Ответы33921 33923 33977

326 7 фев, 21:16 1933651

>>33528
Лул. Нет же.

327 7 фев, 22:26 1933680

>>33406

30 Кб, 1004x207

328 8 фев, 01:34 1933779

Где искать работу джуну? Я от каждого угла слышу, что сейчас всем нужны дата сциентисты, ввел в поиске на хедхантере data и чёт ничего не вижу. Нужен либо опыт, либо предлагают нерилейтед говно. Вон, хуесосы из маил ру как обычно в своём стиле. При этом вакансий по джаве, плюсам, питонам десятки и сотни.
Где искать-то работу джуну?
последний курс, выбираю между беком и нейроночками

Ответы33781 33793 33819

329 8 фев, 01:41 1933781

>>33779
Нужно по стажировкам метаться кабанчиком и молиться, чтобы после стажировки оставили.

Ответы33785

78 Кб, 800x450

330 8 фев, 01:46 1933783

>>20026 (OP)
Посоны подскажите с чего начать? Я в этом полный ноль.
Я хочу написать игрового бота для FAF используя нейросети, что бы бот самообучался и все лучше играл в игру как например AlphaStar играет в StarCraft 2.
Библиотеку хочу использовать TensorFlow.
Меня интересует какие данные нужны для такой нейросети, допустим я подключился к API игры и достал оттуда координаты юнита, действия которые этот юнит может делать, например переместится в заданную точку, как мне все это передать в нейросеть и как заставить нейросеть сделать так что бы юнит двинулся к материи и построил там экстрактор материи?
Насколько это сложно сделать?
И что в теории мне нужно сделать?

Ответы33935

331 8 фев, 01:47 1933785

>>33781
По каким словам кроме data scientist искать вакансии вообще?
И есть ли какой-то профит в платных курсах типа skillbox, которые обещают трудоустройство лучшим ученикам? У меня все-таки есть преимущество перед васянами, которые увидели рекламу и пошли за изи мани, в виде диплома по компуктерным наукам и пары нейронок по курсовым работам. Или это развод всё?

Ответы33792 33832

332 8 фев, 02:28 1933792

>>33785

>Или это развод всё?

Нет, варик 100 проц, неси денюшки.

333 8 фев, 02:33 1933793

>>33779

>Где искать работу джуну?

В Пятерочке

>Я от каждого угла слышу

)))

334 8 фев, 05:06 1933819

>>33779

>Я от каждого угла слышу, что сейчас всем нужны дата сциентисты

Я не слышал, ты там поди в пузыре гугля перемогаешь?

335 8 фев, 05:50 1933832

>>33785
По технологиям ищи. Скиллбокс херня. Есть мнение, что яндекс практикум получше будет.

Ответы34105

336 8 фев, 09:22 1933917

>>31401

>Питон, хоть и оперирует либами на С, но однопоточный GIL никто не отменял.

отменял.
причем, второе как следствие первого.

337 8 фев, 09:24 1933918

>>20026 (OP)
Аноны, как думаете, GPT-4 уничтожит программистов, если его на всём гитхабе обучат? И кто такой этот ваш transformer? Почему именно он показывает такие охренительные результаты?

Ответы33935

338 8 фев, 09:26 1933921

>>33646
Преобразуй боксом-коксом. Избавься от сезонности/тренда. Возьми разницу единичного сдвига. Почисти данные от выбросов.
Проблема в том, что даже если получится стационарный ряд (по DF-тесту), то с настройкой какой-нибудь аримы ты будешь ебаться примерно столько же, если вообще она заведётся.
Тестил какой-нибудь стандартный регрессор (линейный или бустинг) на простых выделенных фичах? Если он работает не лучше чем "предсказывать предыдущее значение", то может задача просто не решается?

Ответы34390

339 8 фев, 09:26 1933923

>>33646

>Проблема в том, что полученные стационарные признаки дают на выходе какую-то шнягую.

мусор на входе - мусор на выходе.

Что, если тебя просто в самих данных нет никаких оригинального "сигнала", а лишь шум сигнала, искаженный через кучу кучей фичей?

В стандартной схеме ты должен был бы "добавить фичей". Желательно чтобы модель понимала временной лаг.

Но мусор есть мусор.

Ответы33977

340 8 фев, 09:45 1933935

>>33783

>Посоны подскажите с чего начать?

Пройди курс по DL и RL. С последним можешь быстро ознакомиться тут https://github.com/FortsAndMills/RL-Theory-book/

>Меня интересует какие данные нужны для такой нейросети

В 99.9% тебе будет нужна какая-то награда от среды, причем это должно быть что-то более плотное чем исход матча. В зависимости от алгоритма тебе будут нужны либо траектории эпизодов, либо четвёрки state-action-reward-state'.

>как мне все это передать в нейросеть

Так, как это всё делается в твоём любимом DL-фреймворке.

>как заставить нейросеть сделать так что бы юнит двинулся к материи и построил там экстрактор материи

Как действия векторизируешь, так и заставляй. Например, 0 - стоять афк, 1 - двинуться к материи и построить экстрактор, 2 - сдаться.

>Насколько это сложно сделать?

Советую не лезть сюда. Лучше уж на ифах, потенциальных полях и fsm'ах.

>>33918
У кода на гитхабе нет контекста. Ты по импортам не поймешь, что от тебя требуют написать.

341 8 фев, 10:27 1933977

>>33923

>Избавься от сезонности/тренда.

Промежуток не указан. Т.е. можно взять период в тысячи измерений, и даже что-то осмысленное можно получить. Вопрос, почему именно эти тысячи, а не другие.

>Возьми разницу единичного сдвига.

С ней как раз херня получается, как на картинке 3.

>Почисти данные от выбросов.

Там выбросов не особо.

>Тестил какой-нибудь стандартный регрессор (линейный или бустинг) на простых выделенных фичах?

С просто фичами или фичами, преобразованными через квадраты/логарифмы, работает. Потому что они не стационарны. А вот со стационарными( это желательно по условию задачи) - есть вопросы.
>>33646

>мусор на входе - мусор на выходе.

Там не мусор, просто временные ряды через равные промежутки времени. Но промежутки эти - не указаны. Может быть это секунды, может минуты, может часы, может дни. Не поймёшь.

>В стандартной схеме ты должен был бы "добавить фичей". >Желательно чтобы модель понимала временной лаг.

Давай уточним, что есть стандартная схема?
У нас есть фичи, мы их преобразуем в новые и новые же используем, не касаясь старых?

могу скинуть изыскания и данные

Ответы33983 33994 34071

342 8 фев, 10:30 1933983

>>33977

>Но промежутки эти - не указаны. Может быть это секунды, может минуты, может часы, может дни. Не поймёшь.

Подбери на кросс-валидации.

Ответы33994 34089

343 8 фев, 10:41 1933994

>>33977
>>33983
Или найди все пики на scipy.signal.periodogram.

Ответы34089

Аноним 344 8 фев, 11:29 1934031

>>20026 (OP)
Аноны, нужен хелп
Есть задача на диплом - реализовать размытие/замену фона на вебкамере, используя СНС, т.е. по факту это семантическая сегментация изображения. Есть три вопроса:
1. Какая архитектура больше всего подходит для этого (UNet, Enet, SegNet)?
2. Можно ли использовать COCO датасет с различными сущностями (машины, люди, животные, дорожные знаки) или лучше использовать LiP датасет, в котором онли люди?
3. Стоит ли сразу делать размытие/замену фона на вебкамере или лучше чуток попрактиковаться на изображениях/видео?
Заранее спасибо

Ответы34639

345 8 фев, 12:11 1934071

>>33977

>Давай уточним, что есть стандартная схема?

предположение, что существует еще более точная фича-предиктор, которая отражается на те, которые сейчас есть и неудовлетворительны.

>Там не мусор, просто временные ряды через равные промежутки времени.

вот сразу бы так и начал. А то приплел каких-то графиков ебанутых.
это должно дедовскими SARIMA-и прилично решаться.

>могу скинуть изыскания и данные

Мамке своей скинь.

Ответы34390

346 8 фев, 12:24 1934089

>>33983

>Подбери на кросс-валидации.

Ограничения количества подвыборок сверху есть?
>>33994

> scipy.signal.periodogram.

Два пика/периода поголы не сделают.

Ответы34170

347 8 фев, 12:40 1934105

>>33832

>яндекс практикум получше будет

https://habr.com/ru/post/518372/

Ответы34171 34227

348 8 фев, 13:44 1934170

>>34089

>Два пика/периода поголы не сделают.

>временные ряды через равные промежутки времени. Но промежутки эти - не указаны.

Ответы34276

349 8 фев, 13:44 1934171

>>34105

>habr.com

Говноед, плез

350 8 фев, 14:19 1934227

>>34105
Ахаха лол. Хз, я годные отзывы слышал. Хотя личных примеров не знаю.

24 Кб, 724x309

351 8 фев, 14:49 1934276

>>34170
У меня сомнения, что у подобной оригинальной фичи - два периода.

352 8 фев, 16:19 1934390

>>33921
Анон, ты ещё тут? Или ты >>34071 ?

>это должно дедовскими SARIMA-и прилично решаться.

Пробовал, подобрать коээфициенты авто-аримой, потом засунуть в SARIMAХ - результат не идеальный.

>Мамке своей скинь.

Не она же решает задачу.
Алсо, наглядное представление быстрее поможет, чем перекидывание фразами и вопросами пол-треда.

Ответы34456

353 8 фев, 17:00 1934456

>>34390
да почему ты не смиришься с тем, что данные лежат за пределами выборки? ты сам как человек можешь решить эту задачу?
Если не можешь, то и от машины не жди.

вот тут недавно нашел хорошую ссылочку куда следует всех форекских шизов в машобе:
https://ru.qaz.wiki/wiki/Efficient-market_hypothesis

>Гипотеза эффективного рынка ( EMH ) - это гипотеза финансовой экономики, которая утверждает, что цены на активы отражают всю доступную информацию. Прямое следствие состоит в том, что невозможно постоянно «обыгрывать рынок» с поправкой на риск, поскольку рыночные цены должны реагировать только на новую информацию. Гипотеза эффективного рынка - https://ru.qaz.wiki/wiki/Efficient-market_hypothesis

Ответы34484

354 8 фев, 17:17 1934484

63 Кб, 870x355

78 Кб, 852x345

>>34456

>ты сам как человек можешь решить эту задачу?

Со стационарными признаками затрудняюсь. С оригинальными это точно решаемо.
Вот, например, признаки, полученные через diff() и через shift(10000), т.е. со смещением в 1 и 10тыс.
Вопрос, можно ли эти 10тыс. как-то обосновать? Или это всё экспериментально берётся?
Как по мне - какая-то хуйня со слишком большой ошибкой.

>форекских шизов в машобе

Тебе ж говорили, это просто обезличенные данные, а не рубли, не курс валюты, не цены на золото или нефть.

Ответы34494 34512

355 8 фев, 17:28 1934494

>>34484

> Тебе ж говорили, это просто обезличенные данные, а не рубли, не курс валюты, не цены на золото или нефть.

Это противоречит философии прогнозирования. Так что иди нахуй, шиз форексовский.

Ответы34498

356 8 фев, 17:31 1934498

>>34494
Нет, ты.

357 8 фев, 17:41 1934512

>>34484
Можно построить физическую модель в виде системы дифференциальных уравнений и решить ее. Подставив потом начальные данные в нее можно будет прогнозировать их изменение.

Ответы34538 34574 34796

358 8 фев, 18:02 1934538

>>34512
Машоб нормального человека.

359 8 фев, 18:25 1934574

>>34512

>системы дифференциальных уравнений

Что это

Ответы34663 34677

360 8 фев, 19:08 1934639

>>34031
Юзай только людей раз и сначала научись кадр правильно сегментировать, а потом уже видео покадрово разбирай. Так проще

Ответы34683

361 8 фев, 19:15 1934650

Есть годные материалы или книжки по pytorch?

362 8 фев, 19:25 1934663

>>34574
Найс рофл!

109 Кб, 500x407

363 8 фев, 19:37 1934677

>>34574

Аноним 364 8 фев, 19:49 1934683

>>34639
А архитектуру любую выбирать?

Ответы34686

365 8 фев, 19:49 1934686

>>34683
Что мешает разные попробовать? Это же не так много времени занимает.

Ответы34709

Аноним 366 8 фев, 20:04 1934709

>>34686
Ок. Так и сделаю. Спасибо

367 8 фев, 21:18 1934796

>>34512
Можно битерлессон почитать и не лезть своим матанопетушинным рылом в нейронный ряд

132 Кб, 960x1280

368 8 фев, 21:26 1934798

Добрый вечер котятки, мы пишем письмо Сенатору США Теду Крузу по поводу набутыливания Российского AI сектора и отрезания его от международной фин. системы

Котятки кто отвечает за эту Шайтан машину? Напишите в какой компании вы работаете и мы поможем отмазать её и вы может даже на мороз не попадете или под клеймо разведки США что с вами никто в европе здороваться не будет

Только не врите, хотя наверное полиси в новых санкции будет по всему сектору, но у вас есть шанс, особенно после jetbrains

Если вы из этой шараги которая помогает ментам - бегите прямо щас иначе блэклист карьеры пожизненно

Ответы34803 34807 35139

369 8 фев, 21:37 1934802

>>20026 (OP)
https://habr.com/ru/company/ods/blog/322626/

370 8 фев, 21:38 1934803

>>34798
То есть смысл санкций в том чтоб толковые специалисты не бежали с рашки помогая делать западную экономику ещё могущественнее а оставались и совершенствовали российские пыточные вундервафли? Я знаю что у либералов российских конечно со стратегическим мышлением не очень, но не перестаю каждый раз удивляться.

Ответы34810

10 Кб, 340x266

371 8 фев, 21:41 1934807

>>34798

>Добрый вечер котятки, мы пишем письмо Сенатору США Теду Крузу

>мы

Кто мы-то блядь?

Ответы34810

372 8 фев, 21:44 1934810

>>34803

>оставались и совершенствовали российские пыточные вундервафли?

Отрежут от западных API, облаков, лицензий и доллара и пойдут нахуй а не развивать.

>>34807

Нас несколько включая юриста международника.

Ответы34824 34835 34852 35002

373 8 фев, 21:51 1934824

>>34810

> Нас несколько включая юриста международника.

Скорей бы уже статью о госизмене дополнили для вас.

Ответы34829

374 8 фев, 21:54 1934829

>>34824

Ты думаешь режим стагнирующей 1.7% мирового ВВП тоталитарной дыры проживет ещё 10 лет?

ватный AIшник лол,

тебе пизда гнида

375 8 фев, 21:56 1934835

>>34810

>западных API, облаков, лицензий

Делать бабло или удовлетворять претензии полутора окатышей? Хммм, что же выбрать..

Ответы34843

376 8 фев, 22:01 1934843

>>34835

Ну да давай поделай под пожизненным отрезанием от бакса.

Будет как с Роскосмосом который обложили санкциями ему пиздец

Ответы34858 34908

377 8 фев, 22:07 1934852

>>34810

>от западных API, облаков, лицензий

Там где ai рядом с государством там это и так запрещено

Ответы34871

378 8 фев, 22:08 1934858

>>34843

>Будет как с Роскосмосом который обложили санкциями

А как же свободный срыночек и копетоглизм?

Ответы34872

379 8 фев, 22:19 1934871

>>34852

>Там где ai рядом с государством там это и так запрещено

Так сектарально же, будет написано полиси об malicious activity и пошли нахуй все, Иранцев вообще от ГитХаба отрубили к хуям.

Буит весело))))

Ответы34874 34889

380 8 фев, 22:20 1934872

>>34858

>А как же свободный срыночек и копетоглизм?

Россия сегодня антилиберальное говно вроде Ирана, пока гитхаб, API и прочее, будет как в Иране или Крыму.

Ответы35002

381 8 фев, 22:21 1934874

>>34871

>пошли нахуй все

Ну и пойдут нахуй все кроме государственной слежки и впк, то есть браво мистер биден.

Ответы34877

382 8 фев, 22:24 1934877

>>34874

>Ну и пойдут нахуй все кроме государственной слежки и впк

Ну то есть кормовая база для слежки и впк, меньше денех и данных двойного назначения гражданского сектора у режима - быстрее конец

Война она всегда тотальная.

383 8 фев, 22:43 1934889

>>34871
Всё нормально у иранцев с гитхабом, че пиздишь тут.

Ответы34890

384 8 фев, 22:44 1934890

>>34889

доооо))) так нормально, что на гражданах США живут как на прокладках, такой скулеж был в свиттере прошлой зимой

Ответы34946

385 8 фев, 23:09 1934908

>>34843

> отрезанием от бакса

А, так вы из дурки, так бы сразу и говорили

386 8 фев, 23:44 1934946

>>34890
Так сейчас всё нормально, уже как больше месяца. Так что sosi

Ответы34988

387 9 фев, 01:25 1934988

>>34946
Нет, иранское айти в агонии, режим вот вот падёт.

388 9 фев, 02:12 1935002

>>34872
Пишу из Крыма, купил впн муллвад, захожу на гитхаб и ему похуй вообще. Привет.
>>34810
То есть ты пришел в тред машобщиков и говоришь - ребят, а давайте вас безработными сделаем, вот здорово будет! Ты тупой?

Ответы35032 35071

28 Кб, 1024x683

389 9 фев, 05:33 1935032

>>35002

> Пишу из Крыма, купил впн муллвад, захожу на гитхаб и ему похуй вообще. Привет.

Куколаб можно полноценно использовать через ВПН?

Ответы35139

390 9 фев, 10:24 1935065

>>20026 (OP)

>Почему python?

Ответы35081 35088

391 9 фев, 10:33 1935071

>>35002

>Пишу из Крыма, купил впн муллвад, захожу на гитхаб и ему похуй вообще. Привет.

Ну попробуй поработать на fortune 500 с маняпаспортом и из под впн)))

Детский Сад.

Ответы35139

392 9 фев, 11:11 1935081

>>35065
Простой, уже есть коммьюнити и инфраструктура.

393 9 фев, 11:21 1935088

>>35065
коммунити.
мы же не придумываем новое, а копируем и синтезируем идеи.

Ответы35091

394 9 фев, 11:24 1935091

>>35088
Ну и нахуй вы тогда нужны если бот для дерьмоты 2 - верх ваших достижений?

Ответы35095 35126

395 9 фев, 11:34 1935095

>>35091
Твое обывательское мнение в целом нас не ебет.
Мы зарабатываем не на Доте, а на предсказаниях и автоматизации более скучных вещей.

Ответы35099

396 9 фев, 11:38 1935099

>>35095
И много заработали своим ctrl-c ctrl-v?

397 9 фев, 11:57 1935110

Которому плюсы не нужны посвящается.
https://contest.com/docs/dc2021-r1

Ответы35114 35384

398 9 фев, 12:11 1935114

>>35110
Ты не понимаешь, у них калмьюнити и синтезация идей!1!

399 9 фев, 12:35 1935126

>>35091
Что не так с ботом для дерьмодоты 2? Если смешно исковеркать название игры, то это перестаёт быть каким-то достижением?

Ответы35136

400 9 фев, 12:49 1935136

>>35126
Ну как тебе сказать. В мире 21 века где может случиться вирус тупо парализующий жизнь на год и в мире где порядка 20% населения не имеет доступа к питьевой воде и еде сидеть и потеть годами над проектом чтобы несколько кк прыщей посидело с открытым ртом или пилить автопилот для машины и выставлять это чем-то ТАКИМ ГРАНДИОЗНЫМ, ТАКИМ ПРОРЫВНЫМ! Как минимум заставляет задуматься над адекватностью таких людей и людей которые хавают подобное.

Ответы35146

401 9 фев, 12:56 1935139

>>35032
Даже без ВПН позволяет. Скажу больше - Гитлаб работает без ВПН. Охуеть, да? Это потому что дебилы-леваки типа персонажа выше >>34798 не понимают что такое санкции и зачем их вообще применяют.

>>35071

>fortune 500

Работают здесь на твои форчун 500 некоторые, у всех фирмы зареганы в Москве просто. Привет.

402 9 фев, 12:59 1935146

>>35136

>они не делают то, что я считаю важным, поэтому они неадекватные

Окей. Тогда про уайлса или перельмана тебе лучше не знать.

>ТАКИМ ГРАНДИОЗНЫМ, ТАКИМ ПРОРЫВНЫМ!

А оно не прорывное?

Ответы35153 35177

403 9 фев, 13:07 1935153

>>35146

>А оно не прорывное?

a) чем?
б) практическое применение?

404 9 фев, 13:17 1935177

>>35146

>Тогда про уайлса или перельмана тебе лучше не знать.

Это точно.

405 9 фев, 15:28 1935384

>>35110
У тебя баттхерт, кресты реально не нужны, когда у тебя дата саентисты, которые должны шарить в соответствующем матане и не более - нахуярили мвп на скриптоговне и ладно.

>ссылка

Нужно с нуля машобный алгоритм настрочить? Или какой-нибудь торч все-таки можно использовать? В чем смысл?

207 Кб, 856x280

406 9 фев, 18:32 1935615

Анончик, мне поставили задачку (я маркетолух, сильно хуями не кидайтесь) прикинуть, стоит ли магазину открываться в той или иной мухосрани. Задача на линейную регрессию. Можно ли тренить на этих фичах?

x1 - население
x2-x5 - региональная популярность из яндекс-вордстата, по ключевым фразам
х6 - количество магазов в нашей нише
у, соответственно, средняя выручка за три месяца

Имеет ли смысл на этом тренить, или нарезать еще фичей?

407 9 фев, 18:34 1935618

Аноны, такая тема: есть данные температуры, давления, влажности с нескольких приборов за каждый день. Что можно вообще с этими данными сделать?

Температуру предсказывать? Ага, конечно.
На ум вообще ничего не лезет. Может ещё какие фичи добавить?

Ответы35882 35940 35967

408 9 фев, 21:02 1935882

>>35618
В чем твоя цель? Научиться что-то полезное делать на питоне?

Ответы35895

409 9 фев, 21:05 1935895

>>35882

Типо того. В университете есть база данных с этими показаниями, она в открытом доступе, а я как раз МЛ изучаю, хотя больше нейронки на PyTorch пишу.

Препод есть, который горит всей этой идеей (сборкой этих приборчиков, рисованием графиков, и так далее. Хочет такую большую систему создать), и я хочу, так сказать, подлизаться + получить практический опыт.

Ответы35973

410 9 фев, 21:40 1935940

>>35618
Кластеризацию какую-нибудь сделать если получится

Ответы35950

411 9 фев, 21:43 1935950

>>35940

Я тоже об этом подумывал, но что-то не понял: а что вообще сделать? Что кластеризовать?

Есть множество показаний с разных приборов и... что?

Ответы35976

412 9 фев, 22:05 1935967

>>35618
Линейную регрессию на температуру наложи. Потепление климата будет показывать.

413 9 фев, 22:12 1935973

>>35895
так может ты у него и спросишь что ему нужно?
Совершенно дебильная идея делать что-то без цели. Она не несет азарта.

Плохо, конечно, когда азартная идея слишком сложна и не решается. Но ведь препод точно знает лучше чем ему загрузить студентов на долгие годы вперед.

Собери ЕЩЕ каких-нибудь данных типа обезличенной успеваемости из Мудла (у вас есть Мудл?) и проведи параллели.
В чистом виде от температуры мало полезного.

414 9 фев, 22:15 1935976

>>35950
Ну вот в этом пространстве твоих измерений и кластеризуй, если так получится что там несколько явных скоплений а остальное шум можно попробовать проанализировать что это за состояния что такое разделение вызывают, чем отличаются итп. Если размерность большая, пробуй уменьшать всеми популярными и не очень методами. Исследуй, ёпта.

415 9 фев, 22:55 1936004

Привет посоны.
Есть ли какой-нибудь алгоритм на :ython: для кластеризации облаков точек, который плюс-минус будет приближен к риалтайму? Размер облака примерно 70к точек (понятно, что можно уменьшить размер). Данные не с лидара, а с ргбд камеры.
Пробовал dbscan из sklearn.cluster, но хотелось бы еще быстрее

Ответы36284 36286

416 10 фев, 08:00 1936284

>>36004
Плюсы учи.

Ответы36286

417 10 фев, 08:07 1936286

>>36284
Крестошизик, спок.
>>36004
https://habr.com/ru/post/101338/

Ответы36367 36643 36676

418 10 фев, 11:37 1936367

>>36286
если у него dbscan не вывозит, то что еще остается?
вроде это и так современный и быстрый считается.

6 Кб, 200x160

419 10 фев, 12:23 1936409

Новый тензорфлоу 2 - это керас?

Ответы36636

420 10 фев, 14:08 1936636

>>36409
Керас это надстройка над слесарьпловом.

421 10 фев, 14:10 1936643

>>36286
спасибо, чел

422 10 фев, 14:24 1936676

>>36286

>habr.com

>С результатами, если честно, туго :). Дальше экспериментов дело не пошло, настало время защиты, и нормальных результатов нет.

Я понимаю, что швабропидоры говноеды по определению, но давать ссылку уважаемым двачерам не только на швабропапашу, но и на высер прыщавого студераста которы там посмотрел пару видяво на ютубчике это уж слишком

423 10 фев, 16:51 1936815

Почему петухон? Не, ну серьёзно. В системах быстрого реагирования типа скальпинга он же проебёт 319%. Как вкатываться если я сиплюсплюс-господин?

Ответы36879 36886 36901 36912 36935 36946 36967 37527

424 10 фев, 17:47 1936879

>>36815
Спешите видеть, сиплюсплюс господин не может вкатиться в петухон!

Ответы36909

425 10 фев, 18:02 1936886

>>36815

> В системах быстрого реагирования типа скальпинга

Ты название треда читал? Какой скальпинг, але. Алсо, на пистоне слишком много написано, да чего там, 100% актуального машоба это пистон. Никто все это переписывать не будет.

Ответы36900 36909

426 10 фев, 18:24 1936900

>>36886

>актуального машоба

Это тебе так в школе сказали?

Ответы36936

427 10 фев, 18:25 1936901

>>36815
У тебя уже не получится, потому что ты разраб и не можешь в понимание коммерции

Ответы36909

428 10 фев, 18:28 1936909

>>36879
Могу, но на кой даунгрейдиться?
>>36886

>100% актуального машоба это пистон.

Мало ебёт. Я почти всё собираюсь с 0 писать.
>>36901
Держи в курсе.

Ответы36917 36918 36954 36967

429 10 фев, 18:29 1936912

>>36815

> Почему петухон?

Сто раз объясняли же уже: господам ресёрчерам и аналитикам слишком много и быстро нужно проверять свои идеи, дрочиться с быстродействием, "чистым кодом" и прочими идеями фикс программисточеляди процесс только замедлит.

>В системах быстрого реагирования типа скальпинга

У команд которые занимаются игрой на фондовых рынках отдельные люди занимаются созданием торговых алгоритмов и сигналов и делают они это на чём хотят, а другие оптимизируют эти придуманные алгоритмы под быстродействие и сеть (вот там и сишка, и даже глубже в полный рост).

430 10 фев, 18:31 1936917

>>36909

>Держи в курсе.

Если ты хоть раз называл работодателя "человеком от бизнеса", то можешь и не пытаться продолжать

431 10 фев, 18:31 1936918

>>36909

>Мало ебёт. Я почти всё собираюсь с 0 писать.

Ну вперёд, пополняй коллекцию шизов.

Ответы36922

432 10 фев, 18:35 1936922

>>36918
Ctrl-C, Ctrl-V обезьянка, успокойся, а?

433 10 фев, 18:41 1936935

>>36815

>сиплюсплюс

>господин

господин можеть позволить себе закрыть ипотеку за 2 года?

Ответы36945 36954

434 10 фев, 18:43 1936936

>>36900

>в школе сказали?

оно и видно
фанбоем крестов в 2k21 может быть разве что восторженный школьник, верующий в НАСТАЯЩЕЕ ПЫГРАМИРАВАНИЕ, не зная даже рынка труда

435 10 фев, 18:51 1936945

>>36935
Могу позволить себе стабильно её оплачивать не имея постоянной работы прогером. Ещё вопросы?

Ответы36947

436 10 фев, 18:55 1936946

>>36815
"В системах быстрого реагирования типа скальпинга" важнее всего не твой ко-ко-код, а скорость канала связи

437 10 фев, 18:55 1936947

>>36945

>сижу на шее у мамки

Типичный шизик-крестоёб

Ответы36948

438 10 фев, 18:57 1936948

>>36947
На моче гадал или что вы тут любите?

Ответы36952 36953

439 10 фев, 19:04 1936952

>>36948

>не имея постоянной работы прогером

при этом шизик-крестоёб

Ответы36953

440 10 фев, 19:05 1936953

>>36952
>>36948

441 10 фев, 19:06 1936954

>>36909

>Я почти всё собираюсь с 0 писать.

Это нормально если ты учишься. Я когда был студентом тоже любил писать велосипеды, в том числе нейронки без использования библиотек. Но со временем понимаешь, что это никому нахуй не нужно, и лучше решать задачи бизнеса и получать за это деньги.
>>36935

>господин можеть позволить себе закрыть ипотеку за 2 года?

Причем здесь питон и вообще машоб? Чтобы закрыть ипотеку за два года надо быть директором в крупной компании.

442 10 фев, 19:32 1936967

>>36909

>Могу, но на кой даунгрейдиться?

А куда ты будешь даунгрейдиться? Ты же не в петухон-разработчики собрался, а в дота саентисты.
А дота саентисты промышленный код не пишут, они быстро собирают модели и проверяют гипотезы. Простой скриптовый петухон для этого как раз подходит.

>Мало ебёт. Я почти всё собираюсь с 0 писать.

На работе на дядю за монеты ты этого делать не будешь.
>>36815

>В системах быстрого реагирования типа скальпинга

Не поверишь, дота саентисты и там петухон юзают.

443 10 фев, 20:05 1936987

Есть на словах Кластер. Управляющая нода и вычислительные. На деле работаем на одной. Как можно распараллелить какую-то абстрактную прогу на все ноды?

Ответы37050 37081

444 10 фев, 20:29 1936997

Посоветуйте как войти в ML на практике. Открываю курсы там матан и рисунки. Было бы неплохо сначала посмотреть как куда данные двигаются, гдянуть питон, а потом уже матан смотреть. Есть такое?

Ответы37000 37120 37272

445 10 фев, 20:30 1937000

>>36997
PS я уже программировал свою собственную многослойную нейронку обратного распространения без использования Tensorflow и пр

446 10 фев, 20:33 1937002

Наткнулся на темпотрон и не понял, на каких задачах его оптимально применять?

447 10 фев, 21:22 1937050

>>36987
МЛ алгоритм или что?

448 10 фев, 21:56 1937081

>>36987
как эти абстракции заебали. абстракции теряют важную информацию. оптимизация заключается в использовании важных не вполне видимых возможностей. Ты же не на матеше.

вывод : тебе никак не ускорить.

347 Кб, webm,
1920x1080, 0:08

449 10 фев, 22:09 1937095

Какая хохлушечка...

Ответы37107 37263 37287 37315 37346

450 10 фев, 22:18 1937107

>>37095
Ага, а в комментах толпы дрочеров практически ей в любви признаются.

451 10 фев, 22:30 1937120

>>36997
Ну глянь питон, потом уже матан смотри. И не матан, а математика.
Для обычной работы в датасайенсе достаточно базовой технической математики. То есть формулы и несложные базовые концепции (особенно из статистики, чтобы тестировать гипотезы).
Питон тоже базовый, скриптописание, не промышленный код.

452 11 фев, 02:56 1937263

>>37095
Ай, пагадай на ручке

Ответы37311

453 11 фев, 03:55 1937272

>>36997
Какой тебе мл, ты шапку осилить не можешь. d2l.ai, там все нужное.

Ответы37377

454 11 фев, 07:00 1937287

>>37095
Кто сказал, что она хохлушечка?

Ответы55504

455 11 фев, 08:31 1937311

>>37263
Ждём хиромантию на основе ML.

Ответы37316

456 11 фев, 08:37 1937315

>>37095
Дрочил бы джва часа

457 11 фев, 08:39 1937316

>>37311
Хиромантия хйня.

458 11 фев, 10:06 1937346

>>37095
Стейсуха в дотасаенс!

459 11 фев, 11:02 1937377

>>37272
Слушай, ну вот серьезно? Освоил программирование, написал свою нейронку без всего и не освою ML? Ну вот ты хоть себе не ври, а тем более не пытайся опускать других.

Это не отрицает того факта, что я благодарен тебе за то что тыкнул меня носом в ссылку. Мне по началу показалось, что в посте ссылки только на занудные абстракции с минимумом практики. Оказался неправ

460 11 фев, 14:05 1937527

>>36815
Сначала на питоне пишут. Если модель сидит на потоке данных, то переписывают на плюсы. Также как сначала делают восковую модель будущей статуэтки, а потом закапывают ее в песок и заливают бронзой. Можно сразу из бронзы делать, но эффективнее двухступенчатый метод.

1 Мб, 890x892

461 11 фев, 17:21 1937754

Как думаете набор кода голосом будет актуален в будующем?
Физический ввод с клавы - это ведь весьма медленный процесс, если сравнивать его со скоростью мысли.

Есть одна идейка как научить ИИ воспринимать речь и переводить ее в код, не каждую букву или слово диктовать, а именно паттерны.

Функция с замыканием, возвращает переменную со значением..

Типо так нагаваривать.

Ответы37767 37809

462 11 фев, 17:26 1937767

>>37754

> набор кода голосом

https://cyberleninka.ru/article/n/programmirovanie-golosom-kak-neobhodimost/viewer

463 11 фев, 17:47 1937809

>>37754

>Физический ввод с клавы - это ведь весьма медленный процесс, если сравнивать его со скоростью мысли.

Вряд ли машинистки что-то перепечатывающие согласятся.

>Функция с замыканием, возвращает переменную со значением..

Так чтобы такое сказать это надо блоксхему какую-то делать или ещё что-то да и если удалить что-то надо, то как? Целыми блоками? Или попробовать?

93 Кб, 400x344

464 11 фев, 18:46 1937914

СЫНОК, ИСПОЛЬЗУЙ РЕГУЛЯРИЗАЦИЮ ТИХОНОВА
@
ФУУ НЕ БУДУ Я ПРИМЕНЯТЬ КАКОЕ-ТО СТАРОЕ СОВКОВОЕ ГОВНО
@
ВООБЩЕ-ТО ЭТО RIDGE REGRESSION
@
ОМ НОМ НОМ ММ VERY DATA MUCH SCIENCE

Ответы37925 38240

465 11 фев, 18:55 1937925

>>37914
Да, типичный дотасаенс.

466 11 фев, 20:03 1938060

Шизик пытается приравнять регуляризацию тихонова и теорему жопеншмульцера. Проблема только в том, что даже в sklearn'е фамилия тихонова всплывает в первых строчках описания, когда его любимый жопеншмульцер нахуй никому не нужен.

Ответы38162 38194 38240

467 11 фев, 21:31 1938145

>>20026 (OP)
В чём суть трансформеров?

Ответы38225

468 11 фев, 22:02 1938162

>>38060
Так над этим и хихикаем же

469 11 фев, 23:14 1938194

>>38060
А почему Тихонов не Жопеншмульцер, а Жопеншмульцер - Жопеншмульцер?

Ответы38209 38219 38240

470 11 фев, 23:40 1938209

>>38194
Сказано же, потому что в туториале соевым про тихонова написали, а про жопеншмульцера не написали.

Ответы38240

471 12 фев, 00:06 1938219

>>38194
По закону тождества.
Жопеншмульцер никому не нужен, кроме местного шизика. Поэтому он и натягивает его на всё подряд. Про тихонова же знает любая собака, умеющая нажимать shift+tab.

Ответы38240

472 12 фев, 00:16 1938225

>>38145

> В чём суть трансформеров?

Аттеншен олл ю нид, зумер

473 12 фев, 00:43 1938240

>>37914
>>38060
>>38194
>>38209
>>38219
Тихонов по молодости то был годный чистый математик, топологией занимался, вводил важные понятия и задачи сложные решал.
А потом начал прикладухой всякой маяться, да так намаялся, что теперь он даже не Жопеншмульцер у машобов.

Ответы38283

474 12 фев, 03:27 1938283

>>38240

>Тихонов

Он в обще молодец, особенно его роль Штирлица мне сильно понравилась.

475 12 фев, 12:42 1938464

Сап аноны, на моей текущей галере мне предложили заниматься дата саенсом в основном nlp, хотя сам я работаю в другой сфере бд. Опытных дата саентистов в компании нет, но они сказали типо не ссы, курсы если что оплатим. Сам проект в зачаточном состоянии и сейчас над ним работает только один человек.
Внимание, вопрос: насколько такой опыт будет релевентен в будущем? Если я год отработаю на этом проекте, скажем, занимаясь по сути самообучением, смогу ли потом устроится джуном-саентистом в другую фирму? Или без опытного ментора это вообще гиблое дело?
питон знаю, имею базовые представления о мл

Ответы38489 38512 38539

476 12 фев, 13:19 1938489

>>38464

>nlp

Самое слодное в дс. Для полноценного понимания речи нужен контекст на который нейросети пока не способны. НЛП работает только в очень конкретных случаях типа техподдержки.

Ответы38512 38563

477 12 фев, 13:44 1938512

>>38464
Есть вероятность, что продолжительное время ты будешь заниматься не датасаенсом, а инжинирингом, настройкой пайплайнов и прочее прочее.
>>38489
Как раз техподдержка суперхуево работает, если только там не уровень "если ,,, нажмите 1".

Ответы38563

478 12 фев, 14:07 1938539

>>38464

>смогу ли потом устроится джуном-саентистом в другую фирму

Сможешь, по сути твой вариант этот тот о котором все айтишники вкатуны в дс мечтают.

Ответы38566

479 12 фев, 14:17 1938563

>>38489
там конкретные задачи на анализ того, к какому виду относится документ
>>38512
Но ведь это тоже же релевантно для того, чтоб потом устроится джуном? Пусть не дата саентистом, а мл инженером, скажем.

480 12 фев, 14:21 1938566

>>38539
Я не обозначил, что сам человек тоже не сильно шарит и только учится хотя сам по себе он опытный программист. Разве все вкатуны не мечтают о менторе?
Просто я боюсь, что в итоге будем делать хуёвый проект самыми базовыми методами, ни про тонкости не узнаю, не про фишки какие то, а в других компаниях тебя будут считать джуном только если ты год работал под чьим-то надзором

Ответы38624

481 12 фев, 15:30 1938624

>>38566
Ну зато в резюме у тебя nlp.
И кто сказал что классика на bag of words плоха, если она справляется?

Ответы38646

482 12 фев, 15:54 1938646

>>38624
не знаю. На собесах же будут спрашивать про более сложные вещи, наверное в нашем проекте сейчас tf-idf, лол

Ответы38706

483 12 фев, 16:52 1938706

>>38646
Эх джуны-джунчики. Берёшь и без задней мысли говоришь что вовсю наворачивали gpt с бертами, информацию общего плана и детали учишь гуглением, на более тонкие моменты говоришь что ты всё таки джун и этим занимались более прошаренные чуваки. Проверять никто не будет.

115 Кб, 590x296

484 12 фев, 18:11 1938798

485 13 фев, 01:06 1939151

>>20026 (OP)

> Trevor Hastie et al. "The Elements of Statistical Learning"

> Christopher M. Bishop "Pattern Recognition and Machine Learning"

Наверняка есть те кто читал или пытался. Осилю ли я что-то из этого если до этого никогда не читал книг на англе, только тексты небольшого размера регулярно подглядывая перевод незнакомых слов? С одной стороны понимаю, что слаб достаточно в англе, с другой, техническая литература читается попроще художественный. Если считаете что не осилю прямо сейчас, то дайте совет как прокачаться в англе чтобы в среднесрочной перспективе смочь прочитать талмуд по млу в оригинале?

Ответы40174 40402

486 13 фев, 01:18 1939160

Посоны, я все нахуй понял! Оно работает!

Теперь такая хуйня, скатывается в локальный минимум, как лечить?

Ответы39292 39309 39630

487 13 фев, 09:26 1939292

>>39160
Обычно локальные минимумы достаточно хороши, чтобы можно было не искать глобальный.
Поменяй архитектуру, добавь данных, настрой параметры lr.

Ответы39352

488 13 фев, 09:57 1939309

>>39160
Это не лечится.

Ответы39352

489 13 фев, 11:10 1939339

Гугл не хранит бигдату. Где-то треть моих рекомендаций ютуба составляет то, что я уже смотрел.

Ответы39561 39655

490 13 фев, 11:25 1939352

>>39292

>Поменяй архитектуру

я сначала задачу решил на логических операциях - xor, and, or и т.д.
потом перенес на нейроны и ручками расставил веса - заработало.
потом расставил веса рандомно, обучил и тоже заработало.
архитектура подобрана идеально, меньше не взлетит, больше - избыточно.

и вот эта сука иногда не учится совсем!

>>39309
не существует метода обучить xor? чо за хуйня?

Ответы39364 39630

491 13 фев, 11:43 1939364

>>39352

>архитектура подобрана идеально

Покажи, кстати.

>больше - избыточно

Похуй. У тебя почти во всех задачах непонятно, где это "избыточно" начинается.

Ответы39428

39 Кб, 745x877

492 13 фев, 12:39 1939428

>>39364
ну вот так например. пачка xor.

вчера пьяный был, надо выкидывать 1 скрытый xD

Ответы39479 39558 40236

493 13 фев, 13:19 1939479

>>39428
Нахуя тебе 9 выходов?

494 13 фев, 13:34 1939486

0-8 = 9 вариантов же

36 Кб, 511x407

495 13 фев, 14:40 1939558

Вся суть этого треда >>39428 пьяный зумер вкатывальщик не может в xor.

496 13 фев, 14:42 1939561

>>39339
Потому что видимо это и есть норм решение

497 13 фев, 15:41 1939630

>>39352
Как вообще связаны сообщения >>39160 и >>39352?

>не существует метода обучить xor? чо за хуйня?

Чтобы реализовать XOR, достаточно взять три нейрона, два в первом слое и один во втором (полносвязно). Либо же один нейрон, но с третьим входом в виде произведения операндов.
И чего там в одном XOR обучать вообще, блеать? Впиши веса руками сразу, алкаш. Кумыса выпей.

Ответы39645 39669

498 13 фев, 15:55 1939641

Подскажите, есть разница в использовании TensorFlow.NET и обычного TensorFlow, не хочу тратить время на изучения python.
Что скажете про ML.NET? Годнота или нет?

Ответы39643 40055

499 13 фев, 16:02 1939643

>>39641
Ничего про дотнет не знаю, но если ты хочешь вкатываться в мл всерьёз и надолго, то питон один хер придётся учить.

Ответы39654 39742

500 13 фев, 16:04 1939645

>>39630

>Чтобы реализовать XOR, достаточно взять три нейрона, два в первом слое и один во втором (полносвязно).

а у меня сколько?

>И чего там в одном XOR обучать вообще, блеать?

ебанутый?

Ответы39650

501 13 фев, 16:07 1939650

>>39645
Ты проспался уже? Кумыса полную чашу испил?
А теперь перечитай тред и ответь на свои вопросы.

502 13 фев, 16:08 1939654

>>39643
Но ведь 20% усилий дают 80% результата
бгг

Ответы39660

503 13 фев, 16:09 1939655

>>39339

>Гугл не хранит бигдату.

Братишка, ебать ты долбоеб

Ответы39657

127 Кб, 872x402

504 13 фев, 16:13 1939657

>>39655

Ответы39667

505 13 фев, 16:15 1939660

>>39654
И что?

Ответы39685

506 13 фев, 16:18 1939667

>>39657
Такого я еще не видел. Христианская наука о данных!

57 Кб, 989x476

507 13 фев, 16:19 1939669

>>39630

>Чтобы реализовать XOR, достаточно взять три нейрона, два в первом слое и один во втором (полносвязно).

ебать ты наверное умный.
вот это иногда не хочет учится. у меня тоже.

С этим можно боротся, кроме как перезапуском?

Ответы39692 39715 39957

508 13 фев, 16:25 1939685

>>39660
Можно изучить ml.net и найти себе место в низкоконкурентной области...пока ты все проебываешь с SOTA в биржевых предсказаниях, например.

Ответы39702 39733

66 Кб, 592x532

509 13 фев, 16:28 1939692

>>39669

> ебать ты наверное умный.

А ты так вообще титан мысли, доктор Манхэттен нахуй. Посмотри на картинку, что ты принес, ты там 9 выходов видишь, зумерша с тиктока?

510 13 фев, 16:38 1939702

>>39685
Наверное, можно. Я просто к тому это сказал, что питон основной язык индустрии, и все новые разработки на гитхаб выкладывают на питоне.

511 13 фев, 16:38 1939703

2 Кб, 394x326

70 Кб, 592x532

Что с вами не так, зумера? Датасет, описывающий задачу xor, имеет два входа и один выход. Где там 9 выходов, объясните. Как там вообще можно додуматься до 9 выходов, что нужно купить вместо мозгов, чтобы голова работала настолько плохо?

Ответы39710

48 Кб, 745x877

512 13 фев, 16:47 1939710

>>39703

>Как там вообще можно додуматься до 9 выходов

это 9 xor, мне так нужно.
чому ты такой ебанутый?

513 13 фев, 16:52 1939715

>>39669
Что за прога? Почему сеть не учится?

Другой анон

Ответы39722

514 13 фев, 16:59 1939722

>>39715

>Что за прога?

http://synset.com/ai/ru/nn/NeuroNet2D.html

>Почему сеть не учится?

иногда попадает в глобальные минимумы

515 13 фев, 17:08 1939733

>>39685

>и найти

или не найти
низкоконкурентная - значит нахуй никому не нужная
и вообще, назовёшь такую область или это лишь твои фантазии?

Ответы39830

516 13 фев, 17:28 1939742

>>39643
Нет, я хочу для своих целей, всерьёз и надолго не хочу вкатываться.

Ответы39811

517 13 фев, 18:13 1939811

>>39742

>для своих целей

каких целей? набросать прототип быстрее и проще на петухоне, зачем ебаться ещё и с майковским говноделием

518 13 фев, 18:30 1939830

>>39733
Заводик в Хуево-Кукуево во встающем колен дотационном российском сельском хозяйстве. Деньги навозом не пахнут.

Ответы39861

519 13 фев, 18:48 1939861

>>39830
зачем на заводике мышиное облучение
но это ладно
а щоб було
главный вопрос - почему обязательно дотнет?

Ответы39869

520 13 фев, 18:51 1939869

>>39861
Потому что программист мог не знать ничего другого.
Кстати, в sql вроде подвезли всю классику дедовскую давно.

521 13 фев, 19:54 1939957

>>39669
Открою тебе страшную тайну: любая задача машинного обучения сводится к задаче оптимизации. Так что и проблемы теории оптимизации перетекают в проблемы машоба.

Градиентный спуск в принципе не может гарантировать достижение искомого глобального минимума, потому что использует только локальную информацию о поверхности, представляющей оптимизируемый функционал. Соответственно, алгоритм обратного распространения тоже.

Далее начинаются танцы с бубном. Эвристики.
Танцы с бубном для нейронок заключаются в выборе конкретного градиентного метода и в выборе структуры самой сети, а также в выборе начальных значений весов. По каждому пункту существует куча рекомендаций, и при этом нет никакой теории. Потому что танцы с бубном.

Перезапуск, кстати, и относится к выбору начальных значений весов.
Короче, танцуй с бубном.

Быть может, тебе тоже кумыса налить?

195 Кб, 687x822

522 13 фев, 20:36 1940020

Подбирается наиболее подходящая надпись к загруженной картинке (среди заголовков из onion news но можно и свои данные добавить) с помощью поиска в том же латентном пространстве что используется в DALL-E
https://colab.research.google.com/drive/15SWvQeO5tJziKdyh8ISJNMvGAZyr_zun?usp=sharing

Ответы40094

523 13 фев, 21:01 1940055

>>39641

>TensorFlow.NET

Опенсорс, держащийся на энтузиастах.
https://www.tensorflow.org/api_docs

2A23A22200000578-0-Googlehasissuedanapologyaftercomputerpro[...].jpg

50 Кб, 634x536

524 13 фев, 21:39 1940094

>>40020

> трилобит, тентакли, лук

Чет хуйня уровня пикрелейтед...

525 13 фев, 22:33 1940174

>>39151
Книг этих я не читал. Но как человек, имеющий некоторое отношение к математике, скажу вот что.
Техническая (или математическая) литература действительно читается проще художественной, причём гораздо проще, особенно, если у тебя уже есть некоторое представление о предмете.
Так что на самом деле тут вопрос не столько в английском, сколько в математике. Если ты в целом хоть что-то соображаешь в той математике, о которой собираешься читать, будет довольно не сложно. Конечно, даже в сухом математическом тексте бывают неочевидные синтаксические конструкции, но их довольно мало.
Я, например, научился читать (и понимать) математические книги гораздо быстрее, чем хоть как-то говорить.
А книги твои, как тут говорят, "дедовские", так что там явно должна быть математика, в отличие от современных книг по машобу для программистов. С другой стороны, программистские книги читать еще проще.
Короче, думай не о том, осилишь ли ты английский, а скорее о том, осилишь ли ты математику. Такие дела.
Могу еще посоветовать очень годную книгу на эту тему.

Ответы40177 40223 40228

526 13 фев, 22:37 1940177

>>40174

>имеющий некоторое отношение к математике

латентный гей?

Ответы40182

527 13 фев, 22:39 1940182

>>40177

>латентный гей?

Ты?

528 13 фев, 23:34 1940223

>>40174

>Могу еще посоветовать очень годную книгу на эту тему.

Давай, интересно

Ответы41109

529 13 фев, 23:37 1940228

>>40174

>Могу еще посоветовать очень годную книгу на эту тему.

Годнее бишопа ничего не будет.

Ответы41109

63 Кб, 1199x1194

530 13 фев, 23:43 1940236

>>39428

531 14 фев, 02:10 1940332

братаны
короче я перекатываюсь к вам из геймдева (хочу в мл инжениринг - который больше про проганье, чем матешу и юпитер)
скажите, при условии, что для вкатывания с математикой все ок и что знаю питон, на какие вещи, с точки зрения api и прочих тулзов нужно обратить внимание для вката?
Я просто в гугле совершенно разную инфу нахожу и не могу более-менее структурированный список составить, чтобы покрыть какой-то процент вакансий.
pyspark? hadoop?
подскажите плиз

Ответы40336 40578 40602 41329

532 14 фев, 02:28 1940336

>>40332
Если ты спрашиваешь конкретно про библиотеки, то я бы рекомендовал учить вот это (в перечисленном порядке): numpy, pandas, opencv, matplotlib, scipy, tensorflow, keras. Ну и не забывай про стандартную библиотеку питона, в ней тоже много чего интересного.

Ответы40383

533 14 фев, 07:07 1940383

>>40336
Судя по всему, он спрашивал скорее про инфраструктурные вещи типа hadoop, mapreduce, нереляционных датабаз, распределённых вычислений и т.д.

Ответы40389

534 14 фев, 07:31 1940389

>>40383

>Судя по всему, он спрашивал скорее про инфраструктурные вещи типа hadoop, mapreduce, нереляционных датабаз, распределённых вычислений и т.д.

Это все из биг даты и к машобу отношения не имеет.

Ответы40408

535 14 фев, 09:00 1940402

>>39151
d2l.ai самая годнота.
Смысл в шапке, если это просто набор информации, книги на категории бы поделили, какие для вкатывальщиков, какие для математиков.

Ответы40440

536 14 фев, 09:14 1940408

>>40389
К МЛ инженерии это как раз имеет отношение.

Ответы40449

537 14 фев, 10:24 1940440

>>40402
Дедовские для математиков, остальные для вкатывальщиков.

538 14 фев, 10:35 1940449

>>40408

>К МЛ инженерии это как раз имеет отношение.

МЛ инженер - это гибрид машобщика, программиста и девопса. Он должен уметь абсолютно все, начиная от теории и прототипирования модели, заканчивая настройкой пайплайнов, написания нормального кода и выката системы в прод. Биг дата же является отдельным направлением, которое может пересекаться с машобом, но очень редко. Большинство датасетов для машоба меньше терабайта и не являются биг датой.

Ответы40454

539 14 фев, 10:41 1940454

>>40449
Теоретик ты наш, а с какой же тогда целью эта бигдата собирается?

540 14 фев, 14:01 1940570

Решил посмотреть разные методы на простом анализе тональности предложений.
Это нормально, что BoW на сырых словах работает не особо хуже чем BoW после лемматизации (через яндепсовский mystem)?
С tf-idf различие также минимально.

Ответы40591 40652

541 14 фев, 14:15 1940578

>>40332
Нужно знать SQL в первую очередь. Синтаксис взаимодействия с хадупом напоминает SQL (spark), либо прямо эмулирует его (Hive). Но это в общем-то несложная часть. Сложность в том, что хадуп - опенсорс, который постоянно ложится из-за своей недоработанности. При этом он написан на джаве. А спарк - на скале. Также же еще нужно быть девопсом, так как хадуп - это операционная система для сети из компов.

542 14 фев, 14:32 1940591

>>40570
Потому что это дедовское говно в принципе не очень работает, так что никаких трюки адхоковские не помогают.

543 14 фев, 14:39 1940602

>>40332
на самом деле нечасто можно увидеть вканутов которые не "ЫЫЫЫ ХОЧУ ДЕЛАТЬ ЛИНЕЙНЫЕ РЕГРЕСИИ ФРОМ СКЛЕРН ИМПОРТ СУПЕРМОДЕЛ - СУПЕРМОДЕЛ.ФИТ"
и прочее говно из курсов. А если не секрет, ты чего решил перекатываться именно в мл инжениринг? деньги?

Ответы40641 40674

544 14 фев, 15:31 1940641

>>40602
Макака, плиз

Ответы40660

545 14 фев, 15:35 1940652

>>40570
Нормально они работали в письменный век. Перестали работать в век зумерских эмодзи .

Просто ты "твиты" скорее всего пытаешься обработать. Короткие сообщение где вся информация скрывается в контексте и значении слов.

Нужны нейросетевые эмбединги.

546 14 фев, 15:42 1940660

>>40641
не понял

547 14 фев, 15:49 1940674

>>40602
ну, вообще, причин много
1) да, деньги. В игродеве платят не очень много, а в датка области зп выше, иногда ГОРАЗДО
2) мл инжениринг хочу, тк не уверен, что по матеше смогу конкурировать со всякими МФТИшниками, ШАДовцами и прочими ребятами - я ведь из бомонки, у нас не так дрочат этот матан. Хоть мне и все это интересно. А прогать я умею - у меня много опыта в шарпе и в геймдеве
3) Сейчас весь ИТ сегмент крутится либо вокруг диких байтоебов, либо вокрут машинного обучения. В таком контексте не попробоваться влиться - глупо. Даже если через пару лет придется перекатиться
А вообще, конечно, хочется прийти к матешке - уж нравится она мне
скажите, насколько нужно реально задротить матан, чтобы стать специалистом, а не макакой очередной?
Учеба в шаде или мфти действительно дает такой бесконечный разрыв? я просто очень редко вижу наличие бомонки как "желательно" в вакансиях: в основном мфти/шад/вмк/вшэ

Ответы40694 40735 40820

548 14 фев, 16:04 1940694

>>40674
По-моему все крутится вокруг вэба.

549 14 фев, 16:38 1940735

>>40674
Математика нужна ресёрчерам. Лучше в аналитику перекатываться.

Ответы40817

550 14 фев, 17:07 1940762

Анончик, где можно посмотреть примеры использования статистики в бизнесе? Гуглил - нашел только какие-то простыни говнокода, из которых нихуя не понятно. Ну или задачник какой-нибудь, чтобы было близко к реальности

25 Кб, 1012x576

551 14 фев, 17:54 1940808

>>20026 (OP)
Какой вариант раскидывания res связей лучше и почему?
Популярнее как я посмотрел второй вариант но почему, параметров же больше а суть та же?

Ответы44746

552 14 фев, 17:59 1940817

>>40735
Я всегда думал, что ресерчерами с потолка не становятся
Думал, что ресерчер это после сеньера
Блин как сложно на самом то деле разобраться кто у вас в дата саенсе что делает

Ответы40885 40921

553 14 фев, 18:01 1940820

>>40674

>шад

Поясните для ВПЛ, туда реально самостоятельно вкатиться после курсов на ютубе/курсере/едХ и МФТИ на степпике?

Ответы40885

554 14 фев, 18:05 1940825

https://stepik.org/course/91157/info
https://stepik.org/course/91156/info

МФТИ уже второй год делает бесплатные курсы для Machine learning.

555 14 фев, 18:48 1940885

>>40817
https://yandex.ru/jobs/vacancies/interns/intern_researcher/
>>40820
Вкатиться реально, курсы не помогут. Читай материалы, которые они советуют поступающим. Решай codeforces и демидовича.
Вроде ещё как добавилось недавно что-то про анализ данных во вступительные, хз какие требования.

556 14 фев, 19:11 1940921

>>40817
Сеньор и ресерчер это вещи из разных измерений.
Ресерчер - это, по-хорошему, PhD, ну или условный аспирант. Короче говоря, это научная тема. По сути тот же ученый, только корпоративный, а не академический.
С индустрийной градацией джун-миддл-сеньор это напрямую не связано.

Ответы40967

557 14 фев, 19:44 1940967

>>40921
и где трава зеленее? у научников или индустрии
вообще бля я теперь точно нихуя не понимаю
пришел сюда с желанием понять что учить, а ушел с тотальным непониманием куда вкатиться, кто чем занимается и куда перспективнее

Ответы41114 41430

344 Кб, 1434x2353

558 14 фев, 20:41 1941019

Ответы41066 42733

559 14 фев, 21:20 1941052

аноны, а классический мл, без нейросеток, применяется сейчас где-нибудь?

Ответы41059

560 14 фев, 21:31 1941059

>>41052
Рекомендательные системы, табличные данные. Задачи, где важна интерпретируемость (кредитный скоринг). Задачи, где важна скорость и качество нужно только в первом приближении (спам-фильтры). В компьютерном зрении - если структура данных постоянна и просто устроена, например, снимаются коробки с одного и того же ракурса.
Почти весь реальный unsupervised.

561 14 фев, 21:38 1941066

>>41019

>alphaGo 2014

Она же была в 15. А ли седоля вообще в 16 только обыграли. Найс обсёр по фактам. Может ещё где-то проебались с датами, это только то что вспомнил.

>нет дармутского семинара

Хоть его больше связывают с AI, имхо, тут тоже нужен.

>нет alexnet'а в 2012

Ну это позор просто

562 14 фев, 22:47 1941109

>>40223
А. Б. Сосинский "Mathematical English. Учебник английского для математиков" и его же более старая "Как написать математическую статью по-английски".
Книги похожи, иногда очень похожи, что неудивительно. Рекомендую начать с первой. На ней же можно и остановиться.

Книги эти написаны математиком для математиков. Цель книг - научить писать математические статьи (и книги).
Подразумевается, что читатель владеет только базовой лексикой, терминологией, умеет в целом понимать прочитанный английский математический текст и, главное, обладает желанием активно использовать именно математические способности, а не гуманитарные привычки (выработанные при изучении языка). Это почти цитата из предисловия.
Более того, автор утверждает, что хорошее знание языка, выработанное обычным гуманитарным способом в школе и универе, даже будет мешать. Будет лучше, если ты плохо знаешь язык - не придётся переучиваться.

Так вот, цель книги - научить писать статьи на английском, при этом требуется среднее умение их читать.
Твоя цель - научиться читать эти написанные статьи.
И здесь нет противоречия. Книга может тебе помочь.
Потому что, фактически, это мануал, который можно развернуть в обратную сторону. Идти не от русского к английскому, а наоборот.

Книга содержит практически все основные языковые конструкции, используемые для написания математических статей.
По сути, это шаблоны, в которые остается лишь подставлять свои слова.

Вещь очень годная.
Если ты хорошо проработаешь эту книгу, она в математическом плане заменит тебе несколько лет стандартного изучения английского в школе и универе. Благо, в ней всего 90 страниц (в старой немного больше).

Короче, ты можешь использовать все шаблоны из этой книги в обратном направлении, от англ к рус, и таким образом сможешь прочитать (и понять) даже сложные конструкции.

Вообще, это не учебник математического (и тем более обычного) английского, а именно мануал по переводу матстатей. Я бы даже сказал, фреймворк.
Но, как я уже говорил, для использования этого мануала нужно базовое понимание той математики, о которой ты хочешь читать или писать.

И да, там даже есть примеры специфических конструкций из теорвера и матстата.

Такие дела. Дерзай.

>>40228
Наверное. Но я не об этом.

>>20026 (OP)
Предлагаю поместить эту книгу в шапку треда рядом с оригинальными статьями и/или с дедовскими книгами.

562 14 фев, 22:47 1941109

Показать весь текст

Ответы41165 41301 41485

563 14 фев, 22:51 1941114

>>40967

>и где трава зеленее? у научников или индустрии

Макакой в индустрии выгоднее всего. Ресерчер в индустрии получает больше, но прибавка к начальной зарплате не стоит времени, затраченного на пхд. Ресерчер вне индустрии получает гроши.

А вообще, лучше всего работать в жирных компаниях вроде гугла, независимо от должности.

564 14 фев, 23:40 1941165

>>41109
Спасибо, как раз то что мне было нужно.

Ответы41410

565 15 фев, 01:27 1941301

>>41109

>Сосинский

Сосницкий

Ответы41410

566 15 фев, 02:01 1941329

>>40332
брат, ситуация полностью противоположная, хочу отсюда перекатиться в геймдев, какой роудмап посоветуешь? Знаю всю матешу шейдерную с матрицами, опенжл впрнц, но хочу ебаться на чуть более высоком уровне, мм?

Ответы41764

567 15 фев, 07:53 1941410

>>41165
Рад был помочь.

>>41301
Сосницкий тут только ты, а Сосинский - годный математик.

568 15 фев, 09:03 1941430

>>40967
Первый анон был прав, макакой выгоднее всего.

Идти в аспирантуру и получать степень имеет смысл, только если ты без этого не можешь. Если тебе нужны интересные сложные исследовательские задачи, а не стандартные индустриально-бизнесовые.
Причём идти нужно в вуз, хотя бы, немного выше среднего. В хреновом вузе в аспирантуре делать вообще нечего.

То есть для этого нужно быть шизоидом, для которого важен интерес к решаемой задаче, а не деньги. Таким, как я, прям.

В академической науке даже на западе часто даже профессора математики/физики/компнаук/итд получают не сильно больше (если не меньше), чем вчерашние студенты-программисты в индустрии.
Так профессором еще стать надо. А для этого нужно иметь недюжинные мозги и такую же усердность, нужно быть упоротым трудоголиком, думать о своих исследованиях 24/7.
А быть трудоголиком в научных исследованиях гораздо сложнее, чем быть трудоголиком в индустрии.

В ИТ индустрии PhD обычно зарабатывают больше, но не сильно, и оно того не стоит.

Однако, есть еще одна причина, по которой много кто сваливает за бугор в аспу: это один из самых простых способов свалить за бугор.

Ответы42389

569 15 фев, 10:25 1941485

>>41109
иди выебывайся в свой двор.
концепция "читай только формулы к книгах по машобу" подходит только тебе.

Ответы41495

570 15 фев, 10:39 1941495

>>41485
А вот и у гуманитария-машиннообучатора жопа подорвалась. Найс.

571 15 фев, 10:43 1941501

Аноны, посоветуйте реально годные курсы по дата саенсу и, в частности, по математической статистики. Не так, что бы материал рассматривался поверхностно, и что бы курс не состоял целиком и полностью из унылых видосов.
Можно даже очные курсы по переквалификации дс2
Слышал, что гибрейнс, скиллфактори и прочие скиллбоксы - гавнище полное.
Что скажите за яндекс.практикум?
я не вкатыш, на работе попросили заняться дс и сказали, что оплатят курсы, поэтому хочу выбрать реально полезный курс

Ответы41512 41517 41542

572 15 фев, 10:55 1941512

>>41501

>яндекс.практикум

Разумеется, тоже гавно

573 15 фев, 10:59 1941517

>>41501
По Яндекс.практикуму в треде мнения разделились.

> Слышал, что гибрейнс, скиллфактори и прочие скиллбоксы - гавнище полное.

Правильно.

574 15 фев, 11:23 1941542

>>41501

> Аноны, посоветуйте реально годные курсы по дата саенсу и, в частности, по математической статистики.

d2l.ai. Инфоцыгане не нужны.

Ответы41570

575 15 фев, 11:42 1941570

>>41542

>d2l.ai. Инфоцыгане не нужны.

Выглядит просто как голопом по европам, ещё и на английском, блин

Ответы41628

576 15 фев, 11:44 1941573

хз оффтоп это или нет, но проходил ли кто стажку в SAS? что происходит после шести недель обучения? если хорошо справлялся эти шесть недель то каковы шансы получить/не получить оффер?

577 15 фев, 12:24 1941628

>>41570

> , ещё и на английском, блин

А тебе на каком надо? Там ещё на китайском есть.

> голопом по европам,

Чего там нет из того что тебе нужно?

Ответы41659

578 15 фев, 12:41 1941659

>>41628

>А тебе на каком надо? Там ещё на китайском есть.

на русском конеш
>Чего там нет из того что тебе нужно?
Хорошего погружения в мат. стат. Насколько я понимаю, без него в дс никуда

579 15 фев, 13:29 1941764

>>41329
ну смотри, я ебался с юнити, поэтому буду говорить с позиции юнити разраба
для ебли на высоком уровне особо ничего не надо, кроме знания ангема. Но его, в целом, можешь не повторять даже тк задачи не особо сложные с математической точки зрения (ну еще посоветую повторить кватернионы немножко)
в остальном нужно качать умение прогать: solid, ооп, code smells и прочие вещи именно прогерские
если хочешь по безопасному пути, то очень советую посмотреть пару курсов на plurasight (он вроде немного стоит). Там правда топовые курсы, строящиеся по правилу (самому лучшему правлу построения курсов) степика: много небольших курсов на разные темы. Причем курсы качественные
Советую также не размениваться первое время на чистый Си шарп, тк в движках, как правило, все прелести языка не используются
после того, как немного освоишься в юнити и поймешь что как создавать объекты, как работать с ассетами, как реализовывать взаимодействие между объектами (физика) и пр, то пробуй реализвать свои игоры (как бы страшно не было видеть пустой экран) - благо идей для игр у всех полно
Ну а после того, как в соляну все потыкаешь, при условии начиля бекграунда в МЛ, можешь начать искать работу. Обязательно иметь при этому хоть каку-то демку игры
От себя могу добавить, что знания шейдеров - хороший буст. Как правило это самые высокооплачиваемые ребята

Ответы41799 42300

580 15 фев, 13:48 1941799

>>41764
я по классике наебашил орфографических ошибок - соре

581 15 фев, 13:51 1941801

кст пацаны, с вами все тот же игродел-вкатун
какие посоветуете пет проекты, чтобы я показал работодателю и он такой "о норм, можно поговорить" и алсо немного прокачаться?
я себе до смены работы выделил месяца 2-3. По идее, за это время можно запилить что-то более менее неплохое
Если не привязываться к цв нлп и пр - что можно запилить?

Ответы41928

582 15 фев, 15:40 1941928

>>41801
Сделай что-нибудь геймдевовское раз уж игродел. Мл в геймдеве пока не особо, но года через 2-3 наверное попрёт.

Ответы42033

583 15 фев, 17:10 1942033

>>41928
а вот у меня есть проект, которым я пару месяцев занимался на работе
короче нужно было из набора объектов найти позицию определнного
юзал облака точек, но без всяких нейросеток - только классический матан: PCA, RANSAC и пр - ну мы там ЭЙАР игрулю делали (но не взлетело)
это совсем не релеватно для области?
алсо еще вопрос
я часто вижу хуйню типа: знание SQL, Mongo Reddis и пр
я с ними нихуя не работал
скажите плез, насколько сложная хуйня? нужно ли тратить время на курсы по этому или достаточно немного потыкать?

Ответы42036 42194

584 15 фев, 17:12 1942036

>>42033
вы уж извините, что доебался
просто хочу не показать очередным вкатуном на собесе

Ответы42060

585 15 фев, 17:26 1942060

>>42036
ну да, мальца доебался конечно
мимо немлшик

586 15 фев, 18:27 1942194

>>42033
Для CV SQL не нужен, зато плюсы нужны. Для тех, которые ближе к бизнес-аналитике SQL нужен, зато плюсы не нужны.

Ответы42202

587 15 фев, 18:32 1942202

>>42194

>зато плюсы нужны

Шиз, опять ты выходишь на связь? Абсолютному большинству машинлернеров плюсы не нужны.

588 15 фев, 20:07 1942300

>>41764
Нах тебе этот мл. Учи скл, дотнет и вкатывайся в бэкенд.

Ответы42312 42313 42315 42317 42679

589 15 фев, 20:15 1942312

>>42300
а чем плох мл?

590 15 фев, 20:15 1942313

>>42300
зп больше ЛОЛ

Ответы42320

591 15 фев, 20:16 1942315

>>42300
в дотнете нужно знать еще джабускрипт и прочее фронтэнд говно
а платят немного
вот и скажи, послать это удовольствие нахуй это или сразу в пизду?

Ответы42326

592 15 фев, 20:19 1942317

>>42300
ну ему, скорее, в комп зрение лучше

593 15 фев, 20:20 1942320

>>42313

>зп больше ЛОЛ

Это пиздешь, который зафорсили сами вкатуны в МЛ.

Ответы42327 42334 42679

594 15 фев, 20:23 1942326

>>42315
Хорошо там платят. Больше чем МЛ.
Просто нужно проект достаточно большой и энтерпрайзный найти чтобы слоеное говнище было настолько сложно, чтобы 25 летние хипстеры с него убегали бы.

Ответы42328 42334 42336 42679

595 15 фев, 20:23 1942327

>>42320
ну тут скорее
есть ведь именно чуваки которые делают алгоритмы
а есть ребята, которые это все упаковывают в код
я хочу, скорее, ко вторым
ну потому что для норм рнд я туповат, да и прогерство больше по душе
а бэк че? курды пилить? ну ебать мне интересно конечно макакить так

Ответы42333

596 15 фев, 20:23 1942328

>>42326

> чтобы была ебучая джава легаси

поправил, не благодари

597 15 фев, 20:23 1942329

Кстати, мл + фронт связка норм или маленький спрос пока?

Ответы42341

598 15 фев, 20:28 1942333

>>42327

>есть ведь именно чуваки которые делают алгоритмы

Таких буквально один на сотню. Остальные бездумно трясут ящик.

>а бэк че? курды пилить? ну ебать мне интересно конечно макакить так

В машобе будет аналогичный макакинг, даже если ты будешь работать непосредственно с моделями.

Ответы42336 42679

599 15 фев, 20:29 1942334

>>42326
>>42320
да бля, я как посмотрю в одс вакансии - охуеваю
200к, 250 300
я в своем гейдеве больше 120 не видел ни разу - только лиды (я мидл 2 года опыта)

Ответы42340 42353

600 15 фев, 20:30 1942336

>>42333
>>42326
я скорее соглашусь, что из бэка на питоне легче будет перейти в мл - тут да
в остальном хз - бек странное место

601 15 фев, 20:36 1942340

>>42334

>да бля, я как посмотрю в одс вакансии - охуеваю

>200к, 250 300

Ты впервые видишь пиздешь в вакансиях? Пойдешь на собеседование - тебя опустят и предложат в два раза ниже.

>я в своем гейдеве больше 120 не видел ни разу - только лиды (я мидл 2 года опыта)

Для двух лет опыта это нормальная зарплата для ДС, а вне ДС так вообще отличная.

Ответы42344 42679

602 15 фев, 20:39 1942341

>>42329
Что это? this<...>doуsnotexist?

603 15 фев, 20:42 1942344

>>42340

> Для двух лет опыта это нормальная зарплата для ДС, а вне ДС так вообще отлична

ну да, но все - таки геймдев - это про геймдев, а не про технологии
сейчас же вся туса в мл - хочу стать часть этого

> Ты впервые видишь пиздешь в вакансиях?

впервые) я два со второго по 5 курс работал за бесплатно в рога и копыта, и с 5 по окончание уника в гейдеве с конторке другана
даже на собесе ни разу не был

Ответы42357

604 15 фев, 20:54 1942353

>>42334
Не пизди. Только что заглянул в ОДС - крайняя вакансия вилка 120-180 gross

Ответы42358 42679

605 15 фев, 20:56 1942357

>>42344

>а не про технологии

а машинлернинг дохуя про технологии? импорт слесарьплов ас сп и в продакшн

Ответы42363 42679

33 Кб, 712x122

606 15 фев, 20:56 1942358

>>42353

Ответы42359 42371

607 15 фев, 20:57 1942359

>>42358
еще и премия нахуй х4
просто в один прекрасный день ты получаешь ебучие 500к на карту

608 15 фев, 20:57 1942363

>>42357
ну вот с тобой я соглашусь
не знаю, чуваки
хочется делать интересные задачи, чтобы удовольствие от процесса было
если это не расхайпованный мл, то что?

Ответы42377 42389

609 15 фев, 21:06 1942371

>>42358
И снова не пизди. Я же сказал - КРАЙНЮЮ, а ты пролистал на 4 вверх, чтобы найти приятные цифры

Ответы42373 42679

610 15 фев, 21:07 1942373

>>42371
вот ты блин душный конечно
ладно, твоя взяла
и вообще бля, раз у вас все так хуево в мл, хули вы тут работаете?

Ответы42376

611 15 фев, 21:10 1942376

>>42373
Никуда больше не берут т.к. по сути программировать не умеем

612 15 фев, 21:10 1942377

>>42363
а может вообще не программирование? что тебе по жизни нравится

Ответы42379 42679

613 15 фев, 21:12 1942379

>>42377
да не
я люболю проганье
но "брать данные из таблички А и помещать их в табличку Б" не совсем то
люди беспилотники делают, роботов, ракеты - это топ
а в рашке хуи сосать только и таблички делать

Ответы42386

614 15 фев, 21:23 1942386

>>42379
тогда зачем ты всё ещё в рашке?

Ответы42390

615 15 фев, 21:25 1942389

>>42363

>хочется делать интересные задачи, чтобы удовольствие от процесса было

Если хочешь интересных задач, иди PhD делать в годный вуз.
Индустрия это (почти) всегда про макакинг, и неважно, бекенд это или мл/дс.

Буквально сегодня про это писали >>41430 .

616 15 фев, 21:25 1942390

>>42386
ну тут уже личные причины - пока не могу уебать
но планирую

617 16 фев, 01:25 1942679

>>42377
>>42371
>>42357
>>42353
>>42340
>>42333
>>42326
>>42320
>>42300
смотри, брат, это называется "боязнь конкуренции"
готовы себя говном облить, лишь бы +1 вканут не был
а то вдруг еще годный попадется и место отберет

Ответы42684

618 16 фев, 01:31 1942684

>>42679

>смотри, брат, это называется "боязнь конкуренции"

>готовы себя говном облить, лишь бы +1 вканут не был

Да причем тут вообще это. Вкатуны все равно не вкатятся, а если и вкатятся, то не составят конкуренцию ставшим к тому времени сеньорами.

Ответы42686

619 16 фев, 01:33 1942686

>>42684
ну выглядит так
- у нас тут так хуево вообще пиздец ТАК ХУЕВО лучше байтоебом иди или игродело и зп у нас размером с небольшой хуй
- а чего сами не перейдете?
- ну эээээ мы прогать не умеем
серьзно? прогать не умеем? а вы тогда вообще кем работаете? model.fit(x) пишете целый день?

Ответы42691

620 16 фев, 01:40 1942691

>>42686

>у нас тут так хуево вообще пиздец ТАК ХУЕВО лучше байтоебом иди или игродело и зп у нас размером с небольшой хуй

Этого никто не говорил. В машобе зарплаты не сильно отличаются от других сфер айти.

>- а чего сами не перейдете?

>- ну эээээ мы прогать не умеем

Перекатываться в тот же веб имеет смысл. Столько же денег, но меньше стресса. Не перекатываются в основном потому, что не хотят учиться ничему новому. Ну и довольно большая часть машобщиков - это как раз макаки, которые вкатились из-за хайпа и кроме model.fit ничего не умеют.

Ответы42855

621 16 фев, 02:52 1942733

>>41019
Про дип лёрнинг в 1971 конечно же забыли.

622 16 фев, 10:22 1942855

>>42691
А почему работа стрессовая?

Ответы42857 42863

623 16 фев, 10:33 1942857

>>42855
Ну здрасте. Трясти черный ящик не зная будет ли результат - это стресс

Ответы42859

624 16 фев, 10:44 1942859

>>42857
Просто охуенный стресс. Даже страшно представить.

Ответы42931

625 16 фев, 10:54 1942863

>>42855

>А почему работа стрессовая?

Невозможно предугадать результат - можешь и год безрезультатно трясти ящик. Из-за этого будешь постоянно волноваться, не выпиздят ли тебя завтра на мороз.

56 Кб, 600x456

626 16 фев, 12:16 1942931

>>42859
https://ru.wikipedia.org/wiki/Выученная_беспомощность

Ответы43255

627 16 фев, 15:42 1943255

>>42931
И что?

628 16 фев, 15:48 1943261

ебать рофл конечно
в треде питона говорят что "ебать питон это скучно и мл сейчас топ"
в треде мл говорят насколько хуево в мл и как бы они хотели в бэк
в треде крестов тоже выбеываются
такое ощущение, что жизнью довольны только шарписты

Ответы43601 43654

629 16 фев, 21:13 1943563

люди и людини из мира CV
есть ли инфа по адекватным конторам, занимающимися комп зрением? меняю работу и не хочу попасть в просак в компашку из черного списка
алсо, если есть те, кто более-менее толерантен к перекатунам из бекенда, тоже буду признателен

Ответы43592

630 16 фев, 21:40 1943592

>>43563

>в просак в компашку из черного списка

каво?!
какого ещё черного списка

Ответы43649

631 16 фев, 22:00 1943601

>>43261
коллега-бэкендер говорил, чтоб я не перекатывался в бэк, а советовал девопс.
коллега-девопс говорил, чтоб я не перекатывался в девопс, а катился в дата саенз и биг дату.
коллега-ios developer говорил, что разработка под яблоко заебись, а в андроиде куча говна
держу в курсе

632 16 фев, 22:34 1943649

>>43592
условно черного
есть же компании - ебанаты
а есть такие, которые анон может пруфанут как збсшные

633 16 фев, 22:39 1943654

>>43261
Подъебать мелкобукву - святое дело

634 17 фев, 01:25 1943755

Вы охуели не перекатывать? Кого ждете? Ну ка перекатили быстро

Ответы43785

635 17 фев, 01:39 1943759

поцонва, мне нужно распознать qr код
использую для этого zbar
но работает крайне хуево - углы и освещения могу очень легко наебнуть
а вот в прилоге тинькова охуеная распознавалка
вопрос
где-то на свете есть более хорошие решения? или есть смысл самому запилить?

Ответы45433

636 17 фев, 03:43 1943785

>>43755
Нормально же сидим. Илитный скрытый тренд. Как и его содержимое

637 17 фев, 05:23 1943803

ОП
ГДЕ
ПЕРЕКОТ
МУДИЛО
ЭМ?

638 17 фев, 14:25 1944157

У меня вопрос по поводу генерации изображений, есть набор фотографий, например кошки, как сделать генератор который будет генерировать кошек из ничего? Я так понял что это GAN нейросеть, попробовал по туториалу создать её, с цифрами ч/б всё получилось, но не получается с цветными изображениями. Есть ли готовый пример не 2017 который подобное делает?

639 17 фев, 15:45 1944217

https://www.infoq.com/news/2021/02/google-trillion-parameter-ai/

Что думаете насчет этого? Блядь ТРИЛЛИОН параметров! В опенсорсе!

Ответы44258 44261 44278

17 Кб, 320x200

640 17 фев, 16:08 1944258

>>44217
Ебануться.
Когда это пощупать можно будет?

Ответы44261

641 17 фев, 16:10 1944261

>>44217
>>44258

>Although Google has not released the pre-trained model weights for the Switch Transformer, the implementation code is available on GitHub.

Необученная.

Ответы44265

642 17 фев, 16:12 1944265

>>44261
Но это дело поправимое, так-то.

643 17 фев, 16:25 1944278

>>44217

> а у меня миллиард пораметров!

> а у меня трилеон!

> а у меня тогда бесконечность!

> а у меня бесконечностью плюс один!

Коротко о "ресёрче" в индустрии, кто там выше туда хотел?

Ответы44298 44321 44329

644 17 фев, 16:34 1944298

>>44278
Количество параметров напрямую определяет качество сети. Тут параметров, как в твоем мозге. Это предел мечтаний.

Ответы44309 44431

645 17 фев, 16:41 1944309

>>44298
Современные ИНС очень косвенное отношение имеют к мозгу.

Ответы44315

646 17 фев, 16:50 1944315

>>44309

> Современные ИНС очень косвенное отношение имеют к мозгу.

ИИ вообще будет иметь отношение к человеческому мозгу, как самолет к птице. Но меняет это что-либо? Кстати, обучить Switch Transformer дешевле, чем GPT.

Ответы44320

647 17 фев, 16:52 1944320

>>44315

>Тут параметров, как в твоем мозге.

Это я про то, что в этой фразе смысла довольно мало.

Ответы44329

536 Кб, 1024x1024

648 17 фев, 16:53 1944321

>>44278

>а у меня телескоп с зеркалом 10 метров!

>а у меня 100!

>а у меня тогда бесконечность!

>а у меня тогда бесконечность плюс один!

>коротко о "ресёрче" в астрономии

Ответы44367

649 17 фев, 16:55 1944328

> OpenAI GPT-3, пожалуй, самая известная модель глубокого обучения, созданная за последние несколько лет. Одна из вещей, которая больше всего впечатляет в GPT-3, - это его размер. В некотором контексте GPT-3 - это не что иное, как GPT-2 с множеством дополнительных параметров. Имея 175 миллиардов параметров, GPT-3 был примерно в четыре раза больше своего крупнейшего предшественника.

> Зная это, как бы вы тогда относились к модели, которая в 6 раз больше GPT-3? Именно этого добилась команда из Google Research с их новой архитектурой Switch Transformer . Новая модель имеет непостижимые 1,6 триллиона параметров, что делает ее в шесть раз больше, чем GPT-3.

> Благодаря новым оптимизациям, Google смог обучить модель Switch Transformer поразительным 1,6 триллионам параметров! Скорость обучения увеличилась до семи раз по сравнению с предыдущими архитектурами.

https://www.kdnuggets.com/2021/01/google-trillion-parameter-switch-transformer-model.html#:~:text=This is precisely what a,times larger than GPT-3.

650 17 фев, 16:55 1944329

>>44278
Будто ты что-то лучше можешь предложить. Да, подход "наебенить побольше слоев и параметров" пока что самый лучший, благо еще и закон Мура позволяет.
саттон.жпг
>>44320

>Это я про то, что в этой фразе смысла довольно мало.

Нормально там смысла. У человека в мозгу параметров больше, чем в мозгу червя, соответственно, возможностей у человека больше. В нейроночках это работает так же.

Ответы44345 44346 44431

651 17 фев, 17:14 1944345

>>44329

>У человека в мозгу параметров больше, чем в мозгу червя, соответственно, возможностей у человека больше.

Проблема как раз в "соответственно". Нет никаких адекватных доказательств, что здесь из А В следует.
Мозг слишком плохо изучен, чтоб говорить, что единственное (или по крайней мере ведущее) его преимущество перед "мозгами" червя, это количество нейронов или даже архитектура сети.

Ответы44381

652 17 фев, 17:16 1944346

>>44329

>У человека в мозгу параметров больше, чем в мозгу червя, соответственно, возможностей у человека больше.

653 17 фев, 17:18 1944347

Хочу вкатиться в NLP. Посоветуйте плз годный курс. Лекционный материал годный, как я понял, есть у Jacob Eisenstein. Но где бы взять упражнения?

Ответы44715

654 17 фев, 17:39 1944367

>>44321
Ложная аналогия.

Ответы44863

655 17 фев, 17:57 1944381

>>44345

> Проблема как раз в "соответственно". Нет никаких адекватных доказательств, что здесь из А В следует.

Есть. Нейроночки могут отвечать на вопросы, человек тоже. Как в случае птицы и самолёта, главное- что и то и другое летает. Остальное в практическом плане несущественно.

Ответы44448

73 Кб, 957x648

656 17 фев, 18:35 1944431

>>44298

>Количество параметров напрямую определяет качество сети.

>>44329

>подход "наебенить побольше слоев и параметров" пока что самый лучший

Жалко только что качество сети напрямую определяемое самым лучшим из подходов в итоге результат даёт не лучше марковских цепей из нулевых и прочих программируемых эвристик без триллиардов параметров.

Ответы44727

657 17 фев, 18:59 1944448

>>44381
Говно тоже летает при набросе на вентилятор.
У вас плохо с импликациями, ну или со статистическим выводом, уважаемый.

658 17 фев, 20:24 1944533

>>20026 (OP)

Двач, помоги разобраться: есть камера видео наблюдения, которая следит за бариста(пидоры, которые продают и пиздят кофе). Я хочу, что бы нейронка в реальном времени считала количество проданных стаканчиков с кофе. Насколько это сложная задача? А если я хочу, что бы нейросеть сортировала стаканчики по объёму? (Понятно, что потом я хочу сравнить показатели с количеством израсходованных материалов и выявлять воровство). Сколько может стоит разработка такой штуки? Сам обычный дотнет чик с горе малым бизнесом в довесок.

Ответы44594 44748 44861

659 17 фев, 21:16 1944594

>>44533
Угомонись, эль кабаньеро, никто у тебя ничё не пиздит, а если даже и пиздит то ничего ты не сделаешь, пидорнёшь одного, к тебе другой люмпен за твои гроши придёт и так же воровать начнёт от бедности. Не с того конца ты проблему решаешь.

Ответы44605 44701 44748

660 17 фев, 21:28 1944605

>>44594
плюсую

661 17 фев, 21:31 1944608

бля поцоны, я конечно ебал ваши курсы
такая параша
1) везде говорят основные концепции - в тех же книгах намного лучше
2) этот вот принцип "мы тут для тебя все подготовили, напиши строчку" - просто ебала
пару раз так сделал - а как наебенить модель с нуля так и не понимаешь
к чему бугурт? я так и не понял, как мне подлить свои данные
в курсах через url качают - ок, понял
а мне хули сделать? у меня на компе прон и хочу сиськи классифицировать - мне типа отдельный скрипт писать или есть
import boobs_from_pc_loader ?

Ответы44654 53630

662 17 фев, 22:59 1944654

>>44608

> мне типа отдельный скрипт писать

Писать, одна (может и самая) нетривиальная часть мля - где взять данные и как их выдрать оттуда где они есть.

Ответы44729

663 18 фев, 00:42 1944701

>>44594

Мне не очень важно твоё мнение на этот счёт, пидор, отвечай на мой ответ или иди нахцй.

Ответы44759 45145

664 18 фев, 01:28 1944715

>>44347
сорри, бампану.

36 Кб, 511x407

665 18 фев, 01:57 1944727

>>44431

> хуйню сделяль

> ррреее, ниработаит

Дэбил, хоспаде... Я же постил ссылку как дистилберт отвечает на вопросы. Но там вручную контекст надо указывать. А вот haystack'у вручную загружает текстовые файлы, просто неразмеченный текст, и оно само под заданный вопрос ещё и контекст подбирает.

Ответы46974

666 18 фев, 02:02 1944729

>>44654
ну я так понимаю, что этот вот дата инжиниринг это целая песня

667 18 фев, 04:06 1944746

>>40808
бампю

668 18 фев, 04:15 1944748

>>44533
Этот >>44594 тотально прав. Лучше зарплату добавь, за твои 17к на проезд и сегореты, как среднему классу, к тебе в твой рабочий дом ни один нормальный человек не пойдет.

Ответы44821

669 18 фев, 05:22 1944759

>>44701

>Мне не очень важно твоё мнение

>отвечай на мой ответ

Поэтому у тебя ничего и не получится. Пожалуй вам не стоит заниматься бизнесом.

670 18 фев, 06:44 1944821

>>44748

Хуя у тебя маеямирок, 17к, лол. Зумеры за такую зп не пернут даже.

В общем, идите на хуй, долбаебы, со своими цены и бизнес советами.

Ответы44864 45145

671 18 фев, 08:28 1944861

>>44533
ну ты хоть в гугл сходи:
https://www.dssl.ru/products/moduli-i-potrassir/

разработка тебе не светит, конечно, но ведь много чего продается готового и твои стаканчики коррелируют с другими показателями.

672 18 фев, 08:38 1944863

>>44367
Нет, истинная.

Ответы45095

673 18 фев, 08:38 1944864

>>44821
а, слушай, я придумал:
ставишь камеру и ПУСКАЕШЬ СЛУХ что заказал на фрилансе нейросетевую аналитику!
Сам первые две недели вручную просматриваешь камеры и пиздишь всех.
Таким образом задача будет решена.

Ответы45145

674 18 фев, 12:30 1945095

>>44863
В астрономии телескопы - лишь экспериментальные инструменты исследований, и чем больше твои телескопы, тем больше всего ты можешь открыть. А есть еще и теория, которая постоянно обобщает опытные факты.
В дотасаенс-индустрии нейронки - уже продукт исследований. Теории в индустрии уже практически никакой нет, вся в прошлом веке закончилась. А тех ученых теперь Жопеншмульцерами называют.

Но я лично с тем аноном не вполне согласен. Всё же кроме наращивания количества нейронов, в новых продуктах еще и различные оптимизации архитектуры проводятся (разной степени теоретичности или тыкания пальцем в небо). Так что там есть исследования, но главным образом околоэкспериментальные.
Теория хоть и развивается, но она довольно далеко от индустрии.

Хуита твоя аналогия.

Ответы45160

675 18 фев, 13:06 1945145

>>44701
>>44821
как ты, такой долбаеб, вообще что-то открыл? приходишь к нам на двач и без уважения говоришь, что мы пидоры? иди жысоны перекладывай, дотнетчик - бизнесмен ебучий
>>44864
топ решение, но с этим дебиком даже нехуй базарить
все у него виноваты, все воруют а он один молодец
взбесил блять, уебок

484 Кб, 1497x1119

676 18 фев, 13:19 1945160

>>45095

> в новых продуктах еще и различные оптимизации архитектуры проводятся (разной степени теоретичности или тыкания пальцем в небо).

Нет там никакого тыканья пальцем в небо. Все решения обоснованы теоретически, более того, основаны на работах тех самых Жопеншмульцеров из середины прошлого века, о которых тут принято говорить в пренебрежительном тоне. Наследие дедов охватывает всё, до чего вообще можно додуматься в машобе, более того, далеко не всё это наследие пока должным образом осмыслено. Ни одна технология машоба, сколь угодно топовая и новая, не придумана с нуля в наше время, все они корнями уходят в работы Жопеншмульцеров.

Ответы45345

677 18 фев, 15:36 1945345

>>45160

>Все решения обоснованы теоретически, более того, основаны на работах тех самых Жопеншмульцеров из середины прошлого века, о которых тут принято говорить в пренебрежительном тоне.

Да, макаки всегда будут говорить о них в пренебрежительном тоне.

678 18 фев, 17:13 1945433

>>43759
Берешь и проводишь через FFT, сверху фильтр гауса, вот тебе и нормальные углы. Это дедовская-оброботка сигналов, нахуй тут нейронка?

Ответы45435

679 18 фев, 17:16 1945435

>>45433
братишь, я про нейронку и не заикался то
мне просто интересно, это выглядит как мега просто стандартная задача
почему тогда у одиних супер охуено а у других супер хуево

Ответы45860

680 19 фев, 01:15 1945860

>>45435
https://developers.google.com/ml-kit/vision/barcode-scanning

Мы за тебя все гуглить должны?
Тот который тормозит, очевидно на яве написан

681 19 фев, 06:03 1945906

А кто-нибудь пробовал в трансформере заменить перцептрон (FFN) на SVM? По идее, должно побыстрее работать, там ведь только опорные векторы считаются, а не всё подряд квадратногнездовым методом. Если что, идея моя, саму архитектуру можно назвать zhopenformer, в честь Жопеншмульцера.

Ответы46228

682 19 фев, 13:57 1946228

>>45906
Градиенты не прокинутся

683 19 фев, 15:50 1946406

Можно не python а js?

Ответы46488 46829

684 19 фев, 17:11 1946488

>>46406
можно, разрешаю

Ответы46847

685 19 фев, 19:17 1946699

Насколько часто норм менять работу в сфере анализа данных? Уже 18 месяцев на текущем месте, и уже наскучило, хочется сменить домен. До этого 14 месяцев отработал в одном месте, а когда переходил, мне на паре собесов предъявили, что я часто прыгаю.
Ясно, что в анализе какое-то время надо на то, чтобы вникнуть в домен, так что тут ожидают более продолжительных трудовых отношений в сравнении с разработкой. Интересно мнение и опыт анона.

Опять же, я не МЛ инженер, а больше в сторону аналитики

686 19 фев, 22:13 1946829

>>46406
Фундаментальных теоретических запретов на это нет. Можно.

Ответы46847

687 19 фев, 22:37 1946847

>>46488
>>46829
Вы заебали, шутники. Я спрашивал нормально ли будет вкатываться на js`e или нет? Насколько там меньше контента по сравнению с питоном?

Ответы46857

688 19 фев, 22:47 1946857

>>46847

>Я спрашивал нормально ли будет вкатываться на js`e или нет

Нет, не нормально. Хочешь заниматься машобом - учи питон.

Ответы46860

689 19 фев, 22:49 1946860

>>46857
А я то думал машоб это умение алгоритмы писать а язык всего-лишь инструмент.

Ответы46864 46948 47062

690 19 фев, 22:51 1946864

>>46860

>А я то думал машоб это умение алгоритмы писать а язык всего-лишь инструмент.

Для каждой задачи свой язык. Ты же не пытаешься писать фронт на питоне?

Ответы46871

691 19 фев, 22:57 1946871

>>46864
Почему в таком случае любая мало-мальски долгоживущая система переписывается на что-то производительнее типа плюсов?

Ответы46878

692 19 фев, 23:04 1946878

>>46871

>Почему в таком случае любая мало-мальски долгоживущая система переписывается на что-то производительнее типа плюсов?

Все машоб библиотеки, в которых необходима производительность, и так написаны на плюсах. На питоне лишь удобная обертка.

Ответы46887

693 19 фев, 23:08 1946887

>>46878
Тогда зачем мне питон если все серьёзные вещи делают на плюсах?

Ответы46913

694 19 фев, 23:22 1946913

>>46887

>Тогда зачем мне питон если все серьёзные вещи делают на плюсах?

Ровно затем, зачем тебе нужен вью/реакт вместо стандартного жс.

695 19 фев, 23:54 1946948

>>46860

>умение алгоритмы писать

Жопеншмульцер, ты? Алгоритмы давно уже написаны людьми поумней тебя, а в дата сосаенсе гораздо важнее уметь получать и правильно обрабатывать данные

696 20 фев, 01:05 1946974

>>44727

> хуйню сделяль

https://sbercloud.ru/ru/warp/gpt-3

> Но там вручную контекст надо указывать. А вот haystack'у вручную загружает текстовые файлы, просто неразмеченный текст

Да, если нахуярить побольше данных без разбора содержат они утечки или нет то внезапно всё заработает. С другими алгоритмами дедовскими такое нельзя!

Ответы47029 47040 47054

697 20 фев, 06:09 1947029

>>46974

> гпт3 лардж

> 780м параметров

Сберкасса не может не наебать, даже гпт2 лардж это уже 1580м или около того параметров вообще-то. Гпт3 самая большая вроде 175 миллиардов параметров... Они бы лучше тот гугловский свичтрансформер обучили, который 1.6 трлн параметров.

698 20 фев, 07:06 1947040

>>46974

> С другими алгоритмами дедовскими такое нельзя!

Теоретически, можно. Даже во времена Жопеншмульцеров было известно, что чем больше данных, тем лучше результат (у того же Вапника это описано как асимптотические методы). Просто тогда вычислительные мощности не позволяли эффективно использовать такой путь улучшения результатов, да и датасетов на терабайты никто не создавал. Поэтому от варианта "настакать побольше слоев да накидать побольше данных" до относительно недавнего времени отказывались. А потом закон Мура порешал.

699 20 фев, 09:06 1947054

>>46974

>нахуярить побольше данных без разбора содержат они утечки или нет

Что такое утечка в данных? Я только утечку памяти в погромировании знаю.

700 20 фев, 09:45 1947062

>>46860
Вкатывайся тогда на пауэрпоинте, он тоже тьюринг-полный.

Ответы47083 47106

701 20 фев, 10:22 1947083

>>47062

>пауэрпоинте

А какой там язык?

Ответы48132

702 20 фев, 10:42 1947106

>>47062

> Вкатывайся тогда на пауэрпоинте, он тоже тьюринг-полный.

Мб ты эксель имел в виду? В пауэрпоинте же только презенташки делать.

Ответы47111 48132

703 20 фев, 10:57 1947111

>>47106
Мне тоже так показалось.

704 20 фев, 11:01 1947112

>>20026 (OP)

>https://www.nature.com/articles/s42256-018-0002-3

>Learnability can be undecidable

>Abstract

>The mathematical foundations of machine learning play a key role in the development of the field. They improve our understanding and provide tools for designing new learning paradigms. The advantages of mathematics, however, sometimes come with a cost. Gödel and Cohen showed, in a nutshell, that not everything is provable. Here we show that machine learning shares this fate. We describe simple scenarios where learnability cannot be proved nor refuted using the standard axioms of mathematics. Our proof is based on the fact the continuum hypothesis cannot be proved nor refuted. We show that, in some cases, a solution to the ‘estimating the maximum’ problem is equivalent to the continuum hypothesis. The main idea is to prove an equivalence between learnability and compression.

Теория Вапника-Червоненкиса рулит!

705 20 фев, 15:18 1947405

ОП походу умер, перекатывайте кто-нибудь другой.

Ответы47430 47552

706 20 фев, 15:51 1947430

>>47405
В чем смысл перекатывания?

Ответы47473

707 20 фев, 16:21 1947473

>>47430

В том что нет притока ньюфагоф, тред медленно умирает и остаются только упоротые Жопошмульцеры

Ответы47552

708 20 фев, 17:21 1947552

>>47405
>>47473
Сделал
>>1947549 (OP)
>>1947549 (OP)
>>1947549 (OP)

709 20 фев, 17:48 1947594

Здравствуйте, данные научники, возникла идея написать классификатор, суть в том, чтобы телеграмм бот выдавал картинки, человек их оценивал и ему назначаются цифры(представьте координаты в 3-хмерном пространстве), т.е если человеку понравились определенные картитнки, то бот отнесет его к определенной категории людей, в общем то можно просто поставить весы у каждой картинки по каждому измерению, типа если тебе понравилась эта картинка, то ты такой-то и далее тебе будут более релевантные картинки присылаться, в общем-то алгоритм не требует нейронок, но я подумал, что нейронки и классификаторы(это одно и то же?) подойдут тоже для этой задумки, хотел поспрашивать что почитать, какая реализация подходит под эти параметры(сам о нейронках только в общих чертах знаю). Я не планирую писать свою сложную рекомендательную систему, но мне кажется что решение уже есть и оно будет эффективней того что я могу напрогать своими ручками, прошу в ответы, кто знает в каком направлении мне двигаться

Ответы47613

710 20 фев, 18:02 1947613

>>47594
Self organized maps

711 21 фев, 10:10 1948132

>>47083
>>47106
https://youtu.be/uNjxe8ShM-8
Кому надо, тот сделает в пауэрпоинте. Главное уметь писать алгоритмы, а инструмент не важен.

Ответы48620

712 21 фев, 18:41 1948620

>>48132
В таком случае можно и с помощью карандаша и бумаги.

Ответы48743

132 Кб, 600x452

713 21 фев, 23:35 1948743

>>48620

> карандаш

> бумага

Ответы49304

714 22 фев, 12:40 1949036

Можно ли вкатиться без вышки?

715 22 фев, 18:30 1949304

>>48743
Слабо? Хуевый из тебя программист в таком случае.

716 22 фев, 23:03 1949464

аноны, какие ресурсы читать, чтобы быть в теме cv? все советуют архив - но там нихуя не понятно на какие статьи стоит обращать внимание, а на какие забить хуй
тем более это статьи. А новости и пр?

Ответы50226

717 23 фев, 18:09 1950036

можно ли стать успешным или твердым середнячком, если не выпускник физтеха или мгу? с ними же по идее невозможно конкурировать... они почти все с 10 класса погружены в математику

Ответы50226

718 23 фев, 21:40 1950226

>>50036

>можно ли стать успешным или твердым середнячком, если не выпускник физтеха или мгу?

Можно. Но это не точно.

Что бы тебе тут не говорили, в дотасаенсе математики мало, во-первых, а во-вторых, и главное, она вся тупо на техническом уровне.
То есть нужны тупо формулы и общее понимание некоторых (несложных) идей. Собственно в математике разбираться не нужно. Естественно, я говорю про обычную работу в индустрии, а не науку.
Ты же не собираешься научными исследованиями заниматься и диссертацию писать?

На обычной работе достаточно минимума общей математики и конкретных вещей из машоба и анализа данных - фактически, линейная алгебра, матстат, теорвер и методы оптимизации (потому что любая задача машоба сводится к задаче оптимизации), ну и основные модели и алгоритмы машоба, которые строятся на основе этих разделов математики.

При желании всё это можно с полного нуля выучить самостоятельно. Сложно сказать, конечно, сколько времени тебе на это понадобится. Некоторые вкатывальщики в интернетах утверждают, что за полгода можно дойти до собеседований, ну уж за год точно.
На питоне кодить научись.

Ну и технический диплом нужен, хоть и от говновуза.
Главное - найти первую работу, дальше всё путём будет.
Проблема в том, однако, что вакансий в дотасаенсе если и не мало, то уж точно не много, не смотря на весь хайп.

>>49464
Хрен знает, читай блоги какие-нибудь по теме, обзоры в твитторах и прочую херь. В шапке треда есть ссылки.

719 27 фев, 20:57 1953364

Аноны, подскажите пожалуйста, без лишней желчи.
Сейчас стоит выбор во что вкатываться: .Net(C#) или же ML.
Нравится имеено писать код, но и матешу не хотелось бы забрасывать.
Следовательно вопрос: пишет ли код ML engineer или занимается тупым перебором табличек и подгадыванием коэфициентов?
Во что перспективнее вкатываться?

Ответы54318

720 28 фев, 10:45 1953630

>>44608
здравстсвуй, я уже 2 года дергаю голых баб (как выяснилось- неправильно и большую часть зря). Сейчас пересобираю архив верно, буду использовать "другую архитектуру" (ан самом деле просто давать на вход больше размеченных вручную данных в большем разрешении.) Добро пожаловать в машинное обучение.
Пройди курс яндекс-хуяндекса по питону, там возьмеш базу. В тенсорфлоу уже сможешь сам всё делать после этого.

721 28 фев, 14:40 1953797

JS или Python?

Ответы54318

722 28 фев, 21:14 1954063

Нужны ли эти перехайпаные стенфорды или можно сразу вкатываться по контенту из секции "Что почитать?".

Ответы54318

723 1 мар, 07:02 1954318

>>53364

>пишет ли код ML engineer

Пишет. Периодически даже на плюсах.

>или занимается тупым перебором табличек и подгадыванием коэфициентов?

И этим тоже может заниматься.

>>53797
Питон. Хуйней страдать можешь и на языке ассемблера.

>>54063

>Нужны ли эти перехайпаные стенфорды

Не нужны. Они для полных даунов.

724 2 мар, 04:09 1955183

Я сформулировал в голове более простой пример, чтобы было понятней при объяснении, придумайте любимый цвет, у него есть rgb, задача нейросетки задать n вопросов и максимально близко угадать твой любимый цвет, вопрос есть ли что-то наиболее релевантное? Почитал про som, ничего не понял, я не вкатыш, просто интересная идея возникла, хочу попробовать

Ответы55186

725 2 мар, 04:46 1955186

>>55183
Вопрос интересный, тут такое дело _{иди нахуй _{не видишь перекат был}}

726 2 мар, 16:05 1955504

>>37287
Акцент. Либо хохлуха, либо белораха.

> Нам памаХает

Ответы55954

727 3 мар, 00:55 1955905

Может тут есть анон который с биомед. cv сектором работает? Пожалуйста отзовись, расскажи о специфике, тяжело ли искать работу и.... авось о проектах, была не была

Ответы55954

728 3 мар, 07:16 1955954

>>55504

> Нам памаХает

Вроде не явно там прям заметно.
В любом случае, она ахуенная. Ебал бы и ебал.

>>55905
Тред перекатили давно. Там спроси.
https://2ch.hk/pr/res/1947549.html (

М)

729 6 мар, 18:29 1959216

Сап двач, есть одна функция автокорреляции. Как по ней сгенерировать рандомные данные?

Ответы59582

730 7 мар, 08:51 1959582

>>59216
из нее генерируешь power spectrum, из power spectrum делаешь amplitude spectrum присваивая рандомные фазы. Ну и обратное FFT

Ответы59663

731 7 мар, 12:01 1959663

42 Кб, 640x480

40 Кб, 640x480

>>59582
Ну как-то не очень. Иногда выходит достаточно близко, иногда пикрил 1. Попробовал так, попробовал еще вариант через многомерное нормально распределение (https://stats.stackexchange.com/a/29240), но результат такой же нестабильный, пикрил 2. Нашел вариант сделать это через авторегрессию, но пока не проверил.
https://pastebin.com/brXWPUw1

Ответы60032

732 7 мар, 18:36 1960032

>>59663
вот это что?

> np.fft.fft(np.sqrt(corr))

может корень надо извлечь после FFT?

> ax2.plot(out_corr / max(out_corr))

Хороший график из одного сампла? Нужно усреднить по тысяче самплов, как минимум

Кстати, если применять правильные формулы, нормализацию и не надо делать

Ответы60037 62140

733 7 мар, 18:41 1960037

>>60032

>может корень надо извлечь после FFT?

Да, надо конечно, но результат еще хуже получается. Хотя я уже поменял эту строчку на scipy.signal.lfilter(np.sqrt(corr), 1, np.fft.ifft(noise)).

Ответы60200

734 7 мар, 20:31 1960200

>>60037
врогонку у тебя сампл комплексный получается
спектр реального должен удовлетворять А(-o)=A(o)

Ответы60202 62140

735 7 мар, 20:32 1960202

>>60200
так: А(-o)=A*(o)

736 8 мар, 21:45 1961482

Куда копать в сторону программ самих изменяющих и дополняющих свой сорс код с минимальным участием человека? А также фишки когда прогу запускают в интернет и она по определённым запросам поисковиков "обучается" в чём-либо?

737 9 мар, 19:06 1962140

>>60200
И что?
>>60032

>Хороший график из одного сампла?

Ну да, а что?

738 10 мар, 21:59 1963196

Нужно сделать распозновалку болезней растений И одновременно оценивалку их характеристик (рост, вес, вид). Стоит все это пытаться сделать одной архитектурой или лучше распределить задачи по отдельным сетям? Т.е. просто сделать несколько параллельных сетей. Привязки к реальному времени нет. Растений много, большинство видов - салаты. Искал по подобным запросам, видел только распознователи видов и болезней в разных научных работах. Вроде как делают и сеть оценивающую вес отдельных растений по фото. Но это коммерческий продукт, а не науч. работа, инфы по реализации минимум. Собственно, что делать? Как вообще стоит подходить к подобным задачам? Если требуется что-то, аналог чего в полной мере найти не можешь, только частично.

Ответы63197

739 10 мар, 22:01 1963197

>>63196
Параллельных, всмысле независимых. Т.е. одна сеть - болезни, другая - вид, третья - рост. Я понимаю, что, скажем при правильной оценке веса, нужно учитывать не просто размеры, но и тот же вид растения, но как у сети сделать одновременно и вывод "коэфицента веса" и еще с десяток выводов под виды, я не понимаю (сделать это адекватно, эффективно и без костылей).

Ответы74895

740 15 мар, 18:01 1967542

Посоветуйте идею какой pet project можно склепать за неделю-две-три для интервью на data science стажёра? Из непосредственно deep learning'а имеются лишь самые базовые знания по nlp и cv.

Ответы67543 68106

741 15 мар, 18:02 1967543

>>67542
для резюме*

742 15 мар, 19:58 1967708

Тупейший вопрос.
Как накидать офлайн распознавалку рукописного текста?
без регистрации и смс

743 16 мар, 05:00 1968106

>>67542
Зачем тебе пет проект и кагглы для стажера? Ты сразу в Дип Майнд хочешь? Учишь базы теории, методов и библиотек. Идешь на hhru пишешь что Дата Сайентист и знаешь pytorch, numpy, scikit, pandas.
1) Тебе пишут.
2) Идешь на собес. Просишь от 80000 руб.
3) Нет успеха - репит.
У меня так и было. Дата сайентистом не работал до того. Писали активно. Твои пет проекты помогут только тебе лично запомнить библиотеки.

Ответы68578

744 16 мар, 15:00 1968578

>>68106
да я хоть куда нибудь хочу.
и 80 слишком жирно лол. везде по 50-60к платят (до вычета налогов) стажёрам. джунам уже больше конечно.
мне пет прожект нужен чтобы хоть чем нибудь резюме заполнить.
можно было бы сказать что у меня в универе норм успехи, но это не так.
поэтому хоть как-нибудь продемонстрировать что я что-то умею нужно.

Ответы68692

745 16 мар, 16:34 1968692

>>68578
Ну смотри, если вузик топовый - уже хорошо. Хотя если бы был топовый ты бы тут не спрашивал и уже имел бы опыт.

Далее, можешь упомянуть соревнования. И вообще на каггле можно практиковаться хорошо и датасеты качать для начала.

Пет-проекты, опять же, имеет значение если годная идея и релизовано грамотно. Но т.к. ты уже здесь спрашиваешь, значит идей нет, то можешь тупо гуглить варианты идей и реализовывать сам. Ясное дело тогда куча людей уже это сделали, но хотя бы практика и видно будет что айкью не ниже 80.

Можно курсы указать, но тогда нужно с сертификатом и платные (т.к. у них хоть какое-то минимальное ревью есть). Легче всего курсера какая-нибудь - не слишком дорого, долго, сложно + известный бренд. Т.е. опять хоть что-то.

Все это, кончено не имееет смысла если уже был хоть какой-то опыт, даже за еду.

Ну для стажера 60к в ДС хорошо наверное, в Зап. Европке в районе 1к ЕВР платят при чуть более дорогой жизни.

Ответы68789

746 16 мар, 17:42 1968789

>>68692
вузик, конечно, топовый, но я мегараздолбай.
сертификаты мне не нужны думаю. нужно, наверное, хоть что-нибудь на каггле на бронзу попробовать накатать, одно соревнованьице. думаю припотеть можно и сделать.
но в целом спасибо.

747 18 мар, 22:12 1970976

помогите, я тупой. Задача придумать сеть, которая должна плюсовать и минусовать интеджеры. С одним нейроном и линейной функции можно простую сумму сделать. А как с минусом?

Ответы79820

748 23 мар, 04:29 1974890

меня интересует ИИ.
Можно сказать уже сдал вводный предмет по ИИ в тех. вузе.
осоветуйте что лучше изучать если я еще не понял что конкретно меня интересует.
машинное обучение, нейронные сети, глубокое обучение или что то другое?

749 23 мар, 04:54 1974895

>>63197
Ты на верном пути, для разных задач используй разные детекторы одной нйронкой это оче тяжкая задача, не неразрешимая, но обучение и интерференс будут долгими и не всегда нужно опознавать болезнь ведь, просто узнать вид например.. Как вариант аутпут детектора вида растений подавать на вход к распознаватель болезней. Датасет нужен ебический, это самое сложное будет.

750 27 мар, 20:49 1979141

>>20026 (OP)
Хочу сделать чат-бота на паскале. В обычные алгоритмы могу, но обычными алгоритмами чат-бот не получается. Простой нейрон могу закодировать, могу объединить в сеть. Но что дальше с этими нейронами делать - не понимаю. Какие-то циферки ввожу и вывожу, а как из этого бота сделать? Вот реально тёмный лес какой-то, что с нейроном делать? Куда подключать? Как символы из строки вводить в нейрон, чтобы он мне сказал, какие символы получил? Не понимаю...

Ответы79445

257 Кб, 621x133

751 28 мар, 13:15 1979419

проиграл с текущего статуса итт и треда реверсеров.

Ответы79454

752 28 мар, 13:42 1979445

>>79141
у НИКОЛАЮОУСА ВИРТА на стене висит картина (НЕ МАСПОМ) с карандашиками разной длины, толщины и прочих параметров (МАНЯФОЛД) и подпись снизу (на АНГЛИЙСКОМ): "world best word processors". Поводм всем нам ЗАДУМАТЬСЯ

753 28 мар, 14:02 1979454

>>79419
Чего?

754 28 мар, 19:12 1979820

>>70976
плюсуют и минусуют в классах коррекции за охраняемым школьным периметром
пока вы не научитесь грамотно изъясняться, вам здесь нечего делать.

43 Кб, 601x423

755 2 апр, 03:39 1983808

умоляю объясните для чего нужна constant

Ответы83840

756 2 апр, 08:58 1983840

>>83808
Вот >>1983834 →.

Тред утонул или удален.
Это копия, сохраненная 12 мая 2021 года.

Скачать тред: только с превью, с превью и прикрепленными файлами.
Второй вариант может долго скачиваться. Файлы будут только в живых или недавно утонувших тредах. Подробнее

Если вам полезен архив М.Двача, пожертвуйте на оплату сервера.