Этого треда уже нет.
Это копия, сохраненная 12 мая 2021 года.

Скачать тред: только с превью, с превью и прикрепленными файлами.
Второй вариант может долго скачиваться. Файлы будут только в живых или недавно утонувших тредах. Подробнее

Если вам полезен архив М.Двача, пожертвуйте на оплату сервера.
НЕЙРОНОЧКИ И МАШОБ ТРЕД №35 /ai/ 1920026 В конец треда | Веб
Очередной тред про хипстерские технологии, которые не работают

Я ничего не понимаю, что делать?
Без петросянства: смотри программу стэнфорда CS229, CS231n https://see.stanford.edu/Course/CS229 (классика) и http://cs231n.stanford.edu/ (введение в нейроночки) и изучай, если не понятно - смотри курсы prerequisites и изучай их. Как именно ты изучишь конкретные пункты, типа линейной алгебры - дело твое, есть книги, курсы, видосики, ссылки смотри ниже.

Почему такой фокус на нейронки?
Потому что остальные чистят вилкой данные в банках с помощью LGBTboost и им некогда предлагать обновления в шапку

Какая математика используется?
В основном линейная алгебра, теорвер, матстат, базовый матан и matrix calculus

Как работает градиентный спуск?
https://cs231n.github.io/optimization-2/

Почему python?
Исторически сложилось

Можно не python?
Никого не волнует, где именно ты натренируешь свою гениальную модель. Но при серьезной работе придется изучать то, что выкладывают другие, а это будет, скорее всего, python, если работа последних лет

Что почитать для вкатывания?
http://www.deeplearningbook.org/
Николенко "Глубокое обучение" - на русском, есть примеры, но меньше охват материала
Франсуа Шолле - Глубокое обучение на Python
https://d2l.ai/index.html

В чем практиковаться нубу?
http://www.deeplearning.net/tutorial/
https://www.hackerrank.com/domains/ai
https://github.com/pytorch/examples
https://github.com/ChristosChristofidis/awesome-deep-learning#tutorials

Где набрать первый самостоятельный опыт?
https://www.kaggle.com/ | http://mltrainings.ru/
Стоит отметить, что спортивный deep learning отличается от работы примерно так же, как олимпиадное программирование от настоящего. За полпроцента точности в бизнесе борятся редко, а в случае проблем нанимают больше макак для разметки датасетов. На кагле ты будешь вилкой чистить свой датасет, чтобы на 0,1% обогнать конкурента.

Где работать?
https://www.indeed.com/q-deep-learning-jobs.html
Вкатывальщики могут устроиться программистами и дальше попроситься в ML-отдел

Есть ли фриланс в машобе?
Есть, https://www.upwork.com/search/jobs/?q=machine+learning
Но прожить только фриланся сложно, разве что постоянного клиента найти, а для этого нужно не быть тобой

Где узнать последние новости?
https://www.reddit.com/r/MachineLearning/
http://www.datatau.com/
https://twitter.com/ylecun
На реддите также есть хороший FAQ для вкатывающихся

Где посмотреть последние статьи?
http://www.arxiv-sanity.com/
https://paperswithcode.com/
https://openreview.net/
Версии для зумеров (Килхер): https://www.youtube.com/channel/UCZHmQk67mSJgfCCTn7xBfew

Количество статей зашкваливающее, поэтому все читают только свою узкую тему и хайповые статьи, упоминаемые в блогах, твиттере, ютубе и телеграме, топы NIPS и прочий хайп. Есть блоги, где кратко пересказывают статьи, даже на русском

Где посмотреть must read статьи?
https://github.com/ChristosChristofidis/awesome-deep-learning#papers
https://huggingface.co/transformers/index.html
То, что обозревает Килхер тоже зачастую must read

Где ещё можно поговорить про анализ данных?
http://ods.ai/

Нужно ли покупать видеокарту/дорогой пека?
Если хочешь просто пощупать нейроночки или сделать курсовую, то можно обойтись облаком. Google Colab дает бесплатно аналог GPU среднего ценового уровня на несколько часов с возможностью продления, при чем этот "средний уровень" постоянно растет. Некоторым достается даже V100.
Иначе выгоднее вложиться в GPU https://timdettmers.com/2019/04/03/which-gpu-for-deep-learning/ Заодно в майнкрафт на топовых настройках погоняешь

Когда уже изобретут AI и он нас всех поработит?
На текущем железе - никогда, тред не об этом

Кто нибудь использовал машоб для трейдинга?
Никто не использовал, ты первый такое придумал. Готовь камаз для бабла.

Список дедовских книг для серьёзных людей:
Trevor Hastie et al. "The Elements of Statistical Learning"
Vladimir N. Vapnik "The Nature of Statistical Learning Theory"
Christopher M. Bishop "Pattern Recognition and Machine Learning"
Взять можно тут: http://libgen.io/

Напоминание ньюфагам: немодифицированные персептроны и прочий мусор середины прошлого века действительно не работают на серьёзных задачах.
Предыдущие:
https://2ch.hk/pr/res/1902462.html (М)
https://2ch.hk/pr/res/1881607.html (М)
https://2ch.hk/pr/res/1868191.html (М)
https://2ch.hk/pr/res/1847673.html (М)
https://2ch.hk/pr/res/1832580.html (М)
https://2ch.hk/pr/res/1817320.html (М)
https://2ch.hk/pr/res/1785952.html (М)
https://2ch.hk/pr/res/1758961.html (М)
https://2ch.hk/pr/res/1734710.html (М)
https://2ch.hk/pr/res/1704037.html (М)
https://2ch.hk/pr/res/1665515.html (М)
2 1920046
Это правда, что тянучки массово вкатываются в дата саенс?
3 1920048
Насчёт используемой в машобчике математики, в первом appendix'е https://d2l.ai/index.html есть все нужное.
4 1920077
>>20048
Этой математики достаточно, если в кликере работать планируешь.
Тервер заканчивается на матожидании и дисперсии, линал - на умножении матриц.
5 1920089
>>20077
Этой математики достаточно, чтобы понять что к чему в алгоритмах машобчика и использовать их хотя бы не методом тыка. Т.е. 100% пользователей, особенно всяким вкатышам, этого за глаза.
6 1920109
>>20089
Этой математики достаточно, но освоить ее по одной книжке нереально. Надо поебать мозги задачками
7 1920130
>>20077
>>20089
А, там ещё Appendix с математикой есть. Тогда ещё более-менее. Математики из preliminaries точно не хватит.
8 1920810
>>20089
Вкатышам - только за щеку
9 1920842
1
10 1920853
>>20046
Да. Хорошие девочки-отличницы учили статистику и матан. Хули им делать еще в декрете?
11 1921098
аноны, а насколько работают сетки с облаками точек/кддеревьями и прочим 3д отребьем в контексте pose estimation? Все чаще нахожу инфу, что пока решения очень сырые
12 1921112
>>21098

>Все чаще нахожу инфу, что пока решения очень сырые


Дедоотрицания. Всё работает. За сетками будущее.
13 1921122
>>21112
а какая из них считается норм для такой задачи?
14 1921135
бля
короче у меня задача типа определить есть ли объект на картинке или нет, а также его положение
нужна ли мне в таком случае нейронка? или дедовские методы ок справятся? по сути ведь тут нет никакой многоклассовости и пр
53007original.jpg29 Кб, 600x300
15 1921166
Кто-нибудь работал с предсказаниями (например, будущих продаж по текущим продажам)?
Надо ли шкалировать и признаки, и метки? Или только признаки? А если после шкалирования только признаков они с метками различаются на порядки?
16 1921329
аноны
увидел, короче, такую тему как озон мастерс - аля ШАД короче
и возник вопрос
действительно ли такие места дают сильный буст? Действительно ли дело обстоит так, что, если ты не из МФТИ/ШАД/Вышка/ВМК, то тебе нечего делать в областях, связанных в даса сайенсом (нлп, цв, мл и пр)? Я просто работаю в своем маня стартапе цвшником, и думаю, что из-за отсутствия чистого дата саенс образования на рынке труда буду сосать хуй
17 1921381
>>21135
Нужны серьезные обоснования чтобы object detection в 2021 решать дедовскими методами. В 99% тебе нужна нейронка, а там смотри на yolo/ssd/faster rcnn/efficientdet.
>>21166
Возьми градиентный бустинг и всё должно заработать из коробки, без шкалирования. Если у предсказываемых значений очень всратые распределения, то можешь попробовать предсказывать их логарифм, но обычно это не нужно.
18 1921445
Когда уже мы получим озвученную сеточкой легендарную пасту "Трьтего дня...." ?
19 1921485
>>21329
да нет, в целом то
тем более цв - это не совсем классический дс - тут нужно и прогать хорошо, и знать именно алгоритмы. А быть генинем матана не обязательно (хотя хорошую базу иметь надо)
20 1921491
>>21381

> Нужны серьезные обоснования чтобы object detection в 2021 решать дедовскими методами.



И чо терь, чтобы найти белое гавно на черном фоне, нейронку обучать?
21 1921539
Кстати, на тему тупых дедов, не принимающих Прогресс.
Большая половина статей по рекомендациям с использованием диплёрнинга не воспроизводятся, а те что воспроизводятся побились обычными эвристиками и дедовскими методами https://arxiv.org/pdf/1907.06902.pdf
22 1921762
>>21381

>Возьми градиентный бустинг и всё должно заработать из коробки, без шкалирования.


Получилась какая-то херня.
23 1921840
Сяп, хз где писать, напишу здесь. Есть кафка с дохуя транзакций по игрекуча разных ивентов от разных игроков. Нужно сообразить модель для аномали детекшн и приблизительно на чём её можно построить тех. решение для её реализации. Я не ленивая свинья и в гугле не забанили, но попрошу помощи и здесь, есть ли у кого может примеры реализации.
инб4: ленивый дебил вкатышь
24 1921884
>>21539
Весь современный машоб это либо прямо достижение дедов из 50-60х, либо их развитие. Бустинг это теория статистического обучения, сверточные сети, и весь диплернинх таким образом, это структура по типу зрительной коры кошки, Нобелевская премия Хьюбела и Визеля, мультихед аттеншен это кернел регрессия Надарайи - Уотсона на максималках, трансформеры это дальнейшее развитие сетей Хопфилда итд. Градиентный спуск туда же. Все это - середина прошлого века.
25 1921908
>>21884
то есть есть и реально крутая хуйня, а не эти сверточные распознавалки?, ну я догадывался конечно, хуево это как то, тем более у корпораций такие ебанутые мощности вычислительные.
26 1921911
>>21884
Умножение и сложение - древние египтяне. Весь машоб - достижения 5000летней давности
27 1921926
>>21911

> Умножение и сложение - древние египтяне. Весь машоб - достижения 5000летней давности


Так глубоко копать смысла нет. Я и не об этом. История машобчика идёт по спирали, одни и те же идеи воплощаются на разных уровнях развития железа и софта. Поэтому, кукареканья "Х - устаревшее дедовское говно" есть бред. Просто пока применения не нашлось / ньюфаги не знают, олдфаги забыли / т.д и всё. Никуда от теорем Жопеншмульцера не уйти. Сойбои - дебилы, в отличие от дедов, поэтому ничего нового создать не способны. Я уже говорил, в 60е этой темой занимались академики, сейчас - всякий сброд с петушиными бородами. Итог немного предсказуем.
28 1921944
>>21926

>История машобчика идёт по спирали, одни и те же идеи воплощаются...


Только если натягивать сову на глобус.

>Итог немного предсказуем.


Итог - ты копротивляешься и орёшь "ваш прогресс не прогресс, ганы изобрели в 1963"
15155196.jpg233 Кб, 1200x781
29 1922087
>>21944

>ваш прогресс не прогресс, ганы изобрели в 1963


Тот анон прав, наш прогресс это какие то всратые котики и дипфейки, где что нибуть практическое и полезное хотя бы уровня MYCIN?
30 1922139
>>22087

>практическое и полезное


>хотя бы уровня mycin


Если оно настолько практическое и полезное, то почему про него забыли буквально через пару лет. Литералли ничем не отличается от какого-нибудь IBM watson.
От DLSS больше практичности и пользы будет.
31 1922183
>>22139

>то почему про него забыли


Потому, что медикипедики прихуели и начали торпедировать проджек, ты почитал бы как у докторов пердаки подорвало от того что их могут пидорнуть на мороз
32 1922211
>>22183
Хуйня это всё. Можешь ты представить, чтобы медики или вообще кто угодно мог хотя бы требовать прикрыть гпт3, 4? Это бред ебучий.
33 1922265
>>22211

> гпт3, 4?


Так это говно никому конкуренцию не составляет, помнишь как чувак на коленке написал приложуху которая составляет типовые судебные иски и как разорвало пердаки у пендоюристов?
34 1922466
анончики, подскажите плез
короче 4 года работал байтоебом в цв (писал на микроконтроллерах зрение промышленного софта - в основном в задачах object detection дедовскими методами)
Сейчас хочу перекатиться в современный цв с сетками и блекджеками
Прошел курс от самсунга по зрению (и по обработке текстов), так что приблизительно понимаю о чем речь, но нужна хорошая практика
Отсюда вопрос: посоветуйте плз, какой проект по зрению можно запилить, чтобы лучше прочуствовать нейроночки (а то на котиках да мнисте итак все понятно), да и чтобы работодателю было бы интересно со мной поговорить
Алсо, если сможете такой же совет дать по nlp, то буду благодарен) тк, несмотря на бекграунд, тема тоже интересная
спасибо)
35 1922471
привет, аноны
я тот чел, который уже писал про задачу распознавания в облаке точек кубиков
короче тема такая: я реализовал определение ориентации облака точек (напомню, что у меня камера стоит сверху и снимает кубики\прямоугольники) через РСА
но чет задумался: а собственные вектора ковариационной матрицы прям честно дают мне локальные х у и з кластера? По идее ведь ничего общего с внешней системой координат х у и з эти оси не имеют, тк они всего лишь вектора, на которые дисперсия максимальна
Значит по идее, я ведь не могу их считать полноценными осями ориентации объекта? А то что заработало, выходит, не более чем удачный набор данных
Я прав?
36 1922601
Антоны, какие нейронки сейчас можно использовать для парсера языка? Нужно обрабатывать предложение и разбирать его на части речи, частицы и все прочее.
37 1922719
>>22601

>Нужно обрабатывать предложение и разбирать его на части речи, частицы и все прочее.


Соснешь, тебе нужен морфологический анализатор хуяндекса https://yandex.ru/dev/mystem/
Ну или васянский PyMorphy
image.png23 Кб, 764x188
38 1922720
>>22601
Литералли любые seq2seq. Для русского предобученную придется поискать, но английский берт для pos-теггинга ищется за 3 секунды.
https://huggingface.co/vblagoje/bert-english-uncased-finetuned-pos
39 1922721
>>22720

>берт


Лол, это же говно даже для английского
40 1922723
>>22721
Мне всё за тебя искать?
41 1922724
>>22723

>искать


Это говно даром не нужно
42 1922768
>>22466
очевидный kaggle, сейчас там есть несколько сорев по CV
43 1922807
аноны, какие видите перспективы нлп в следующие лет 5-10?
44 1922809
>>22807

>нлп в следующие лет 5-10


Оч туманные, нейроговно с ним не справляется, а все типа
https://www.link.cs.cmu.edu/link/
не модно

Идет целенаправленной отвод прогрессивных разработок, который заменяется модными и хайповыми штуками. Иллюзия.
45 1922822
>>22471

> то что заработало, выходит, не более чем удачный набор данных


Ну кубик как раз и есть удачный набор данных.
Если бы у тебя были шестиугольники, то PCA бы уже не помог
46 1922825
>>22466

>Отсюда вопрос: посоветуйте плз, какой проект по зрению можно запилить, чтобы лучше прочуствовать нейроночки


super resolution с помощью собственного датасета

>Алсо, если сможете такой же совет дать по nlp, то буду благодарен


зафайнтюнь что-нибудь
47 1922826
>>21926
>>22087

>Тот анон прав


Нечеткий, ну мы же знаем, что ты тут семенишь
48 1922971
>>22720
Я знаю про берт, думал, может что новее выпустили уже
49 1923031
>>22809
рили? я думал, что как раз-таки нейроночки новую жизнь всему этому дали
50 1923076
Анончики, есть тут кто-нибудь, кто внедрял аналитику и мл в бизнес, сидя на другой должности?

У меня ситуация следующая. Работаю маркетолухом, нет, не дрочилой яндекс-метрики в хипстерском стартапе. В нашей нише вообще контекстной рекламы и таргета нет. Тут дедовский маркетинг с наружной рекламой, мерчом и акциями 2 говна по цене 3.

Люблю копаться в циферках, постоянно ковыряю эксель. Умею в панды, склерн, все вот эти катбусты, более менее в статистику, когда-то мог поворочать датасетами и модельками на R, но уже все забыл. В нейросети пока не могу (да и не хочу особо). Хочу намекнуть кабанчику, что можно взять большие данные и на их основе делать выводы. Но пока руководитель отдела не дает этим заниматься и постоянно грузит какой-то хуйней, начиная от "посмотри акции конкурентов" и заканчивая "надо коробки в архив отнести".

С чего у вас в компании начиналось внедрение аналитики? В какую сторону смотреть в первую очередь и какие мл-инструменты в первую очередь реализуют в бизнесе. Из подручных средств есть разраб, занимающийся сайтами, но много чего помимо веба умеющий. Ну и говнобаза на 1С.
51 1923095
>>23076
тебе такое в ods надо
52 1923142
>>20026 (OP)
Сап
Подскажите есть ли универсальные гайды по работе с дейтой любой?
Допустим у нас есть пара таблиц числовых данных (не важно что это за данные). Что можно с ними сделать использую питон, пандус и прочие библиотеки. Мне на ум приходит только корреляция каждого из столбов друг с другом.
53 1923170
>>23142

А цель какая? Ты хочешь модель построить?
54 1923180
>>23170
Цель - из набора цифр получить данные.
Вопрос именно про работу с дейтой, не про нейронки и модели.
55 1923186
>>23180
Пришли хоть скрин, а то "как из данных получить данные"
56 1923197
>>23180
Тебе надо понять, какая колонка чему соответствует?
57 1923203
>>22971
Так открой хаггинфейс и посмотри, что ещё есть
58 1923209
>>23142
Тебе нужен data mining. Гугли, конкретных алгоритмов полно, как и готовых инструментов.
59 1923211
>>23031
Это местный шизик, не обращай внимание
60 1923254
>>23142
Можешь кластеризацию ебануть
61 1923294
>>23186
>>23197
>>23209
Представь таблицу с данными. В ней 4 столбца (или колонки) - a,b,c,d. В каждом из них floats, то бишь числа. И ты хочешь из этого непонять чего найти что-то интересное. Например вдруг окажется что a(d) на промежутке от [n,k]. Я о таких вещах.
>>23254
Ебанул тебе регрессий по башке.
62 1923492
>>23294

> Например вдруг окажется что a(d) на промежутке от [n,k]. Я о таких вещах.


И как ты это себе представляешь для произвольного датасета? Чтобы выявить что y = f(x), нужно ко всем парам элементов датасета применить все возможные f с оценкой каждого результата. Не считая того, что возможны варианты с композициями функций, тогда придется считать что-то типа y = fn(fn-1(...(f(x)...) + как-то сортировать результаты, короче, ты какую-то неведомую хуйню хочешь с запредельной вычислительной сложностью.
63 1923500
>>23294
Присылай датасет, будем ковырять всем форумом
64 1923636
>>20026 (OP)
Кокие там в ИИ достижения в 2021?
65 1923646
>>23076
Ну это сильно зависит от твоего босса. Работал в финансах и околофинансах. На одной из моих позиций босс запрещала использовать VBA, потому что мол "ты съебешь, а поддерживать это никто не сможет, много работы - передай на подчиненных" не говоря уже про BI-системы, более серьезную автоматизацию и моделирование. В таком случае я просто не афишировал, а просто делал для себя - если видел, что могу сэкономить время свое / коллег, например, или извлечь еще какую-то ценность. А в другом месте боссу самому были интересны такие приколы и он меня дергал, мол "а можешь вот наших клиентов на кластеры разбить, есть же алгоритмы специальные".
Т.е. в определенных случаях, даже если ты сможешь продемонстрировать ценность чего-то (моделирования \ автоматизиции \ интерактивных отчетов), человек на это не пойдет из-за
1. собственного консерватизма
2. нежелания самому потом хотя бы поверхностно разбираться в том, что ты там наворотил (потому что руководитель должен)
3. опасений, что ты съебешь и придется прикрыть эту активность из-за того, что в команде не найдется тех, кто будет в этом шарить и придется упразднить какую-то связанную с этим активность / отчет, к которым вышестоящее начальство успеет привыкнуть. Соответственно твоему руководителю придется держать ответ за это или искать человека со скиллами, которых у самого твоего руководителя нету - соотвественно при найме ему будет трудно их оценить у претендента на должность
66 1923702
Насколько хорошо трансформер будет игнорировать опечатки в словах если не брать в расчёт эмбеддинги?
67 1923743
>>23636
DALL-E
Нашли ошибку в реализации алгоритма 2013 года.
Новая сота на imagenet с использованием мета-псевдолейблинга на неразмеченных данных, лучше предыдущей sota и по качеству, и по времени сходимости.
Это только за январь.
68 1923781
>>21445
Для голоса самое важное это желание голосоделов. Несколько часов гоблопидора на руках, теперь надо обучить
69 1923852
Чего делать с бустингами когда любая фича может быть наном, при этом в тренировочных данных естественно не все такие случаи отражены? Если типа "аугментировать", размножая строки и рандомно заменяя фичи на наны получается слабая фигня.
70 1923874
>>23636
4 недели ещё не прошло, ты о чём?
71 1923958
>>23852
Заполнять наны очевидно, и в train и в test.
Иногда ты можешь грубо прикинуть какое именно значение в нанах - если хорошо знаешь данные с которыми работаешь (например, помнишь, что до года n столбец m не заполнялся - и тупо заполняешь годом n-1).
Иногда ты можешь понять из датасета или особенностей сферы (в каких-то случаях, например, nan корректно заменить на 0).
Можешь попробовать заполнять построив по модельке для каждого столбца с наном, даже тупо регрессией.
Или поставить какое-нибудь чиловое значение (если это числовой столбец), которое будет явно экстремальным для данного столбца - GLM это бы поднасрало, а для всяких деревьев решений и бустингов будет приемлимо.
image.png77 Кб, 650x254
72 1924008
>>23636
switch transformer
Screenshot327.jpg81 Кб, 628x752
73 1924064
Ну спасибо, Абу.
74 1924065
>>23209
ну и пиздец. и ведь постоянно кто-то пишет советы уровня нейросети.
75 1924068
>>23076
Раз времени мало, может ты и есть идеальный клиент для Orange и Knime ?

в Orange есть простой виджет outliers - загрузил клиентов - вот тебе и первая выгода (c)
Любой классификатор позволяет вычислить расхождение с предсказанием - это быстрая выборка нестандартных клиентов/контрагентов - вот и вторая выгода.
Тексты сайтов-доноров рекламы спарсил, загнал в bag of words, прикрепил эффективность по логистической регрессии, посмотрел важные слова - вот и третья выгода (но откровенно говоря, выглядит очень уж наивной моделью)

Тут местные илитарии не любят Orange, потому что он обесценивает их макакичную работу по копированию питон-мануалов из Гугла. Но ты то должен понимать суть.
76 1924076
>>24068

>Тут местные илитарии не любят Orange, потому что он обесценивает их макакичную работу по копированию питон-мануалов из Гугла


Шиз, опять ты выходишь на связь? Orange, как и любое GUI-говно, создает больше проблем, чем решает.
77 1924191
>>24064
чо делать если пайтон знаешь норм а инглиш ниже среднего блять...
78 1924197
>>24076
тебе при трудоустройстве создает больше проблем. И конфузирует новичков-вкатывальщиков.

А людям Orange строить и жить помогает!
79 1924200
>>24191
Учи инглиш
80 1924201
>>24191
вообще-то дохрена книг переводится.
Но давай чтобы не провоцировать илитариев, предложу
читать Николенко. Ведь это единственный российский ученый написавший книгу , которая, очевидно, не могла быть испорчена переводом.
1500486455180233574.jpg35 Кб, 461x414
81 1924211
>>24201

> вообще-то дохрена книг переводится.


Проблема в том, что они устаревают быстрее, чем переводятся. Предметная область такая, ничего не поделаешь. Единственный путь тут - постоянно обновляемые онлайн учебники типа https://d2l.ai/index.html В 2021 не знаешь англюсика = официально неграмотный, без вариантов.
82 1924214
>>24211

>Единственный путь тут - постоянно обновляемые онлайн учебники


По ссылке "современные сверточные сети" заканчиваюся на densenet (16 год). Ничем не отличается от любого другого учебника того же времени.
83 1924227
>>24214
А что в свертках с денснетов с тех пор вышло? Squeeze and excite?
books.jpg117 Кб, 820x675
84 1924293
>>24211

>Проблема в том, что они устаревают быстрее, чем переводятся.


Ты кого тут ебать собрался?

И кого же наш гипотетический вкатывальщик, не понимающий азов статистики, собрался обгонять? Пятерочку и гарвардских профессоров?
85 1924299
>>24293
это моя свалка, но вот Шпигелхалтер и Уэс Маккини 2020 реально полезные и охуенные.
86 1924466
Bitterlesson это круто! Это так же круто, как наконец купить сто сникерсов (I trust you).
87 1924524
>>24299
Спасибо за подгон
88 1924570
Анчоусы, нужна помощь. Есть временной ряд из 4 переменных с шагом в 24 часа. Как по одной записи получать прогноз на следующие 12 дней по изменению этих 4 параметров? Это возможно или нужно для каждого по отдельности делать модельки?
sage 89 1924574
>>24008
Вроде недавно общели FPGA трансфоремеры?
90 1924714
>>24227
В том числе и SaE.
Ещё split-transform-merge (resnext), depthwise separable convolutions (мобайлнет), архитектурный поиск (efficientnet).
91 1924761
>>24714

>split-transform-merge (resnext)


Хуитка

> depthwise separable convolutions


Топчик

>efficientnet


Хуита теоретическая

В целом по мне эти вещи не достойны учебника. Так, пару параграфов может.

Вообще по мне изучать лучше UNet и производные fully convolutional сети, а классификаторы уже унылы и в целом уже на этапе resnet довольно неплохие
92 1925592
>>1903293 →
Анон, у тебя получилось что по эмбеддингам? Хочу попробовать с DETR OCR модель сделать.
93 1925735
антоны, есть ли тут кто из cv? В этом году защищаю диплом по зрению и хочу пойти на работу в эту область (до этого работал в бэке), но часто слышу, что работа в цв это просто "ну вот у нас модель работает на 80 процентов точность, накидай еще данных шоб повысить" и так все время. Будешь делать что угодно, кроме самого цв, а моделька будет та, которую деды выбрали лет 10 назад и менять ее не нужно
Так еще у себя в видео Антоха Мальцев говорил (не знаю, катируется ли он на двачах или нет)
Это так или знакомым по ебалу за такую дезу дать?
94 1925760
>>25735

>работа в цв это просто "ну вот у нас модель работает на 80 процентов точность, накидай еще данных шоб повысить" и так все время. Будешь делать что угодно, кроме самого цв, а моделька будет та, которую деды выбрали лет 10 назад и менять ее не нужно


Не понимаю проблемы. Ты можешь параллельно подбирать другую модель даже если тебе не говорили это делать. Получишь точность лучше - придешь к своему тимлиду, покажешь модель, и скорее всего ее запустят в прод. Только вот я тебе гарантирую, что через год работы у тебя пропадет весь энтузиазм, и ты будешь работать по минимуму.
95 1925902
>>25760
Вот и вопрос
Стоит ли туда идти вообще? я ведь хочу не хуйней страдать а работать
96 1925964
>>25902

>не хуйней страдать а работать


Трясун начал что то подозревать
97 1926023
>>25964
че?
98 1926247
Есть полтора года до выпуска. Как лучше всего вкатиться?
99 1926519
>>26247
Что нравится, туда и вкатывайся. Всё равно будешь в итоге другим заниматься.
100 1926581
У меня есть домашняя машина, к ней по ssh подключаюсь с ноута иногда и запускаю Жупитер Блокнот. Ну и по прокинутому порту уже захожу в браузере на ноутбуке. Там и работаю, но когда нужно поставить что-то на обучение, то после закрытия соединения эта хреновина потом фиг даст посмотреть прогресс. Открываю его заново, захожу на сайт, но информация в окошках вывода старая, не обновляется и вообще Жупитер не подает признаков, собственно, обучения модели. Что делать? Можно, конечно, просто писать питоновские скрипты с модельками, как белый человек, и запускать их фоном, тогда их выполнение точно не останавливается, но как тогда узнать прогресс обучения?
16101340052293.jpg71 Кб, 473x521
101 1926584
>>21762
Бамп вопросу.
102 1926781
>>26584
Что за говно происходит? "Будущие значения по прошлым через градиентный бустинг"?
В чем твоя идея? Что на что похоже?
Какие были выбраны фичи и какой y?

Пиздец, элитарные трясуны в худшем виде. Термины увидел и сразу их в код написал и получил мусор?
103 1926786
>>26581
Попробуй вкладку браузера не закрывать. Там какая-то хитрая штука с этим.
104 1926829
>>26786
Да, это работает. Но как тогда разработку ведут в крупных компаниях? Читал еще, что удаленный интерпреттор подключают по тому же ssh к pyCharm, но он за деньги, а пиратить не хочется.
В общем, пока что для экспериментов тунель ssh + Жупитер , а для долговременных вычислений: засовывание модели в .py . Но геморно это все как-то, должно быть готовое решение.
105 1926831
>>26829
PyCharm PROFFESSIONAL
*fix
106 1926843
>>26581
Vnc/rdp/nomachine-nx/teamviewer/etc
107 1926846
>>26829

> Но как тогда разработку ведут в крупных компаниях?


комп включил оставленным и пошел. назавта пришел. как, как, блять...
tensorboard какой-нибудь еще есть.

Да по сути это и не разработка, а черновой поиск решений. Разработку кодомакаки ведут.

есть запусти man screen, если дружишь с консолью и ipython
16051211872643.jpg64 Кб, 433x601
108 1926988
>>26781
Есть фейкопочта?
109 1927035
Аноны, загорелся датасаенсом, реально переключиться с веба, если в матане вообще околонулевой? Имею ввиду задрочить математику до необходимого уровня самому или это реально только при вузике сделать?
photo2020-12-0313-26-34.jpg53 Кб, 811x608
110 1927078
>>26988
нет, конечно. О чем мне общаться с фейкопрограммистом?

Иди, блядь, снимай ролики о том как ты вкатываешься и имитируйте там вместе датасаспенс в камертах.
Люди делом заняты.

Тебе просто написал кто-то довольно общее (и верное) замечание, о том, что градиентный бустинг не требует шкалирования. Никто не обещал что что-то получится.
111 1927091
>>27078
Извини, пропустил на треде табличку "Только для опытных датасаентистов, чье ЧСВ не пролазит в тред".

>Люди делом заняты.


Как скажешь.
Не забудь вовремя поливать дерево, на котором специалисты растут.
Всего хорошего.
112 1927093
>>27091

>Не забудь вовремя поливать дерево, на котором специалисты растут.


а я и поливаю:
выкладывай всю историю своих страданий публично чтобы тебе могли помочь публично и чтобы опытные датасаентисты повысили свое ЧСВ.
нахрена им твоя фейкопочта?
113 1927105
>>27093

>выкладывай всю историю


Подразумевая, что тут же появятся толпы желающих помочь.

>нахрена им твоя фейкопочта?


Потому что итт заняты по большей частью мерянием пиписьками старые технологии/новые технологии, предсказанием где будет машобчик через 5 лет и вопросами типа "сап, решил вкатитья в машоб".
Не особо хочется разбавлять эту атмосферу своими проблемами и вопросами.
114 1927109
Ну и какого хуя антоху подрезали, он был о делу вообщето. Моча соевая пригоревшая.
115 1927112
>>27105
а было бы неплохо.
заебали своим SOTA от Жопеншмульцера.
Конкретная задача (предположительно) решаемая градиентными деревьями показывает из чего на самом деле состоит машоб.
116 1927169
>>27112
У меня есть набор временных рядов (пик1).
Признаки я почистил, посмотрел корреляцию, выделил значимые, проверил на стационарность тестом Дики-Фуллера, убрал у некоторых нестационарность, посмотрел автокорреляцию, добавил новых признаков в виде лагов (пик 2). Где значения 900+ - это целевой результат.
Поделил данные через TimeSeriesSplit, засунул в линейную регрессию, случайный лес, xgboost, а у меня везде примерно получается пик3. А должен быть пик4.
Что может быть не так?
117 1927200
>>24068
Погуглил оранж. Это вообще законно?
image.png253 Кб, 543x543
118 1927211
>>24068

>не любят Orange, потому что он обесценивает их макакичную работу



РИСОВАТЬ РАНДОМФОРЕСТЫ В ТЕТРАДКЕ ВАЖНО

ЭТО ДРУГОЕ
119 1927213
>>24068
Суть я более-менее понимаю, не могу именно вытянуть полезное для бизнеса. Посчитать и модель построить я могу, не знаю вот только нахуя
120 1927219
>>27213
А в Единственном русскоязычном курсе по Оранж об этом рассказывают. Рассказываю нахуя. Начинают с CRISP-DM. Дают всякие исторические примеры и тд. Представляешь?

А у Жопенцмуллеров сразу питон и керас.
121 1927222
Посочувствуйте курс или книжку по статистике (не Жопеншмульцера)
122 1927223
>>27219
Спасибо, анон. Теперь хоть знаю, в какую сторону гуглить. А то вокруг одни душные деды с их матаном
123 1927224
>>27222
карпов на степике
124 1927305
>>27224
Это тот которого обоссали настолько, что он вынужден был переснимать курс в прошлом году? Ну такой себе совет
125 1927307
>>27305
За что был обоссан, кроме ЦПТ?
126 1927311
>>27169

> У меня есть набор временных рядов (пик1).


Ну так и сделай pip install fbprophet.

Вообще плохо понимаю как ты мыслишь и с чего тут xgboost должен был дать что-то полезное кроме шума.

У prophet нет признаков. Он на основе сезонности себя рисует ряд.
127 1927315
>>27213

> Суть я более-менее понимаю, не могу именно вытянуть полезное для бизнеса. Посчитать и модель построить я могу, не знаю вот только нахуя



А ты не пиздишь? Не понятно как такие люди возникают. Ты математик в вакууме?
128 1927326
>>27311

>Вообще плохо понимаю как ты мыслишь и с чего тут xgboost должен был дать что-то полезное кроме шума.


Какава примерама такава решенияма.
Вот тут, например, регрессии используются для решения схожих задач:
https://towardsdatascience.com/5-machine-learning-techniques-for-sales-forecasting-598e4984b109
И вот тут, как не посмотришь, регрессии с randomforest'ами, xgboost'aми и прочими LGBM'ами:
https://www.kaggle.com/c/walmart-recruiting-store-sales-forecasting/code
https://www.kaggle.com/c/competitive-data-science-predict-future-sales/notebooks

>prophet


Т.е. baseline не нужен? Делать так?
От стационарности тоже отказаться?
129 1927335
>>27315
Научили так. Хуевертить фичами и моделями умею, сделать полезно нет
130 1927339
>>27326

>Вот тут, например, регрессии используются для решения схожих задач:


https://towardsdatascience.com/5-machine-learning-techniques-for-sales-forecasting-598e4984b109

И закончили они на дедовской ARIMA, которая и выигрывает.
И ты ееможешь в prophet получить.

по поводу остального не знаю и не готов за тебя вычитывать насколько хорошо повторил Кагл.
131 1927372
>>27035
Там математики на полтора месяца тебе.
132 1927377
>>27372
>>27035
Потому что то, что машиннообучаторы называют математикой, к математике имеет мало отношения. Это инженерно-алгоритмически-вычислительная хуита, а не математика.
133 1927382
>>27035
>>27372
Хотя я хуй его знает, конечно, какие у тебя там способности.
134 1927455
>>27078
Ты уже можешь больше 80% треда
135 1927549
>>27377

> машиннообучаторы называют математикой, к математике имеет мало отношения.


Ты модульный петух чтоле? Математика это, успокойся да выпей ещё этих таблеток.
136 1927550
>>27549
Импортировать катбуст для решения титаника на кагле это не математика
137 1927559
>>27305
Для вката достаточно, остальное сам нагуглит. Отличать нормальное распределение от слона в удаве можно научиться и у Карпова. Тут не надо иметь глубинные знания о решениях уравнений по теореме Пьера д'Ачелло-Сосницкого
138 1927560
>>27035
Задрачивай статистику. Можешь еще пару видосов про линал посмотреть, чтобы знать, что такое вектор.

на самом деле, значительная часть терминов во всей этой хуйне, который мы занимаемся - это матеша за 10-11 класс, но длинными умными словами
16086849848570.png325 Кб, 900x900
139 1927561
>>27222

> Посочувствуйте курс или книжку по статистике (не Жопеншмульцера)


Какая тебе статистика, зумер, ты шапку осилить не можешь. https://d2l.ai/index.html первый appendix. Там все, нужное для машоба, не только статистика.
>>27224
>>27559
Ноунейм параша без задач.
140 1927811
>>27549
Да там и "прикладной" математики не особо.
141 1928131
поцоны
иду через неделю на собес по зрению
что могут спросить? На какие моменты обратить внимание?
142 1928168
>>28131
в последней строчке написано ИМШЫНБМК
143 1928244
>>28168
ну от анонов этого треда я ничего и не ожидал особо
рил самый душный тред
144 1928264
>>28244
так вы бесите своим наивным подходом к довольно сложной области.
145 1928277
>>28264
мань, по порядку
1) поинтересовать какие вопросы могут быть на собесе - это не "наивный" подход. Почему-то в ods нормально отвечают на такие вопросы, хотя они тоже варятся в этой (о боже) сложнейшей области за пределами человеческого понимания
ты там не МФТИ заканчивал? У них все, как и ты, ассоциальные
Можно просто написать пару примеров что у тебя лично спрашивали или что спрашивали у друзей и не выебваться (или помолчать)
2) > довольно сложной области
тебе либо 15, либо ты просто зарвавшийся какой-то
в программировании все области сложные. Я абсолютно уверен, что написание многопоточных прилог на с++ не сильно проще клепания моделей в жупитере
146 1928278
>>28277
мимо не ОП вопроса
147 1928292
>>27169
Анончик, очень сложно подсказать тебе, если ты боишься конкретно сказать, что у тебя за данные и что за задача. Вот например нихуя непонятно, что ты хотел сказать под "А должен быть пик4." - пик 4 это твой таргет?

Судя по твоим постам, ты пытаешься предсказывать некие временные ряды с некоторым количеством внешних переменных. Хорошо, что ты сделал тесты на стационарность и смотрел автокорреляцию. Для бейслайна я бы предложил тебе SARIMAX из statsmodels, закинешь туда нужный порядок, возможную сезонность, ну и внешние данные.
148 1928341
>>28277
Хуя рванулась манюня "не автор вопроса" которой не подскачили тут же кабанчиком варианты накидывать забесплатно.
149 1928355
>>28341
ой бля иди нахуй вообще
15910219081250.png217 Кб, 640x640
150 1928388
>>28277

>Я абсолютно уверен, что написание многопоточных прилог на с++



Вот тебе совет для собеса : не пытайся делать вид , что написание типовых прог на хуевом языке - вершина Айти и что ты якобы познал все.
151 1928440
>>28292
Данные могу скинуть
на почту
сейчас опять кто-нибудь сагрится
152 1928454
>>28355
ОЙ ВСЬО
153 1928478
>>28440
че тут агриться - не ты первый с гениальными идеями поработать Форекс.
154 1928488
>>28478
Иногда данные из задачи - это просто данные из задачи.
155 1928607
Xi Цзиньпинь мужчина горький урок половой член
156 1928648
Почему баб так много в датасаенсе? Неужели он такой простой?
a2.mkv1,6 Мб, webm,
1280x720, 0:11
157 1928722
>>28648
проще пареной репы
159 1928753
>>28131

>мелкобуква


>иду через неделю на собес


Не трать время зря, иди сразу в пятерочку
160 1928757
>>28722
>>28724
мистер аношин из амазона опять раскручивает свою местечковую тусовку с бесполезными персонажами?
161 1928762
>>28757
- он уже в Microsoft перехантился.
- просто хотел показать анонам грани пиздеца
162 1928765
>>28762
бля, там под видом невротъебенных возможностей просто надувают число подписоты
за исключением нескольких грамотных людей, большая часть этих типа спецов, которые ведут вебинары, - просто напонтованные пустышки. как собственно и сам этот чел, за счёт супер навыков самопрезентации и нетворкинга добравшийся до вот уже микрософта.
163 1928769
>>27091

>поливать дерево, на котором специалисты растут


>сап двач, а как какать



Такое дерево в индустрии не нужно
164 1928832
>>28769
А на чем тогда "специалистов" вешать? Как без дерева то?
1.png61 Кб, 1064x524
165 1928858
Ябать, эти ваши трансформеры сила... Стандартный пайплайн для вопрос-ответ задачи, из нейроночек выбрал дистилберт, файнтюненный на SQUAD, в контекст просто скопипастил верхнюю часть (до оглавления) статьи с педевикии про комплексные числа. Результат пикрелейтед. Шок, реально. Отвечает осмысленнее любого зумера.
166 1928867
Аноны, как вы представляете свой kaggle / github в резюме. Просто даете ссылки или расписываете в самом резюме про кейсы \ проекты с которыми работали / соревнования, в которых принимали участие?
Алсо, если расписываете, упоминаете ли пэт-проекты не связанные непосредственно с анализом данных / ML?
167 1928889
>>28858
Попроси два комплексных числа умножить
168 1929041
Анончики, у меня назрел вопрос. Вот эта вся хипстерская хуйня, которой вы тут занимаетесь, машинлернинги, нейросети и прочее троганье себя за место на каггле – какое оно может возыметь прикладной смысл для B2B? Ну, скажем, есть у вас ООО ХуйСтройМонтаж, которое собирает поддоны из деревяшек, чтобы продавать их транспортным компаниям. Или, например фирма, торгующая стройматериалами, скажем, цементом. Как все выше обсуждаемое может помочь ему, простому быдлобизнесу, стоящему на кабанчиках, где твой основной продукт – это цена на твое барахло, ведь у твоих конкурентов оно точно такое же.

Неужели все это модное говно работает только на интернет-магазинах с фалосами или заводах с ебанутейшим оборудованием, в которое можно запихать компьютер вижн?
crisp-dm.jpg43 Кб, 800x600
169 1929093
>>29041
проблема в том, что кабанчики даже не начали накапливать данные.
Даже не пытались анализировать данные с помощью людей, чтобы потом на основе их знаний, сделать следующий шаг.

Но это постепенно меняется.

Ну рассказывай, Михал Палыч, че там с рогами?
170 1929108
>>29041
ах да, вторая ступень - данные накопили, но они все еще поддаются анализу офисным быдлом. Кое-как в экселе повертели и готово решение.
С этой точки зрения, становится понятно как именно Пятерочка стала школой МЛ - их данные просто ни в один эксель не помещались. Пришлось что-то писать и упорядочивать.
171 1929122
>>29041
Может помочь "простому быдлобизнесу" или нет зависит от его простоты, очевидно. Совсем простому наверное нет, другое дело что сам простой быдлобизнес экономике не очень-то и нужен.
172 1929402
>>29041

> Как все выше обсуждаемое может помочь ему, простому быдлобизнесу, стоящему на кабанчиках, где твой основной продукт – это цена на твое барахло, ведь у твоих конкурентов оно точно такое же.


Никак. Суть того наебизнеса, о котором ты пишешь - связи и знакомства в теме такого наебизнеса. Грубо говоря, Вася с улицы купит бульдозер и останется при своих интересах. А Петр Иванович, проработавший в этой теме 20 лет, и знающий всех в городе, с таким же бульдозером легко будет получать тендеры и контракты как подрядчик. Машобчик в таких схемах не решает ничего.
173 1929437
>>29402
вот пока ты так думаешь, так и будешь кошкодевочек раздевать и в кагл дрочить.
174 1929474
>>28648
Ну да. На начальных этапах уж точно. Выучил стандартные решения стандартных задач и вперёд. Даже нормально кодить уметь не надо. Для второго-третьего курса говновуза самое то.
175 1929496
>>29474

>и вперёд


на ютубчик, учить других
176 1929525
>>29496
Авотхуй. Лично знаю несколько примеров, которые, нихуя по сути не понимая ни в программировании, ни в дотасаентистской «математике», устраивались на работу в дота саенс. Это тебе не пхд в области интеллектуального анализа данных в нормальном вузе, а работка в типичном бизнесе.
177 1929528
>>29525
ну мало ли
бывает
178 1929580
>>29525
Эти примеры по пуси-пассу прошли?
179 1929611
>>28648
Датасаентисту, который связан с бизнесом нужно быть больше бизнес-аналитиком. Модели все написаны, успевай только импортировать модули, а вот присобачить эти модули к бизнесу, чтобы они профит приносили - это самое сложное и необходимое бизнесу. Чтобы понимать бизнес, нужно понимать менеджеров и потребителей, т. е. необходимы вкачанные софтскиллы, которые у самок обычно лучше развиты.
180 1929615
>>29580
бывает, что навыки софт-скиллз, умение достигать целей и глубокое погружение в бизнес-часть ценятся больше, чем пресловутое умение кодить

ДА
181 1929636
>>29611

>Чтобы понимать бизнес, нужно понимать менеджеров и потребителей, т. е. необходимы вкачанные софтскиллы, которые у самок обычно лучше развиты.



Так это просто не дата-саентист, а даун-аутист.

Как можно изучить нейронки, не изучив сути ?
Для кого во всех этих датасетах пишут подробные описания данных?
182 1929651
>>29636
В том-то и суть. Нужно самому для себя сделать исчерпывающее описание для датасета, который сам же и собираешь. Чтобы потом уже фит-предикт сделать.
WrO7MY4.jpg356 Кб, 1280x720
183 1929654
>>29651
тогда что это за тред профнепригодных ?
184 1929809
>>29580
Извинитеможнопорузге.
185 1929812
>>29809
киска проход
186 1929865
>>29812
Аааа ну возможно. Я таких знаю штук 6 минимум, 5 из них тянки.
Untitled.png146 Кб, 1863x120
187 1929898
инфоцыгане заспамили
188 1929907
>>29898
Что за курсы? ШАД на минималках?
189 1929919
>>29812
лучший переводчик этого треда!
191 1929993
>>29898
РДЖ?
192 1929996
>>29923
ии ага, назвали бы реалистичней системы таргетной рекламы, как всучить вам товар порелевантнее
193 1930033
Аноны, как существенно увеличить зп или просто доход, если не хочу и не могу уезжать из ДС?
194 1930043
>>30033
удаленка на барина из калифорнии
195 1930062
>>30043
Сколько стоит ожидать среднему джуну?
196 1930086
>>30062

>джуну


>удаленка

197 1930096
>>30086
Да я уже посмотрел сам и нашел все. Около 50 баксов в час.
198 1930097
>>30096
джун на удаленке нахуй не упал никому
199 1930098
>>30097
Ну это ты так думаешь. Много кому нужны простые быстрые модельки на один раз, а я еще и код нормальный писать умею. У меня уже был похожий опыт, но здесь, не догадался перенести его на все.
200 1930102
>>30098

>Ну это ты так думаешь


бгг думает что чет могёт
201 1930232
https://www.youtube.com/watch?v=X74HrvGevXY
Что скажете по этому поводу?
202 1930262
>>30232
где текстовый конспект высера? тезисы? с чем именно не согласен ?
вообще, ты как к вечно занятой илите айти обращаешься?
203 1930267
>>30262
А что, слабо написать нейронку которая тебе краткий конспект видео составит раз ты такой ленивый?
204 1930284
>>30262

> ты как к вечно занятой илите айти обращаешься?


Ахахаха посрал тебе за воротник, илитка ты наша.
205 1930366
>>28131
Как вкатился? Программист, математик? Какой опыт?
342423.jpg158 Кб, 1919x941
206 1930481
>>30267

>писать код бесплатно

207 1930601
>>20026 (OP)
Есть тут люди, мутившие небольшие стартапы в мл и дс?
208 1930690
>>30601
Антоха Мальцев чем-то таким занимается
209 1930708
>>29093
У меня затык на первой стадии. Я не могу сам себе задач нарезать.
210 1930883
привет пацаны
работаю в чистом ML пару лет, но хочу перейти в NLP или CV - ну нравятся мне эти области
если отбросить "ну куда больше нравится туда и иди" (потому что привлекает оба варианта, а поработать год там - год там не очень хотелось бы), то куда бы вы посоветовали пойти?
С точки зрения перспектив / количества вакансии / амбициозности задач какое из направлений лучше?
Также вопрос: в случае чего насколько сложно совершить перекать из одного в другое?
Поделки делал и там и там, так что о чем области примерно понимаю, но если есть серьезные дяди тут, то интересно послушать ваг опыт
211 1930918
>>30883
Что такое "чистое мл" ?
Рейтинги кредитные из экселя в бустинг загружать ты имеешь ввиду?
212 1931008
>>30918
Нажимает кнопку "Регрессия" в экселе, наверное
Untitled.png72 Кб, 1399x966
213 1931018
Требования для тимлида.
https://hh.ru/vacancy/42156528
214 1931043
>>31018
Это много или мало?
215 1931047
>>30883
>>30918
А почему кстати CV часто стоит как бы особняком от ML в общем?
В вакансиях, например.
Или это у меня когнитивное искажение?
216 1931050
>>31018
Що таке Data Lake?
217 1931059
>>31047
Наверное потому что крутится вокруг эвристики if (тут пятно) then деталь_упала()
для чего нужно просто писать на c++.
218 1931062
>>31050
Хадуп и все виды беспорядочно накапливаемых данных, которые мы пока не знаем как обработать, а тимплид требует 300 в мес
219 1931082
>>31059
Т.е. фактически там никакого машоба и нет, что ли?
Точнее, оно там есть лишь в виде готовых библиотек обученных моделей распознавания образов на картиночках, а ты фактически работаешь как обычный программист?
220 1931099
>>30918
угу, типа того.
ток сюда студента и взяли - я на 3 курсе
221 1931101
>>31082
ну фифти фифти
есть иногда очень замудренные задачи, для которых либо сетки в целом не нужны, либо их переучивать надо
222 1931151
>>31101
Спасибо, понятно.
А есть еще подобные ниши в машобе?
223 1931153
>>20026 (OP)
Уважаемые, используется ли еще сейчас классический машоб, или все везде давно на разных продвинутых нейронках?
224 1931195
>>31153
Нейронки в CV в основном. И для них с++ очень желательно знать. В других местах помимо навыка перебора гиперпараметров нужно быть бизнес-аналитиком, или дата-инженером-девопсом для регулярно падающего хадупа.
https://www.youtube.com/watch?v=Cs3ae65tmKA
225 1931198
>>31195

>И для них с++ очень желательно знать


С++ машобщику вообще не нужен.
226 1931229
Есть возможность по дешёвке взять 2х2080тишек и поставить в слай для нейроночек. Насколько 3к серия лучше прежней и не проебусь ли я?
227 1931232
>>31153
Работаю в одной из консервативных забюрократизированных сфер, где словосочетание "data science" редко используется неиронично, используем в основном дедовский generalized linear model с табличными данными из-за его максимальной интерпретируемости в сравнении с другими моделями. В редких NLP задачах DL тоже не используем, только более явные и понятные методы типа cosine similarity. CV проекты отсутствуют в принципе.
Вообще если, например, пойдешь рисковиком в банк и другие подобные места - в основном будешь работать именно с самыми консервативными из дедовских методов, хотя сейчас у многих банков появляются позиции DS для, в том числе, CV проектов, + есть микрокредиты, где обычно более лояльно относятся к более прогрессивным технологиям, так что и в консервативных сферах типа финансовой помимо дедовских методов надодится место и всяким новомодным вещам. Вообще, гораздо больше мест, где используются дедовские методы, просто обычно они не называются модными словосочетаниями типа data scientist.
228 1931233
>>31198
С++ не нужен бизнес-аналитикам, которым софт-скиллы важнее понимания машоба, а для нормального МЛ разработчика это вообще основной язык.
229 1931247
>>31233
ну ты людей то не пугай
все от поля деятельности зависит
вон, тот же Антоха Мальцев говорил, что они почти не пишут на крестах. Хотя его команда пилила 3д сканирование с помощью ЮАРОВ (робот такой промышленный)
Также в ОДС часто спрашивали насколько нужен с++ для зрения, и ответ тоже не то что бы был однозначным - большенство как раз-таки сошлись на мнении, что он нахуй не нужон
алсо друган устроится цвшников на питоне
короче я вижу так: где нужная какая-то прям дико оптимальная хутиа - там кресты (правда вопрос, занимаются ли цвшники оптимизацией на крестах - все таки тоже огромная область). В остальных случаях - может вытянуть питон (может си шарп)
в любом случае нормальный программист хотя бы 1 си подобный язык должен примерно знать
и ты, прежде чем бросать такие фразы, хоть пруфани, а
230 1931252
>>31229
2080ти==3070
231 1931256
>>31247

>цвшников на питоне


Больше видявакарт!!! Хотя что еще ожидать от трясунов.
232 1931258
>>31252
А если их будет две то я опережу 2 поколения?
233 1931267
>>31256
еще раз
я не говорю о том, что все так делают
если есть такие конторы, и у них все ок ( а у некоторых и правда все ок) просто закупая видюхи и напиливая продукт дальше - то это НОРМАЛЬНО, как бы твой манямирок не сопротивлялся, дедуль
как будто идея закупать доп видюхи для цв (как и сервера для классического проганья) это что то новое и вообще зумеры заебали лезут к нам ууу ряяя какой я злой раньше было лучше
лично я , конечно же, за подход - цвшники делают алгоритмы (оптимальные с точки зрения алгоритма) - прогеры их оптимизируют (с токи зрения кода\архитектуры и пр)
но опять же ничего не имею против первых
234 1931268
>>31195
блин, клевый видос
прям лукас
235 1931269
>>31195
>>31268
вообще очень приятно слушать не диких задротов (чувак явно и себе время уделяет, помимо работы)
сразу слышишь более адекватные мысли
236 1931274
Вышмата не знаю, статистики не знаю. Кодирую на крестах. Хочу стать топовым млщиком, с чего начать?
237 1931279
>>31274
подумать, точно ли ты хочешь перекат в мл
также подумать, чего ты ждешь от работы
глянь видос выше, там неплохо это рассказывают
если ты прям кодируешь, а не лабы делаешь, то твои скилы уж точно в мире данных пригодятся
а если кратко: учи вышмат питон и эскюэль - на степике все есть
238 1931288

>подумать, точно ли ты хочешь перекат в мл


Ну конечно. Перспективная сфера же.

>питон


Читал что на нём ничего сложнее бота для шахмат не написать.
239 1931289
>>31279
>>31288
Ну ты понял
240 1931300
>>31288

> Читал что на нём ничего сложнее бота для шахмат не написать


нет
241 1931312
>>31258
Нет, 2 видюхи примерно на 60%, а не на 100% быстрее чем одна, из-за оверхеда на пересылку данных по шине.
Но памяти побольше будет
242 1931313
>>31267

>то это НОРМАЛЬНО


Нет, маня, это не нормально
243 1931317
>>31313
лол
нет, маня, это нормально
у нетфликса модельки в проде в юпитере вертятся
244 1931332
>>31317
Потому что в нетфликсе работают сжв-петухи.
245 1931335
>>31332
ну я вот его смотрю и мне збс
не чувствую НЕОПТИМАЛЬНОСТИ их кода
ве быстро и круто
и ты, дед, сиди и дальше байты еби
246 1931336
>>31332
но про сжв петухов я с тобой согласен
247 1931337
>>31233

>для нормального МЛ разработчика это вообще основной язык


Тензорфлоу написан на крестах и оптимизирован до максимума, так что лучше ты все равно не напишешь. Всякие библиотеки для CV и работы с данными тоже сделаны на крестах, и могут быть использованы в многопоточном режиме. Подсчет метрик, построение графиков и прочее производительности не требует. Ну и зачем машобщику кресты?
248 1931340
>>31269
В чём они более адекватные?
249 1931341
>>31337
плюсую молодому человек (или человекине)
250 1931342
>>31340
да я выебнулся, забей)
251 1931343
>>31337

> Ну и зачем машобщику кресты?


Зачем машобщику математика?
252 1931350
>>31336
Спасибо.
>>31335
А я его не смотрю, и мне тоже збс.
И я не дед.
253 1931351
>>31343

>Зачем машобщику математика?


Чтобы уметь воспроизводить модели из SOTA пейперов и использовать их для решения задач бизнеса.
254 1931355
>>31342
Я предвидел это!
255 1931367
>>31343
Это смотря что считать математикой.
256 1931370
>>31232

>где словосочетание "data science" редко используется неиронично


А в научном сообществе вообще всегда это звучит иронично. Потому что дота саенс не наука.
257 1931384
>>31351

>воспроизводить модели


Кокие модели? Ведь нужно трясти ящик и крутить пимпы
258 1931385
>>31367

>считать математикой


Все что оторванно от реальности
259 1931396
>>31385
Философия тоже оторвана от реальности.
Untitled.png20 Кб, 1810x234
260 1931401
>>31247
Для моделей в пандасе не нужен, а в OpenCV очень даже нужен. Питон, хоть и оперирует либами на С, но однопоточный GIL никто не отменял.
261 1931402
>>31396
Чел, ты...математика и философия это неразрывные вещи.
262 1931408
>>31402
Это как посмотреть.
263 1931413
>>31401
чет пикрил не понял
264 1931417
>>31402
Чистая математика находится на границе познаваемого, далее начинается философия, в которой уже нет никаких критериев истинности.
Ну а вообще да, они связаны, наверное.
Забавно, что согласно критерию Поппера математика наукой не является.
265 1931419
Зашел на апворк, почему ставка по 50 баксов у всяких пхд и прочих серьезных людей, а кто-то согласен и за 5 долларов в час работать? Речь про ДСов, там не только индусы.
266 1931420
>>31396

>Философия


Она как раз и пытается обьяснить реальность, скорее математика = теология
267 1931421
>>31417

>Забавно


Так а что тебя удивляет, математика не наука.
268 1931424
>>31419

>а кто-то согласен и за 5 долларов в час работат


Там и за 3 есть, демпингующие макаки
269 1931431
>>31424
А они реально что-то умеют? Или нужно искать барина на постоянной основе.
Посмотрел заказы. То, что я с двумя такими же джунами делал 3 месяца хотят купить за 45к рублей. Это буржуйская народная забава такая, покупать и продавать говно?
270 1931433
>>31431

>А они реально что-то умеют


Нет конечно, просто те кто умеют они просят 5 и сосут писю
271 1931434
>>31433

>5


50, фикс
272 1931438
>>31413
Топ тегов из вакансий хх по запросам из первой строчки.
273 1931440
>>31438
Гит, лол
9u3vne29fe7z.jpg67 Кб, 800x445
275 1931446
276 1931447
>>31445
Как же он заебал. В последних видосах уже прямо говорит, что не знает о чем снимать и просто про все говорит.
277 1931458
>>31420
Философия пытается, но у неё нихрена не получается.
Естественные науки философию не используют, только математику.
В общественных и гуманитарных, да, философия нужна, однако, вполне возможно, только до тех пор, пока использование математики в них затруднительно.
Для использования математики нужны базовые экспериментальные постулаты, которые можно было бы положить в основание теории в качестве аксиом, иначе польза от математики может быть только локальной. Например, как теория аукционов в экономике, при этом сама современная экономика имеет вид скорее кулинарной книги с кучей рецептов, чем цельной теории.
В общественных науках воспроизводимые эксперименты ставить не получается (по крайней мере, пока), поэтому и теорию не построить, именно поэтому приходится обращаться к домысливанию, т.е. к философии.
Лично я думаю, что прорыв в теоретических разработках общественных наук будет возможен только после глобальной цифровизации всего общества, и когда в этой огромной мешанине бигдаты будут найдены некоторые инварианты общественных отношений (если они вообще существуют), которые и будут положены в основание теории как аксиомы.
Чувствую, математика там будет совершенно упоротая.
Пиздец, вот же где машоб развернётся на всю катушку.
278 1931469
>>31421
Ну тут опять смотря что считать наукой.
По Попперу научная теория должна быть принципиально опровержимой, а в математике теоремы это не предмет споров. Теорема это теорема, и всё тут.
279 1931496
>>31458

>только математику.


Перестань, никто твою математику не использует, это она плетется и подбирает все что придумывают для решения прикладных задач
280 1931498
>>31458

>глобальной цифровизации всего общества,


Говно без задач, даже твои кампутепы до 2021 не совершили никакого общечеловеческого прогресса и не совершат.
281 1931516
>>31496
Кто придумывает?
282 1931520
>>31498
А он никому и нахой не нужон, прогресс ваш. Нужны только деньги.
283 1931557
>>31498
маньк, ты ебнутый? компухтеры не совершили прогересса? тебе 10?
284 1931566
>>31557

>компухтеры не совершили прогересса


Как там КПД ДВС двигателей выше 40% стал? Или может жечь жижу перестали?
285 1931593
>>31458
Философия, что в гуманитарных, что в технических науках - первородная наука, из которого произрастает методология научных исследований + букет социальных наук типа социологии, психологии и т.д. Без философии в естественных науках не будешь понимать некоторые вещи в методологии научных исследований, а без адекватной методологии не сможешь эффективно провести исследование, правильно оформить все, опубликовать результаты, и не быть обоссаным редакцией и научным сообществом. Т.е. можно обойтись и без именно философии, но некоторые вещи будут хуже восприниматься.
Вне науки, в прикладных сферах, применения ей вообще нету, ну кроме удовольствия от знания разве что.
286 1931598
>>31566
чеее
какой еще кпд двс? тебе нахуя двс в 2021?
287 1931606
>>31598
Дурак что ли?
288 1931612
>>31606
а может ты дурак? какой нахуй двс
Мы о компах, мань
О К О М П А Х
289 1931618
>>31612
А, ну тогда ладно.
290 1931658
>>31593
Ну хрен знает. С одной стороны вроде и правильно, а с другой...

>Вне науки, в прикладных сферах, применения ей вообще нету, ну кроме удовольствия от знания разве что.


Это, очевидно, верно.
291 1931680
>>31612

>Мы о компах, мань


>О К О М П А Х


Ну так и расскажи какой от них толк кроме развлечений?
292 1931704
>>20026 (OP)
Аноны, поясните за топологический анализ данных. Эта тема уже вошла в индустрию, или еще только на уровне научных наработок?
293 1931780
>>31458
Ты не ту философию учил. В вузах есть отдельный курс " Философия науки".
294 1931888
>>31566
Видел этого шиза в пораше. Возможно это бот
295 1932324
чем отличается DBSCAN от Fuzzy-C-Means?
чем DBSCAN похож на K - Means?
296 1932688
>>32324
Тем, что нахуй не нужны. Just stack more layers, bitch!
15960264102200.jpg67 Кб, 592x532
297 1932689
>>32688

>Тем, что нахуй не нужны. Just stack more layers, bitch!

298 1932754
Бля, придумайте мне пожалуйста задачу, которую можно решить с помощью графа знаний, желательно внутри Российского рынка, но можно и внутри зарубежного, похуй в принципе.
А то диплом надо писать, а в голову нихуя не идёт вообще
299 1932769
>>32754

>диплом надо писать


>придумайте мне пожалуйста задачу


блин, твой диплом это уровень детишек с лопатками в песочнице
300 1932784
>>32769
Так и хули, писать то всё равно его надо, иначе из шараги пидорнут
301 1932793
>>32784

>писать то всё равно его надо


Генератор времени лекция для сдутепедерастов, ну что бы время с разными группами не пересекалось, что бы преподы могли кофе попить и всем было удобно.
302 1932796
>>32793
а графы знаний тут нахуя?
303 1932798
>>32689
Здарова, Жопеншмульцер
304 1932799
>>32796
Что бы пересечений не было
305 1932800
>>32784

>иначе из шараги пидорнут


Ты это заслужил
сасай
306 1932807
Очередная победа машобчика над битерлессоновыми дедами
https://thisanimedoesnotexist.ai/
307 1932817
>>32800
не заслужил, я всё закрыл кроме ебучего диплома
>>32799
всё равно это как то не очень для диплома магистра
308 1932821
>>32807
Какие то пиздоглазые уебища
309 1932829
>>20026 (OP)
>>32798
>>32807
А кто такие жопеншмульцер, битерлессон и вапникошиз, которых тут вечно форсят? И почему между ними вечный срач?
310 1933009
>>32829
Жопеншмульцер - пародия на термины (конкретно - на фамилии учёных, в честь которых эти термины названы), которые современные машобообезьяны не знают.
Bitter lesson - статья какого-то жопеншмульцера о том, что нужно не пытаться добавить к модели знания о предметной области, а собрать побольше данных и настакать слоёв.
Вапник - древний дед, один из разработчиков теории Вапника-Червоненкиса, ещё из тех времён, когда в машобе доказывали теоремы, а не просто гоняли модели на датасетах и хвастались, что побили сота.
311 1933026
>>33009
Спасибо!
Про теорию Вапника-Червоненкиса я знаю.
А вапникошиз, получается, это тип, который форсит эту теорию и вообще научный подход в машобе?
А остальные ему в ответ: «Пишол нахой, ябучий учонодед»?
312 1933116
>>31593
Методологию исследования придумывают всё же никак не профессиональные философы, а всё те же учёные.
313 1933263
>>33116
Поддерживаю. Философы, фактически, просто констатируют методологию, которая складывается в научном сообществе.
314 1933280
>>33263

>Философы, фактически, просто констатируют методологию, которая складывается в научном сообществе


Ну так и математики то же самое делают. Математика сорт философии.
315 1933341
>>33280
Нет.
0GmYOooZb0BphrXA.mp44,3 Мб, mp4,
480x480, 0:52
316 1933388
317 1933406
А как с патентированием в мле? Можно затюненную модельку запатентовать и сидеть пердеть получая бабосики?
318 1933425
DmHOVfYXgAIaQeg.jpg67 Кб, 640x640
321 1933500
>>27169
Всё ещё ревестирую знатоков временных рядов.
322 1933515
>>33425
Нет.
323 1933528
324 1933608
>>33500
Попробуй не сами эти числа, а их логарифмы
325 1933646
>>33608
Спасибо.

>а их логарифмы


Они не стационарны. Равно как и их квадраты/квадратные корни.
Проблемы засунуть оригинальные признаки в модель нет.
Проблема в том, что полученные стационарные признаки дают на выходе какую-то шнягую.
Вот и вопрос, что делать.
326 1933651
>>33528
Лул. Нет же.
327 1933680
изображение2021-02-08013226.png30 Кб, 1004x207
328 1933779
Где искать работу джуну? Я от каждого угла слышу, что сейчас всем нужны дата сциентисты, ввел в поиске на хедхантере data и чёт ничего не вижу. Нужен либо опыт, либо предлагают нерилейтед говно. Вон, хуесосы из маил ру как обычно в своём стиле. При этом вакансий по джаве, плюсам, питонам десятки и сотни.
Где искать-то работу джуну?
последний курс, выбираю между беком и нейроночками
329 1933781
>>33779
Нужно по стажировкам метаться кабанчиком и молиться, чтобы после стажировки оставили.
800px-Fafguide-beginner-1.jpg78 Кб, 800x450
330 1933783
>>20026 (OP)
Посоны подскажите с чего начать? Я в этом полный ноль.
Я хочу написать игрового бота для FAF используя нейросети, что бы бот самообучался и все лучше играл в игру как например AlphaStar играет в StarCraft 2.
Библиотеку хочу использовать TensorFlow.
Меня интересует какие данные нужны для такой нейросети, допустим я подключился к API игры и достал оттуда координаты юнита, действия которые этот юнит может делать, например переместится в заданную точку, как мне все это передать в нейросеть и как заставить нейросеть сделать так что бы юнит двинулся к материи и построил там экстрактор материи?
Насколько это сложно сделать?
И что в теории мне нужно сделать?
331 1933785
>>33781
По каким словам кроме data scientist искать вакансии вообще?
И есть ли какой-то профит в платных курсах типа skillbox, которые обещают трудоустройство лучшим ученикам? У меня все-таки есть преимущество перед васянами, которые увидели рекламу и пошли за изи мани, в виде диплома по компуктерным наукам и пары нейронок по курсовым работам. Или это развод всё?
332 1933792
>>33785

>Или это развод всё?


Нет, варик 100 проц, неси денюшки.
333 1933793
>>33779

>Где искать работу джуну?


В Пятерочке

>Я от каждого угла слышу


)))
334 1933819
>>33779

>Я от каждого угла слышу, что сейчас всем нужны дата сциентисты


Я не слышал, ты там поди в пузыре гугля перемогаешь?
335 1933832
>>33785
По технологиям ищи. Скиллбокс херня. Есть мнение, что яндекс практикум получше будет.
336 1933917
>>31401

>Питон, хоть и оперирует либами на С, но однопоточный GIL никто не отменял.


отменял.
причем, второе как следствие первого.
337 1933918
>>20026 (OP)
Аноны, как думаете, GPT-4 уничтожит программистов, если его на всём гитхабе обучат? И кто такой этот ваш transformer? Почему именно он показывает такие охренительные результаты?
338 1933921
>>33646
Преобразуй боксом-коксом. Избавься от сезонности/тренда. Возьми разницу единичного сдвига. Почисти данные от выбросов.
Проблема в том, что даже если получится стационарный ряд (по DF-тесту), то с настройкой какой-нибудь аримы ты будешь ебаться примерно столько же, если вообще она заведётся.
Тестил какой-нибудь стандартный регрессор (линейный или бустинг) на простых выделенных фичах? Если он работает не лучше чем "предсказывать предыдущее значение", то может задача просто не решается?
339 1933923
>>33646

>Проблема в том, что полученные стационарные признаки дают на выходе какую-то шнягую.



мусор на входе - мусор на выходе.

Что, если тебя просто в самих данных нет никаких оригинального "сигнала", а лишь шум сигнала, искаженный через кучу кучей фичей?

В стандартной схеме ты должен был бы "добавить фичей". Желательно чтобы модель понимала временной лаг.

Но мусор есть мусор.
340 1933935
>>33783

>Посоны подскажите с чего начать?


Пройди курс по DL и RL. С последним можешь быстро ознакомиться тут https://github.com/FortsAndMills/RL-Theory-book/

>Меня интересует какие данные нужны для такой нейросети


В 99.9% тебе будет нужна какая-то награда от среды, причем это должно быть что-то более плотное чем исход матча. В зависимости от алгоритма тебе будут нужны либо траектории эпизодов, либо четвёрки state-action-reward-state'.

>как мне все это передать в нейросеть


Так, как это всё делается в твоём любимом DL-фреймворке.

>как заставить нейросеть сделать так что бы юнит двинулся к материи и построил там экстрактор материи


Как действия векторизируешь, так и заставляй. Например, 0 - стоять афк, 1 - двинуться к материи и построить экстрактор, 2 - сдаться.

>Насколько это сложно сделать?


Советую не лезть сюда. Лучше уж на ифах, потенциальных полях и fsm'ах.

>>33918
У кода на гитхабе нет контекста. Ты по импортам не поймешь, что от тебя требуют написать.
341 1933977
>>33923

>Избавься от сезонности/тренда.


Промежуток не указан. Т.е. можно взять период в тысячи измерений, и даже что-то осмысленное можно получить. Вопрос, почему именно эти тысячи, а не другие.

>Возьми разницу единичного сдвига.


С ней как раз херня получается, как на картинке 3.

>Почисти данные от выбросов.


Там выбросов не особо.

>Тестил какой-нибудь стандартный регрессор (линейный или бустинг) на простых выделенных фичах?


С просто фичами или фичами, преобразованными через квадраты/логарифмы, работает. Потому что они не стационарны. А вот со стационарными( это желательно по условию задачи) - есть вопросы.
>>33646

>мусор на входе - мусор на выходе.


Там не мусор, просто временные ряды через равные промежутки времени. Но промежутки эти - не указаны. Может быть это секунды, может минуты, может часы, может дни. Не поймёшь.

>В стандартной схеме ты должен был бы "добавить фичей". >Желательно чтобы модель понимала временной лаг.


Давай уточним, что есть стандартная схема?
У нас есть фичи, мы их преобразуем в новые и новые же используем, не касаясь старых?

могу скинуть изыскания и данные
342 1933983
>>33977

>Но промежутки эти - не указаны. Может быть это секунды, может минуты, может часы, может дни. Не поймёшь.


Подбери на кросс-валидации.
343 1933994
>>33977
>>33983
Или найди все пики на scipy.signal.periodogram.
Аноним 344 1934031
>>20026 (OP)
Аноны, нужен хелп
Есть задача на диплом - реализовать размытие/замену фона на вебкамере, используя СНС, т.е. по факту это семантическая сегментация изображения. Есть три вопроса:
1. Какая архитектура больше всего подходит для этого (UNet, Enet, SegNet)?
2. Можно ли использовать COCO датасет с различными сущностями (машины, люди, животные, дорожные знаки) или лучше использовать LiP датасет, в котором онли люди?
3. Стоит ли сразу делать размытие/замену фона на вебкамере или лучше чуток попрактиковаться на изображениях/видео?
Заранее спасибо
345 1934071
>>33977

>Давай уточним, что есть стандартная схема?


предположение, что существует еще более точная фича-предиктор, которая отражается на те, которые сейчас есть и неудовлетворительны.

>Там не мусор, просто временные ряды через равные промежутки времени.


вот сразу бы так и начал. А то приплел каких-то графиков ебанутых.
это должно дедовскими SARIMA-и прилично решаться.

>могу скинуть изыскания и данные


Мамке своей скинь.
346 1934089
>>33983

>Подбери на кросс-валидации.


Ограничения количества подвыборок сверху есть?
>>33994

> scipy.signal.periodogram.


Два пика/периода поголы не сделают.
347 1934105
>>33832

>яндекс практикум получше будет


https://habr.com/ru/post/518372/
348 1934170
>>34089

>Два пика/периода поголы не сделают.


>временные ряды через равные промежутки времени. Но промежутки эти - не указаны.

349 1934171
>>34105

>habr.com


Говноед, плез
350 1934227
>>34105
Ахаха лол. Хз, я годные отзывы слышал. Хотя личных примеров не знаю.
x1.png24 Кб, 724x309
351 1934276
>>34170
У меня сомнения, что у подобной оригинальной фичи - два периода.
352 1934390
>>33921
Анон, ты ещё тут? Или ты >>34071 ?

>это должно дедовскими SARIMA-и прилично решаться.


Пробовал, подобрать коээфициенты авто-аримой, потом засунуть в SARIMAХ - результат не идеальный.

>Мамке своей скинь.


Не она же решает задачу.
Алсо, наглядное представление быстрее поможет, чем перекидывание фразами и вопросами пол-треда.
353 1934456
>>34390
да почему ты не смиришься с тем, что данные лежат за пределами выборки? ты сам как человек можешь решить эту задачу?
Если не можешь, то и от машины не жди.

вот тут недавно нашел хорошую ссылочку куда следует всех форекских шизов в машобе:
https://ru.qaz.wiki/wiki/Efficient-market_hypothesis

>Гипотеза эффективного рынка ( EMH ) - это гипотеза финансовой экономики, которая утверждает, что цены на активы отражают всю доступную информацию. Прямое следствие состоит в том, что невозможно постоянно «обыгрывать рынок» с поправкой на риск, поскольку рыночные цены должны реагировать только на новую информацию. Гипотеза эффективного рынка - https://ru.qaz.wiki/wiki/Efficient-market_hypothesis

354 1934484
>>34456

>ты сам как человек можешь решить эту задачу?


Со стационарными признаками затрудняюсь. С оригинальными это точно решаемо.
Вот, например, признаки, полученные через diff() и через shift(10000), т.е. со смещением в 1 и 10тыс.
Вопрос, можно ли эти 10тыс. как-то обосновать? Или это всё экспериментально берётся?
Как по мне - какая-то хуйня со слишком большой ошибкой.

>форекских шизов в машобе


Тебе ж говорили, это просто обезличенные данные, а не рубли, не курс валюты, не цены на золото или нефть.
355 1934494
>>34484

> Тебе ж говорили, это просто обезличенные данные, а не рубли, не курс валюты, не цены на золото или нефть.



Это противоречит философии прогнозирования. Так что иди нахуй, шиз форексовский.
356 1934498
>>34494
Нет, ты.
357 1934512
>>34484
Можно построить физическую модель в виде системы дифференциальных уравнений и решить ее. Подставив потом начальные данные в нее можно будет прогнозировать их изменение.
358 1934538
>>34512
Машоб нормального человека.
359 1934574
>>34512

>системы дифференциальных уравнений


Что это
360 1934639
>>34031
Юзай только людей раз и сначала научись кадр правильно сегментировать, а потом уже видео покадрово разбирай. Так проще
361 1934650
Есть годные материалы или книжки по pytorch?
362 1934663
>>34574
Найс рофл!
unnamed.jpg109 Кб, 500x407
363 1934677
Аноним 364 1934683
>>34639
А архитектуру любую выбирать?
365 1934686
>>34683
Что мешает разные попробовать? Это же не так много времени занимает.
Аноним 366 1934709
>>34686
Ок. Так и сделаю. Спасибо
367 1934796
>>34512
Можно битерлессон почитать и не лезть своим матанопетушинным рылом в нейронный ряд
AI.jpg132 Кб, 960x1280
368 1934798
Добрый вечер котятки, мы пишем письмо Сенатору США Теду Крузу по поводу набутыливания Российского AI сектора и отрезания его от международной фин. системы

Котятки кто отвечает за эту Шайтан машину? Напишите в какой компании вы работаете и мы поможем отмазать её и вы может даже на мороз не попадете или под клеймо разведки США что с вами никто в европе здороваться не будет

Только не врите, хотя наверное полиси в новых санкции будет по всему сектору, но у вас есть шанс, особенно после jetbrains

Если вы из этой шараги которая помогает ментам - бегите прямо щас иначе блэклист карьеры пожизненно
370 1934803
>>34798
То есть смысл санкций в том чтоб толковые специалисты не бежали с рашки помогая делать западную экономику ещё могущественнее а оставались и совершенствовали российские пыточные вундервафли? Я знаю что у либералов российских конечно со стратегическим мышлением не очень, но не перестаю каждый раз удивляться.
Братишка.jpg10 Кб, 340x266
371 1934807
>>34798

>Добрый вечер котятки, мы пишем письмо Сенатору США Теду Крузу


>мы


Кто мы-то блядь?
372 1934810
>>34803

>оставались и совершенствовали российские пыточные вундервафли?



Отрежут от западных API, облаков, лицензий и доллара и пойдут нахуй а не развивать.

>>34807

Нас несколько включая юриста международника.
373 1934824
>>34810

> Нас несколько включая юриста международника.


Скорей бы уже статью о госизмене дополнили для вас.
374 1934829
>>34824

Ты думаешь режим стагнирующей 1.7% мирового ВВП тоталитарной дыры проживет ещё 10 лет?

ватный AIшник лол,

тебе пизда гнида
375 1934835
>>34810

>западных API, облаков, лицензий


Делать бабло или удовлетворять претензии полутора окатышей? Хммм, что же выбрать..
376 1934843
>>34835

Ну да давай поделай под пожизненным отрезанием от бакса.

Будет как с Роскосмосом который обложили санкциями ему пиздец
377 1934852
>>34810

>от западных API, облаков, лицензий


Там где ai рядом с государством там это и так запрещено
378 1934858
>>34843

>Будет как с Роскосмосом который обложили санкциями


А как же свободный срыночек и копетоглизм?
379 1934871
>>34852

>Там где ai рядом с государством там это и так запрещено



Так сектарально же, будет написано полиси об malicious activity и пошли нахуй все, Иранцев вообще от ГитХаба отрубили к хуям.

Буит весело))))
380 1934872
>>34858

>А как же свободный срыночек и копетоглизм?



Россия сегодня антилиберальное говно вроде Ирана, пока гитхаб, API и прочее, будет как в Иране или Крыму.
381 1934874
>>34871

>пошли нахуй все


Ну и пойдут нахуй все кроме государственной слежки и впк, то есть браво мистер биден.
382 1934877
>>34874

>Ну и пойдут нахуй все кроме государственной слежки и впк



Ну то есть кормовая база для слежки и впк, меньше денех и данных двойного назначения гражданского сектора у режима - быстрее конец

Война она всегда тотальная.
383 1934889
>>34871
Всё нормально у иранцев с гитхабом, че пиздишь тут.
384 1934890
>>34889

доооо))) так нормально, что на гражданах США живут как на прокладках, такой скулеж был в свиттере прошлой зимой
385 1934908
>>34843

> отрезанием от бакса


А, так вы из дурки, так бы сразу и говорили
386 1934946
>>34890
Так сейчас всё нормально, уже как больше месяца. Так что sosi
387 1934988
>>34946
Нет, иранское айти в агонии, режим вот вот падёт.
388 1935002
>>34872
Пишу из Крыма, купил впн муллвад, захожу на гитхаб и ему похуй вообще. Привет.
>>34810
То есть ты пришел в тред машобщиков и говоришь - ребят, а давайте вас безработными сделаем, вот здорово будет! Ты тупой?
google-colaboratory-colab-guia-completa-1024x683.jpg28 Кб, 1024x683
389 1935032
>>35002

> Пишу из Крыма, купил впн муллвад, захожу на гитхаб и ему похуй вообще. Привет.


Куколаб можно полноценно использовать через ВПН?
390 1935065
>>20026 (OP)

>Почему python?

391 1935071
>>35002

>Пишу из Крыма, купил впн муллвад, захожу на гитхаб и ему похуй вообще. Привет.



Ну попробуй поработать на fortune 500 с маняпаспортом и из под впн)))

Детский Сад.
392 1935081
>>35065
Простой, уже есть коммьюнити и инфраструктура.
393 1935088
>>35065
коммунити.
мы же не придумываем новое, а копируем и синтезируем идеи.
394 1935091
>>35088
Ну и нахуй вы тогда нужны если бот для дерьмоты 2 - верх ваших достижений?
395 1935095
>>35091
Твое обывательское мнение в целом нас не ебет.
Мы зарабатываем не на Доте, а на предсказаниях и автоматизации более скучных вещей.
396 1935099
>>35095
И много заработали своим ctrl-c ctrl-v?
397 1935110
Которому плюсы не нужны посвящается.
https://contest.com/docs/dc2021-r1
398 1935114
>>35110
Ты не понимаешь, у них калмьюнити и синтезация идей!1!
399 1935126
>>35091
Что не так с ботом для дерьмодоты 2? Если смешно исковеркать название игры, то это перестаёт быть каким-то достижением?
400 1935136
>>35126
Ну как тебе сказать. В мире 21 века где может случиться вирус тупо парализующий жизнь на год и в мире где порядка 20% населения не имеет доступа к питьевой воде и еде сидеть и потеть годами над проектом чтобы несколько кк прыщей посидело с открытым ртом или пилить автопилот для машины и выставлять это чем-то ТАКИМ ГРАНДИОЗНЫМ, ТАКИМ ПРОРЫВНЫМ! Как минимум заставляет задуматься над адекватностью таких людей и людей которые хавают подобное.
401 1935139
>>35032
Даже без ВПН позволяет. Скажу больше - Гитлаб работает без ВПН. Охуеть, да? Это потому что дебилы-леваки типа персонажа выше >>34798 не понимают что такое санкции и зачем их вообще применяют.

>>35071

>fortune 500


Работают здесь на твои форчун 500 некоторые, у всех фирмы зареганы в Москве просто. Привет.
402 1935146
>>35136

>они не делают то, что я считаю важным, поэтому они неадекватные


Окей. Тогда про уайлса или перельмана тебе лучше не знать.

>ТАКИМ ГРАНДИОЗНЫМ, ТАКИМ ПРОРЫВНЫМ!


А оно не прорывное?
403 1935153
>>35146

>А оно не прорывное?


a) чем?
б) практическое применение?
404 1935177
>>35146

>Тогда про уайлса или перельмана тебе лучше не знать.


Это точно.
405 1935384
>>35110
У тебя баттхерт, кресты реально не нужны, когда у тебя дата саентисты, которые должны шарить в соответствующем матане и не более - нахуярили мвп на скриптоговне и ладно.

>ссылка


Нужно с нуля машобный алгоритм настрочить? Или какой-нибудь торч все-таки можно использовать? В чем смысл?
image.png207 Кб, 856x280
406 1935615
Анончик, мне поставили задачку (я маркетолух, сильно хуями не кидайтесь) прикинуть, стоит ли магазину открываться в той или иной мухосрани. Задача на линейную регрессию. Можно ли тренить на этих фичах?

x1 - население
x2-x5 - региональная популярность из яндекс-вордстата, по ключевым фразам
х6 - количество магазов в нашей нише
у, соответственно, средняя выручка за три месяца

Имеет ли смысл на этом тренить, или нарезать еще фичей?
407 1935618
Аноны, такая тема: есть данные температуры, давления, влажности с нескольких приборов за каждый день. Что можно вообще с этими данными сделать?

Температуру предсказывать? Ага, конечно.
На ум вообще ничего не лезет. Может ещё какие фичи добавить?
408 1935882
>>35618
В чем твоя цель? Научиться что-то полезное делать на питоне?
409 1935895
>>35882

Типо того. В университете есть база данных с этими показаниями, она в открытом доступе, а я как раз МЛ изучаю, хотя больше нейронки на PyTorch пишу.

Препод есть, который горит всей этой идеей (сборкой этих приборчиков, рисованием графиков, и так далее. Хочет такую большую систему создать), и я хочу, так сказать, подлизаться + получить практический опыт.
410 1935940
>>35618
Кластеризацию какую-нибудь сделать если получится
411 1935950
>>35940

Я тоже об этом подумывал, но что-то не понял: а что вообще сделать? Что кластеризовать?

Есть множество показаний с разных приборов и... что?
412 1935967
>>35618
Линейную регрессию на температуру наложи. Потепление климата будет показывать.
413 1935973
>>35895
так может ты у него и спросишь что ему нужно?
Совершенно дебильная идея делать что-то без цели. Она не несет азарта.

Плохо, конечно, когда азартная идея слишком сложна и не решается. Но ведь препод точно знает лучше чем ему загрузить студентов на долгие годы вперед.

Собери ЕЩЕ каких-нибудь данных типа обезличенной успеваемости из Мудла (у вас есть Мудл?) и проведи параллели.
В чистом виде от температуры мало полезного.
414 1935976
>>35950
Ну вот в этом пространстве твоих измерений и кластеризуй, если так получится что там несколько явных скоплений а остальное шум можно попробовать проанализировать что это за состояния что такое разделение вызывают, чем отличаются итп. Если размерность большая, пробуй уменьшать всеми популярными и не очень методами. Исследуй, ёпта.
415 1936004
Привет посоны.
Есть ли какой-нибудь алгоритм на :ython: для кластеризации облаков точек, который плюс-минус будет приближен к риалтайму? Размер облака примерно 70к точек (понятно, что можно уменьшить размер). Данные не с лидара, а с ргбд камеры.
Пробовал dbscan из sklearn.cluster, но хотелось бы еще быстрее
416 1936284
>>36004
Плюсы учи.
417 1936286
>>36284
Крестошизик, спок.
>>36004
https://habr.com/ru/post/101338/
418 1936367
>>36286
если у него dbscan не вывозит, то что еще остается?
вроде это и так современный и быстрый считается.
1281842075890.jpg6 Кб, 200x160
419 1936409
Новый тензорфлоу 2 - это керас?
420 1936636
>>36409
Керас это надстройка над слесарьпловом.
421 1936643
>>36286
спасибо, чел
422 1936676
>>36286

>habr.com


>С результатами, если честно, туго :). Дальше экспериментов дело не пошло, настало время защиты, и нормальных результатов нет.


Я понимаю, что швабропидоры говноеды по определению, но давать ссылку уважаемым двачерам не только на швабропапашу, но и на высер прыщавого студераста которы там посмотрел пару видяво на ютубчике это уж слишком
423 1936815
Почему петухон? Не, ну серьёзно. В системах быстрого реагирования типа скальпинга он же проебёт 319%. Как вкатываться если я сиплюсплюс-господин?
424 1936879
>>36815
Спешите видеть, сиплюсплюс господин не может вкатиться в петухон!
425 1936886
>>36815

> В системах быстрого реагирования типа скальпинга


Ты название треда читал? Какой скальпинг, але. Алсо, на пистоне слишком много написано, да чего там, 100% актуального машоба это пистон. Никто все это переписывать не будет.
426 1936900
>>36886

>актуального машоба


Это тебе так в школе сказали?
427 1936901
>>36815
У тебя уже не получится, потому что ты разраб и не можешь в понимание коммерции
428 1936909
>>36879
Могу, но на кой даунгрейдиться?
>>36886

>100% актуального машоба это пистон.


Мало ебёт. Я почти всё собираюсь с 0 писать.
>>36901
Держи в курсе.
429 1936912
>>36815

> Почему петухон?


Сто раз объясняли же уже: господам ресёрчерам и аналитикам слишком много и быстро нужно проверять свои идеи, дрочиться с быстродействием, "чистым кодом" и прочими идеями фикс программисточеляди процесс только замедлит.

>В системах быстрого реагирования типа скальпинга


У команд которые занимаются игрой на фондовых рынках отдельные люди занимаются созданием торговых алгоритмов и сигналов и делают они это на чём хотят, а другие оптимизируют эти придуманные алгоритмы под быстродействие и сеть (вот там и сишка, и даже глубже в полный рост).
430 1936917
>>36909

>Держи в курсе.


Если ты хоть раз называл работодателя "человеком от бизнеса", то можешь и не пытаться продолжать
431 1936918
>>36909

>Мало ебёт. Я почти всё собираюсь с 0 писать.


Ну вперёд, пополняй коллекцию шизов.
432 1936922
>>36918
Ctrl-C, Ctrl-V обезьянка, успокойся, а?
433 1936935
>>36815

>сиплюсплюс


>господин



господин можеть позволить себе закрыть ипотеку за 2 года?
434 1936936
>>36900

>в школе сказали?


оно и видно
фанбоем крестов в 2k21 может быть разве что восторженный школьник, верующий в НАСТАЯЩЕЕ ПЫГРАМИРАВАНИЕ, не зная даже рынка труда
435 1936945
>>36935
Могу позволить себе стабильно её оплачивать не имея постоянной работы прогером. Ещё вопросы?
436 1936946
>>36815
"В системах быстрого реагирования типа скальпинга" важнее всего не твой ко-ко-код, а скорость канала связи
437 1936947
>>36945

>сижу на шее у мамки


Типичный шизик-крестоёб
438 1936948
>>36947
На моче гадал или что вы тут любите?
439 1936952
>>36948

>не имея постоянной работы прогером


при этом шизик-крестоёб
440 1936953
441 1936954
>>36909

>Я почти всё собираюсь с 0 писать.


Это нормально если ты учишься. Я когда был студентом тоже любил писать велосипеды, в том числе нейронки без использования библиотек. Но со временем понимаешь, что это никому нахуй не нужно, и лучше решать задачи бизнеса и получать за это деньги.
>>36935

>господин можеть позволить себе закрыть ипотеку за 2 года?


Причем здесь питон и вообще машоб? Чтобы закрыть ипотеку за два года надо быть директором в крупной компании.
442 1936967
>>36909

>Могу, но на кой даунгрейдиться?


А куда ты будешь даунгрейдиться? Ты же не в петухон-разработчики собрался, а в дота саентисты.
А дота саентисты промышленный код не пишут, они быстро собирают модели и проверяют гипотезы. Простой скриптовый петухон для этого как раз подходит.

>Мало ебёт. Я почти всё собираюсь с 0 писать.


На работе на дядю за монеты ты этого делать не будешь.
>>36815

>В системах быстрого реагирования типа скальпинга


Не поверишь, дота саентисты и там петухон юзают.
443 1936987
Есть на словах Кластер. Управляющая нода и вычислительные. На деле работаем на одной. Как можно распараллелить какую-то абстрактную прогу на все ноды?
444 1936997
Посоветуйте как войти в ML на практике. Открываю курсы там матан и рисунки. Было бы неплохо сначала посмотреть как куда данные двигаются, гдянуть питон, а потом уже матан смотреть. Есть такое?
445 1937000
>>36997
PS я уже программировал свою собственную многослойную нейронку обратного распространения без использования Tensorflow и пр
446 1937002
Наткнулся на темпотрон и не понял, на каких задачах его оптимально применять?
447 1937050
>>36987
МЛ алгоритм или что?
448 1937081
>>36987
как эти абстракции заебали. абстракции теряют важную информацию. оптимизация заключается в использовании важных не вполне видимых возможностей. Ты же не на матеше.

вывод : тебе никак не ускорить.
Гэ.webm347 Кб, webm,
1920x1080, 0:08
449 1937095
Какая хохлушечка...
450 1937107
>>37095
Ага, а в комментах толпы дрочеров практически ей в любви признаются.
451 1937120
>>36997
Ну глянь питон, потом уже матан смотри. И не матан, а математика.
Для обычной работы в датасайенсе достаточно базовой технической математики. То есть формулы и несложные базовые концепции (особенно из статистики, чтобы тестировать гипотезы).
Питон тоже базовый, скриптописание, не промышленный код.
452 1937263
>>37095
Ай, пагадай на ручке
453 1937272
>>36997
Какой тебе мл, ты шапку осилить не можешь. d2l.ai, там все нужное.
454 1937287
>>37095
Кто сказал, что она хохлушечка?
455 1937311
>>37263
Ждём хиромантию на основе ML.
456 1937315
>>37095
Дрочил бы джва часа
457 1937316
>>37311
Хиромантия хйня.
458 1937346
>>37095
Стейсуха в дотасаенс!
459 1937377
>>37272
Слушай, ну вот серьезно? Освоил программирование, написал свою нейронку без всего и не освою ML? Ну вот ты хоть себе не ври, а тем более не пытайся опускать других.

Это не отрицает того факта, что я благодарен тебе за то что тыкнул меня носом в ссылку. Мне по началу показалось, что в посте ссылки только на занудные абстракции с минимумом практики. Оказался неправ
460 1937527
>>36815
Сначала на питоне пишут. Если модель сидит на потоке данных, то переписывают на плюсы. Также как сначала делают восковую модель будущей статуэтки, а потом закапывают ее в песок и заливают бронзой. Можно сразу из бронзы делать, но эффективнее двухступенчатый метод.
image1 Мб, 890x892
461 1937754
Как думаете набор кода голосом будет актуален в будующем?
Физический ввод с клавы - это ведь весьма медленный процесс, если сравнивать его со скоростью мысли.

Есть одна идейка как научить ИИ воспринимать речь и переводить ее в код, не каждую букву или слово диктовать, а именно паттерны.

Функция с замыканием, возвращает переменную со значением..

Типо так нагаваривать.
463 1937809
>>37754

>Физический ввод с клавы - это ведь весьма медленный процесс, если сравнивать его со скоростью мысли.



Вряд ли машинистки что-то перепечатывающие согласятся.

>Функция с замыканием, возвращает переменную со значением..


Так чтобы такое сказать это надо блоксхему какую-то делать или ещё что-то да и если удалить что-то надо, то как? Целыми блоками? Или попробовать?
image.png93 Кб, 400x344
464 1937914
СЫНОК, ИСПОЛЬЗУЙ РЕГУЛЯРИЗАЦИЮ ТИХОНОВА
@
ФУУ НЕ БУДУ Я ПРИМЕНЯТЬ КАКОЕ-ТО СТАРОЕ СОВКОВОЕ ГОВНО
@
ВООБЩЕ-ТО ЭТО RIDGE REGRESSION
@
ОМ НОМ НОМ ММ VERY DATA MUCH SCIENCE
465 1937925
>>37914
Да, типичный дотасаенс.
466 1938060
Шизик пытается приравнять регуляризацию тихонова и теорему жопеншмульцера. Проблема только в том, что даже в sklearn'е фамилия тихонова всплывает в первых строчках описания, когда его любимый жопеншмульцер нахуй никому не нужен.
467 1938145
>>20026 (OP)
В чём суть трансформеров?
468 1938162
>>38060
Так над этим и хихикаем же
469 1938194
>>38060
А почему Тихонов не Жопеншмульцер, а Жопеншмульцер - Жопеншмульцер?
470 1938209
>>38194
Сказано же, потому что в туториале соевым про тихонова написали, а про жопеншмульцера не написали.
471 1938219
>>38194
По закону тождества.
Жопеншмульцер никому не нужен, кроме местного шизика. Поэтому он и натягивает его на всё подряд. Про тихонова же знает любая собака, умеющая нажимать shift+tab.
472 1938225
>>38145

> В чём суть трансформеров?


Аттеншен олл ю нид, зумер
473 1938240
>>37914
>>38060
>>38194
>>38209
>>38219
Тихонов по молодости то был годный чистый математик, топологией занимался, вводил важные понятия и задачи сложные решал.
А потом начал прикладухой всякой маяться, да так намаялся, что теперь он даже не Жопеншмульцер у машобов.
474 1938283
>>38240

>Тихонов


Он в обще молодец, особенно его роль Штирлица мне сильно понравилась.
475 1938464
Сап аноны, на моей текущей галере мне предложили заниматься дата саенсом в основном nlp, хотя сам я работаю в другой сфере бд. Опытных дата саентистов в компании нет, но они сказали типо не ссы, курсы если что оплатим. Сам проект в зачаточном состоянии и сейчас над ним работает только один человек.
Внимание, вопрос: насколько такой опыт будет релевентен в будущем? Если я год отработаю на этом проекте, скажем, занимаясь по сути самообучением, смогу ли потом устроится джуном-саентистом в другую фирму? Или без опытного ментора это вообще гиблое дело?
питон знаю, имею базовые представления о мл
476 1938489
>>38464

>nlp


Самое слодное в дс. Для полноценного понимания речи нужен контекст на который нейросети пока не способны. НЛП работает только в очень конкретных случаях типа техподдержки.
477 1938512
>>38464
Есть вероятность, что продолжительное время ты будешь заниматься не датасаенсом, а инжинирингом, настройкой пайплайнов и прочее прочее.
>>38489
Как раз техподдержка суперхуево работает, если только там не уровень "если ,,, нажмите 1".
478 1938539
>>38464

>смогу ли потом устроится джуном-саентистом в другую фирму


Сможешь, по сути твой вариант этот тот о котором все айтишники вкатуны в дс мечтают.
479 1938563
>>38489
там конкретные задачи на анализ того, к какому виду относится документ
>>38512
Но ведь это тоже же релевантно для того, чтоб потом устроится джуном? Пусть не дата саентистом, а мл инженером, скажем.
480 1938566
>>38539
Я не обозначил, что сам человек тоже не сильно шарит и только учится хотя сам по себе он опытный программист. Разве все вкатуны не мечтают о менторе?
Просто я боюсь, что в итоге будем делать хуёвый проект самыми базовыми методами, ни про тонкости не узнаю, не про фишки какие то, а в других компаниях тебя будут считать джуном только если ты год работал под чьим-то надзором
481 1938624
>>38566
Ну зато в резюме у тебя nlp.
И кто сказал что классика на bag of words плоха, если она справляется?
482 1938646
>>38624
не знаю. На собесах же будут спрашивать про более сложные вещи, наверное в нашем проекте сейчас tf-idf, лол
483 1938706
>>38646
Эх джуны-джунчики. Берёшь и без задней мысли говоришь что вовсю наворачивали gpt с бертами, информацию общего плана и детали учишь гуглением, на более тонкие моменты говоришь что ты всё таки джун и этим занимались более прошаренные чуваки. Проверять никто не будет.
image.png115 Кб, 590x296
484 1938798
485 1939151
>>20026 (OP)

> Trevor Hastie et al. "The Elements of Statistical Learning"


> Christopher M. Bishop "Pattern Recognition and Machine Learning"


Наверняка есть те кто читал или пытался. Осилю ли я что-то из этого если до этого никогда не читал книг на англе, только тексты небольшого размера регулярно подглядывая перевод незнакомых слов? С одной стороны понимаю, что слаб достаточно в англе, с другой, техническая литература читается попроще художественный. Если считаете что не осилю прямо сейчас, то дайте совет как прокачаться в англе чтобы в среднесрочной перспективе смочь прочитать талмуд по млу в оригинале?
486 1939160
Посоны, я все нахуй понял! Оно работает!

Теперь такая хуйня, скатывается в локальный минимум, как лечить?
487 1939292
>>39160
Обычно локальные минимумы достаточно хороши, чтобы можно было не искать глобальный.
Поменяй архитектуру, добавь данных, настрой параметры lr.
488 1939309
>>39160
Это не лечится.
489 1939339
Гугл не хранит бигдату. Где-то треть моих рекомендаций ютуба составляет то, что я уже смотрел.
490 1939352
>>39292

>Поменяй архитектуру


я сначала задачу решил на логических операциях - xor, and, or и т.д.
потом перенес на нейроны и ручками расставил веса - заработало.
потом расставил веса рандомно, обучил и тоже заработало.
архитектура подобрана идеально, меньше не взлетит, больше - избыточно.

и вот эта сука иногда не учится совсем!

>>39309
не существует метода обучить xor? чо за хуйня?
491 1939364
>>39352

>архитектура подобрана идеально


Покажи, кстати.

>больше - избыточно


Похуй. У тебя почти во всех задачах непонятно, где это "избыточно" начинается.
Безымянный.png39 Кб, 745x877
492 1939428
>>39364
ну вот так например. пачка xor.

вчера пьяный был, надо выкидывать 1 скрытый xD
493 1939479
>>39428
Нахуя тебе 9 выходов?
494 1939486
0-8 = 9 вариантов же
16128666209740.jpg36 Кб, 511x407
495 1939558
Вся суть этого треда >>39428 пьяный зумер вкатывальщик не может в xor.
496 1939561
>>39339
Потому что видимо это и есть норм решение
497 1939630
>>39352
Как вообще связаны сообщения >>39160 и >>39352?

>не существует метода обучить xor? чо за хуйня?


Чтобы реализовать XOR, достаточно взять три нейрона, два в первом слое и один во втором (полносвязно). Либо же один нейрон, но с третьим входом в виде произведения операндов.
И чего там в одном XOR обучать вообще, блеать? Впиши веса руками сразу, алкаш. Кумыса выпей.
498 1939641
Подскажите, есть разница в использовании TensorFlow.NET и обычного TensorFlow, не хочу тратить время на изучения python.
Что скажете про ML.NET? Годнота или нет?
499 1939643
>>39641
Ничего про дотнет не знаю, но если ты хочешь вкатываться в мл всерьёз и надолго, то питон один хер придётся учить.
500 1939645
>>39630

>Чтобы реализовать XOR, достаточно взять три нейрона, два в первом слое и один во втором (полносвязно).


а у меня сколько?

>И чего там в одном XOR обучать вообще, блеать?


ебанутый?
501 1939650
>>39645
Ты проспался уже? Кумыса полную чашу испил?
А теперь перечитай тред и ответь на свои вопросы.
502 1939654
>>39643
Но ведь 20% усилий дают 80% результата
бгг
503 1939655
>>39339

>Гугл не хранит бигдату.


Братишка, ебать ты долбоеб
IMG20210213161059.jpg127 Кб, 872x402
504 1939657
505 1939660
>>39654
И что?
506 1939667
>>39657
Такого я еще не видел. Христианская наука о данных!
Безымянный.png57 Кб, 989x476
507 1939669
>>39630

>Чтобы реализовать XOR, достаточно взять три нейрона, два в первом слое и один во втором (полносвязно).


ебать ты наверное умный.
вот это иногда не хочет учится. у меня тоже.

С этим можно боротся, кроме как перезапуском?
508 1939685
>>39660
Можно изучить ml.net и найти себе место в низкоконкурентной области...пока ты все проебываешь с SOTA в биржевых предсказаниях, например.
16128067450050.jpg66 Кб, 592x532
509 1939692
>>39669

> ебать ты наверное умный.


А ты так вообще титан мысли, доктор Манхэттен нахуй. Посмотри на картинку, что ты принес, ты там 9 выходов видишь, зумерша с тиктока?
510 1939702
>>39685
Наверное, можно. Я просто к тому это сказал, что питон основной язык индустрии, и все новые разработки на гитхаб выкладывают на питоне.
511 1939703
Что с вами не так, зумера? Датасет, описывающий задачу xor, имеет два входа и один выход. Где там 9 выходов, объясните. Как там вообще можно додуматься до 9 выходов, что нужно купить вместо мозгов, чтобы голова работала настолько плохо?
16132091947940.png48 Кб, 745x877
512 1939710
>>39703

>Как там вообще можно додуматься до 9 выходов


это 9 xor, мне так нужно.
чому ты такой ебанутый?
513 1939715
>>39669
Что за прога? Почему сеть не учится?

Другой анон
514 1939722
>>39715

>Что за прога?


http://synset.com/ai/ru/nn/NeuroNet2D.html

>Почему сеть не учится?


иногда попадает в глобальные минимумы
515 1939733
>>39685

>и найти


или не найти
низкоконкурентная - значит нахуй никому не нужная
и вообще, назовёшь такую область или это лишь твои фантазии?
516 1939742
>>39643
Нет, я хочу для своих целей, всерьёз и надолго не хочу вкатываться.
517 1939811
>>39742

>для своих целей


каких целей? набросать прототип быстрее и проще на петухоне, зачем ебаться ещё и с майковским говноделием
518 1939830
>>39733
Заводик в Хуево-Кукуево во встающем колен дотационном российском сельском хозяйстве. Деньги навозом не пахнут.
519 1939861
>>39830
зачем на заводике мышиное облучение
но это ладно
а щоб було
главный вопрос - почему обязательно дотнет?
520 1939869
>>39861
Потому что программист мог не знать ничего другого.
Кстати, в sql вроде подвезли всю классику дедовскую давно.
521 1939957
>>39669
Открою тебе страшную тайну: любая задача машинного обучения сводится к задаче оптимизации. Так что и проблемы теории оптимизации перетекают в проблемы машоба.

Градиентный спуск в принципе не может гарантировать достижение искомого глобального минимума, потому что использует только локальную информацию о поверхности, представляющей оптимизируемый функционал. Соответственно, алгоритм обратного распространения тоже.

Далее начинаются танцы с бубном. Эвристики.
Танцы с бубном для нейронок заключаются в выборе конкретного градиентного метода и в выборе структуры самой сети, а также в выборе начальных значений весов. По каждому пункту существует куча рекомендаций, и при этом нет никакой теории. Потому что танцы с бубном.

Перезапуск, кстати, и относится к выбору начальных значений весов.
Короче, танцуй с бубном.

Быть может, тебе тоже кумыса налить?
pic.png195 Кб, 687x822
522 1940020
Подбирается наиболее подходящая надпись к загруженной картинке (среди заголовков из onion news но можно и свои данные добавить) с помощью поиска в том же латентном пространстве что используется в DALL-E
https://colab.research.google.com/drive/15SWvQeO5tJziKdyh8ISJNMvGAZyr_zun?usp=sharing
523 1940055
>>39641

>TensorFlow.NET


Опенсорс, держащийся на энтузиастах.
https://www.tensorflow.org/api_docs
2A23A22200000578-0-Googlehasissuedanapologyaftercomputerpro[...].jpg50 Кб, 634x536
524 1940094
>>40020

> трилобит, тентакли, лук


Чет хуйня уровня пикрелейтед...
525 1940174
>>39151
Книг этих я не читал. Но как человек, имеющий некоторое отношение к математике, скажу вот что.
Техническая (или математическая) литература действительно читается проще художественной, причём гораздо проще, особенно, если у тебя уже есть некоторое представление о предмете.
Так что на самом деле тут вопрос не столько в английском, сколько в математике. Если ты в целом хоть что-то соображаешь в той математике, о которой собираешься читать, будет довольно не сложно. Конечно, даже в сухом математическом тексте бывают неочевидные синтаксические конструкции, но их довольно мало.
Я, например, научился читать (и понимать) математические книги гораздо быстрее, чем хоть как-то говорить.
А книги твои, как тут говорят, "дедовские", так что там явно должна быть математика, в отличие от современных книг по машобу для программистов. С другой стороны, программистские книги читать еще проще.
Короче, думай не о том, осилишь ли ты английский, а скорее о том, осилишь ли ты математику. Такие дела.
Могу еще посоветовать очень годную книгу на эту тему.
526 1940177
>>40174

>имеющий некоторое отношение к математике


латентный гей?
527 1940182
>>40177

>латентный гей?


Ты?
528 1940223
>>40174

>Могу еще посоветовать очень годную книгу на эту тему.


Давай, интересно
529 1940228
>>40174

>Могу еще посоветовать очень годную книгу на эту тему.


Годнее бишопа ничего не будет.
15657393717190.png63 Кб, 1199x1194
530 1940236
531 1940332
братаны
короче я перекатываюсь к вам из геймдева (хочу в мл инжениринг - который больше про проганье, чем матешу и юпитер)
скажите, при условии, что для вкатывания с математикой все ок и что знаю питон, на какие вещи, с точки зрения api и прочих тулзов нужно обратить внимание для вката?
Я просто в гугле совершенно разную инфу нахожу и не могу более-менее структурированный список составить, чтобы покрыть какой-то процент вакансий.
pyspark? hadoop?
подскажите плиз
532 1940336
>>40332
Если ты спрашиваешь конкретно про библиотеки, то я бы рекомендовал учить вот это (в перечисленном порядке): numpy, pandas, opencv, matplotlib, scipy, tensorflow, keras. Ну и не забывай про стандартную библиотеку питона, в ней тоже много чего интересного.
533 1940383
>>40336
Судя по всему, он спрашивал скорее про инфраструктурные вещи типа hadoop, mapreduce, нереляционных датабаз, распределённых вычислений и т.д.
534 1940389
>>40383

>Судя по всему, он спрашивал скорее про инфраструктурные вещи типа hadoop, mapreduce, нереляционных датабаз, распределённых вычислений и т.д.


Это все из биг даты и к машобу отношения не имеет.
535 1940402
>>39151
d2l.ai самая годнота.
Смысл в шапке, если это просто набор информации, книги на категории бы поделили, какие для вкатывальщиков, какие для математиков.
536 1940408
>>40389
К МЛ инженерии это как раз имеет отношение.
537 1940440
>>40402
Дедовские для математиков, остальные для вкатывальщиков.
538 1940449
>>40408

>К МЛ инженерии это как раз имеет отношение.


МЛ инженер - это гибрид машобщика, программиста и девопса. Он должен уметь абсолютно все, начиная от теории и прототипирования модели, заканчивая настройкой пайплайнов, написания нормального кода и выката системы в прод. Биг дата же является отдельным направлением, которое может пересекаться с машобом, но очень редко. Большинство датасетов для машоба меньше терабайта и не являются биг датой.
539 1940454
>>40449
Теоретик ты наш, а с какой же тогда целью эта бигдата собирается?
540 1940570
Решил посмотреть разные методы на простом анализе тональности предложений.
Это нормально, что BoW на сырых словах работает не особо хуже чем BoW после лемматизации (через яндепсовский mystem)?
С tf-idf различие также минимально.
541 1940578
>>40332
Нужно знать SQL в первую очередь. Синтаксис взаимодействия с хадупом напоминает SQL (spark), либо прямо эмулирует его (Hive). Но это в общем-то несложная часть. Сложность в том, что хадуп - опенсорс, который постоянно ложится из-за своей недоработанности. При этом он написан на джаве. А спарк - на скале. Также же еще нужно быть девопсом, так как хадуп - это операционная система для сети из компов.
542 1940591
>>40570
Потому что это дедовское говно в принципе не очень работает, так что никаких трюки адхоковские не помогают.
543 1940602
>>40332
на самом деле нечасто можно увидеть вканутов которые не "ЫЫЫЫ ХОЧУ ДЕЛАТЬ ЛИНЕЙНЫЕ РЕГРЕСИИ ФРОМ СКЛЕРН ИМПОРТ СУПЕРМОДЕЛ - СУПЕРМОДЕЛ.ФИТ"
и прочее говно из курсов. А если не секрет, ты чего решил перекатываться именно в мл инжениринг? деньги?
544 1940641
>>40602
Макака, плиз
545 1940652
>>40570
Нормально они работали в письменный век. Перестали работать в век зумерских эмодзи .

Просто ты "твиты" скорее всего пытаешься обработать. Короткие сообщение где вся информация скрывается в контексте и значении слов.

Нужны нейросетевые эмбединги.
546 1940660
>>40641
не понял
547 1940674
>>40602
ну, вообще, причин много
1) да, деньги. В игродеве платят не очень много, а в датка области зп выше, иногда ГОРАЗДО
2) мл инжениринг хочу, тк не уверен, что по матеше смогу конкурировать со всякими МФТИшниками, ШАДовцами и прочими ребятами - я ведь из бомонки, у нас не так дрочат этот матан. Хоть мне и все это интересно. А прогать я умею - у меня много опыта в шарпе и в геймдеве
3) Сейчас весь ИТ сегмент крутится либо вокруг диких байтоебов, либо вокрут машинного обучения. В таком контексте не попробоваться влиться - глупо. Даже если через пару лет придется перекатиться
А вообще, конечно, хочется прийти к матешке - уж нравится она мне
скажите, насколько нужно реально задротить матан, чтобы стать специалистом, а не макакой очередной?
Учеба в шаде или мфти действительно дает такой бесконечный разрыв? я просто очень редко вижу наличие бомонки как "желательно" в вакансиях: в основном мфти/шад/вмк/вшэ
548 1940694
>>40674
По-моему все крутится вокруг вэба.
549 1940735
>>40674
Математика нужна ресёрчерам. Лучше в аналитику перекатываться.
550 1940762
Анончик, где можно посмотреть примеры использования статистики в бизнесе? Гуглил - нашел только какие-то простыни говнокода, из которых нихуя не понятно. Ну или задачник какой-нибудь, чтобы было близко к реальности
Безымянный.png25 Кб, 1012x576
551 1940808
>>20026 (OP)
Какой вариант раскидывания res связей лучше и почему?
Популярнее как я посмотрел второй вариант но почему, параметров же больше а суть та же?
552 1940817
>>40735
Я всегда думал, что ресерчерами с потолка не становятся
Думал, что ресерчер это после сеньера
Блин как сложно на самом то деле разобраться кто у вас в дата саенсе что делает
553 1940820
>>40674

>шад


Поясните для ВПЛ, туда реально самостоятельно вкатиться после курсов на ютубе/курсере/едХ и МФТИ на степпике?
554 1940825
https://stepik.org/course/91157/info
https://stepik.org/course/91156/info

МФТИ уже второй год делает бесплатные курсы для Machine learning.
555 1940885
>>40817
https://yandex.ru/jobs/vacancies/interns/intern_researcher/
>>40820
Вкатиться реально, курсы не помогут. Читай материалы, которые они советуют поступающим. Решай codeforces и демидовича.
Вроде ещё как добавилось недавно что-то про анализ данных во вступительные, хз какие требования.
556 1940921
>>40817
Сеньор и ресерчер это вещи из разных измерений.
Ресерчер - это, по-хорошему, PhD, ну или условный аспирант. Короче говоря, это научная тема. По сути тот же ученый, только корпоративный, а не академический.
С индустрийной градацией джун-миддл-сеньор это напрямую не связано.
557 1940967
>>40921
и где трава зеленее? у научников или индустрии
вообще бля я теперь точно нихуя не понимаю
пришел сюда с желанием понять что учить, а ушел с тотальным непониманием куда вкатиться, кто чем занимается и куда перспективнее
image.png344 Кб, 1434x2353
558 1941019
559 1941052
аноны, а классический мл, без нейросеток, применяется сейчас где-нибудь?
560 1941059
>>41052
Рекомендательные системы, табличные данные. Задачи, где важна интерпретируемость (кредитный скоринг). Задачи, где важна скорость и качество нужно только в первом приближении (спам-фильтры). В компьютерном зрении - если структура данных постоянна и просто устроена, например, снимаются коробки с одного и того же ракурса.
Почти весь реальный unsupervised.
561 1941066
>>41019

>alphaGo 2014


Она же была в 15. А ли седоля вообще в 16 только обыграли. Найс обсёр по фактам. Может ещё где-то проебались с датами, это только то что вспомнил.

>нет дармутского семинара


Хоть его больше связывают с AI, имхо, тут тоже нужен.

>нет alexnet'а в 2012


Ну это позор просто
562 1941109
>>40223
А. Б. Сосинский "Mathematical English. Учебник английского для математиков" и его же более старая "Как написать математическую статью по-английски".
Книги похожи, иногда очень похожи, что неудивительно. Рекомендую начать с первой. На ней же можно и остановиться.

Книги эти написаны математиком для математиков. Цель книг - научить писать математические статьи (и книги).
Подразумевается, что читатель владеет только базовой лексикой, терминологией, умеет в целом понимать прочитанный английский математический текст и, главное, обладает желанием активно использовать именно математические способности, а не гуманитарные привычки (выработанные при изучении языка). Это почти цитата из предисловия.
Более того, автор утверждает, что хорошее знание языка, выработанное обычным гуманитарным способом в школе и универе, даже будет мешать. Будет лучше, если ты плохо знаешь язык - не придётся переучиваться.

Так вот, цель книги - научить писать статьи на английском, при этом требуется среднее умение их читать.
Твоя цель - научиться читать эти написанные статьи.
И здесь нет противоречия. Книга может тебе помочь.
Потому что, фактически, это мануал, который можно развернуть в обратную сторону. Идти не от русского к английскому, а наоборот.

Книга содержит практически все основные языковые конструкции, используемые для написания математических статей.
По сути, это шаблоны, в которые остается лишь подставлять свои слова.

Вещь очень годная.
Если ты хорошо проработаешь эту книгу, она в математическом плане заменит тебе несколько лет стандартного изучения английского в школе и универе. Благо, в ней всего 90 страниц (в старой немного больше).

Короче, ты можешь использовать все шаблоны из этой книги в обратном направлении, от англ к рус, и таким образом сможешь прочитать (и понять) даже сложные конструкции.

Вообще, это не учебник математического (и тем более обычного) английского, а именно мануал по переводу матстатей. Я бы даже сказал, фреймворк.
Но, как я уже говорил, для использования этого мануала нужно базовое понимание той математики, о которой ты хочешь читать или писать.

И да, там даже есть примеры специфических конструкций из теорвера и матстата.

Такие дела. Дерзай.

>>40228
Наверное. Но я не об этом.

>>20026 (OP)
Предлагаю поместить эту книгу в шапку треда рядом с оригинальными статьями и/или с дедовскими книгами.
562 1941109
>>40223
А. Б. Сосинский "Mathematical English. Учебник английского для математиков" и его же более старая "Как написать математическую статью по-английски".
Книги похожи, иногда очень похожи, что неудивительно. Рекомендую начать с первой. На ней же можно и остановиться.

Книги эти написаны математиком для математиков. Цель книг - научить писать математические статьи (и книги).
Подразумевается, что читатель владеет только базовой лексикой, терминологией, умеет в целом понимать прочитанный английский математический текст и, главное, обладает желанием активно использовать именно математические способности, а не гуманитарные привычки (выработанные при изучении языка). Это почти цитата из предисловия.
Более того, автор утверждает, что хорошее знание языка, выработанное обычным гуманитарным способом в школе и универе, даже будет мешать. Будет лучше, если ты плохо знаешь язык - не придётся переучиваться.

Так вот, цель книги - научить писать статьи на английском, при этом требуется среднее умение их читать.
Твоя цель - научиться читать эти написанные статьи.
И здесь нет противоречия. Книга может тебе помочь.
Потому что, фактически, это мануал, который можно развернуть в обратную сторону. Идти не от русского к английскому, а наоборот.

Книга содержит практически все основные языковые конструкции, используемые для написания математических статей.
По сути, это шаблоны, в которые остается лишь подставлять свои слова.

Вещь очень годная.
Если ты хорошо проработаешь эту книгу, она в математическом плане заменит тебе несколько лет стандартного изучения английского в школе и универе. Благо, в ней всего 90 страниц (в старой немного больше).

Короче, ты можешь использовать все шаблоны из этой книги в обратном направлении, от англ к рус, и таким образом сможешь прочитать (и понять) даже сложные конструкции.

Вообще, это не учебник математического (и тем более обычного) английского, а именно мануал по переводу матстатей. Я бы даже сказал, фреймворк.
Но, как я уже говорил, для использования этого мануала нужно базовое понимание той математики, о которой ты хочешь читать или писать.

И да, там даже есть примеры специфических конструкций из теорвера и матстата.

Такие дела. Дерзай.

>>40228
Наверное. Но я не об этом.

>>20026 (OP)
Предлагаю поместить эту книгу в шапку треда рядом с оригинальными статьями и/или с дедовскими книгами.
563 1941114
>>40967

>и где трава зеленее? у научников или индустрии


Макакой в индустрии выгоднее всего. Ресерчер в индустрии получает больше, но прибавка к начальной зарплате не стоит времени, затраченного на пхд. Ресерчер вне индустрии получает гроши.

А вообще, лучше всего работать в жирных компаниях вроде гугла, независимо от должности.
564 1941165
>>41109
Спасибо, как раз то что мне было нужно.
565 1941301
>>41109

>Сосинский


Сосницкий
566 1941329
>>40332
брат, ситуация полностью противоположная, хочу отсюда перекатиться в геймдев, какой роудмап посоветуешь? Знаю всю матешу шейдерную с матрицами, опенжл впрнц, но хочу ебаться на чуть более высоком уровне, мм?
567 1941410
>>41165
Рад был помочь.

>>41301
Сосницкий тут только ты, а Сосинский - годный математик.
568 1941430
>>40967
Первый анон был прав, макакой выгоднее всего.

Идти в аспирантуру и получать степень имеет смысл, только если ты без этого не можешь. Если тебе нужны интересные сложные исследовательские задачи, а не стандартные индустриально-бизнесовые.
Причём идти нужно в вуз, хотя бы, немного выше среднего. В хреновом вузе в аспирантуре делать вообще нечего.

То есть для этого нужно быть шизоидом, для которого важен интерес к решаемой задаче, а не деньги. Таким, как я, прям.

В академической науке даже на западе часто даже профессора математики/физики/компнаук/итд получают не сильно больше (если не меньше), чем вчерашние студенты-программисты в индустрии.
Так профессором еще стать надо. А для этого нужно иметь недюжинные мозги и такую же усердность, нужно быть упоротым трудоголиком, думать о своих исследованиях 24/7.
А быть трудоголиком в научных исследованиях гораздо сложнее, чем быть трудоголиком в индустрии.

В ИТ индустрии PhD обычно зарабатывают больше, но не сильно, и оно того не стоит.

Однако, есть еще одна причина, по которой много кто сваливает за бугор в аспу: это один из самых простых способов свалить за бугор.
569 1941485
>>41109
иди выебывайся в свой двор.
концепция "читай только формулы к книгах по машобу" подходит только тебе.
570 1941495
>>41485
А вот и у гуманитария-машиннообучатора жопа подорвалась. Найс.
571 1941501
Аноны, посоветуйте реально годные курсы по дата саенсу и, в частности, по математической статистики. Не так, что бы материал рассматривался поверхностно, и что бы курс не состоял целиком и полностью из унылых видосов.
Можно даже очные курсы по переквалификации дс2
Слышал, что гибрейнс, скиллфактори и прочие скиллбоксы - гавнище полное.
Что скажите за яндекс.практикум?
я не вкатыш, на работе попросили заняться дс и сказали, что оплатят курсы, поэтому хочу выбрать реально полезный курс
572 1941512
>>41501

>яндекс.практикум


Разумеется, тоже гавно
573 1941517
>>41501
По Яндекс.практикуму в треде мнения разделились.

> Слышал, что гибрейнс, скиллфактори и прочие скиллбоксы - гавнище полное.


Правильно.
574 1941542
>>41501

> Аноны, посоветуйте реально годные курсы по дата саенсу и, в частности, по математической статистики.


d2l.ai. Инфоцыгане не нужны.
575 1941570
>>41542

>d2l.ai. Инфоцыгане не нужны.


Выглядит просто как голопом по европам, ещё и на английском, блин
576 1941573
хз оффтоп это или нет, но проходил ли кто стажку в SAS? что происходит после шести недель обучения? если хорошо справлялся эти шесть недель то каковы шансы получить/не получить оффер?
577 1941628
>>41570

> , ещё и на английском, блин


А тебе на каком надо? Там ещё на китайском есть.

> голопом по европам,


Чего там нет из того что тебе нужно?
578 1941659
>>41628

>А тебе на каком надо? Там ещё на китайском есть.


на русском конеш
>Чего там нет из того что тебе нужно?
Хорошего погружения в мат. стат. Насколько я понимаю, без него в дс никуда
579 1941764
>>41329
ну смотри, я ебался с юнити, поэтому буду говорить с позиции юнити разраба
для ебли на высоком уровне особо ничего не надо, кроме знания ангема. Но его, в целом, можешь не повторять даже тк задачи не особо сложные с математической точки зрения (ну еще посоветую повторить кватернионы немножко)
в остальном нужно качать умение прогать: solid, ооп, code smells и прочие вещи именно прогерские
если хочешь по безопасному пути, то очень советую посмотреть пару курсов на plurasight (он вроде немного стоит). Там правда топовые курсы, строящиеся по правилу (самому лучшему правлу построения курсов) степика: много небольших курсов на разные темы. Причем курсы качественные
Советую также не размениваться первое время на чистый Си шарп, тк в движках, как правило, все прелести языка не используются
после того, как немного освоишься в юнити и поймешь что как создавать объекты, как работать с ассетами, как реализовывать взаимодействие между объектами (физика) и пр, то пробуй реализвать свои игоры (как бы страшно не было видеть пустой экран) - благо идей для игр у всех полно
Ну а после того, как в соляну все потыкаешь, при условии начиля бекграунда в МЛ, можешь начать искать работу. Обязательно иметь при этому хоть каку-то демку игры
От себя могу добавить, что знания шейдеров - хороший буст. Как правило это самые высокооплачиваемые ребята
580 1941799
>>41764
я по классике наебашил орфографических ошибок - соре
581 1941801
кст пацаны, с вами все тот же игродел-вкатун
какие посоветуете пет проекты, чтобы я показал работодателю и он такой "о норм, можно поговорить" и алсо немного прокачаться?
я себе до смены работы выделил месяца 2-3. По идее, за это время можно запилить что-то более менее неплохое
Если не привязываться к цв нлп и пр - что можно запилить?
582 1941928
>>41801
Сделай что-нибудь геймдевовское раз уж игродел. Мл в геймдеве пока не особо, но года через 2-3 наверное попрёт.
583 1942033
>>41928
а вот у меня есть проект, которым я пару месяцев занимался на работе
короче нужно было из набора объектов найти позицию определнного
юзал облака точек, но без всяких нейросеток - только классический матан: PCA, RANSAC и пр - ну мы там ЭЙАР игрулю делали (но не взлетело)
это совсем не релеватно для области?
алсо еще вопрос
я часто вижу хуйню типа: знание SQL, Mongo Reddis и пр
я с ними нихуя не работал
скажите плез, насколько сложная хуйня? нужно ли тратить время на курсы по этому или достаточно немного потыкать?
584 1942036
>>42033
вы уж извините, что доебался
просто хочу не показать очередным вкатуном на собесе
585 1942060
>>42036
ну да, мальца доебался конечно
мимо немлшик
586 1942194
>>42033
Для CV SQL не нужен, зато плюсы нужны. Для тех, которые ближе к бизнес-аналитике SQL нужен, зато плюсы не нужны.
587 1942202
>>42194

>зато плюсы нужны


Шиз, опять ты выходишь на связь? Абсолютному большинству машинлернеров плюсы не нужны.
588 1942300
>>41764
Нах тебе этот мл. Учи скл, дотнет и вкатывайся в бэкенд.
589 1942312
>>42300
а чем плох мл?
590 1942313
>>42300
зп больше ЛОЛ
591 1942315
>>42300
в дотнете нужно знать еще джабускрипт и прочее фронтэнд говно
а платят немного
вот и скажи, послать это удовольствие нахуй это или сразу в пизду?
592 1942317
>>42300
ну ему, скорее, в комп зрение лучше
593 1942320
>>42313

>зп больше ЛОЛ


Это пиздешь, который зафорсили сами вкатуны в МЛ.
594 1942326
>>42315
Хорошо там платят. Больше чем МЛ.
Просто нужно проект достаточно большой и энтерпрайзный найти чтобы слоеное говнище было настолько сложно, чтобы 25 летние хипстеры с него убегали бы.
595 1942327
>>42320
ну тут скорее
есть ведь именно чуваки которые делают алгоритмы
а есть ребята, которые это все упаковывают в код
я хочу, скорее, ко вторым
ну потому что для норм рнд я туповат, да и прогерство больше по душе
а бэк че? курды пилить? ну ебать мне интересно конечно макакить так
596 1942328
>>42326

> чтобы была ебучая джава легаси


поправил, не благодари
597 1942329
Кстати, мл + фронт связка норм или маленький спрос пока?
598 1942333
>>42327

>есть ведь именно чуваки которые делают алгоритмы


Таких буквально один на сотню. Остальные бездумно трясут ящик.

>а бэк че? курды пилить? ну ебать мне интересно конечно макакить так


В машобе будет аналогичный макакинг, даже если ты будешь работать непосредственно с моделями.
599 1942334
>>42326
>>42320
да бля, я как посмотрю в одс вакансии - охуеваю
200к, 250 300
я в своем гейдеве больше 120 не видел ни разу - только лиды (я мидл 2 года опыта)
600 1942336
>>42333
>>42326
я скорее соглашусь, что из бэка на питоне легче будет перейти в мл - тут да
в остальном хз - бек странное место
601 1942340
>>42334

>да бля, я как посмотрю в одс вакансии - охуеваю


>200к, 250 300


Ты впервые видишь пиздешь в вакансиях? Пойдешь на собеседование - тебя опустят и предложат в два раза ниже.

>я в своем гейдеве больше 120 не видел ни разу - только лиды (я мидл 2 года опыта)


Для двух лет опыта это нормальная зарплата для ДС, а вне ДС так вообще отличная.
602 1942341
>>42329
Что это? this<...>doуsnotexist?
603 1942344
>>42340

> Для двух лет опыта это нормальная зарплата для ДС, а вне ДС так вообще отлична


ну да, но все - таки геймдев - это про геймдев, а не про технологии
сейчас же вся туса в мл - хочу стать часть этого

> Ты впервые видишь пиздешь в вакансиях?


впервые) я два со второго по 5 курс работал за бесплатно в рога и копыта, и с 5 по окончание уника в гейдеве с конторке другана
даже на собесе ни разу не был
604 1942353
>>42334
Не пизди. Только что заглянул в ОДС - крайняя вакансия вилка 120-180 gross
605 1942357
>>42344

>а не про технологии


а машинлернинг дохуя про технологии? импорт слесарьплов ас сп и в продакшн
Screenshot 2021-02-15 at 20.56.06.png33 Кб, 712x122
606 1942358
607 1942359
>>42358
еще и премия нахуй х4
просто в один прекрасный день ты получаешь ебучие 500к на карту
608 1942363
>>42357
ну вот с тобой я соглашусь
не знаю, чуваки
хочется делать интересные задачи, чтобы удовольствие от процесса было
если это не расхайпованный мл, то что?
609 1942371
>>42358
И снова не пизди. Я же сказал - КРАЙНЮЮ, а ты пролистал на 4 вверх, чтобы найти приятные цифры
610 1942373
>>42371
вот ты блин душный конечно
ладно, твоя взяла
и вообще бля, раз у вас все так хуево в мл, хули вы тут работаете?
611 1942376
>>42373
Никуда больше не берут т.к. по сути программировать не умеем
612 1942377
>>42363
а может вообще не программирование? что тебе по жизни нравится
613 1942379
>>42377
да не
я люболю проганье
но "брать данные из таблички А и помещать их в табличку Б" не совсем то
люди беспилотники делают, роботов, ракеты - это топ
а в рашке хуи сосать только и таблички делать
614 1942386
>>42379
тогда зачем ты всё ещё в рашке?
615 1942389
>>42363

>хочется делать интересные задачи, чтобы удовольствие от процесса было


Если хочешь интересных задач, иди PhD делать в годный вуз.
Индустрия это (почти) всегда про макакинг, и неважно, бекенд это или мл/дс.

Буквально сегодня про это писали >>41430 .
616 1942390
>>42386
ну тут уже личные причины - пока не могу уебать
но планирую
617 1942679
>>42377
>>42371
>>42357
>>42353
>>42340
>>42333
>>42326
>>42320
>>42300
смотри, брат, это называется "боязнь конкуренции"
готовы себя говном облить, лишь бы +1 вканут не был
а то вдруг еще годный попадется и место отберет
618 1942684
>>42679

>смотри, брат, это называется "боязнь конкуренции"


>готовы себя говном облить, лишь бы +1 вканут не был


Да причем тут вообще это. Вкатуны все равно не вкатятся, а если и вкатятся, то не составят конкуренцию ставшим к тому времени сеньорами.
619 1942686
>>42684
ну выглядит так
- у нас тут так хуево вообще пиздец ТАК ХУЕВО лучше байтоебом иди или игродело и зп у нас размером с небольшой хуй
- а чего сами не перейдете?
- ну эээээ мы прогать не умеем
серьзно? прогать не умеем? а вы тогда вообще кем работаете? model.fit(x) пишете целый день?
620 1942691
>>42686

>у нас тут так хуево вообще пиздец ТАК ХУЕВО лучше байтоебом иди или игродело и зп у нас размером с небольшой хуй


Этого никто не говорил. В машобе зарплаты не сильно отличаются от других сфер айти.

>- а чего сами не перейдете?


>- ну эээээ мы прогать не умеем


Перекатываться в тот же веб имеет смысл. Столько же денег, но меньше стресса. Не перекатываются в основном потому, что не хотят учиться ничему новому. Ну и довольно большая часть машобщиков - это как раз макаки, которые вкатились из-за хайпа и кроме model.fit ничего не умеют.
621 1942733
>>41019
Про дип лёрнинг в 1971 конечно же забыли.
622 1942855
>>42691
А почему работа стрессовая?
623 1942857
>>42855
Ну здрасте. Трясти черный ящик не зная будет ли результат - это стресс
624 1942859
>>42857
Просто охуенный стресс. Даже страшно представить.
625 1942863
>>42855

>А почему работа стрессовая?


Невозможно предугадать результат - можешь и год безрезультатно трясти ящик. Из-за этого будешь постоянно волноваться, не выпиздят ли тебя завтра на мороз.
vyuchennaya-bespomoshchnost2[1].jpg56 Кб, 600x456
626 1942931
627 1943255
>>42931
И что?
628 1943261
ебать рофл конечно
в треде питона говорят что "ебать питон это скучно и мл сейчас топ"
в треде мл говорят насколько хуево в мл и как бы они хотели в бэк
в треде крестов тоже выбеываются
такое ощущение, что жизнью довольны только шарписты
629 1943563
люди и людини из мира CV
есть ли инфа по адекватным конторам, занимающимися комп зрением? меняю работу и не хочу попасть в просак в компашку из черного списка
алсо, если есть те, кто более-менее толерантен к перекатунам из бекенда, тоже буду признателен
630 1943592
>>43563

>в просак в компашку из черного списка


каво?!
какого ещё черного списка
631 1943601
>>43261
коллега-бэкендер говорил, чтоб я не перекатывался в бэк, а советовал девопс.
коллега-девопс говорил, чтоб я не перекатывался в девопс, а катился в дата саенз и биг дату.
коллега-ios developer говорил, что разработка под яблоко заебись, а в андроиде куча говна
держу в курсе
632 1943649
>>43592
условно черного
есть же компании - ебанаты
а есть такие, которые анон может пруфанут как збсшные
633 1943654
>>43261
Подъебать мелкобукву - святое дело
634 1943755
Вы охуели не перекатывать? Кого ждете? Ну ка перекатили быстро
635 1943759
поцонва, мне нужно распознать qr код
использую для этого zbar
но работает крайне хуево - углы и освещения могу очень легко наебнуть
а вот в прилоге тинькова охуеная распознавалка
вопрос
где-то на свете есть более хорошие решения? или есть смысл самому запилить?
636 1943785
>>43755
Нормально же сидим. Илитный скрытый тренд. Как и его содержимое
637 1943803
ОП
ГДЕ
ПЕРЕКОТ
МУДИЛО
ЭМ?
638 1944157
У меня вопрос по поводу генерации изображений, есть набор фотографий, например кошки, как сделать генератор который будет генерировать кошек из ничего? Я так понял что это GAN нейросеть, попробовал по туториалу создать её, с цифрами ч/б всё получилось, но не получается с цветными изображениями. Есть ли готовый пример не 2017 который подобное делает?
639 1944217
https://www.infoq.com/news/2021/02/google-trillion-parameter-ai/

Что думаете насчет этого? Блядь ТРИЛЛИОН параметров! В опенсорсе!
4220485632.jpg17 Кб, 320x200
640 1944258
>>44217
Ебануться.
Когда это пощупать можно будет?
641 1944261
>>44217
>>44258

>Although Google has not released the pre-trained model weights for the Switch Transformer, the implementation code is available on GitHub.


Необученная.
642 1944265
>>44261
Но это дело поправимое, так-то.
643 1944278
>>44217

> а у меня миллиард пораметров!


> а у меня трилеон!


> а у меня тогда бесконечность!


> а у меня бесконечностью плюс один!


Коротко о "ресёрче" в индустрии, кто там выше туда хотел?
644 1944298
>>44278
Количество параметров напрямую определяет качество сети. Тут параметров, как в твоем мозге. Это предел мечтаний.
645 1944309
>>44298
Современные ИНС очень косвенное отношение имеют к мозгу.
646 1944315
>>44309

> Современные ИНС очень косвенное отношение имеют к мозгу.


ИИ вообще будет иметь отношение к человеческому мозгу, как самолет к птице. Но меняет это что-либо? Кстати, обучить Switch Transformer дешевле, чем GPT.
647 1944320
>>44315

>Тут параметров, как в твоем мозге.


Это я про то, что в этой фразе смысла довольно мало.
image.png536 Кб, 1024x1024
648 1944321
>>44278

>а у меня телескоп с зеркалом 10 метров!


>а у меня 100!


>а у меня тогда бесконечность!


>а у меня тогда бесконечность плюс один!


>коротко о "ресёрче" в астрономии

649 1944328

> OpenAI GPT-3, пожалуй, самая известная модель глубокого обучения, созданная за последние несколько лет. Одна из вещей, которая больше всего впечатляет в GPT-3, - это его размер. В некотором контексте GPT-3 - это не что иное, как GPT-2 с множеством дополнительных параметров. Имея 175 миллиардов параметров, GPT-3 был примерно в четыре раза больше своего крупнейшего предшественника.



> Зная это, как бы вы тогда относились к модели, которая в 6 раз больше GPT-3? Именно этого добилась команда из Google Research с их новой архитектурой Switch Transformer . Новая модель имеет непостижимые 1,6 триллиона параметров, что делает ее в шесть раз больше, чем GPT-3.



> Благодаря новым оптимизациям, Google смог обучить модель Switch Transformer поразительным 1,6 триллионам параметров! Скорость обучения увеличилась до семи раз по сравнению с предыдущими архитектурами.



https://www.kdnuggets.com/2021/01/google-trillion-parameter-switch-transformer-model.html#:~:text=This is precisely what a,times larger than GPT-3.
650 1944329
>>44278
Будто ты что-то лучше можешь предложить. Да, подход "наебенить побольше слоев и параметров" пока что самый лучший, благо еще и закон Мура позволяет.
саттон.жпг
>>44320

>Это я про то, что в этой фразе смысла довольно мало.


Нормально там смысла. У человека в мозгу параметров больше, чем в мозгу червя, соответственно, возможностей у человека больше. В нейроночках это работает так же.
651 1944345
>>44329

>У человека в мозгу параметров больше, чем в мозгу червя, соответственно, возможностей у человека больше.


Проблема как раз в "соответственно". Нет никаких адекватных доказательств, что здесь из А В следует.
Мозг слишком плохо изучен, чтоб говорить, что единственное (или по крайней мере ведущее) его преимущество перед "мозгами" червя, это количество нейронов или даже архитектура сети.
652 1944346
>>44329

>У человека в мозгу параметров больше, чем в мозгу червя, соответственно, возможностей у человека больше.


Проблема как раз в "соответственно". Нет никаких адекватных доказательств, что здесь из А В следует.
Мозг слишком плохо изучен, чтоб говорить, что единственное (или по крайней мере ведущее) его преимущество перед "мозгами" червя, это количество нейронов или даже архитектура сети. Это просто принятая у машобов нулевая гипотеза.
653 1944347
Хочу вкатиться в NLP. Посоветуйте плз годный курс. Лекционный материал годный, как я понял, есть у Jacob Eisenstein. Но где бы взять упражнения?
654 1944367
>>44321
Ложная аналогия.
655 1944381
>>44345

> Проблема как раз в "соответственно". Нет никаких адекватных доказательств, что здесь из А В следует.


Есть. Нейроночки могут отвечать на вопросы, человек тоже. Как в случае птицы и самолёта, главное- что и то и другое летает. Остальное в практическом плане несущественно.
183138.png73 Кб, 957x648
656 1944431
>>44298

>Количество параметров напрямую определяет качество сети.


>>44329

>подход "наебенить побольше слоев и параметров" пока что самый лучший


Жалко только что качество сети напрямую определяемое самым лучшим из подходов в итоге результат даёт не лучше марковских цепей из нулевых и прочих программируемых эвристик без триллиардов параметров.
657 1944448
>>44381
Говно тоже летает при набросе на вентилятор.
У вас плохо с импликациями, ну или со статистическим выводом, уважаемый.
658 1944533
>>20026 (OP)

Двач, помоги разобраться: есть камера видео наблюдения, которая следит за бариста(пидоры, которые продают и пиздят кофе). Я хочу, что бы нейронка в реальном времени считала количество проданных стаканчиков с кофе. Насколько это сложная задача? А если я хочу, что бы нейросеть сортировала стаканчики по объёму? (Понятно, что потом я хочу сравнить показатели с количеством израсходованных материалов и выявлять воровство). Сколько может стоит разработка такой штуки? Сам обычный дотнет чик с горе малым бизнесом в довесок.
659 1944594
>>44533
Угомонись, эль кабаньеро, никто у тебя ничё не пиздит, а если даже и пиздит то ничего ты не сделаешь, пидорнёшь одного, к тебе другой люмпен за твои гроши придёт и так же воровать начнёт от бедности. Не с того конца ты проблему решаешь.
660 1944605
>>44594
плюсую
661 1944608
бля поцоны, я конечно ебал ваши курсы
такая параша
1) везде говорят основные концепции - в тех же книгах намного лучше
2) этот вот принцип "мы тут для тебя все подготовили, напиши строчку" - просто ебала
пару раз так сделал - а как наебенить модель с нуля так и не понимаешь
к чему бугурт? я так и не понял, как мне подлить свои данные
в курсах через url качают - ок, понял
а мне хули сделать? у меня на компе прон и хочу сиськи классифицировать - мне типа отдельный скрипт писать или есть
import boobs_from_pc_loader ?
662 1944654
>>44608

> мне типа отдельный скрипт писать


Писать, одна (может и самая) нетривиальная часть мля - где взять данные и как их выдрать оттуда где они есть.
663 1944701
>>44594

Мне не очень важно твоё мнение на этот счёт, пидор, отвечай на мой ответ или иди нахцй.
664 1944715
>>44347
сорри, бампану.
16128666209740.jpg36 Кб, 511x407
665 1944727
>>44431

> хуйню сделяль


> ррреее, ниработаит


Дэбил, хоспаде... Я же постил ссылку как дистилберт отвечает на вопросы. Но там вручную контекст надо указывать. А вот haystack'у вручную загружает текстовые файлы, просто неразмеченный текст, и оно само под заданный вопрос ещё и контекст подбирает.
666 1944729
>>44654
ну я так понимаю, что этот вот дата инжиниринг это целая песня
667 1944746
>>40808
бампю
668 1944748
>>44533
Этот >>44594 тотально прав. Лучше зарплату добавь, за твои 17к на проезд и сегореты, как среднему классу, к тебе в твой рабочий дом ни один нормальный человек не пойдет.
669 1944759
>>44701

>Мне не очень важно твоё мнение


>отвечай на мой ответ


Поэтому у тебя ничего и не получится. Пожалуй вам не стоит заниматься бизнесом.
670 1944821
>>44748

Хуя у тебя маеямирок, 17к, лол. Зумеры за такую зп не пернут даже.

В общем, идите на хуй, долбаебы, со своими цены и бизнес советами.
671 1944861
>>44533
ну ты хоть в гугл сходи:
https://www.dssl.ru/products/moduli-i-potrassir/

разработка тебе не светит, конечно, но ведь много чего продается готового и твои стаканчики коррелируют с другими показателями.
672 1944863
>>44367
Нет, истинная.
673 1944864
>>44821
а, слушай, я придумал:
ставишь камеру и ПУСКАЕШЬ СЛУХ что заказал на фрилансе нейросетевую аналитику!
Сам первые две недели вручную просматриваешь камеры и пиздишь всех.
Таким образом задача будет решена.
674 1945095
>>44863
В астрономии телескопы - лишь экспериментальные инструменты исследований, и чем больше твои телескопы, тем больше всего ты можешь открыть. А есть еще и теория, которая постоянно обобщает опытные факты.
В дотасаенс-индустрии нейронки - уже продукт исследований. Теории в индустрии уже практически никакой нет, вся в прошлом веке закончилась. А тех ученых теперь Жопеншмульцерами называют.

Но я лично с тем аноном не вполне согласен. Всё же кроме наращивания количества нейронов, в новых продуктах еще и различные оптимизации архитектуры проводятся (разной степени теоретичности или тыкания пальцем в небо). Так что там есть исследования, но главным образом околоэкспериментальные.
Теория хоть и развивается, но она довольно далеко от индустрии.

Хуита твоя аналогия.
675 1945145
>>44701
>>44821
как ты, такой долбаеб, вообще что-то открыл? приходишь к нам на двач и без уважения говоришь, что мы пидоры? иди жысоны перекладывай, дотнетчик - бизнесмен ебучий
>>44864
топ решение, но с этим дебиком даже нехуй базарить
все у него виноваты, все воруют а он один молодец
взбесил блять, уебок
16131874072170.jpg484 Кб, 1497x1119
676 1945160
>>45095

> в новых продуктах еще и различные оптимизации архитектуры проводятся (разной степени теоретичности или тыкания пальцем в небо).


Нет там никакого тыканья пальцем в небо. Все решения обоснованы теоретически, более того, основаны на работах тех самых Жопеншмульцеров из середины прошлого века, о которых тут принято говорить в пренебрежительном тоне. Наследие дедов охватывает всё, до чего вообще можно додуматься в машобе, более того, далеко не всё это наследие пока должным образом осмыслено. Ни одна технология машоба, сколь угодно топовая и новая, не придумана с нуля в наше время, все они корнями уходят в работы Жопеншмульцеров.
677 1945345
>>45160

>Все решения обоснованы теоретически, более того, основаны на работах тех самых Жопеншмульцеров из середины прошлого века, о которых тут принято говорить в пренебрежительном тоне.


Да, макаки всегда будут говорить о них в пренебрежительном тоне.
678 1945433
>>43759
Берешь и проводишь через FFT, сверху фильтр гауса, вот тебе и нормальные углы. Это дедовская-оброботка сигналов, нахуй тут нейронка?
679 1945435
>>45433
братишь, я про нейронку и не заикался то
мне просто интересно, это выглядит как мега просто стандартная задача
почему тогда у одиних супер охуено а у других супер хуево
680 1945860
>>45435
https://developers.google.com/ml-kit/vision/barcode-scanning

Мы за тебя все гуглить должны?
Тот который тормозит, очевидно на яве написан
681 1945906
А кто-нибудь пробовал в трансформере заменить перцептрон (FFN) на SVM? По идее, должно побыстрее работать, там ведь только опорные векторы считаются, а не всё подряд квадратногнездовым методом. Если что, идея моя, саму архитектуру можно назвать zhopenformer, в честь Жопеншмульцера.
682 1946228
>>45906
Градиенты не прокинутся
683 1946406
Можно не python а js?
684 1946488
>>46406
можно, разрешаю
685 1946699
Насколько часто норм менять работу в сфере анализа данных? Уже 18 месяцев на текущем месте, и уже наскучило, хочется сменить домен. До этого 14 месяцев отработал в одном месте, а когда переходил, мне на паре собесов предъявили, что я часто прыгаю.
Ясно, что в анализе какое-то время надо на то, чтобы вникнуть в домен, так что тут ожидают более продолжительных трудовых отношений в сравнении с разработкой. Интересно мнение и опыт анона.

Опять же, я не МЛ инженер, а больше в сторону аналитики
686 1946829
>>46406
Фундаментальных теоретических запретов на это нет. Можно.
687 1946847
>>46488
>>46829
Вы заебали, шутники. Я спрашивал нормально ли будет вкатываться на js`e или нет? Насколько там меньше контента по сравнению с питоном?
688 1946857
>>46847

>Я спрашивал нормально ли будет вкатываться на js`e или нет


Нет, не нормально. Хочешь заниматься машобом - учи питон.
689 1946860
>>46857
А я то думал машоб это умение алгоритмы писать а язык всего-лишь инструмент.
690 1946864
>>46860

>А я то думал машоб это умение алгоритмы писать а язык всего-лишь инструмент.


Для каждой задачи свой язык. Ты же не пытаешься писать фронт на питоне?
691 1946871
>>46864
Почему в таком случае любая мало-мальски долгоживущая система переписывается на что-то производительнее типа плюсов?
692 1946878
>>46871

>Почему в таком случае любая мало-мальски долгоживущая система переписывается на что-то производительнее типа плюсов?


Все машоб библиотеки, в которых необходима производительность, и так написаны на плюсах. На питоне лишь удобная обертка.
693 1946887
>>46878
Тогда зачем мне питон если все серьёзные вещи делают на плюсах?
694 1946913
>>46887

>Тогда зачем мне питон если все серьёзные вещи делают на плюсах?


Ровно затем, зачем тебе нужен вью/реакт вместо стандартного жс.
695 1946948
>>46860

>умение алгоритмы писать


Жопеншмульцер, ты? Алгоритмы давно уже написаны людьми поумней тебя, а в дата сосаенсе гораздо важнее уметь получать и правильно обрабатывать данные
696 1946974
>>44727

> хуйню сделяль


https://sbercloud.ru/ru/warp/gpt-3

> Но там вручную контекст надо указывать. А вот haystack'у вручную загружает текстовые файлы, просто неразмеченный текст


Да, если нахуярить побольше данных без разбора содержат они утечки или нет то внезапно всё заработает. С другими алгоритмами дедовскими такое нельзя!
697 1947029
>>46974

> гпт3 лардж


> 780м параметров


Сберкасса не может не наебать, даже гпт2 лардж это уже 1580м или около того параметров вообще-то. Гпт3 самая большая вроде 175 миллиардов параметров... Они бы лучше тот гугловский свичтрансформер обучили, который 1.6 трлн параметров.
698 1947040
>>46974

> С другими алгоритмами дедовскими такое нельзя!


Теоретически, можно. Даже во времена Жопеншмульцеров было известно, что чем больше данных, тем лучше результат (у того же Вапника это описано как асимптотические методы). Просто тогда вычислительные мощности не позволяли эффективно использовать такой путь улучшения результатов, да и датасетов на терабайты никто не создавал. Поэтому от варианта "настакать побольше слоев да накидать побольше данных" до относительно недавнего времени отказывались. А потом закон Мура порешал.
699 1947054
>>46974

>нахуярить побольше данных без разбора содержат они утечки или нет


Что такое утечка в данных? Я только утечку памяти в погромировании знаю.
700 1947062
>>46860
Вкатывайся тогда на пауэрпоинте, он тоже тьюринг-полный.
701 1947083
>>47062

>пауэрпоинте


А какой там язык?
702 1947106
>>47062

> Вкатывайся тогда на пауэрпоинте, он тоже тьюринг-полный.


Мб ты эксель имел в виду? В пауэрпоинте же только презенташки делать.
703 1947111
>>47106
Мне тоже так показалось.
704 1947112
>>20026 (OP)

>https://www.nature.com/articles/s42256-018-0002-3


>Learnability can be undecidable


>Abstract


>The mathematical foundations of machine learning play a key role in the development of the field. They improve our understanding and provide tools for designing new learning paradigms. The advantages of mathematics, however, sometimes come with a cost. Gödel and Cohen showed, in a nutshell, that not everything is provable. Here we show that machine learning shares this fate. We describe simple scenarios where learnability cannot be proved nor refuted using the standard axioms of mathematics. Our proof is based on the fact the continuum hypothesis cannot be proved nor refuted. We show that, in some cases, a solution to the ‘estimating the maximum’ problem is equivalent to the continuum hypothesis. The main idea is to prove an equivalence between learnability and compression.



Теория Вапника-Червоненкиса рулит!
705 1947405
ОП походу умер, перекатывайте кто-нибудь другой.
706 1947430
>>47405
В чем смысл перекатывания?
707 1947473
>>47430

В том что нет притока ньюфагоф, тред медленно умирает и остаются только упоротые Жопошмульцеры
709 1947594
Здравствуйте, данные научники, возникла идея написать классификатор, суть в том, чтобы телеграмм бот выдавал картинки, человек их оценивал и ему назначаются цифры(представьте координаты в 3-хмерном пространстве), т.е если человеку понравились определенные картитнки, то бот отнесет его к определенной категории людей, в общем то можно просто поставить весы у каждой картинки по каждому измерению, типа если тебе понравилась эта картинка, то ты такой-то и далее тебе будут более релевантные картинки присылаться, в общем-то алгоритм не требует нейронок, но я подумал, что нейронки и классификаторы(это одно и то же?) подойдут тоже для этой задумки, хотел поспрашивать что почитать, какая реализация подходит под эти параметры(сам о нейронках только в общих чертах знаю). Я не планирую писать свою сложную рекомендательную систему, но мне кажется что решение уже есть и оно будет эффективней того что я могу напрогать своими ручками, прошу в ответы, кто знает в каком направлении мне двигаться
710 1947613
>>47594
Self organized maps
711 1948132
>>47083
>>47106
https://youtu.be/uNjxe8ShM-8
Кому надо, тот сделает в пауэрпоинте. Главное уметь писать алгоритмы, а инструмент не важен.
712 1948620
>>48132
В таком случае можно и с помощью карандаша и бумаги.
015.png132 Кб, 600x452
713 1948743
>>48620

> карандаш


> бумага

714 1949036
Можно ли вкатиться без вышки?
715 1949304
>>48743
Слабо? Хуевый из тебя программист в таком случае.
716 1949464
аноны, какие ресурсы читать, чтобы быть в теме cv? все советуют архив - но там нихуя не понятно на какие статьи стоит обращать внимание, а на какие забить хуй
тем более это статьи. А новости и пр?
717 1950036
можно ли стать успешным или твердым середнячком, если не выпускник физтеха или мгу? с ними же по идее невозможно конкурировать... они почти все с 10 класса погружены в математику
718 1950226
>>50036

>можно ли стать успешным или твердым середнячком, если не выпускник физтеха или мгу?



Можно. Но это не точно.

Что бы тебе тут не говорили, в дотасаенсе математики мало, во-первых, а во-вторых, и главное, она вся тупо на техническом уровне.
То есть нужны тупо формулы и общее понимание некоторых (несложных) идей. Собственно в математике разбираться не нужно. Естественно, я говорю про обычную работу в индустрии, а не науку.
Ты же не собираешься научными исследованиями заниматься и диссертацию писать?

На обычной работе достаточно минимума общей математики и конкретных вещей из машоба и анализа данных - фактически, линейная алгебра, матстат, теорвер и методы оптимизации (потому что любая задача машоба сводится к задаче оптимизации), ну и основные модели и алгоритмы машоба, которые строятся на основе этих разделов математики.

При желании всё это можно с полного нуля выучить самостоятельно. Сложно сказать, конечно, сколько времени тебе на это понадобится. Некоторые вкатывальщики в интернетах утверждают, что за полгода можно дойти до собеседований, ну уж за год точно.
На питоне кодить научись.

Ну и технический диплом нужен, хоть и от говновуза.
Главное - найти первую работу, дальше всё путём будет.
Проблема в том, однако, что вакансий в дотасаенсе если и не мало, то уж точно не много, не смотря на весь хайп.

>>49464
Хрен знает, читай блоги какие-нибудь по теме, обзоры в твитторах и прочую херь. В шапке треда есть ссылки.
719 1953364
Аноны, подскажите пожалуйста, без лишней желчи.
Сейчас стоит выбор во что вкатываться: .Net(C#) или же ML.
Нравится имеено писать код, но и матешу не хотелось бы забрасывать.
Следовательно вопрос: пишет ли код ML engineer или занимается тупым перебором табличек и подгадыванием коэфициентов?
Во что перспективнее вкатываться?
720 1953630
>>44608
здравстсвуй, я уже 2 года дергаю голых баб (как выяснилось- неправильно и большую часть зря). Сейчас пересобираю архив верно, буду использовать "другую архитектуру" (ан самом деле просто давать на вход больше размеченных вручную данных в большем разрешении.) Добро пожаловать в машинное обучение.
Пройди курс яндекс-хуяндекса по питону, там возьмеш базу. В тенсорфлоу уже сможешь сам всё делать после этого.
721 1953797
JS или Python?
722 1954063
Нужны ли эти перехайпаные стенфорды или можно сразу вкатываться по контенту из секции "Что почитать?".
723 1954318
>>53364

>пишет ли код ML engineer


Пишет. Периодически даже на плюсах.

>или занимается тупым перебором табличек и подгадыванием коэфициентов?


И этим тоже может заниматься.

>>53797
Питон. Хуйней страдать можешь и на языке ассемблера.

>>54063

>Нужны ли эти перехайпаные стенфорды


Не нужны. Они для полных даунов.
724 1955183
Я сформулировал в голове более простой пример, чтобы было понятней при объяснении, придумайте любимый цвет, у него есть rgb, задача нейросетки задать n вопросов и максимально близко угадать твой любимый цвет, вопрос есть ли что-то наиболее релевантное? Почитал про som, ничего не понял, я не вкатыш, просто интересная идея возникла, хочу попробовать
725 1955186
>>55183
Вопрос интересный, тут такое дело иди нахуй не видишь перекат был
726 1955504
>>37287
Акцент. Либо хохлуха, либо белораха.

> Нам памаХает

727 1955905
Может тут есть анон который с биомед. cv сектором работает? Пожалуйста отзовись, расскажи о специфике, тяжело ли искать работу и.... авось о проектах, была не была
728 1955954
>>55504

> Нам памаХает


Вроде не явно там прям заметно.
В любом случае, она ахуенная. Ебал бы и ебал.

>>55905
Тред перекатили давно. Там спроси.
https://2ch.hk/pr/res/1947549.html (М)
729 1959216
Сап двач, есть одна функция автокорреляции. Как по ней сгенерировать рандомные данные?
730 1959582
>>59216
из нее генерируешь power spectrum, из power spectrum делаешь amplitude spectrum присваивая рандомные фазы. Ну и обратное FFT
731 1959663
>>59582
Ну как-то не очень. Иногда выходит достаточно близко, иногда пикрил 1. Попробовал так, попробовал еще вариант через многомерное нормально распределение (https://stats.stackexchange.com/a/29240), но результат такой же нестабильный, пикрил 2. Нашел вариант сделать это через авторегрессию, но пока не проверил.
https://pastebin.com/brXWPUw1
732 1960032
>>59663
вот это что?

> np.fft.fft(np.sqrt(corr))


может корень надо извлечь после FFT?

> ax2.plot(out_corr / max(out_corr))



Хороший график из одного сампла? Нужно усреднить по тысяче самплов, как минимум

Кстати, если применять правильные формулы, нормализацию и не надо делать
733 1960037
>>60032

>может корень надо извлечь после FFT?


Да, надо конечно, но результат еще хуже получается. Хотя я уже поменял эту строчку на scipy.signal.lfilter(np.sqrt(corr), 1, np.fft.ifft(noise)).
734 1960200
>>60037
врогонку у тебя сампл комплексный получается
спектр реального должен удовлетворять А(-o)=A(o)
735 1960202
>>60200
так: А(-o)=A*(o)
736 1961482
Куда копать в сторону программ самих изменяющих и дополняющих свой сорс код с минимальным участием человека? А также фишки когда прогу запускают в интернет и она по определённым запросам поисковиков "обучается" в чём-либо?
737 1962140
>>60200
И что?
>>60032

>Хороший график из одного сампла?


Ну да, а что?
738 1963196
Нужно сделать распозновалку болезней растений И одновременно оценивалку их характеристик (рост, вес, вид). Стоит все это пытаться сделать одной архитектурой или лучше распределить задачи по отдельным сетям? Т.е. просто сделать несколько параллельных сетей. Привязки к реальному времени нет. Растений много, большинство видов - салаты. Искал по подобным запросам, видел только распознователи видов и болезней в разных научных работах. Вроде как делают и сеть оценивающую вес отдельных растений по фото. Но это коммерческий продукт, а не науч. работа, инфы по реализации минимум. Собственно, что делать? Как вообще стоит подходить к подобным задачам? Если требуется что-то, аналог чего в полной мере найти не можешь, только частично.
739 1963197
>>63196
Параллельных, всмысле независимых. Т.е. одна сеть - болезни, другая - вид, третья - рост. Я понимаю, что, скажем при правильной оценке веса, нужно учитывать не просто размеры, но и тот же вид растения, но как у сети сделать одновременно и вывод "коэфицента веса" и еще с десяток выводов под виды, я не понимаю (сделать это адекватно, эффективно и без костылей).
740 1967542
Посоветуйте идею какой pet project можно склепать за неделю-две-три для интервью на data science стажёра? Из непосредственно deep learning'а имеются лишь самые базовые знания по nlp и cv.
741 1967543
>>67542
для резюме*
742 1967708
Тупейший вопрос.
Как накидать офлайн распознавалку рукописного текста?
без регистрации и смс
743 1968106
>>67542
Зачем тебе пет проект и кагглы для стажера? Ты сразу в Дип Майнд хочешь? Учишь базы теории, методов и библиотек. Идешь на hhru пишешь что Дата Сайентист и знаешь pytorch, numpy, scikit, pandas.
1) Тебе пишут.
2) Идешь на собес. Просишь от 80000 руб.
3) Нет успеха - репит.
У меня так и было. Дата сайентистом не работал до того. Писали активно. Твои пет проекты помогут только тебе лично запомнить библиотеки.
744 1968578
>>68106
да я хоть куда нибудь хочу.
и 80 слишком жирно лол. везде по 50-60к платят (до вычета налогов) стажёрам. джунам уже больше конечно.
мне пет прожект нужен чтобы хоть чем нибудь резюме заполнить.
можно было бы сказать что у меня в универе норм успехи, но это не так.
поэтому хоть как-нибудь продемонстрировать что я что-то умею нужно.
745 1968692
>>68578
Ну смотри, если вузик топовый - уже хорошо. Хотя если бы был топовый ты бы тут не спрашивал и уже имел бы опыт.

Далее, можешь упомянуть соревнования. И вообще на каггле можно практиковаться хорошо и датасеты качать для начала.

Пет-проекты, опять же, имеет значение если годная идея и релизовано грамотно. Но т.к. ты уже здесь спрашиваешь, значит идей нет, то можешь тупо гуглить варианты идей и реализовывать сам. Ясное дело тогда куча людей уже это сделали, но хотя бы практика и видно будет что айкью не ниже 80.

Можно курсы указать, но тогда нужно с сертификатом и платные (т.к. у них хоть какое-то минимальное ревью есть). Легче всего курсера какая-нибудь - не слишком дорого, долго, сложно + известный бренд. Т.е. опять хоть что-то.

Все это, кончено не имееет смысла если уже был хоть какой-то опыт, даже за еду.

Ну для стажера 60к в ДС хорошо наверное, в Зап. Европке в районе 1к ЕВР платят при чуть более дорогой жизни.
746 1968789
>>68692
вузик, конечно, топовый, но я мегараздолбай.
сертификаты мне не нужны думаю. нужно, наверное, хоть что-нибудь на каггле на бронзу попробовать накатать, одно соревнованьице. думаю припотеть можно и сделать.
но в целом спасибо.
747 1970976
помогите, я тупой. Задача придумать сеть, которая должна плюсовать и минусовать интеджеры. С одним нейроном и линейной функции можно простую сумму сделать. А как с минусом?
748 1974890
меня интересует ИИ.
Можно сказать уже сдал вводный предмет по ИИ в тех. вузе.
осоветуйте что лучше изучать если я еще не понял что конкретно меня интересует.
машинное обучение, нейронные сети, глубокое обучение или что то другое?
749 1974895
>>63197
Ты на верном пути, для разных задач используй разные детекторы одной нйронкой это оче тяжкая задача, не неразрешимая, но обучение и интерференс будут долгими и не всегда нужно опознавать болезнь ведь, просто узнать вид например.. Как вариант аутпут детектора вида растений подавать на вход к распознаватель болезней. Датасет нужен ебический, это самое сложное будет.
750 1979141
>>20026 (OP)
Хочу сделать чат-бота на паскале. В обычные алгоритмы могу, но обычными алгоритмами чат-бот не получается. Простой нейрон могу закодировать, могу объединить в сеть. Но что дальше с этими нейронами делать - не понимаю. Какие-то циферки ввожу и вывожу, а как из этого бота сделать? Вот реально тёмный лес какой-то, что с нейроном делать? Куда подключать? Как символы из строки вводить в нейрон, чтобы он мне сказал, какие символы получил? Не понимаю...
kakkova-huya.png257 Кб, 621x133
751 1979419
проиграл с текущего статуса итт и треда реверсеров.
752 1979445
>>79141
у НИКОЛАЮОУСА ВИРТА на стене висит картина (НЕ МАСПОМ) с карандашиками разной длины, толщины и прочих параметров (МАНЯФОЛД) и подпись снизу (на АНГЛИЙСКОМ): "world best word processors". Поводм всем нам ЗАДУМАТЬСЯ
753 1979454
>>79419
Чего?
754 1979820
>>70976
плюсуют и минусуют в классах коррекции за охраняемым школьным периметром
пока вы не научитесь грамотно изъясняться, вам здесь нечего делать.
Screenshot from 2021-04-02 02-36-44.png43 Кб, 601x423
755 1983808
умоляю объясните для чего нужна constant
756 1983840
Тред утонул или удален.
Это копия, сохраненная 12 мая 2021 года.

Скачать тред: только с превью, с превью и прикрепленными файлами.
Второй вариант может долго скачиваться. Файлы будут только в живых или недавно утонувших тредах. Подробнее

Если вам полезен архив М.Двача, пожертвуйте на оплату сервера.
« /pr/В начало тредаВеб-версияНастройки
/a//b//mu//s//vg/Все доски