Думаешь мекс понимает зачем нужно сдувать листья с луж во время дождя или немного погодя?Сабина писал(а): Сб янв 27, 2018 10:20 pm А я не первый раз слышу что основные сложности связаны именно со сбоорм данных
Что стреляет лучше по баблу Spark или ML?
- Мальчик-Одуванчик
- Уже с Приветом
- Сообщения: 15526
- Зарегистрирован: Чт сен 27, 2007 5:53 pm
Re: Что стреляет лучше по баблу Spark или ML?
-
- Уже с Приветом
- Сообщения: 5106
- Зарегистрирован: Пн окт 18, 2004 8:46 pm
Re: Что стреляет лучше по баблу Spark или ML?
Безусловно, ЕТЛ - важная часть любой работы, и там много своих подводных камней. Поэтому и существует разделение труда для дейта инженеров и ученых (те, кто модели строит). Конечно, между ними есть "пересечения". Ученые сами обрабатывают данные, но скорее уже в "конечной таблице", а вот эту самую "таблицу" им инженеры по данным и подготавливают обычно из разных источников. Причин для разделения труда несколько. Основная - ЕТЛщики не умеют, а ученые не хотят заниматься другими вещами. Если следовать данной классификации, я очень сомневаюсь по поводу приведенной выше цифре относительно времени. Хотя задачи, конечно, разные бывают. Одна из задач ученых - донести до бизнеса, что они делают. А это может стать большой проблемой в силу непонимания бизнесом, что происходит. Поэтому в такой момент на первый план и выходит квалификация ученого. А если такой ученый строит модели путем вызова функции с известным ему названием (например, линейная регрессия), хорошего не жди. Далее - интерпретация результатов. Типа две кривые не совпадают, значит результаты разные. Про т-тесты, лог-ренк, кай большинство понятия не имеет. Именно здечь и причина в хорошем знании математики. А если бы вы слышали "научные" перлы, которые нередко на митингах проскакивают. Благо кроме пары человек маразма происходящего никто не замечает. А потом перл и замять можно.Сабина писал(а): Сб янв 27, 2018 10:46 pm обычный etl в случае бигдата не совсем обычный. впрочем и обычный немало времени занимает![]()

-
- Уже с Приветом
- Сообщения: 5106
- Зарегистрирован: Пн окт 18, 2004 8:46 pm
Re: Что стреляет лучше по баблу Spark или ML?
На этот вопрос уже ответил Эдуард Бернштейн очень много лет назад. Пероводя на современный язык - главное бабло срубить, а остальное (результат) не важно. А вообще принципы типа пускания пыли в глаза и навешивания лапши на уши - очень полезные в современной работе.Мальчик-Одуванчик писал(а): Вс янв 28, 2018 1:50 amДумаешь мекс понимает зачем нужно сдувать листья с луж во время дождя или немного погодя?Сабина писал(а): Сб янв 27, 2018 10:20 pm А я не первый раз слышу что основные сложности связаны именно со сбоорм данных

-
- Уже с Приветом
- Сообщения: 19041
- Зарегистрирован: Ср янв 11, 2012 3:25 am
- Откуда: CA
Re: Что стреляет лучше по баблу Spark или ML?
Если он понимает и более того в один день придумает машину, которая это все делает в разы лучше и быстрее, то из него может полуится Илон МаскМальчик-Одуванчик писал(а): Вс янв 28, 2018 1:50 amДумаешь мекс понимает зачем нужно сдувать листья с луж во время дождя или немного погодя?Сабина писал(а): Сб янв 27, 2018 10:20 pm А я не первый раз слышу что основные сложности связаны именно со сбоорм данных

https://www.youtube.com/watch?v=wOwblaKmyVw
- Sergunka
- Уже с Приветом
- Сообщения: 34164
- Зарегистрирован: Вс дек 03, 2000 4:01 am
- Откуда: Vladivostok->San Francisco->Los Angeles->San Francisco
Re: Что стреляет лучше по баблу Spark или ML?
Сегодня сделал сертификацию по первому курсу на четыре недели. Очень толковый курс с правильным подходом.Sergunka писал(а): Пн дек 18, 2017 4:47 pmЯ уже вписался в этот курс. Хотелось бы за бабосы поговорить?Chessplayer писал(а): Пн дек 18, 2017 1:18 am Если хотите взять быка за рога, то разбирайтесь в deep learning:
https://www.coursera.org/specializations/deep-learning![]()
По спарку сейчас гоняем связку кашка-спарки-кассандра

"A patriot must always be ready to defend his country against his government." Edward Abbey
- Мальчик-Одуванчик
- Уже с Приветом
- Сообщения: 15526
- Зарегистрирован: Чт сен 27, 2007 5:53 pm
Re: Что стреляет лучше по баблу Spark или ML?
Может хоть Маск додумается что нефиг сдувать листья в дождливую погоду.Сабина писал(а): Вс янв 28, 2018 10:50 amЕсли он понимает и более того в один день придумает машину, которая это все делает в разы лучше и быстрее, то из него может полуится Илон МаскМальчик-Одуванчик писал(а): Вс янв 28, 2018 1:50 amДумаешь мекс понимает зачем нужно сдувать листья с луж во время дождя или немного погодя?Сабина писал(а): Сб янв 27, 2018 10:20 pm А я не первый раз слышу что основные сложности связаны именно со сбоорм данных. А мекс или кто - дело десятое