как живется data scientistам нынче?

Сабина · Post by **Сабина** » 02 Mar 2016 00:43

shokoladnitsaa wrote:
Сабина wrote:Dezyre:
Hadoop - https://www.dezyre.com/Hadoop-Training-online/19" onclick="window.open(this.href);return false;
Spark- https://www.dezyre.com/apache-spark-sca ... -online/38" onclick="window.open(this.href);return false;
R - https://www.dezyre.com/data-science-in- ... raining/37" onclick="window.open(this.href);return false;
Python - https://www.dezyre.com/data-science-in- ... raining/36" onclick="window.open(this.href);return false;
Где на хакатоны записаться не нашла , но они всем участникам курсов предлагают, чтото вроде 20 в несяц, там чисто для тех кто хочет в Data Science
Спасибо, Сабина, тоже буду смотреть Hadoop .Хочу пока ограничиться Хадупом И Хайвом

Make sense. Главное понимать последовательность:
Сначала был хадуп и весь его инструментарий, включая Hive. Они решали задачи как вообще справляться с Big Data
Но в какой то момент его перестало быть достаточно чтобы решать определённые задачи вроде streaming и появился Спарк. Спарк работает "поверху Hadoop технологий" (HDFS ), но это следующее поколение и вся аналитика сейчас в Спарке по самые уши. То есть знание Хадупа или того же Хайва нужны чисто для понимания основ.
Вот хорошая речь Матея с недавнего Нью Йорского Spark Summit, - https://www.youtube.com/watch?v=B4nSMzsuaQw" onclick="window.open(this.href);return false;
Он объясняет где в наше время Спарк и какие задачи решает.
В общем хадуп стоит освоить, как основу, а потом "быренько" Спарк учить

x.angie · Post by **x.angie** » 03 Mar 2016 06:35

shokoladnitsaa wrote:Хочу пока ограничиться Хадупом И Хайвом

Не получится. Hadoop и Hive - это только части большой инфраструктуры Big Data. Там нужно всё рассматривать в комлексе.

Плюс, сейчас популрен real-time processing, когда данные молотятся в real-time, чего Hadoop не умеет. Поэтому, нужно смотреть и Spark (и его обвзяки) тоже. Что бы лучше понять Spark, возьмите какую-нибудь обзорную статью по Scala, будет лучше понятна концепция RDD, которая лежит в основе Spark. Статью по Scala и какой-нить high-level обзор по функциональщине.

Кстати, с последними новостями от бывш. Typesafe не понятна будущая судьба Scala, они были единственные кто двигал Scala как платформу в чёртов Enterprise. Так что скоро Scala маргинализируется, но Spark вроде бы переписывать не собираются (пока?).

Физик-Лирик · Post by **Физик-Лирик** » 03 Mar 2016 14:31

x.angie wrote: Кстати, с последними новостями от бывш. Typesafe не понятна будущая судьба Scala, они были единственные кто двигал Scala как платформу в чёртов Enterprise. Так что скоро Scala маргинализируется, но Spark вроде бы переписывать не собираются (пока?).

А я со Спарком как раз на Скале работаю. Что, теперь на Питон надо переключаться? А то я уже к Скале привык. Да и Спарковская библиотека по машинному обучению поддерживает Скалу. И с РДД на Скале с ее функциональным стилем неплохо работается. Все, кранты теперь?

valchkou · Post by **valchkou** » 03 Mar 2016 21:58

Физик-Лирик wrote:
x.angie wrote: Кстати, с последними новостями от бывш. Typesafe не понятна будущая судьба Scala, они были единственные кто двигал Scala как платформу в чёртов Enterprise. Так что скоро Scala маргинализируется, но Spark вроде бы переписывать не собираются (пока?).
А я со Спарком как раз на Скале работаю. Что, теперь на Питон надо переключаться? А то я уже к Скале привык. Да и Спарковская библиотека по машинному обучению поддерживает Скалу. И с РДД на Скале с ее функциональным стилем неплохо работается. Все, кранты теперь?

переходите на что то более вечное - на java.
загнется скала, спарк на яву перепишут, без вариантов. Он и так частичто на яве написан.
Потому корпы и не любят всякие там скалы, руби, closure.
Сегодня в тренде, а завтра забухал ведущий евангелист и язык вместе с ним ушел в небытие.
Я как раз начал скалу изучать, но пока не проникся чем же она лучше той же java 8.

x.angie · Post by **x.angie** » 04 Mar 2016 23:15

Физик-Лирик wrote:А я со Спарком как раз на Скале работаю. Что, теперь на Питон надо переключаться? А то я уже к Скале привык. Да и Спарковская библиотека по машинному обучению поддерживает Скалу. И с РДД на Скале с ее функциональным стилем неплохо работается. Все, кранты теперь?

Сейчас пока мне сложно ответить на этот вопрос. По сути, Typesafe были единственные, кто серьёзно пытался продвинуть Scala и её инфраструктуру (Scala, Akka, Play, Typesafe Activator, etc.) в чёртовом Enterprise. То что мы читаем между строк (со Scala не получилось, сорян, но мы будет двигать reactive programming в Enterprise всё равно, с нашим framework переделанным под интеллектуальное большинство), говорит о том, в ближайшее время массовой Scala в Enterprise мы не увидим. Нет Scala в Enterprise -> нет бизнеса/денег -> нет развития. Будет какое-то такое себе развитие в рамках комьюнити, но о лозунге "Scala - в массы!" можно забыть. А жаль. По моему мнению, Scala - это лучшее что случилось на JVM платформе. Плюс, будем посмотреть на Dotty.

Я не думаю что в ближайшем будущем мы увидим Spark переписанный на Java, но в среднесрочной или долгосрочной перспективе - очень даже может быть.

В общем, я для себя записал сделать reality check через шесть месяцев, посмотрим куда это всё будет идти.

x.angie · Post by **x.angie** » 04 Mar 2016 23:21

valchkou wrote:Я как раз начал скалу изучать, но пока не проникся чем же она лучше той же java 8.

Да ничем она не лучше, не забивайте себе голову. Её придумали что бы честные Java программисты зря тратили время, вместо написания еще одного REST microservices <ультра-модный в вечер пятницы buzzword> framework.

fruit6 · Post by **fruit6** » 05 Mar 2016 01:22

кто-нибудь видел скалу в настоящем ентерпрайзе? гиков которые готовы писать на чем угодно типа кложуре, лишь бы не жаба -- не в счет, много шума и понтов, мало черной икры на завтрак.

скалу учил, но за деньги не писал, сложилось впечатление что это кложуре дубль два - падение камнем вниз. как говорят: решает несуществующую проблему.
на кложуре писал, неудивительно что не взлетело.

Kolbasoff · Post by **Kolbasoff** » 05 Mar 2016 01:48

fruit6 wrote:много шума и понтов, мало черной икры на завтрак.

А это пять!! В загашник афоризмов, спасибо.

Физик-Лирик · Post by **Физик-Лирик** » 05 Mar 2016 03:09

fruit6 wrote:кто-нибудь видел скалу в настоящем ентерпрайзе? гиков которые готовы писать на чем угодно типа кложуре, лишь бы не жаба -- не в счет, много шума и понтов, мало черной икры на завтрак.

скалу учил, но за деньги не писал, сложилось впечатление что это кложуре дубль два - падение камнем вниз. как говорят: решает несуществующую проблему.
на кложуре писал, неудивительно что не взлетело.

Я писал на Скале / Спарке только в связи машинным обучением (обработка данных, алгоритмы), а так же использовал ММлиб. В принципе мне нравится.

Космос · Post by **Космос** » 05 Mar 2016 09:34

так что платят, дата сайнтисты ?

Действительно больше чем в любых других областях IT? Да или нет и насколько

...только не надо писать "зависит от опыта", "зависит от штата" и прочую пустоту ни о чем.
На сколько - статистику в студию!

Физик-Лирик · Post by **Физик-Лирик** » 05 Mar 2016 15:43

Космос wrote:так что платят, дата сайнтисты ? Действительно больше чем в любых других областях IT? Да или нет и насколько ...только не надо писать "зависит от опыта", "зависит от штата" и прочую пустоту ни о чем.
На сколько - статистику в студию!

Я могу только сказать по тем цифрам, которые я видел на сайтах работ, когда зарплату добавляют к описанию, и по разговорам с рекрутерами. На мой субъективный взгляд, платят в среднем так же как и девелоперам. Особо статистикой зарплат я не заморачивался. Так что я, честно говоря, не вижу особого смысла девелоперам становится Дейта сайнтистами в смысле денег. Просто в предиктив аналитику идут те, кто решил не связываться с академией. Одним из основным требованием на позицию Дейта сайнтиста, связанную с машинным обучением и статистикой, будет докторская степень или хотя бы мастер (предпочитают докторов). Для ЕТЛ Дейта сайнс достаточно бакалавра или мастера. Если есть желание перейти в область из соображений неденежного интереса - тогда другое дело.

Космос · Post by **Космос** » 07 Mar 2016 10:33

а цифры каковы?

я наблюдаю что в калифорнии полно даже mid позиций для data science на140К и senior 200К, чего не скажешь о software development.

Физик-Лирик · Post by **Физик-Лирик** » 07 Mar 2016 14:13

Космос wrote:а цифры каковы?
я наблюдаю что в калифорнии полно даже mid позиций для data science на140К и senior 200К, чего не скажешь о software development.

А цифры как раз от места и зависят.

А 140-200 для Кали - это больше или меньше чем для девелоперов? Мне кажется тот же диапазон. Похожие цифры видел для НЙ. Поменьше для Сиэттла. Но я детального анализа не проводил.

Космос · Post by **Космос** » 08 Mar 2016 00:43

я думаю что это на порядок больше чем Software Development. Где вы видели 140К на mid в Cali

KotKot · Post by **KotKot** » 08 Mar 2016 01:07

Космос wrote:я думаю что это на порядок больше чем Software Development. Где вы видели 140К на mid в Cali

В смысле, девелоперы получают 14 тыс в год?

Привет

как живется data scientistам нынче?

Re: как живется data scientistам нынче?

Re: как живется data scientistам нынче?

Re: как живется data scientistам нынче?

Re: как живется data scientistам нынче?

Re: как живется data scientistам нынче?

Re: как живется data scientistам нынче?

Re: как живется data scientistам нынче?

Re: как живется data scientistам нынче?

Re: как живется data scientistам нынче?

Re: как живется data scientistам нынче?

Re: как живется data scientistам нынче?

Re: как живется data scientistам нынче?

Re: как живется data scientistам нынче?

Re: как живется data scientistам нынче?

Re: как живется data scientistам нынче?