Физик-Лирик wrote:Вы в какой области из перечисленных будете искать работу? Например для ЕТЛ достаточно освоить Пиг (что несложно), Хай (практически сиквел), Хадуп, Спарк (собственно годятся на Хадупе под Ярном). Собственно вот и начало для ЕТЛ больших данных. С предиктив аналитикс дело более тонкое.
Вообще, я на мой сегодняшний баркас пошел из-за того что обещали (хе-хе!) биг дату. И еще потому что это был контракт. И сначала все было замечательно, я написал ETL-программень с использованием Хадупа, коснулся Терадаты (но как обычного DataSource), засосал все в Монго, и все на AWS, т.е. прогресс в резюме был на лице. Но потом что-то пошло не так (не по моей вине а из-за смещения приоритетов у начальства) и в итоге я занимаюсь голимым быдлокодингом. Причем, так как я предложение поженицца отверг, на меня еще и смотрят как на врага народа, типа "не командный игрок". А командные игроки хреначат и вечерами и по выходным. А я лаптоп в 5 закрыл и досвидос амигос.
Так что начну подготовку с ETL-стэка, потом перейду на Спарк MLLib, стандартной дорогой: statistics, regressions для начала. Я просмотрел теорию, я же это все когда-то применял в своей недолгой инженерной деятельности в СССР, но сейчас конечно подзабыл, но вспоминается легко. Но программы конечно другие. У меня вот до сих в башке названия древних фортрановских пакетов конца 80-х засели - DECOMP и SOLVE.
Что до серьезной аналитики и обучаемых систем, то посмотрим как пойдет с азами. Но торопицца мне не куда, на птицеферму я в любом случае больше не пойду, а на дату какую-нить халтурку срублю.