Курс "Введение в науку о данных".
Nov. 16th, 2014 09:00 pm![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
За мной должок - я должен рассказать о курсе "Introduction to Data Science". Вообще-то, я его не закончил, уехав в отпуск. Но нежданно-негаданно пришло свидетельство об окончании, да ещё и с отличием! Выполненных заданий хватило на 82.6%. Курс проводится на "Курсере" Вашингтонским университетом (University of Washington), находящимся в Сиэтле. (не путать с Washington University и George Washington University !). Курс читает профессор Bill Howe. Лекции мне не очень понравились - они какие-то многословные, мне кажется, то, что читается в пятнадцатиминутном ролике, можно рассказать за три минуты. Однако, возможно и другое - я просто плохо понимаю язык, и многое просто пролетело мимо ушей, а в голове осталось только самое понятное.
Зато курс имеет интересные задания - два на языке Питон, который я учил больше года назад и успел подзабыть, два на языке R, который я учил полгода назад, но тоже подзабыл. Одно из заданий требовало сбор данных из Твиттера. Ещё одно задание было на языке Pig для Hadoop-а. Его требовалось выполнять на веб-серверах Амазона, заплатив за использование. Предполагалось, что это будет стоить $5-$10, но у меня вышло около 16 долларов. Ещё предлагалось установить виртуальную машину с Убунту, на которой установлены все нужные для курса программы. Я никогда не работал с виртуальными машинами, так что попробовал. Ещё одно задание по теме машинного обучения предполагало выполнение, хотя бы частичное, какой-либо задачи с kaggle.com. На этом сайте проводится своеобразное соревнование в решении некоторых более-менее практических задач. Я попробовал прогнозировать спрос на аренду велосипедов, среди участников я занял не самое последнее место, хотя и близко от зада. Я хочу как-нибудь вернуться к этой задаче.
В общем, курс рекомендую.
Зато курс имеет интересные задания - два на языке Питон, который я учил больше года назад и успел подзабыть, два на языке R, который я учил полгода назад, но тоже подзабыл. Одно из заданий требовало сбор данных из Твиттера. Ещё одно задание было на языке Pig для Hadoop-а. Его требовалось выполнять на веб-серверах Амазона, заплатив за использование. Предполагалось, что это будет стоить $5-$10, но у меня вышло около 16 долларов. Ещё предлагалось установить виртуальную машину с Убунту, на которой установлены все нужные для курса программы. Я никогда не работал с виртуальными машинами, так что попробовал. Ещё одно задание по теме машинного обучения предполагало выполнение, хотя бы частичное, какой-либо задачи с kaggle.com. На этом сайте проводится своеобразное соревнование в решении некоторых более-менее практических задач. Я попробовал прогнозировать спрос на аренду велосипедов, среди участников я занял не самое последнее место, хотя и близко от зада. Я хочу как-нибудь вернуться к этой задаче.
В общем, курс рекомендую.