Ксения, с точки зрения своего опыта, рассказала про главные грабли, на которые может наступить молодой аналитик.
Data mining на практике. Подводные камни анализа данных / Ксения Петрова / COO dmlabs.org
Презентация: www.slideshare.net/WG_Talks/data-mining-dmlabsorg
DataTalks — неформальные встречи бизнес-аналитиков и специалистов в области анализа данных.
Присоединяйтесь к нашей группе на LinkedIn: www.linkedin.com/groups?gid=6788018
Техносфера Mail.ru Group, МГУ им. М.В. Ломоносова.
Курс «Алгоритмы интеллектуальной обработки больших объемов данных», Лекция №1 — «Задачи Data Mining»
Лектор — Николай Анохин
Обзор задач Data Mining.
Стандартизация подхода к решению задач Data Mining.
Процесс CRISP-DM.
Виды данных.
Кластеризация, классификация, регрессия.
Понятие модели и алгоритма обучения.
Техносфера Mail.ru Group, МГУ им. М.В. Ломоносова.
Курс «Алгоритмы интеллектуальной обработки больших объемов данных», Лекция №2 «Задача кластеризации и ЕМ-алгоритм»
Лектор — Николай Анохин
Постановка задачи кластеризации. Функции расстояния. Критерии качества кластеризации. EM-алгоритм. K-means и модификации.
Что такое Data Mining?
Знакомство с Data Mining.
основные задачи Data Mining.
Применение Data Mining для решения задачи классификации.
Применение Data Mining для решения задачи регрессии.
Автоматизация интеллектуального анализа данных.
//Перезалили 2-ю лекцию. Теперь ее можно смотреть с мобильных устройств.
Краткое описание второй лекции (Week 0, continued):
В этот раз @David Malan и его помощники отправились в (не такой уж) далекий Коннектикут, в Йельский университет.
Студенты этого представителя «Лиги плюща» с энтузиазмом приняли гарвардскую команду, и узнали много нового из лекции, а именно:
• Что такое алгоритмы. Казалось бы, такое простое понятие, но на самом деле алгоритмизовать даже столь элементарный процесс, как намазывание арахисового масла на тост совсем не просто. Ребята вам это покажут на практике=).
• Как эффективно посчитать количество людей в аудитории? У нас есть такой алгоритм.
• Есть такое английское выражение “From Scratch”. Переводится оно как «С самого начала». Но можно также перевести как «Начиная со Scratch», если слово Scratch понимать как специальный учебный язык программирования. Так вот, вас познакомят со Scratch — замечательной разработкой Массачусетского технологического университета и покажут, как писать с её помощью программки.
А еще вы увидите, какие шедевры на Scratch написали студенты CS50 прошлых годов=).
Машинное обучение представляет собой новую парадигму программирования, где вместо явного задания правил на таком языке программирования как Java или C, вы создаете систему, которая сама выводит эти правила, обучаясь на данных. Но как это выглядит на самом деле? В первой части серии «Машинное Обучение: Zero to Hero» Макс Горбунов показывает простой пример создания модели машинного обучения, объясняя идеи, которые мы применим в последующих эпизодах к более интересной проблеме – машинному зрению.
Попробуйте сами запустить этот аналог Hello World для Машинного Обучения → goo.gle/2Zp2ZF3
psystatistica.ru
Внимание: вы можете помочь проекту
ЯндексДеньги 4100145059554
киви 79095835699
Друзья, мы хотим расширять область своей деятельности. Мы хотим преподавать мат.статистику не только в рамках этого курса, но и всеобъемлюще. Мы хотим рассказать про все методы мат.статистики, которые есть в программах SPSS, Statistica, но также и в других программах, типа SAS, Eviews, Stata, r-statistics и так далее. Если такое сделать, этому курсу не будет аналогов в мире. Будут сотни подробных видеоуроков о разных методах статистики в разных программных средах. Однако, без финансовой помощи нам не справиться. Каждый может внести свой любой вклад в развитие этого полезного для всех дела.
Источник — postnauka.ru/video/49443
В чем заключаются сильные и слабые стороны анализа данных? Как проверить наблюдаемые паттерны? Как методы анализа данных помогают формировать новые концепции? На эти и другие вопросы отвечает доктор технических наук Борис Миркин.