НИЯУ МИФИ19 September 2024 - 31 January 2025 г.Course started

Обработка данных на языке Python. Часть 2

Киреев Василий Сергеевичopenedu

Записаться на курс
В курсе продолжается изучение основных подходов и библиотеки обработки и визуализации данных в языке Python. Слушатели учатся методам работы с разными типами данных – от слабоструктурированных, до табличных, а также учатся решать практические задания по подготовке данных, с использованием открытых наборов данных и API. В курсе слушатели знакомятся с библиотеками, которые необходимы для эффективного решения широкого круга аналитических задач, такими как Ipython, Pandas, Numpy, Matplotlib и Scikit-learn, и др.
Модуль 1. Базовая обработка текстов. Регулярные выражения. Библиотека Re. Модуль 2. Базовый парсинг сайтов. Библиотекa BS4. Построение дерева тегов статической Html страницы. Модуль 3. Поиск аномальных значений. Восстановление пропущенных значений. Модуль 4. Квантование и перекодирование данных. Библиотека Sklearn. Модуль 5. Регрессионный анализ в Библиотеке Sklearn. Линейная регрессия. Модуль 6. Продвинутая обработка текстов. Векторизация текстовых данных с библиотекой Sklearn. Модуль 7. Работа  с языком SQL в файловой СУБД Sqlite3. Модуль 8. Модуль Random, генерация случайных подвыборок и оценка статистических характеристик исходной выборки.