Большие данные и машинное обучение, лекция-3: табличные данные в Python, библиотека Pandas

- Качаем данные: датасет ILO (МОТ - Международная организация труда) - Таблица для анализа: средня зарплата по видам деятельности, полу, странам и годам - Загружаем данные из файла CSV - Pandas DataFrame - таблица, с которой можно делать что угодно (она же 2д-массив NumPy) - Произвольный доступ к данным: диапазон строк, диапазон колонок, доступ к отдельный ячейке - Оператор “квадратные скобки“ DataFrame[] vs [] - Pandas Series - отдельная колонка таблицы (она же 1д-массив NumPy) - Доступ к колонкам: через квадратные скобки по имени vs ООП-стиль через точку - Запросы к данным: фильтр строк по значениям, больше волшебства оператора “квадратные скобки“ - Фильтр данных по значениям строковых значений - Фильтр данных по диапазонам числовых значений - Составные фильтры: средняя зарплата в стране за выбранный диапазон лет - Разоблачение волшебства запросов через квадратные скобки: фильтрация данных массивом булевых значений - Поэлементные логические операторы NumPy - Статистические опер
Back to Top