Объяснение функции канкад 0:05 Функция канкад используется для объединения данных из структуры сири или дата фрейм в одну общую структуру дата фрейм. Объяснение принципов работы функции на примере вертикального и горизонтального конкатирования.
Дейта-бейс стайл подход 6:14 Реляционные базы данных используют специальный язык запросов сквель для объединения таблиц. Оператор джоя в сквель объединяет данные из двух таблиц, используя ключ для идентификации совпадений. В пандас аналогом джоя являются функции мерч и джоэн.
Примеры объединения таблиц 10:13 Объединить две таблицы с идентификаторами сотрудников и проектами, используя ключ айди сотрудника. Различные типы объединения: лефт, райт, аутер, кросс джоэн. Примеры результатов объединения с использованием различных типов объединения.
Объединение структур данных 14:53 Обсуждение причин, почему для большинства организаций не подходит хранение данных в одной большой таблице. Нормализация данных и использование реляционных баз данных.
Функция merge и ее аргументы 18:16 Лефт и райт - левая и правая структура для объединения. Хау - тип слияния структур (инер, аута, кросс, райт джоэн). Он, лефт он, райт он - имена столбцов для ключа. Сорт - сортировка данных в лексикографическом порядке. Сафикс - суффикс для пересекающихся имен столбцов. Индикаторы - добавление информационного столбца с информацией об исходных данных.
Примеры использования функции merge 21:27 Объединение двух дата фреймов с одинаковыми столбцами. Использование нескольких столбцов в качестве ключей. Пересекающиеся имена столбцов и использование суффиксов. Использование разных имен столбцов в качестве ключей.
Использование индекса в качестве ключа 30:10 Создаем датафрейм с индексом в качестве ключа, используя аргументы lft index и right index. Объединяем две структуры по их индексам, выступающим в качестве ключей для объединения.
Использование метода джоэн 31:29 Метод джоэн объединяет объекты датафреймов на основе их индекса, используя левое объединение (left join). Можно указать столбец, который будет использоваться в качестве ключа в левом датафрейме, используя аргумент on.
Объединение нескольких датафреймов в списке 33:52 Метод джойн можно применять к списку объектов датафреймов. Можно изменять порядок объединения, применяя метод джойн к разным датафреймам.