Подробный разбор MERGE, JOIN & CONCAT. Типы объединения таблиц и Database-style подход в pandas.

YOUTUBE · 01.12.2025 09:40

Ключевые темы и таймкоды

Объяснение функции канкад

0:05
  • Функция канкад используется для объединения данных из структуры сири или дата фрейм в одну общую структуру дата фрейм.
  • Объяснение принципов работы функции на примере вертикального и горизонтального конкатирования.

Дейта-бейс стайл подход

6:14
  • Реляционные базы данных используют специальный язык запросов сквель для объединения таблиц.
  • Оператор джоя в сквель объединяет данные из двух таблиц, используя ключ для идентификации совпадений.
  • В пандас аналогом джоя являются функции мерч и джоэн.

Примеры объединения таблиц

10:13
  • Объединить две таблицы с идентификаторами сотрудников и проектами, используя ключ айди сотрудника.
  • Различные типы объединения: лефт, райт, аутер, кросс джоэн.
  • Примеры результатов объединения с использованием различных типов объединения.

Объединение структур данных

14:53
  • Обсуждение причин, почему для большинства организаций не подходит хранение данных в одной большой таблице.
  • Нормализация данных и использование реляционных баз данных.

Функция merge и ее аргументы

18:16
  • Лефт и райт - левая и правая структура для объединения.
  • Хау - тип слияния структур (инер, аута, кросс, райт джоэн).
  • Он, лефт он, райт он - имена столбцов для ключа.
  • Сорт - сортировка данных в лексикографическом порядке.
  • Сафикс - суффикс для пересекающихся имен столбцов.
  • Индикаторы - добавление информационного столбца с информацией об исходных данных.

Примеры использования функции merge

21:27
  • Объединение двух дата фреймов с одинаковыми столбцами.
  • Использование нескольких столбцов в качестве ключей.
  • Пересекающиеся имена столбцов и использование суффиксов.
  • Использование разных имен столбцов в качестве ключей.

Использование индекса в качестве ключа

30:10
  • Создаем датафрейм с индексом в качестве ключа, используя аргументы lft index и right index.
  • Объединяем две структуры по их индексам, выступающим в качестве ключей для объединения.

Использование метода джоэн

31:29
  • Метод джоэн объединяет объекты датафреймов на основе их индекса, используя левое объединение (left join).
  • Можно указать столбец, который будет использоваться в качестве ключа в левом датафрейме, используя аргумент on.

Объединение нескольких датафреймов в списке

33:52
  • Метод джойн можно применять к списку объектов датафреймов.
  • Можно изменять порядок объединения, применяя метод джойн к разным датафреймам.