Парсинг сайтов PYTHON - #2 Работа с BEAUTIFUL SOUP (BS4), FAKE-USERAGENT

YOUTUBE · 01.12.2025 04:20

Ключевые темы и таймкоды

Введение и подготовка

0:00
  • Использование модуля BeautifulSoup для парсинга данных с сайта.
  • Подключение библиотеки BeautifulSoup и создание объекта для парсинга страницы.
  • Установка парсера XML.

Работа с BeautifulSoup

0:56
  • BeautifulSoup принимает теги HTML в качестве аргументов.
  • Поиск значений с помощью ID и классов.
  • Пример поиска значения JavaScript.

Поиск значений по ID

1:52
  • Использование ID для нахождения блока с JavaScript.
  • Применение методов find и find_all для поиска элементов.

Получение значения JavaScript

3:39
  • Нахождение блока с JavaScript внутри основного блока.
  • Получение значения «включён» или «выключен» с помощью метода text.

Поиск значений Flash и User-Agent

5:52
  • Поиск блока с Flash.
  • Получение значения User-Agent из первого тега span.
  • Корректировка кода для получения значения User-Agent без поиска по span.

Подмена User-Agent

7:59
  • Обход ограничений сайтов, проверяющих User-Agent.
  • Использование POST-запросов для передачи собственных параметров.
  • Передача заголовков с подменным User-Agent.

Использование модуля random_user_agent

11:15
  • Установка модуля random_user_agent.
  • Создание переменной с рандомным User-Agent.
  • Отправка запросов с подменным User-Agent для парсинга сайта.

Заключение и дополнительные примеры

12:12
  • Объяснение процесса парсинга HTML-кода.
  • Пример получения размера окна и ссылок.
  • Упоминание о планах на следующее видео: разбор POST-запросов и авторизация на сайте.