Парсинг сайтов PYTHON - #2 Работа с BEAUTIFUL SOUP (BS4), FAKE-USERAGENT

YOUTUBE · 01.12.2025 04:20

Ключевые темы и таймкоды

Введение и подготовка

0:00

Использование модуля BeautifulSoup для парсинга данных с сайта.
Подключение библиотеки BeautifulSoup и создание объекта для парсинга страницы.
Установка парсера XML.

Работа с BeautifulSoup

0:56

BeautifulSoup принимает теги HTML в качестве аргументов.
Поиск значений с помощью ID и классов.
Пример поиска значения JavaScript.

Поиск значений по ID

1:52

Использование ID для нахождения блока с JavaScript.
Применение методов find и find_all для поиска элементов.

Получение значения JavaScript

3:39

Нахождение блока с JavaScript внутри основного блока.
Получение значения «включён» или «выключен» с помощью метода text.

Поиск значений Flash и User-Agent

5:52

Поиск блока с Flash.
Получение значения User-Agent из первого тега span.
Корректировка кода для получения значения User-Agent без поиска по span.

Подмена User-Agent

7:59

Обход ограничений сайтов, проверяющих User-Agent.
Использование POST-запросов для передачи собственных параметров.
Передача заголовков с подменным User-Agent.

Использование модуля random_user_agent

11:15

Установка модуля random_user_agent.
Создание переменной с рандомным User-Agent.
Отправка запросов с подменным User-Agent для парсинга сайта.

Заключение и дополнительные примеры

12:12

Объяснение процесса парсинга HTML-кода.
Пример получения размера окна и ссылок.
Упоминание о планах на следующее видео: разбор POST-запросов и авторизация на сайте.