Используйте LLMs Для Извлечения Данных Из Текста (Экспертный Режим)

YOUTUBE · 26.11.2025 05:49

Ключевые темы и таймкоды

Извлечение текста с помощью языковых моделей

0:00

Видео объясняет, как использовать языковые модели для извлечения текста из PDF-файлов.
Евгений Юрцев создал библиотеку Core, которая упрощает процесс извлечения текста.

Создание схемы и цепочки экстракции

1:10

Создание схемы для извлечения информации о компании и инструменте.
Создание цепочки экстракции с использованием языковой модели и схемы.

Примеры использования Core

5:15

Извлечение информации о машине и ее частях.
Извлечение информации о финансовых прогнозах пользователя.

Извлечение информации о компаниях

8:28

Создание модели чата с использованием GPT-4.
Использование API Greenhouse для извлечения информации о вакансиях из списка компаний.

Анализ вакансий

9:07

Автор просматривает вакансии на сайте и анализирует их, используя Beautiful Soup для извлечения текста и Markdown для уменьшения количества токенов.
Создает объект для анализа и использует его для извлечения информации о зарплате и инструментах.

Использование OpenAI

13:02

Автор использует OpenAI для определения стоимости анализа вакансий и рекомендует сократить количество HTML-кода для экономии ресурсов.
Автор предлагает использовать список из тысячи различных компаний для анализа и сохранять результаты для дальнейшего использования.