Используйте LLMs Для Извлечения Данных Из Текста (Экспертный Режим)

YOUTUBE · 26.11.2025 05:49

Ключевые темы и таймкоды

Извлечение текста с помощью языковых моделей

0:00
  • Видео объясняет, как использовать языковые модели для извлечения текста из PDF-файлов.
  • Евгений Юрцев создал библиотеку Core, которая упрощает процесс извлечения текста.

Создание схемы и цепочки экстракции

1:10
  • Создание схемы для извлечения информации о компании и инструменте.
  • Создание цепочки экстракции с использованием языковой модели и схемы.

Примеры использования Core

5:15
  • Извлечение информации о машине и ее частях.
  • Извлечение информации о финансовых прогнозах пользователя.

Извлечение информации о компаниях

8:28
  • Создание модели чата с использованием GPT-4.
  • Использование API Greenhouse для извлечения информации о вакансиях из списка компаний.

Анализ вакансий

9:07
  • Автор просматривает вакансии на сайте и анализирует их, используя Beautiful Soup для извлечения текста и Markdown для уменьшения количества токенов.
  • Создает объект для анализа и использует его для извлечения информации о зарплате и инструментах.

Использование OpenAI

13:02
  • Автор использует OpenAI для определения стоимости анализа вакансий и рекомендует сократить количество HTML-кода для экономии ресурсов.
  • Автор предлагает использовать список из тысячи различных компаний для анализа и сохранять результаты для дальнейшего использования.