Извлечение текста с помощью языковых моделей 0:00 Видео объясняет, как использовать языковые модели для извлечения текста из PDF-файлов. Евгений Юрцев создал библиотеку Core, которая упрощает процесс извлечения текста.
Создание схемы и цепочки экстракции 1:10 Создание схемы для извлечения информации о компании и инструменте. Создание цепочки экстракции с использованием языковой модели и схемы.
Примеры использования Core 5:15 Извлечение информации о машине и ее частях. Извлечение информации о финансовых прогнозах пользователя.
Извлечение информации о компаниях 8:28 Создание модели чата с использованием GPT-4. Использование API Greenhouse для извлечения информации о вакансиях из списка компаний.
Анализ вакансий 9:07 Автор просматривает вакансии на сайте и анализирует их, используя Beautiful Soup для извлечения текста и Markdown для уменьшения количества токенов. Создает объект для анализа и использует его для извлечения информации о зарплате и инструментах.
Использование OpenAI 13:02 Автор использует OpenAI для определения стоимости анализа вакансий и рекомендует сократить количество HTML-кода для экономии ресурсов. Автор предлагает использовать список из тысячи различных компаний для анализа и сохранять результаты для дальнейшего использования.