Нейросеть для перевода аудио в текст. Транскрибация от OpenAI: Whisper

YOUTUBE · 30.11.2025 08:55

Ключевые темы и таймкоды

Введение в нейросеть Whisper

0:00
  • Нейросеть от OpenAI переводит аудиофайлы в текст.
  • Установка проста и занимает около 7 минут.
  • Работает с любыми аудио и видео файлами, включая WAV, MP3 и видео.

Установка на Windows

0:59
  • Требуется версия Python не ниже 3.9.
  • Установка через командную строку, рекомендуется проверять каждый шаг.
  • Установка PyTorch и FFMPEG для поддержки различных форматов.

Настройка путей и переменных среды

2:57
  • Настройка путей для FFMPEG и PyTorch в переменных среды.
  • Использование Total Commander для отображения скрытых папок.
  • Проверка установки FFMPEG и PyTorch.

Установка Whisper

4:52
  • Установка Whisper через Git.
  • Запуск команды в командной строке для транскрибирования аудиофайлов.
  • Whisper определяет язык и создает текстовые файлы и субтитры.

Заключение и советы

6:50
  • Использование Total Commander для удобства.
  • Транскрипция видеофайлов различных форматов.
  • Важность командной строки и терпение в процессе установки.