Аудио в текст

Компания OpenAI представила новую нейросетевую модель под названием Whisper Turbo, способную с высокой скоростью преобразовывать аудиозаписи в текст. Whisper Turbo демонстрирует впечатляющую производительность: всего за 12 секунд он способен перевести в текстовый формат 2 минуты речи. По сравнению с предыдущими версиями модели, скорость обработки данных увеличилась в восемь раз. Данная модель поддерживает обработку разнообразных аудиофайлов, включая записи с микрофона любой длительности, а также видео. Whisper Turbo понимает русский язык и еще более ста других языков. Полученные текстовые данные можно экспортировать в форматах TXT и JSON для дальнейшего использования. Для ознакомления с возможностями модели в онлайн-режиме доступна демонстрационная версия: Протестировал ниже:

74 views

3801

1439