Нейромережі для розшифрування аудіо

Нейромережі для розшифрування аудіо

ШІ вміє не тільки генерувати картинки та текст, а й транскрибувати аудіо. Звичайно, нейромережі роблять це не так добре, як люди: доведеться підправити знаки та деякі помилки. Але якщо потрібно розшифрувати невеликий запис, а не тригодинну доповідь, такі сервіси цілком підійдуть. Зібрали кілька безкоштовних нейромереж для розшифрування аудіо.

Whisper

https://apps.apple.com/ru/app/whisper-transcription/id1668083311?mt=12

Ліміти: на безкоштовних моделях немає
Вартість: 9,99 $⁣ на місяць за просунуті моделі — більш швидкі та якісні

Додаток для macOS, який працює на нейромережі Whisper від компанії OpenAI. Безкоштовно доступні дві моделі, їх потрібно заздалегідь завантажити. Мова визначається автоматично. Сервіс якісно і швидко транскрибує, розставляє розділові знаки і розділяє текст на абзаци.

Riverside

https://riverside.fm/start

Ліміти: 2 години аудіо
Вартість: більше – від 15 $  на місяць.

Достатньо перетягнути файл на сайт, вибрати одну зі 100 мов і дочекатися транскрибації. Коректно розшифровує мову і розставляє розділові знаки. З мінусів — не поділяє спікерів у діалозі та не підтримує популярний формат M4A

Otter.AI

http://otter.ai/

Ліміти: 300 хвилин на місяць, 30 хвилин запису розмови за раз
Вартість: більше — від 8,33 $⁣  на місяць

Створено для розшифровки онлайн-зустріч. Записувати дзвінки не доведеться: сервіс можна підключити безпосередньо до Google Meets або Zoom. Поділяє мову спікерів, але підтримує лише англійську мову.

Оцініть статтю
Додати коментар