Google Speech-to-Text для русского: обзор и альтернативы
Google Speech-to-Text — один из лидеров мирового рынка распознавания речи. Разбираем, как он работает с русским и стоит ли его использовать в 2026 году.
Что такое Google Speech-to-Text
Google Speech-to-Text — облачный API распознавания речи от Google Cloud. Запущен в 2017, в 2026 году поддерживает 125+ языков, включая русский. Это не готовый сервис «загрузил-получил», а API для разработчиков — нужно писать код или использовать сторонние обёртки.
Точность на русском языке
По данным Google: WER на русском составляет 4-6% на чистом аудио. На практике (наши тесты на 50 часах разнородных записей):
|---|---|---|
Google уступает специализированным моделям на русском, потому что модель тренирована больше на английском (~50% данных). Для интернациональных проектов с поддержкой 125 языков — Google логичный выбор. Для чистого русского — есть варианты лучше.
Цена
Google Speech-to-Text работает по модели pay-per-use:
Для часа аудио: $3.84-5.76 (~340-510 ₽). Это в 5-7 раз дороже Dicto и в 5 раз дороже Яндекса.
Доступность из РФ в 2026
С 2022 года Google Cloud прекратил приём новых клиентов из России. Существующие аккаунты работают, но оплата возможна только зарубежной картой. Технически API доступен — нужен VPN для управления через консоль и зарубежная карта для оплаты. Это превращает простой сервис в сложный proxy-проект.
Дополнительные сложности:
Как использовать в 2026
Три варианта:
Альтернативы Google для русского
|---|---|---|---|
Когда Google Speech-to-Text всё-таки имеет смысл
Когда выбирать Dicto вместо Google
Вывод
Google Speech-to-Text в 2026 году для русских проектов — overkill: дороже, юридически сложнее, по точности уступает специализированным русским моделям. Для международных проектов на 50+ языках с реалтайм-стримингом — отличный выбор. Для типичных задач транскрибации на русском — Dicto, Yandex или Сбер выгоднее.
Попробуйте Dicto бесплатно
180 минут на тест при регистрации. AI-саммари, разметка спикеров — без карты.
Начать бесплатно