Голос в текст на телефоне: iPhone и Android
Перевести голос в текст на телефоне можно встроенными средствами iPhone и Android или точнее — загрузив запись диктофона в Dicto. Пошаговый разбор.
Голос в текст прямо на телефоне: что реально работает
Телефон всегда под рукой, поэтому именно на нём чаще всего рождается идея «надо бы перевести голос в текст». Записали мысль на диктофон, сохранили голосовое из мессенджера, надиктовали черновик статьи — а дальше нужен текст, который можно искать, редактировать и отправлять.
Хорошая новость: и iPhone, и Android умеют переводить голос в текст из коробки. Плохая — встроенные инструменты заточены под короткие команды и диктовку «здесь и сейчас», а не под расшифровку готовой записи диктофона на 40 минут с двумя собеседниками. В этом гайде разберём оба пути: что встроено в систему, где этого не хватает, и как сделать запись диктофона в текст качественно через Dicto.
Голос в текст на iPhone
На iPhone есть два разных сценария, и их легко спутать.
Диктовка в реальном времени (клавиатура)
Если нужно надиктовать сообщение или заметку прямо сейчас:
- Откройте любое поле ввода (Заметки, Сообщения, Почта).
- Нажмите значок микрофона на клавиатуре.
- Говорите — текст появляется по мере речи.
- Знаки препинания произносите словами: «запятая», «точка», «новый абзац».
Это удобно для коротких заметок, но работает только онлайн-надиктовкой: расшифровать уже записанный файл так нельзя.
Запись диктофона (Голосовые заметки) в текст
Приложение Голосовые заметки (Voice Memos) пишет звук в формате m4a. Само по себе оно текст не делает — это просто рекордер. Чтобы получить диктофон в текст айфон, файл нужно отдать сервису распознавания:
- Откройте Голосовые заметки и найдите нужную запись.
- Нажмите на запись, затем кнопку «···» (Поделиться).
- Сохраните файл m4a в Файлы или отправьте себе.
- Загрузите его в Dicto — получите готовый текст с пунктуацией и спикерами.
Так вы обходите главное ограничение iPhone: встроенная диктовка не расшифровывает архив записей, а Dicto принимает m4a напрямую.
Голос в текст на Android
На Android картина похожая, но зависит от производителя.
Диктовка через Gboard
Клавиатура Gboard (стоит на большинстве Android) умеет переводить голос в текст на лету:
- Откройте поле ввода и вызовите клавиатуру.
- Нажмите значок микрофона.
- Диктуйте — система распознаёт речь в реальном времени.
Минусы те же, что и на iPhone: это онлайн-надиктовка для коротких фраз, а не расшифровка файла.
Запись рекордера в текст
Штатный рекордер (Запись, Voice Recorder, Диктофон) сохраняет аудио обычно в m4a или mp3. У некоторых моделей (например, Pixel) есть авто-транскрипция, но она:
- работает не на всех языках одинаково хорошо;
- не размечает спикеров надёжно;
- ограничена экосистемой конкретного бренда.
Универсальный путь — загрузить запись в облачный сервис:
- Откройте приложение рекордера и выберите запись.
- Нажмите «Поделиться» и сохраните файл m4a или mp3.
- Загрузите его в Dicto — поддерживаются m4a, mp3, wav, ogg и другие.
Подробнее о работе с записями именно как с файлами — в материале про [диктофон в текст](/diktofon-v-tekst).
Встроенный способ против Dicto: таблица
Сравним честно: для разных задач подходят разные инструменты.
| Параметр | Встроенная диктовка (iPhone/Android) | Dicto |
|---|---|---|
| Что переводит | речь в реальном времени | готовые файлы и ссылки |
| Запись диктофона (m4a, mp3) | нет, только надиктовка | да, загрузка файла |
| Точность (русский) | средняя, плывёт на длинных фразах | ~98% на движке Voxtral |
| Пунктуация | вручную голосом | авто-пунктуация |
| Разделение спикеров | нет | до 10 спикеров |
| Длинные записи | неудобно | до 6 часов / 500 МБ |
| AI-разбор | нет | саммари, тезисы, action items, RAG-чат |
| Экспорт | текст в поле ввода | TXT, SRT, DOCX |
Вывод простой: встроенная диктовка хороша для коротких заметок на ходу, а для записи диктофона в текст — длинных интервью, лекций, встреч — нужен полноценный сервис.
Как перевести запись диктофона в текст через Dicto
Dicto работает в браузере телефона, ставить приложение не нужно.
Шаг 1. Загрузите файл или вставьте ссылку
- Файл с телефона: выгрузите запись из Голосовых заметок (iPhone) или рекордера (Android) и загрузите m4a/mp3 в Dicto.
- Ссылка: если запись уже на YouTube, VK, Rutube, OK или Дзене — просто вставьте URL, скачивать ничего не нужно.
Шаг 2. Дождитесь расшифровки
Движок Voxtral обрабатывает примерно час аудио за 2 минуты. Точность — около 98% для русского и до 99% для английского, с авто-пунктуацией и разбивкой по спикерам (до 10 человек).
Шаг 3. Заберите текст и разбор
- Готовую расшифровку можно экспортировать в TXT, SRT или DOCX.
- AI сделает саммари, тезисы и action items, а через RAG-чат можно задавать вопросы прямо по записи.
Если параллельно вы расшифровываете голосовые из мессенджеров, пригодится гайд про [расшифровку голосовых](/rasshifrovka-golosovyh) — принцип тот же: файл или ссылка на вход, готовый текст на выходе.
Форматы, точность и безопасность
С телефона аудио чаще всего приходит в m4a (iPhone, многие Android) или mp3 — оба формата Dicto принимает напрямую, конвертировать ничего не нужно. Также поддерживаются wav, ogg и другие.
Несколько важных моментов:
- Лимиты: до 500 МБ и до 6 часов на запись. Если длительность превышает баланс, вы получите превью первых минут, чтобы оценить качество.
- Безопасность: РФ-хостинг (Selectel), соответствие 152-ФЗ, аудио автоматически удаляется через 7 дней.
- Цена входа: на тарифе Free доступно 30 минут и 1 AI-разбор бесплатно — этого хватит, чтобы проверить расшифровку своей записи. Дальше есть пополняемый кошелёк и пакеты вплоть до 140 часов; подробности на странице [тарифов](/pricing).
Если хочется сначала разобраться, как вообще расшифровать аудио без затрат, прочитайте отдельный разбор: [бесплатная расшифровка](/blog/kak-rasshifrovat-audio-besplatno).
Частые вопросы
Можно ли перевести голос в текст прямо на телефоне без программ?
Да, для коротких заметок: на iPhone — микрофон на клавиатуре или диктовка, на Android — голосовой ввод Gboard. Но это работает только как надиктовка в реальном времени. Чтобы расшифровать уже готовую запись диктофона, файл нужно загрузить в сервис вроде Dicto.
В каком формате iPhone сохраняет запись диктофона?
Приложение Голосовые заметки сохраняет звук в формате m4a. Этот файл можно сразу загрузить в Dicto — конвертация не требуется, как и для mp3 с Android.
Насколько точно распознаётся русская речь?
Dicto использует движок Voxtral с точностью около 98% для русского языка и до 99% для английского, с авто-пунктуацией и разделением до 10 спикеров. Встроенная диктовка телефона обычно заметно уступает на длинных и шумных записях.
Безопасно ли загружать личные записи?
Да. Файлы хранятся на серверах в России (Selectel), сервис соответствует 152-ФЗ, а исходное аудио автоматически удаляется через 7 дней после обработки.
Попробуйте Dicto бесплатно
Бесплатная проба при регистрации: 30 минут и AI-разбор. Разметка спикеров — без карты.
Начать бесплатно