Создание голосового пакета

Руководство по созданию голосового пакета для роботов-пылесосов

Процесс создания голосового пакета

Создание голосового пакета для робота-пылесоса состоит из 5 основных шагов:

Выбор модели — поиск и выбор поддерживаемого робота-пылесоса
Настройка фраз — выбор голоса или загрузка аудиофайлов для каждой фразы
Предпросмотр — проверка всех настроенных фраз перед сборкой
Выбор проекта — создание нового проекта или выбор существующего
Сборка — генерация финального голосового пакета

Шаг 1: Выбор модели робота

Первым шагом выберите модель вашего робота-пылесоса из списка поддерживаемых устройств.

Используйте строку поиска для быстрого нахождения модели по названию или бренду (Xiaomi, Roborock, Dreame, Ecovacs и др.).

Модели отображаются по 12 штук на странице с возможностью пагинации. Каждая карточка показывает изображение и название модели. Выберите вашу модель, чтобы перейти к настройке голосовых фраз.

Шаг 2: Настройка голосовых фраз

После выбора модели откроется интерфейс настройки фраз. В верхней части отображается прогресс-бар, показывающий процент готовности голосового пакета.

Управление списком фраз

Поиск — ищите фразы по оригинальному или изменённому тексту
Фильтрация — показывайте все фразы, только настроенные или только не настроенные
Сворачивание — сверните или разверните все фразы для удобства навигации

Для каждой фразы доступны два режима настройки:

Режим TTS (синтез речи)

Используйте этот режим для автоматической генерации голоса нейросетью:

Введите текст — измените текст фразы при необходимости (см. правила оформления текста)
Выберите голос — используйте фильтры:
- Язык (русский, английский, немецкий, испанский, французский)
- Пол (мужской/женский)
- Поиск по названию и тегам
- Добавление в избранное для быстрого доступа
Прослушайте пример — нажмите кнопку воспроизведения рядом с голосом
Сгенерируйте — нажмите кнопку генерации для создания аудио

Сохраняйте часто используемые голоса в избранное (звёздочка) для быстрого доступа в будущем.

Режим загрузки файла

Загрузите собственный аудиофайл вместо синтеза речи:

Нажмите "Загрузить файл" — выберите аудиофайл (MP3, WAV, OGG до 20MB)
Отредактируйте аудио при необходимости:
- Обрезка — потяните границы на waveform для выбора начала и конца фрагмента
- Громкость — регулировка от 10% до 300% с предварительным прослушиванием
Воспроизведите — проверьте результат перед сохранением

Шаг 3: Предпросмотр

Когда все фразы настроены, нажмите кнопку "Предпросмотр" для проверки результатов.

На экране предпросмотра вы увидите:

Сводку настроенных фраз (количество / общее число)
Список всех фраз с информацией о голосе или загруженном файле
Кнопки воспроизведения для каждой фразы

Убедитесь, что хотя бы одна фраза настроена, прежде чем переходить к сборке.

Шаг 4: Выбор проекта

После предпросмотра выберите проект для сохранения голосового пакета.

Доступные варианты:

Существующий проект — выберите из списка ваших проектов (поиск по названию)
Новый проект — введите название и пройдите проверку CAPTCHA

При выборе опубликованного проекта вы увидите предупреждение. Рекомендуется создавать отдельные проекты для разных версий голосовых пакетов.

Шаг 5: Сборка голосового пакета

После выбора проекта начнётся автоматическая сборка голосового пакета.

Процесс сборки включает следующие стадии:

draft — начальное состояние
started — сборка запущена
building — обработка аудиофайлов
completed — голосовой пакет готов
failed — ошибка сборки (будет показано сообщение)

Прогресс отображается в процентах с визуальным индикатором. После успешной завершения вы будете автоматически перенаправлены на страницу версий проекта.

Советы и рекомендации

Выбор голоса

Выбирайте голос, соответствующий языку вашей модели робота
Прослушайте пример голоса перед генерацией всех фраз
Используйте один голос для всех фраз для согласованности
Сохраняйте понравившиеся голоса в избранное

Работа с аудиофайлами

Используйте форматы MP3, WAV или OGG
Максимальный размер файла — 20MB
Автоматическая конвертация в WAV происходит при загрузке
Функция обрезки позволяет точечно настроить начало и конец фразы

Автосохранение

Все изменения автоматически сохраняются каждые 500мс
При случайном обновлении страницы работа восстанавливается из localStorage
Session ID отслеживает прогресс сборки на сервере

Лучшие практики

Начните с синтеза TTS для быстрого прототипирования
Используйте обрезку для точной настройки длительности фраз
Регулируйте громкость для согласованности между фразами
Используйте коррекцию произношения для улучшения качества синтеза
Создавайте отдельные проекты для разных версий голосовых пакетов
Проверяйте результаты на этапе предпросмотра

Возможные проблемы

Ошибки генерации TTS

Пустой текст — убедитесь, что текст фразы не пустой
Неподдерживаемые символы — используйте только буквы, цифры и знаки препинания (см. правила оформления текста)
Ошибка сети — проверьте подключение к интернету и попробуйте снова

Проблемы с загрузкой файлов

Неподдерживаемый формат — используйте MP3, WAV или OGG
Файл слишком большой — максимальный размер 20MB
Повреждённый файл — убедитесь, что файл воспроизводится в плеере

Ошибки сборки

Нет настроенных фраз — настройте хотя бы одну фразу перед сборкой
Ошибка сервера — подождите несколько минут и попробуйте снова
Превышен лимит — обратитесь в поддержку, если проблема повторяется

При возникновении проблем вы можете воспользоваться формой обратной связи или связаться с поддержкой через Telegram.

Прежде чем начать синтез, убедитесь, что текст оформлен правильно. Очень важно соблюдать правила пунктуации. Каждое предложение должно заканчиваться соответствующим знаком препинания, после которого следует пробел. В тексте допускаются только буквы выбранного языка, цифры и знаки препинания. Любые другие символы недопустимы. При несоблюдении рекомендаций, генерация может работать некорректно или вовсе вызвать ошибку.

Коррекция произношения

Не все голоса могут поддерживать функции коррекции произношения.

Ударение

Если требуется изменить ударение в слове, используйте знак + перед гласной буквой.

З+амок, зам+ок. Л+иса, лис+а. В+орона, вор+она.

Пауза

Чтобы сделать паузу, используйте более одного тире. Каждый последующий знак тире равен паузе 0.3-0.5 секунд, за исключением первого.

Подождем одну секунду --- теперь скажем.
Подождем две секунды ----- теперь скажем.

Акцент на слово

Используйте знак + перед словом, как это показано ниже.

+Вы сегодня подписываете договор?
Вы сегодня подписываете +договор?