Создание голосового пакета

Руководство по созданию голосового пакета для роботов-пылесосов

Процесс создания голосового пакета

Создание голосового пакета для робота-пылесоса состоит из 5 основных шагов:

  1. Выбор модели — поиск и выбор поддерживаемого робота-пылесоса
  2. Настройка фраз — выбор голоса или загрузка аудиофайлов для каждой фразы
  3. Предпросмотр — проверка всех настроенных фраз перед сборкой
  4. Выбор проекта — создание нового проекта или выбор существующего
  5. Сборка — генерация финального голосового пакета

Шаг 1: Выбор модели робота

Первым шагом выберите модель вашего робота-пылесоса из списка поддерживаемых устройств.

Используйте строку поиска для быстрого нахождения модели по названию или бренду (Xiaomi, Roborock, Dreame, Ecovacs и др.).

Модели отображаются по 12 штук на странице с возможностью пагинации. Каждая карточка показывает изображение и название модели. Выберите вашу модель, чтобы перейти к настройке голосовых фраз.


Шаг 2: Настройка голосовых фраз

После выбора модели откроется интерфейс настройки фраз. В верхней части отображается прогресс-бар, показывающий процент готовности голосового пакета.

Управление списком фраз

  • Поиск — ищите фразы по оригинальному или изменённому тексту
  • Фильтрация — показывайте все фразы, только настроенные или только не настроенные
  • Сворачивание — сверните или разверните все фразы для удобства навигации

Для каждой фразы доступны два режима настройки:

Режим TTS (синтез речи)

Используйте этот режим для автоматической генерации голоса нейросетью:

  1. Введите текст — измените текст фразы при необходимости (см. правила оформления текста)
  2. Выберите голос — используйте фильтры:
    • Язык (русский, английский, немецкий, испанский, французский)
    • Пол (мужской/женский)
    • Поиск по названию и тегам
    • Добавление в избранное для быстрого доступа
  3. Прослушайте пример — нажмите кнопку воспроизведения рядом с голосом
  4. Сгенерируйте — нажмите кнопку генерации для создания аудио

Сохраняйте часто используемые голоса в избранное (звёздочка) для быстрого доступа в будущем.

Режим загрузки файла

Загрузите собственный аудиофайл вместо синтеза речи:

  1. Нажмите "Загрузить файл" — выберите аудиофайл (MP3, WAV, OGG до 20MB)
  2. Отредактируйте аудио при необходимости:
    • Обрезка — потяните границы на waveform для выбора начала и конца фрагмента
    • Громкость — регулировка от 10% до 300% с предварительным прослушиванием
  3. Воспроизведите — проверьте результат перед сохранением

Шаг 3: Предпросмотр

Когда все фразы настроены, нажмите кнопку "Предпросмотр" для проверки результатов.

На экране предпросмотра вы увидите:

  • Сводку настроенных фраз (количество / общее число)
  • Список всех фраз с информацией о голосе или загруженном файле
  • Кнопки воспроизведения для каждой фразы

Убедитесь, что хотя бы одна фраза настроена, прежде чем переходить к сборке.


Шаг 4: Выбор проекта

После предпросмотра выберите проект для сохранения голосового пакета.

Доступные варианты:

  • Существующий проект — выберите из списка ваших проектов (поиск по названию)
  • Новый проект — введите название и пройдите проверку CAPTCHA

При выборе опубликованного проекта вы увидите предупреждение. Рекомендуется создавать отдельные проекты для разных версий голосовых пакетов.


Шаг 5: Сборка голосового пакета

После выбора проекта начнётся автоматическая сборка голосового пакета.

Процесс сборки включает следующие стадии:

  • draft — начальное состояние
  • started — сборка запущена
  • building — обработка аудиофайлов
  • completed — голосовой пакет готов
  • failed — ошибка сборки (будет показано сообщение)

Прогресс отображается в процентах с визуальным индикатором. После успешной завершения вы будете автоматически перенаправлены на страницу версий проекта.


Советы и рекомендации

Выбор голоса

  • Выбирайте голос, соответствующий языку вашей модели робота
  • Прослушайте пример голоса перед генерацией всех фраз
  • Используйте один голос для всех фраз для согласованности
  • Сохраняйте понравившиеся голоса в избранное

Работа с аудиофайлами

  • Используйте форматы MP3, WAV или OGG
  • Максимальный размер файла — 20MB
  • Автоматическая конвертация в WAV происходит при загрузке
  • Функция обрезки позволяет точечно настроить начало и конец фразы

Автосохранение

  • Все изменения автоматически сохраняются каждые 500мс
  • При случайном обновлении страницы работа восстанавливается из localStorage
  • Session ID отслеживает прогресс сборки на сервере

Лучшие практики

  1. Начните с синтеза TTS для быстрого прототипирования
  2. Используйте обрезку для точной настройки длительности фраз
  3. Регулируйте громкость для согласованности между фразами
  4. Используйте коррекцию произношения для улучшения качества синтеза
  5. Создавайте отдельные проекты для разных версий голосовых пакетов
  6. Проверяйте результаты на этапе предпросмотра

Возможные проблемы

Ошибки генерации TTS

  • Пустой текст — убедитесь, что текст фразы не пустой
  • Неподдерживаемые символы — используйте только буквы, цифры и знаки препинания (см. правила оформления текста)
  • Ошибка сети — проверьте подключение к интернету и попробуйте снова

Проблемы с загрузкой файлов

  • Неподдерживаемый формат — используйте MP3, WAV или OGG
  • Файл слишком большой — максимальный размер 20MB
  • Повреждённый файл — убедитесь, что файл воспроизводится в плеере

Ошибки сборки

  • Нет настроенных фраз — настройте хотя бы одну фразу перед сборкой
  • Ошибка сервера — подождите несколько минут и попробуйте снова
  • Превышен лимит — обратитесь в поддержку, если проблема повторяется

При возникновении проблем вы можете воспользоваться формой обратной связи или связаться с поддержкой через Telegram.


Генерация голоса

Прежде чем начать синтез, убедитесь, что текст оформлен правильно. Очень важно соблюдать правила пунктуации. Каждое предложение должно заканчиваться соответствующим знаком препинания, после которого следует пробел. В тексте допускаются только буквы выбранного языка, цифры и знаки препинания. Любые другие символы недопустимы. При несоблюдении рекомендаций, генерация может работать некорректно или вовсе вызвать ошибку.

Коррекция произношения

Не все голоса могут поддерживать функции коррекции произношения.

Ударение

Если требуется изменить ударение в слове, используйте знак + перед гласной буквой.

З+амок, зам+ок. Л+иса, лис+а. В+орона, вор+она.

Пауза

Чтобы сделать паузу, используйте более одного тире. Каждый последующий знак тире равен паузе 0.3-0.5 секунд, за исключением первого.

Подождем одну секунду --- теперь скажем.
Подождем две секунды ----- теперь скажем.

Акцент на слово

Используйте знак + перед словом, как это показано ниже.

+Вы сегодня подписываете договор?
Вы сегодня подписываете +договор?

Как вам это руководство?