ML Engineer
AI Engineer Voice Technologies React Native Project Remote
ID: 16889
26 ноября 2025 г.
Активна
ООО "Октема"
Россия, Уфа
180 000 ₽ - 250 000 ₽
Тип занятости
Частичная занятость
Формат работы
Удаленная работа
📞Способы связи
📄 Оригинальный текст вакансии
#AI #LLM #embeddings #consulting #reactnative #вакансия
AI-инженер по голосовым технологиям (React Native проект)
💰 Оплата: 180 000 – 250 000 ₽
Частичная занятость
О компании
Мы — аккредитованная ИТ-компания ООО "Октема", г. Уфа (www.oktema.ru), работаем над федеральным цифровым проектом.
Разрабатываем голосового ассистента для приложения "цифровой улей" (react native).
Ассистент должен работать в мобильном приложении и при отсутствии связи на мобильном устройстве пользователя, то есть работать и в офлайн режиме.
Основные требования включают работу с моделями машинного обучения, такими как Vosk, Embedding Gemma, Piper/VITS tts ONNX
Задача
Голосовой ассистент
1. пользователь вызывает ассистента
2. озвучивает команды «записи» в приложение
Сервис должен работать в офлайн режиме
Примеры диалога ассистента и пользователя:
Пользователь:
- Новая запись, ящик 12
Ассистент:
• Ящик 12 ввод значений
Пользователь:
• Ширина …. (количественное значение)
• Высота …. (количественное значение)
• Длина …. (количественное значение)
Ассистент: Данные внесены
Пользователь:
- Комментарий: ящик черный (текстовые значения)
Ассистент: Данные внесены
Используемые сервисы
Изначально на распознавание внедрили Vosk, но в ее офлайн модели были ошибки
Поэтому заменили на Sherpa-ONNX
Для синтеза речи изначально были использованы встроенные библиотеки от от Android и IOS
Но не устроила "роботизированность" голоса
Поэтому сейчас тестируем Piper, к нему тоже есть нарекания
Нужен инженер с опытом работы с указанными моделями
Требования
- Интегрировать LLM / Embeddings / AI-моделей в мобильные приложения.
- Адаптация модели Vosk для эффективного распознавания специализированных терминов и сложных понятий.
- Оптимизация процесса обработки аудиоданных для повышения точности распознавания.
- Интеграция и настройка модели Piper/VITS ONNX для улучшения качества синтеза текста в речь.
- Работа над улучшением производительности приложения на мобильных устройствах.
Будет плюсом
- Опыт с React Native bridge / native modules.
- Работа с Whisper / Gemini / Hugging Face / MLC.ai.
- Опыт оптимизации и портирования моделей под мобильные устройства.
Условия
- Удалённый формат, гибкий график.
- Возможность привлечения к дальнейшим задачам проекта.
Контакты
Иван Петров, @iypetrov
🛠 Навыки
Embedding Gemma
LLM
ONNX
Piper
React Native
Sherpa-ONNX
Vosk
🎯 Домены
AI
Mobile Applications
Voice technologies
🤖 ИИ навыки
Android
Audio processing
Embeddings
Git
iOS
JavaScript
LLM
Machine Learning
Mobile Application Development
Model Optimization
ONNX
Piper
Python
React Native
Sherpa-ONNX
Speech Recognition
Text-to-Speech
VITS
* Навыки определены автоматически с помощью нейросети
🤖 ИИ домены
Artificial Intelligence
Mobile Applications
Software Development
Voice Technology
* Домены определены автоматически с помощью нейросети
📢 Информация о публикации
🔗 Оригинальные посты (1)
Канал:javascript_jobs