К вакансиям
ML Engineer

AI Engineer Voice Text Remote

ID: 31022
24 февраля 2026 г.
Активна
Voximplant
Россия, Москва

Формат работы

Удаленная работа

📞Способы связи

📄 Оригинальный текст вакансии

#AI #VoiceTech #ML #DS #AIEngineer #MLEngineer Привет, это Voximplant! Сейчас мы ищем AI Engineer для задач в направлении voice/text. Мы международная SaaS компания в области облачных коммуникаций. Если быть точнее CPaaS - Communication Platform as a Service. Мы создаём платформу, которая позволяет компаниям по всему миру строить клиентские коммуникации внутри своих продуктов и бизнес-процессов. Через нашу инфраструктуру бизнесы запускают голосовые сервисы, контакт-центры, омниканальные коммуникации, автоматизацию взаимодействия с клиентами и решения на базе AI. У нас есть 2 направления бизнеса: B2B и B2D. B2B - облачные контакт-центры, B2D (business to developers) - платформа-лего для разработчиков, внутри которой можно строить свою собственную коммуникационную платформу. О Voximplant в 2026 году: С 2013 года на рынке облачных коммуникаций; 300+ сотрудников; 30 000 клиентов по всему миру; 3 млрд звонков обрабатываем в год. Задачи: Проектировать архитектуру голосовых ботов: многокомпонентные сервисы, API-интерфейсы, инструменты управления и автоматизации; Интегрировать RAG-решения, включая векторный поиск, чанкование, embedding; Погружаться в детали проектов, анализировать ограничения и выбирать подходы к реализации; Прототипировать интеграции с поставщиками (ASR, TTS, LLM, Turn Detector, Noise filter); Проводить бенчмаркинг поставщиков (latency, throughput, cost); Улучшать технические метрики продуктов (latency, количество ошибок); Развертывать модели в облаках и оборачивать их в сервисы; Развивать подходы к автотестированию в тексте и голосе; Вместе с продактом и технической командой работать над развитием продукта; Сопровождать запуски проектов для клиентов; Ожидания от будущего коллеги: Опыт проектирования комплексных LLM-систем или AI-платформ; Опыт интеграции моделей разных вендоров: OpenAI, Qwen и других.; Опыт работы с ASR/TTS: управление потоками речи в реальном времени, корректное восстановление контекста после прерывания, согласование таймингов между распознаванием, ответом и синтезом речи Понимание современных подходов к RAG, включая: работу с векторными базами данных, разработку и настройку embedding-пайплайнов. Опыт работы с function calling, tools, agents и понимание архитектуры цепочек промптов; Опыт участия, внедрения или создания внутренних инструментов для работы с LLM-инструментарием, а также их мониторинга; Уверенные навыки программирования на Python: построение пайплайнов, интеграция с API LLM и векторными базами, автоматизация процессов. Умение четко излагать технические идеи, документировать архитектурные решения и менторить коллег. Будет плюсом: Опыт разработки платформенных решений, SDK или low-code инструментов для AI-ассистентов и поддержки команд; Знания и опыт работы с ML-мониторингом, логированием, observability и CI/CD для LLM-инструментов; Навыки проектирования мультимодальных систем: обработка текста, аудио и интеграция мультимодальных моделей. Предлагаем: Мы - продуктовая компания, которая создает технически сложный и востребованный продукт для бизнеса; Гибкое начало рабочего дня;; Работа в аккредитованной IT-компании; Одна из 2-х льгот на выбор за счет компании (с возможностью воспользоваться другой на корпоративных условиях): ДМС (Лучи), Корпоративное обучение английскому/испанскому языку до 2-х раз в неделю; Корпоративные скидки от BestBenefits; Удалённый формат работы, при желании гибрида — Московский офис находится в пяти минутах от метро Тульская, рядом с Даниловским рынком; Современные и удобные инструменты, софт и оборудование для работы. Процесс найма: Скрининг с HR; Техническое интервью; Оффер. Резюме ждёт Ольга @olgas_itrec

🌐 Языки

английский (B2 — Средне-продвинутый)

🛠 Навыки

agent (computer science)
Application programming interface
Audio processing
automatic speech recognition
Cloud Computing
Continuous integration and continuous delivery
Embedding
Function Calling
Large language model
multimodal system
Observability
Prompt Engineering
Python (computer programming)
retrieval-augmented generation
text processing
Text-to-Speech
Tools
Vector database

🎯 Домены

AI
B2B
B2D
ML
SaaS
Voice Technology

🤖 ИИ навыки

agent architecture
API Integration
automatic speech recognition
CI/CD
Cloud Deployment
Embedding
Function Calling
Large language model
LLM monitoring
Observability
Prompt Engineering
Python (computer programming)
retrieval-augmented generation
Text-to-Speech
Vector database

* Навыки определены автоматически с помощью нейросети

🤖 ИИ домены

AI
Communication Platform as a Service
Multimodal Systems
SaaS
Voice Technology

* Домены определены автоматически с помощью нейросети

📢 Информация о публикации

🔗 Оригинальные посты (1)