ML-инженер (GigaChat Data)
СБЕРОбязанности
Мы - команда ML-инженеров GigaChat Data. Наша команда готовит данные для обучения всей линейки моделей LLM GigaChat (GigaChat, GigaChat Vision, GigaChat Audio, Giga Embeddings и др.). Мы собираем данные как для базовых моделей, так и для их адаптации под конкретные сценарии: Core модели базовые модели; Продукты B2C WEB-версия GigaChat, персонализированные интеллектуальные ассистенты и пр.; Внутренние банковские задачи автоматизация обработки документов, анализ финансовых данных, поддержка сотрудников и пр.; Внешние заказчики кастомные решения для корпоративных клиентов, интеграция LLM в бизнес-процессы и пр. Обязанности сбор данных для alignment обучения моделей: Supervised Finetuning (SFT), Reinforcement Learning (RL, DPO , PPO, GRPO и пр.) улучшение пайплайнов предобработки данных для разметки и обучения работа в плотной связке с командой ML, LoRA-finetuning взаимодействие с командой асессоров/ разметчиков (мониторинг качества, корректировка инструкций и пр.) расчет метрик и принятие решений по улучшению качества данных на их основе. Требования знания Python на очень высоком уровне опыт работы с проприетарными и open-source LLM (Llama, Mistral, Qwen, Google Gemini, OpenAI GPT, Anthropic и пр.) понимание процессов работы с данными для больших языковых моделей способность решать проблемы и организовывать работу в условиях многозадачности Будет плюсом: опыт работы с LLM-агентами (LangChain, LangSmith, LangGraph, FAISS, RAG, ChromaDB и пр.). Условия комфортный офис в Москве на Кутузовском проспекте (Sber City) возможность выбрать удобный график офис/гибрид ежегодный пересмотр зарплаты и годовая премия корпоративный спортзал и зоны отдыха более 400 образовательных программ СберУниверситета для профессионального и карьерного развития расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа ипотека для сотрудников выгоднее до 4% бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров.
8 дней назад
Источник: trudvsem.ru
Обращаем Ваше внимание, что вакансия взята с внешнего источника trudvsem.ru. Администрация сайта не несет ответственность за ее содержание.
Рекомендуемые вакансии
Обязанности Мы - команда GigaChat Data, готовим данные для обучения базовых моделей GigaChat во всех ... модели. Направления задач: звуковая модальность GigaChat - большой языковой модели для генерации ...
19.05.2025; Источник: trudvsem.ru
Обязанности Мы - команда GigaChat Data, готовим данные для обучения базовых моделей GigaChat во всех ... модели Направления задач: звуковая модальность GigaChat - большой языковой модели для генерации ...
03.06.2025; Источник: trudvsem.ru
... ML-инженеров GigaChat Data. Наша команда готовит данные для обучения всей линейки моделей LLM GigaChat (GigaChat, GigaChat ... Vision, GigaChat Audio, Giga ... B2C WEB-версия GigaChat, персонализированные интеллектуальные ...
27.05.2025; Источник: trudvsem.ru