Анализ и решение инцидентов/аварий (ошибочное поведение, ошибки пользователей, проблемы производительности), локализация причин возникновения, проведение мероприятий по предотвращению их повторения;
Поиск корневых причин инцидентов
Установка патчей/релизов, настройка новой функциональности ПО;
Конфигурирование прикладного ПО;
Мониторинг серверов и конфигурации обслуживаемого ПО, определение точек/метрик мониторинга и их настройка;
Выполнение процедур для непрерывности работ системы;
Аварийно-восстановительные работы на системе;
Взаимодействие с командой продукта/системы для обеспечения непрерывности функционирования продукта
Мы будем рады рассмотреть вашу кандидатуру, если у вас есть:
Опыт администрирования операционных систем Linux, Windows;
Знание SQL (PostgreSQL) на уверенном уровне;
Опыт поддержки приложений с микросервисной архитектурой;
Навыки настройки систем мониторинга Zabbix, Prometheus
Знание клиент-серверных технологий (архитектура, виды серверов, протоколы, кластеризация);
Навык опыта работ с Web-серверами и серверами приложений (Nginx, Apache Tomcat, Oracle Weblogic)
Умение работать в Jira, TFS (приветствуется);
Confluence (публикация страниц, документов);
Опыт локализации проблем в информационных системах;
Опыт работы от 3 лет
Что мы предлагаем:
Оплата: ДМС включая стоматологию, страховки от несчастных случаев, полиса путешественника, помощи в сложных жизненных ситуациях, сотовой связи 3000 рублей в месяц, доплата 10 дней больничного до 100% оклада;