Cloud Sre Engineer - Warsaw, Polska - T-mobile

    T-mobile
    T-mobile Warsaw, Polska

    1 tydzień temu

    Default job background
    W pełnym wymiarze godzin
    Opis
    Technologies-expected : AWS Azure GCP Java Terraform Docker Kubernetes Prometheus ELK Opensearch Kibana Dynatrace Jenkins JIRA Confluence GIT Gitlab technologies-optional : Python Go about-project : SRE (Site Reliability Engineering), czyli Inżynieria Dostępności Systemów IT, to koncepcja stworzona w Google w celu usprawnienia procesów tworzenia i utrzymania systemów informatycznych.

    Głównym założeniem SRE jest podejście inżynieryjne do problemów operacyjnych.

    Współczesny rozwój oprogramowania, przyspieszony przez kulturę Dev Ops wprowadzoną w wielu organizacjach, może prowadzić do obniżenia jakości dostarczanych rozwiązań.

    Tutaj właśnie SRE wkracza na scenę, zapewniając balans pomiędzy rozwojem aplikacji a ich dostępnością, wykorzystując do tego tzw.

    "error budget".

    Jako zespół Cloud SRE uczestniczymy w migracji aplikacji na chmurę publiczną Mozart, wdrażając przy tym innowacyjne podejście do ich rozwoju i utrzymania w środowiskach chmurowych.

    Jesteśmy odpowiedzialni za kluczowe aspekty usług, takie jak wysoka dostępność, szybki czas dostępu, wydajność, innowacyjny monitoring, reakcja na problemy, zarządzanie dystrybucją i planowanie przydziału zasobów (capacity planning).

    W naszej codziennej pracy stawiamy na szeroko pojętą automatykę.

    Wykorzystując narzędzia developerskie, automatyzujemy różnorodne zadania i procesy, zyskując dzięki temu dużą oszczędność czasu, spójność rozwiązań i szybszy czas reakcji w przypadku awarii systemów.

    responsibilities : Zapewnienie jakości i dostępności systemów oraz aplikacji w AWS Cloud Wdrażanie zautomatyzowanych procesów niezbędnych do efektywnego propagowania dobrych praktyk inżynierskich i filtrowania podatności oraz ryzyk reputacyjnych Wymiana wiedzy w zakresie zespołu i organizacji, rozwój kultury SRE Wsparcie definicji/wdrożenia oraz monitoring jakości usług (SLI) Zarządzanie Error Budget Proaktywne podejście do wsparcia, budowanie relacji i dbanie o wizerunek zespołu Tworzenie pipeline oraz automatyzacji, które adresują potrzeby SRE Wsparcie w troubleshootingu aplikacji podczas awarii produkcyjnej (Praca na Windowsie albo Linuxie - do wyboru)​ requirements-expected : Znajomość jednej z wiodących chmur publicznych (AWS, Azure, GCP) Praktyczna znajomość języka programowania Umiejętności komunikacyjne i analityczne przy rozwiązywaniu problemów i kreowaniu nowych inicjatyw Praktyczna znajomość narzędzi CI/CD i ich konfiguracji Znajomość podejścia Git Ops Praktyczna znajomość Terraform, konteneryzacji (Docker, Kubernetes), rozwoju mikroserwisów, API, integracji oraz automatyzacji Doświadczenie w rozwijaniu testów funkcjonalnych oraz niefunkcjonalnych platformy Umiejętność pracy na środowiskach unixowych z wiedzą o działaniu serwerów, skalowalności, redundancji i zarządzania ruchem sieciowym Praktyczne doświadczenie w rozproszonym monitorowaniu i logowaniu (Prometheus, ELK, Opensearch) Praca z narzędziami tj.

    Kibana, Dynatrace, Jenkins, JIRA, Confluence, GIT, Gitlab Znajomość języka angielskiego (B2+) offered : Współpraca w oparciu o umowę direct B2 B Pakiet medyczny, sportowy i ubezpieczenie na życie na preferencyjnych warunkach Dostęp do platformy szkoleniowej Ro Do S Brak dress code'u - u nas możesz być sobą Znam Talent – szkolenia lub pieniądze za polecenie znajomych do pracy Poza tym możesz u nas liczyć na dostęp do naszych produktów i usług na preferencyjnych warunkach benefits : dofinansowanie zajęć sportowych prywatna opieka medyczna dofinansowanie szkoleń i kursów ubezpieczenie na życie możliwość pracy zdalnej elastyczny czas pracy zniżki na firmowe produkty i usługi służbowy telefon do użytku prywatnego brak dress code'u parking dla pracowników program rekomendacji pracowników inicjatywy dobroczynne