포지션 상세 정보
- 기술스택
- LinuxAnsibleKubernetesPythonGitHub
- 주요업무
• 데이터 센터에 CPU 서버, GPU 서버, InfiniBand와 같은 고속 인터커넥션 네트워크, 스토리지 서버 등 다양한 하드웨어 구성 요소로 이루어진 대규모 클러스터 시스템을 설치, 업그레이드 및 유지보수 • GPU 가속 및 클러스터링을 위한 디바이스 드라이버, 통신 라이브러리, 디렉토리 서비스, 분산 파일 시스템, 오브젝트 스토리 등 시스템 소프트웨어 구성 요소들을 설치하고 관리 • 소프트웨어 프로비저닝 과정을 Ansible과 같은 IaC 툴로 자동화 • 클러스터 상에 Kubernetes 등 컨테이너 오케스트레이션 툴을 설치하고 관리 • 각종 하드웨어 혹은 소프트웨어 장애에 대한 원인 분석 및 해결 • 모레의 내부 개발 인프라를 관리
- 자격요건
• 다음 중 하나에 해당하시는 분 - 2년 이상의 IT 인프라 관리 혹은 사이트 신뢰성 엔지니어링 경력 - IT 시스템/솔루션 총판 혹은 리셀러에서의 2년 이상의 Linux 시스템 설치 및 유지보수 경력 - 혹은 이와 동등한 경력 • 컴퓨터 시스템의 여러 하드웨어 및 소프트웨어 구성 요소에 대한 폭넓은 이해 • Linux 시스템 사용 및 관리가 가능하신 분 • 영문으로 된 기술 문서를 이해할 수 있으신 분 • 뛰어난 논리적 사고 및 문제 해결 능력 - 2년 이상의 IT 인프라 관리 혹은 사이트 신뢰성 엔지니어링 경력 - IT 시스템/솔루션 총판 혹은 리셀러에서의 2년 이상의 Linux 시스템 설치 및 유지보수 경력 - 혹은 이와 동등한 경력
- 우대사항
• 컴퓨터공학 혹은 관련 전공 학부 졸업 • 클러스터 시스템, 특히 GPU 클러스터를 구축 및 관리한 경험 • InfiniBand 네트워크 설치, 구성 및 운영 경험 • Ansible 혹은 다른 IaC 툴 사용 경험 • Docker 및 Kubernetes에 대한 지식, 그리고 Kubernetes 클러스터를 직접 구축해 본 경험 • 대규모 IT 인프라의 모니터링 솔루션 개발 경험 • Python 개발 가능하신 분
- 복지 및 혜택
[근무환경] • 강남역 8번 출구 위치 • 음료/커피/스낵 지원 • 유연근무제 • 재택근무제 • 장비지원금 지원 [복지제도] • 교육 및 도서 지원 • 본인 및 배우자 건강검진 지원 • 생일 휴가 및 선물 지원 • 장기근속 휴가 • 헬스장 지원 [조직문화] • 각종 문화행사 지원 • 동호회활동 지원 • 회식비 지원
기업/서비스 소개
기업상세 정보로 이동1 / 4
초거대 AI 시대가 도래하면서 대규모 계산 인프라를 잘 구축/활용하는 것이 AI 산업의 핵심이 되었습니다. 모레는 GPU/NPU 라이브러리부터 분산 런타임 시스템, 자동 병렬화/최적화 컴파일러, PyTorch/TensorFlow 호환 프레임워크, 클라우드 플랫폼에 이르기까지 AI 인프라 소프트웨어 스택을 완전히 새롭게 개발합니다. 모레는 하드웨어부터 초거대 AI 모델에 이르기까지 다양한 영역의 문제를 해결하면서 기존에 없던 혁신적인 소프트웨어를 개발하고 있습니다. 모레와 함께 성장하며 새로운 업무에 도전할 개발자 분들을 찾습니다!