포지션 상세 정보
- 기술스택
Prometheus
Grafana
Jaeger
Terraform
Ansible
Python
Docker
Kubernetes
- 주요업무
•AI 모델 운영 및 최적화 : NVIDIA Triton Inference Server를 활용한 AI 모델 배포·서빙 아키텍처를 총괄하고, 실시간 추론 서비스의 성능을 최적화합니다. Dynamic Batching, Model Ensemble, Multi-GPU 최적화 등을 통해 시스템의 효율성을 극대화합니다. • MLOps 및 AIOps 리더십 : ML(기계 학습) 모델의 라이프사이클 전반(데이터 준비, 모델 개발, 모니터링, 재학습)을 관리하는 AIOps(AI Operations) 시스템을 설계하고 운영합니다. MLflow, DVC, Optuna, Ray Tune과 같은 도구를 활용해 모델 개발 프로세스를 표준화하고 자동화합니다. • 시스템 성능 관리 : Prometheus, Grafana, Jaeger 등을 사용한 모니터링 시스템을 구축하여 AI 서비스의 성능(처리량, 지연 시간, 가용성 등)을 관리하고, 장애 발생 시 신속한 원인 분석 및 해결을 주도합니다. • 데이터 관리 및 거버넌스 : 대규모 데이터 파이프라인(ETL/ELT)을 구축하고, 데이터 품질(DQ) 관리, 메타데이터 카탈로그, 데이터 계보(Lineage) 등 데이터 거버넌스 체계를 확립하여 AI 모델 학습에 필요한 데이터 신뢰성을 확보합니다. • AI 인프라 및 보안 관리 : Terraform, Ansible 등을 활용한 IaC(Infrastructure as Code) 기반의 AI 인프라를 구축 및 관리하며, 비밀정보 관리, 네트워크 보안, 취약점 스캔 등 AI 시스템의 보안을 강화합니다. • 지속적 통합·배포(CI/CD) 자동화 : AI 모델의 CI/CD 파이프라인을 설계하고 자동화하며, 블루/그린, 카나리, A/B 테스트 등 다양한 배포 전략을 적용하여 안정적이고 효율적인 모델 릴리스를 보장합니다. [포지션 상세] AI의 성공을 함께 만들어갈 MLOps/AI 플랫폼 엔지니어를 모십니다.우리 팀은 AI 모델러가 오직 모델 개발에만 집중할 수 있도록, AI 모델의 학습과 배포 과정을 자동화하는 플랫폼을 만듭니다. 우리는 기술의 경계를 넘어, AI 모델의 가치가 실제로 발휘될 수 있도록 돕는 중요한 역할을 하고 있습니다. 복잡한 AI 인프라를 효율적으로 운영하고 최적화하며, AI 서비스의 심장과 같은 플랫폼을 함께 만들어 갈 분을 찾습니다.
- 자격요건
• 5년 이상의 AI/ML 관련 경력 • Python, C++ 등 프로그래밍 언어 숙련도가 있으신 분 • MLOps/DevOps 관련 기술에 대한 깊은 이해(Kubernetes, Docker, CI/CD 파이프라인 등)가 있으신분 • NVIDIA Triton Inference Server 등 AI 인프라 운영 경험이 있으신 분 • MLflow, DVC, Prometheus, Grafana, Jaeger 등 모니터링 및 MLOps 도구 활용 경험이 있으신 분 • 클라우드 환경(AWS, GCP, Azure 등) 및 IaC(Infrastructure as Code) 경험이 있으신 분
- 우대사항
• 2년 이상의 팀 리딩 경험이 있으신 분 • 대규모 분산 시스템 및 데이터 파이프라인(Spark, Flink 등) 설계·운영 경험이 있으신 분 • AI 서비스의 보안 및 규제 준수(Compliance) 관련 경험이 있으신 분 • 기술 블로그 작성 또는 오픈소스 기여 경험이 있으신 분 • 서비스형 소프트웨어(SaaS) 개발·운영 경험이 있으신 분
- 복지 및 혜택
• 연 6일 병가 제공 • 야근 시 저녁 식대 지원 • 야근 시 교통비 지원 (밤 10시 반 이후 퇴근 시 안전하게 택시 타세요!) • 출장용 법인 차량 운영 • 자가 차량 이용 시, 유류비 실비정산 • 업무용 도서 구입비 지원 • 주말수당 / 출장수당 지급 • 정밀건강검진 지원 • 생일 시 오후반차 및 상품권 지급 • 기타 경조 휴가 및 경조금 지급 등 • 사내 세미나 및 스터디 운영
- 채용절차 및 기타 지원 유의사항
서류합격 - 1차 실무진 면접 - 2차 임원진 면접 - 최종합격 *1차 실무진 면접에서는 오프라인 코딩 테스트가 진행됩니다. *위 절차는 기본 프로세스로 경우에 따라 추가 절차(레퍼런스 체크)가 진행될 수 있습니다.
기업/서비스 소개
기업상세 정보로 이동
"See. Think. Move." 씨메스(CMES)는 AI 기반 3D 로봇 비전 기술을 바탕으로 물류·제조·자동차 등 다양한 산업의 스마트 자동화를 이끄는 로봇 솔루션 기업입니다. AI 알고리즘, 3D 비전, 로봇 제어, SI까지 전 과정을 자체 기술로 구현하며, 서울 본사를 중심으로 미국·베트남 등 글로벌 거점과 함께 빠르게 성장하고 있습니다. • MISSION : Redefining the Future of Smart Workflows. 씨메스는 산업 현장의 스마트 워크플로우를 재정의하며, 더 빠르고 정확한 자동화의 미래를 만들어갑니다. • VISION : It's More Than Robotics. We Automate Intelligence. 씨메스는 로봇을 넘어, 지능형 자동화를 통해 산업의 본질을 바꿔갑니다 https://www.cmesrobotics.ai