포지션 상세 정보
- 기술스택
PyTorch
TensorFlow
CUDA
Linux
Docker
- 주요업무
ㆍ대규모 LLM 추론 인프라 아키텍처 설계 - H100/L40S 기반 환경 최적 구성안 수립 ㆍ운영 전략 수립 - 모델 서빙, 캐시·메모리 관리, 스케일링 전략 등 장기 운영 로드맵 마련 ㆍ성능 모니터링 및 병목 해소 - 멀티-GPU·멀티노드 환경 운영 안정성 확보 ㆍ기술 커뮤니케이션 - 외부 업체 및 내부 관계자와 기술 미팅, 요구사항 분석, 설계 방향 제시 ㆍ프로젝트 리딩 - 인프라·모델 서빙·최적화 담당 엔지니어 협업 및 일정·품질 관리
- 자격요건
ㆍPyTorch 또는 TensorFlow 기반 LLM 모델 서빙 아키텍처 이해 및 운영 경험 ㆍH100, L40S 등 GPU 서버 기반 LLM 추론 인프라 구축 경험 ㆍ멀티-GPU·멀티노드 환경 구성 및 모니터링 경험 ㆍCUDA/NCCL 및 GPU 메모리 구조 이해(성능 병목 파악 가능 수준) ㆍLinux 서버 환경 및 Docker 운영 경험 ㆍ기술 요구사항을 해석하고 설계에 반영할 수 있는 커뮤니케이션 능력
- 우대사항
ㆍvLLM, TensorRT-LLM 등 고성능 추론 프레임워크 실전 적용 경험 ㆍGPU 서버 대규모 스케일링 및 최적화 경험 ㆍH100/L40S 혼합 환경 운영 및 최적화 경험 ㆍ대규모 LLM 성능 프로파일링 및 병목 제거 경험 ㆍ캐시 관리·분산 저장 전략 설계 경험 ㆍSI, 컨설팅, Pre-sales 협업 경험(제안·견적·PoC 진행)
- 복지 및 혜택
[지원금/보험] 건강검진, 의료비지원(본인/가족), 각종 경조사 지원, 자녀학자금, 영유아 보육비 [급여제도] 인센티브제, 스톡옵션 또는 자사주지급 (우수인력 대상), 퇴직금, 야근수당, 휴일(특근)수당, 4대 보험, 포괄임금제 아님(법정 OT비 지급) [교육/생활] 간식 제공, 식비 지원 [출퇴근] 자율 근무제, 탄력근무제 [리프레시] 연차, 창립기념일, 근로자의 날 휴무
- 채용절차 및 기타 지원 유의사항
ㆍ입사지원 서류에 허위사실이 발견될 경우, 채용확정 이후라도 채용이 취소될 수 있습니다.
포지션 경력/학력/마감일/근무지역 정보
- 경력
- 경력 2~10년
- 학력
- 대학교졸업(4년) 이상
- 마감일
- 2025-11-15
- 근무지역
- 경기 성남시 수정구 창업로42 판교 제2테크노밸리 경기 기업성장센터
기업/서비스 소개
기업상세 정보로 이동



1 / 4
(주)소테리아는 초전력 애플리케이션을 위한 친환경 데이터센터 HPC Accelerator ASIC 플랫폼으로 3세대 AI반도체 혁신 기업입니다. - 2024 시리즈B 330억 투자유치 - 2024.09 IPO 주관사 2개사 선정 완료