포지션 상세 정보
- 기술스택
PyTorch
TensorFlow
CUDA
Linux
Docker
- 주요업무
ㆍ자사 LLM 솔루션 개발 ㆍ대규모 LLM 추론 인프라 아키텍처 설계 - H100/L40S 기반 환경 최적 구성안 수립 ㆍ운영 전략 수립 - 모델 서빙, 캐시·메모리 관리, 스케일링 전략 등 장기 운영 로드맵 마련 ㆍ성능 모니터링 및 병목 해소 - 멀티-GPU·멀티노드 환경 운영 안정성 확보 ㆍ기술 커뮤니케이션 - 외부 업체 및 내부 관계자와 기술 미팅, 요구사항 분석, 설계 방향 제시 ㆍ프로젝트 리딩 - 인프라·모델 서빙·최적화 담당 엔지니어 협업 및 일정·품질 관리
- 자격요건
ㆍ대규모 언어모델(LLM) 이해 - Transformer 구조 (Prefill / Decode, KV Cache 관리 등)에 대한 이해 - Decoder-only 모델 기반 LLM 추론 경험 ㆍ프롬프트 엔지니어링 - 프롬프트 엔지니어링 및 테스트 - 프롬프트 설계, 체인 구성, 성능 평가 및 자동화된 프롬프트 테스트 경험 ㆍ다양한 입력 시나리오 기반 기능/성능 검증 능력 - RAG (Retrieval-Augmented Generation) 파이프라인 - VectorDB(예: FAISS, Milvus) 기반 문서 임베딩, 인덱싱, 검색 기술 이해 ㆍ최신 지식 반영, 환각(hallucination) 완화, 도메인 적응을 위한 RAG 설계 능력
- 우대사항
ㆍLLM 서빙 및 최적화 경험 ㆍvLLM, LMCache 등 LLM 서빙 프레임워크 활용 경험 ㆍKV Cache 오프로딩 및 Prefetching 관련 최적화 경험 ㆍ효율적 리소스 활용 및 QoS 보장 경험 ㆍAgentic RAG 및 Multi-Agent AI 프레임워크 경험 ㆍHPC/클라우드 기반 LLM 인퍼런스 운영 경험
- 복지 및 혜택
[지원금/보험] 건강검진, 의료비지원(본인/가족), 각종 경조사 지원, 자녀학자금, 영유아 보육비 [급여제도] 인센티브제, 스톡옵션 또는 자사주지급 (우수인력 대상), 퇴직금, 야근수당, 휴일(특근)수당, 4대 보험, 포괄임금제 아님(법정 OT비 지급) [교육/생활] 간식 제공, 식비 지원 [출퇴근] 자율 근무제, 탄력근무제 [리프레시] 연차, 창립기념일, 근로자의 날 휴무
- 채용절차 및 기타 지원 유의사항
ㆍ입사지원 서류에 허위사실이 발견될 경우, 채용확정 이후라도 채용이 취소될 수 있습니다.
포지션 경력/학력/마감일/근무지역 정보
- 경력
- 경력 10~20년
- 학력
- 대학교졸업(4년) 이상
- 마감일
- 2026-01-14
- 근무지역
- 경기 성남시 수정구 창업로42 판교 제2테크노밸리 경기 기업성장센터
기업/서비스 소개
기업상세 정보로 이동



1 / 4
(주)소테리아는 초전력 애플리케이션을 위한 친환경 데이터센터 HPC Accelerator ASIC 플랫폼으로 3세대 AI반도체 혁신 기업입니다. - 2024 시리즈B 330억 투자유치 - 2024.09 IPO 주관사 2개사 선정 완료