Claude Code · Codex · Cursor 최적화

사람보다 AI가
더 잘 쓰는 GPU 클라우드.

CLI 한 줄에 모든 GPU 작업이 들어 있습니다. AI 에이전트에게 자연어로 던지면 GPU를 빌리고, 학습을 돌리고, 추론 서버까지 띄웁니다. 모든 인프라는 AWS 위에서 도는 만큼 학습이 갑자기 사라지지 않습니다.

· 카드 등록 없이 시작 · 첫 가입은 구글 한 번이면 끝

Claude Code · onpod 매뉴얼 로드됨연결됨
H100 한 장으로 Llama 3 8B 띄워서 endpoint 알려줘. 30분 안 쓰면 알아서 꺼주고.
Claude

네, onpod에 H100 한 장 띄울게요.

H100 SXM 1장 예약 (시간 단위)
vllm/vllm-openai:latest 시작
my-llama.live.onpod.ai 준비됨
30분 미사용 시 자동 종료 예약

4분 17초 걸렸어요. 토큰은 콘솔 “AI 에이전트” 탭에서 발급된 것 그대로 썼습니다.

왜 안 죽나요

학습이 사라지지 않는
GPU 클라우드.

GPU as a Service를 쓰다 보면 호스트 사고로 학습이 통째로 날아가거나, 잘 돌던 추론 서버가 알 수 없는 이유로 멈추는 일이 자주 있습니다. 우리는 그런 사고를 두 번 겪고 만들었습니다.

AWS 인프라 위에서 작동

사용자 GPU 호스트가 아니라, AWS의 검증된 EC2/EBS/네트워크 위에서 실행됩니다. 호스트 자체가 사라지는 사고가 발생하지 않습니다.

학습이 사라지지 않습니다

체크포인트는 호스트가 아닌 영구 스토리지에 저장됩니다. 인스턴스가 죽어도 새 인스턴스가 같은 지점에서 이어 받습니다.

안 끄면 안 꺼집니다

“다른 사용자가 들어와서 내 인스턴스가 회수됐다”는 일이 없도록 SKU를 분리했습니다. 시간 단위·장기 예약은 내가 끄기 전엔 회수 없음.

기반 인프라는 AWS Seoul (ap-northeast-2)

자체 데이터센터나 임대 호스트가 아닙니다. 데이터센터의 가용성·네트워크 안정성· 보안 등급은 AWS가 보장하는 그대로. 우리는 그 위에 GPU 라이프사이클· 결제·AI 에이전트 인터페이스만 얹었습니다.

바이바이 리스트

그동안 GPU 빌리느라하던 일들 — 이제 안 해도 됩니다.

AWS 콘솔 클릭 30번콘솔 들어가지 않습니다
IAM · VPC · 보안 그룹 세팅셋업이 없어요. 가입하면 바로 됩니다
인스턴스 타입 고민·견적AI에게 “H100 한 장” 한 마디
Docker 이미지 빌드 · 푸시이미지 이름만 던지면 알아서 가져옵니다
endpoint 만들고 도메인 묶고 TLS{slug}.live.onpod.ai 자동 발급
비용 청구·환율·세금계산서 정리원화 청구 · 자동 충전 · 세금계산서까지

AI에게 맡기는 법

CLI 한 줄.
나머지는 AI가 합니다.

우리 CLI는 사람보다 Claude Code · Codex · Cursor가 더 잘 쓰도록 설계됐습니다. 콘솔에서 마우스로 클릭하지 않고, AI 에이전트에 자연어 한 줄 던지면 GPU 라이프사이클·학습·추론까지 알아서 처리합니다.

1

구글로 가입

5초면 끝납니다. 카드 등록도 나중에 해도 됩니다.

2

한 줄 복사·붙여넣기

콘솔 “AI 에이전트” 탭에 토큰이 포함된 프롬프트가 있습니다. Claude · Cursor · Codex 첫 메시지에 통째로 붙여 넣으세요.

3

자연어로 일 시키기

그 뒤로는 그냥 “H100 두 장으로 학습 돌려” 라고 던지면 됩니다. 에이전트가 매뉴얼 읽고 알아서 처리합니다.

이렇게 시켜보세요

L4 한 장을 5분만 빌려서 nvidia-smi 결과 보여줘. 끝나면 정리.
H100 한 장으로 vLLM 띄워서 Llama 3 8B endpoint 알려줘.
A100 두 장으로 내 GitHub repo 학습 돌리고 체크포인트 R2에 푸시해.
추론 endpoint가 분당 100건 넘게 들어오면 자동으로 인스턴스 2장으로 늘려.

누구를 위해서

AI 에이전트와 일하는 사람

Claude · Cursor · Codex에 작업을 맡기는 분. 에이전트가 GPU 빌리는 일까지 자율로 합니다.

1인 ML 엔지니어

혼자 학습 돌리고 추론 띄우는 분. 인프라 셋업에 시간 쓰지 않고 모델에 집중합니다.

기업 ML 팀

한국 리전 강제, 원화 결제, 감사 대응 보고서. 보안 검토에 필요한 항목이 미리 준비돼 있어요.

사용 방식

쓰는 방식은 세 가지.AI에게 골라달라고 해도 됩니다.

사용한 시간만큼만

시간 단위

사용 시작 시 즉시 GPU를 잡고, 끄기 전까지 회수되지 않습니다.

  • 내가 끄기 전까지 회수 없음
  • 켜져 있는 시간에만 과금
  • 짧은 학습 · 실험 · 단발성 추론
추천
월·연 단위 가격 잠금

장기 예약

월·연 단위로 GPU를 통째로 예약합니다. 약정 기간 안에는 회수가 없습니다.

  • 약정 기간 내내 보장
  • 약정 기간 전체에 대해 과금
  • 장기 학습 · 상시 운영 · 안정성 우선
비어 있는 자리를 사용

스팟

다른 사용자의 빈 자리를 활용해 더 가볍게 띄웁니다. 단, 회수될 수 있습니다.

  • 시간/장기 사용자 진입 시 1분 안내 후 회수
  • 켜져 있는 시간에만 과금
  • 대량 일괄 · 중간 저장 가능한 작업

추론 배포

학습한 모델을 그 자리에서
공개 endpoint로 띄웁니다.

별도 인프라 셋업 없이, 콘솔에서 이미지 한 번에 띄우면 외부에서 호출할 수 있는 URL이 발급됩니다.

endpoint 자동 발급

이미지와 GPU만 고르면 {slug}.live.onpod.ai가 바로 발급됩니다.

자동 스케일

트래픽이 늘면 알아서 인스턴스를 늘리고, 비면 줄입니다.

사용량 그래프

분 단위 토큰 사용량을 콘솔에서 한눈에 봅니다.

한국 리전 단독
학습·추론 모두 국내에서
원화 결제 · 자동 충전
카드·계좌·간편결제 모두
규제 대응
개인정보·금융 가이드 정합
세금계산서
법인 결제 흐름 그대로

기업 보안

엔터프라이즈 환경에 맞춰 만들었습니다.

학습·추론 모두 국내 데이터센터에서 처리합니다.
변경 이력 전체가 기록되어 감사·보안 검토 시 그대로 제출할 수 있습니다.
API 키는 한 번만 노출되며, 언제든 회수하고 만료시킬 수 있습니다.
환경변수를 바꿔도 컨테이너가 재시작되지 않아 학습이 끊기지 않습니다.
내 인스턴스를 정리하는 동작이 다른 작업에 영향을 줄 수 없도록 격리합니다.
공개 endpoint는 발급된 API 토큰으로만 호출할 수 있어 외부 노출을 막습니다.

가격

모든 가격은 원화로 표시됩니다.

환율은 분기별로 한 번만 조정합니다. 환율 변동분은 우리가 흡수해서 청구서가 갑자기 바뀌지 않습니다.

모델
VRAM
시간 단위
장기 예약
스팟
L4 24GB
24GB
1,036원 / 시간
740원 / 시간
444원 / 시간
A100 40GB
40GB
1,776원 / 시간
1,184원 / 시간
740원 / 시간
A100 80GB
80GB
2,368원 / 시간
1,628원 / 시간
1,036원 / 시간
H100 80GB
80GB
3,700원 / 시간
2,664원 / 시간
1,776원 / 시간
H200 141GB
141GB
5,032원 / 시간
3,700원 / 시간
2,516원 / 시간
B200 192GB
192GB
7,400원 / 시간
5,328원 / 시간
3,552원 / 시간

예시 · H100 80GB 시간 단위 1시간 = 3,700원 · 24시간 연속 = 88,800원.

자주 묻는 질문

FAQ

정말 한 문장으로 GPU가 빌려지나요?

가입하고 콘솔의 “AI 에이전트” 탭에 있는 한 줄 프롬프트를 Claude·Cursor·Codex 첫 메시지에 붙여 넣은 다음부터는, 자연어로 일을 시키면 됩니다. 에이전트가 우리 매뉴얼을 읽고 GPU 임대·모델 실행·endpoint 발급까지 알아서 처리합니다.

AI에게 맡기지 않고 직접 콘솔에서 써도 되나요?

물론입니다. 콘솔에서 GPU 모델·이미지·환경변수를 골라 한 번에 띄울 수 있습니다. AI 에이전트는 더 빠르게 쓰는 방식일 뿐, 강제는 아닙니다.

데이터는 어디에 저장되나요?

GPU와 컨테이너는 모두 한국 데이터센터(서울 또는 평촌)에서 동작합니다. 학습·추론 데이터는 사용자가 명시적으로 외부 스토리지로 보내지 않는 한 인스턴스 종료와 함께 폐기됩니다.

기업 보안 검토에 필요한 항목이 준비되어 있나요?

변경 이력 전체가 자동 기록되어 감사 보고로 제공 가능합니다. 데이터 처리 위치, API 키 관리 정책, 격리 방식, 결제 흐름 등 검토 표준 항목 답변지를 미리 준비해 드립니다.

결제는 어떻게 이뤄지나요?

원화 카드·계좌·간편결제 모두 지원합니다. 잔액이 떨어지기 전에 자동 충전되며, 실패가 반복되면 단계적으로 안내합니다. 법인 결제 흐름에 맞춘 세금계산서 발행도 가능합니다.

회사 정보를 알고 싶습니다.

한국 법인이며, 사업자등록번호와 통신판매업 신고는 약관 페이지에 공시되어 있습니다. 본사는 서울입니다.

환불 정책은 어떻게 되나요?

신청한 GPU가 5분 안에 준비되지 않으면 지연된 시간만큼 자동 환불됩니다. 우리 측 사고로 인한 중단도 사용 시간에서 제외됩니다.

기존 클라우드에서 옮길 수 있나요?

Docker 이미지와 환경변수만 있으면 그대로 이전 가능합니다. 모델 가중치 마이그레이션도 지원합니다. 자세한 절차는 콘솔의 마이그레이션 가이드를 참고하세요.

5초면 시작합니다.

구글로 가입한 다음, AI 에이전트에 한 줄만 붙여 넣으면 끝입니다.

5초 가입 → AI에게 맡기기