gstack이란?

Garry Tan(YC 대표)이 만든 오픈소스 AI 소프트웨어 팩토리:

Claude Code를 23개 전문 AI 역할로 변환
7단계 스프린트 워크플로우로 프로덕션 코드 출하
혼자서 팀 수준의 생산성 달성 (60일간 60만줄 코드)
repo: github.com/garrytan/gstack

핵심 철학

“개발자 = CEO, 각 스킬 = 전문 팀원”

Claude Code를 대체하는 게 아니라, 빈 곳을 채운다
AI가 이미 잘하는 것(코드 구현) → 스킬 불필요
AI가 혼자선 부족한 것(제품 방향, 취향, 자기 리뷰) → 전문 스킬 필요

왜 23개로 쪼갰나?

자기가 짠 코드를 자기가 리뷰하면 같은 가정을 공유해서 실수를 못 본다

→ 역할을 분리해서 컨텍스트를 끊는다 → 각 스킬이 하나의 관점(렌즈)만 갖고 깊이 본다

AI가 이미 잘 하는 것     → 스킬 불필요 (그냥 Claude Code)
├─ 코드 구현
├─ 리팩터링
└─ 버그 수정

AI가 혼자선 부족한 것    → 전문 스킬 필요
├─ 제품 방향 검증        → /office-hours
├─ 스코프 판단           → /plan-ceo-review
├─ 디자인 취향 반영      → /design-shotgun
├─ 자기 코드 자기 리뷰   → /review (분리된 관점)
└─ 보안 감사             → /cso

스프린트 워크플로우 7단계

1	`Think → Plan → Build → Review → Test → Ship → Reflect`

Think — “뭘 만들지?” 검증

/office-hours: YC 오피스 아워처럼 6가지 강제 질문
아이디어 자체를 검증하는 단계
아웃풋: 디자인 독 (이 제품이 뭔지, 왜 필요한지)

Plan — “어떻게 만들지?” 확정

Think에서 나온 디자인 독을 받아서 4명의 전문가가 각자의 렌즈로 검토:

/office-hours 아웃풋 (디자인 독)
    │
    ├→ /plan-ceo-review    "스코프가 맞아? 너무 크거나 작지 않아?"
    ├→ /plan-eng-review    "기술적으로 어떤 구조로 만들지?"
    ├→ /plan-design-review "사용자 경험은 괜찮은지?"
    └→ /plan-devex-review  "개발자가 쓰기 편한지?" (API/SDK일 때)

“뭘”이 흔들리면 “어떻게”를 아무리 잘 짜도 소용없으니까 Think → Plan 순서가 중요
/autoplan: 위 4개를 자동 순차 실행, 취향 결정만 사람이 함

/plan-ceo-review 4가지 모드

모드	설명
Expansion	스코프 확장 — 더 큰 기회 발견
Selective Expansion	선택적 확장 — 핵심만 추가
Hold Scope	스코프 유지 — 현재 범위 고수
Reduction	스코프 축소 — MVP로 줄이기

혼자 개발하면 스코프 크리프 생기기 쉬운데, AI가 견제해주는 구조

Build — 디자인 + 코딩

스킬	기능
`/design-consultation`	디자인 시스템 처음부터 구축
`/design-shotgun`	목업 4-6개 한번에 생성해서 비교
`/design-html`	선택된 목업을 프로덕션 HTML/CSS로 변환

코드 구현 스킬은 없다 — Claude Code가 이미 잘 하니까
gstack은 구조화된 프로세스가 필요한 영역(디자인)만 담당

Review — 분리된 관점으로 검증

스킬	뭘 보는가	비유
`/review`	코드 품질, 로직 버그, 구조	코드 리뷰어
`/investigate`	특정 버그 루트 코즈	탐정
`/codex`	OpenAI로 세컨드 오피니언	외부 감사

/review 특징

자동 수정 (뻔한 이슈) + 플래그 (판단 필요한 이슈) 구분
/codex와 조합하면 cross-model analysis (Claude + GPT 비교)

/investigate 규칙

Iron Law: 조사 없이 수정하지 않는다
가설 세워서 검증 → 3번 연속 틀리면 자동 멈춤
멈추고 접근 방식 자체를 재고하게 만듦

Test — 실제 브라우저로 QA + 보안

스킬	기능
`/qa`	Chromium 브라우저 띄워서 실제 테스트 + 버그 수정 + 회귀 테스트 자동 생성
`/qa-only`	같은 테스트인데 리포트만 (코드 수정 없음)
`/cso`	OWASP Top 10 + STRIDE 보안 감사, 신뢰도 8/10+ 게이트
`/benchmark`	Core Web Vitals, 페이지 로드 성능 측정

/qa가 버그 발견하면

버그 수정 (원자적 커밋)
회귀 테스트 자동 생성
수정 후 재검증

Ship — 테스트 → PR → 배포 자동화

/ship
  → main 동기화
  → 테스트 전체 실행
  → 커버리지 감사
  → 테스트 프레임워크 없으면 자동 부트스트랩
  → PR 생성
  → /document-release 자동 호출 (문서 업데이트)

/land-and-deploy
  → PR 머지
  → CI 통과 대기
  → 프로덕션 배포
  → 헬스체크 검증

/canary
  → 배포 후 감시 루프
  → 콘솔 에러 / 성능 회귀 / 페이지 장애 감지

스킵할 수 있는 단계가 없다 — “귀찮으니까 넘어가자”를 구조적으로 차단

Reflect — 회고

/retro: 주간 회고 (커밋 수, 테스트 건강도, 성장 기회)
/retro global: 모든 프로젝트 횡단 회고

전체 스킬 맵 (23개)

Think

스킬	역할
`/office-hours`	YC 오피스 아워 — 6가지 강제 질문으로 아이디어 검증

Plan

스킬	역할
`/plan-ceo-review`	CEO — 스코프 결정 (4가지 모드)
`/plan-eng-review`	EM — 아키텍처 잠금, 테스트 매트릭스, 실패 모드
`/plan-design-review`	시니어 디자이너 — 디자인 차원별 0-10 점수
`/plan-devex-review`	DX 리드 — 개발자 경험 감사
`/autoplan`	자동 파이프라인 — 모든 리뷰 순차 실행

Build

스킬	역할
`/design-consultation`	디자인 파트너 — 디자인 시스템 구축
`/design-shotgun`	디자인 탐색 — 목업 4-6개 변형 생성
`/design-html`	디자인 엔지니어 — 목업→프로덕션 HTML

Review

스킬	역할
`/review`	스태프 엔지니어 — 코드 리뷰 + 자동 수정
`/investigate`	디버거 — 체계적 루트 코즈 분석
`/design-review`	디자이너 — 디자인 감사 + 수정
`/devex-review`	DX 테스터 — 라이브 DX 감사
`/codex`	세컨드 오피니언 — OpenAI로 독립 리뷰

Test

스킬	역할
`/qa`	QA 리드 — 브라우저 테스트 + 수정 + 회귀 테스트
`/qa-only`	QA 리포터 — 리포트만
`/cso`	CSO — OWASP + STRIDE 보안 감사
`/benchmark`	성능 엔지니어 — Core Web Vitals 측정

Ship

스킬	역할
`/ship`	릴리스 엔지니어 — 테스트→PR
`/land-and-deploy`	릴리스 엔지니어 — 머지→배포→검증
`/canary`	SRE — 배포 후 모니터링
`/document-release`	테크 라이터 — 문서 자동 업데이트

Reflect

스킬	역할
`/retro`	EM — 주간 회고, 성장 기회

지원 도구

도구	기능	사용 시점
`/browse`	Chromium 직접 제어 (~100ms)	웹 앱 디버깅, 실시간 확인
`/pair-agent`	다른 AI와 브라우저 공유	멀티 에이전트 협업
`/careful`	위험 명령 실행 전 경고	항상
`/freeze`	특정 폴더만 편집 허용	범위 제한 필요 시
`/guard`	`/careful` + `/freeze` 합본	프로덕션 작업 시
`/unfreeze`	`/freeze` 해제	잠금 해제 필요 시
`/learn`	세션 간 학습 패턴 저장	지식 축적

스킬 선택 가이드

만드는 것	Plan 단계	실시간 감사
엔드 유저 (UI/웹/모바일)	`/plan-design-review`	`/design-review`
개발자 (API/CLI/SDK/문서)	`/plan-devex-review`	`/devex-review`
아키텍처 (데이터 흐름/성능)	`/plan-eng-review`	`/review`
전부 다 / 모르겠으면	`/autoplan`	—

설치

# 기본 설치 (30초)
git clone --single-branch --depth 1 https://github.com/garrytan/gstack.git ~/.claude/skills/gstack
cd ~/.claude/skills/gstack && ./setup

# 팀 모드 (자동 업데이트)
cd ~/.claude/skills/gstack && ./setup --team

# 멀티 플랫폼
./setup --host codex    # OpenAI Codex
./setup --host cursor   # Cursor
./setup --host kiro     # Kiro

요구사항: Claude Code, Git, Bun v1.0+

실전 패턴

패턴 1: 풀 스프린트 (처음부터 끝까지)

/office-hours → /autoplan → (코딩) → /review → /qa → /cso → /ship → /retro

패턴 2: 빠른 기능 추가 (Plan 생략)

1	`(코딩) → /review → /qa → /ship`

패턴 3: 버그 수정

1	`/investigate → (수정) → /review → /qa → /ship`

패턴 4: 디자인 중심

/office-hours → /plan-design-review → /design-shotgun → /design-html → /review → /ship

패턴 5: 보안 감사 후 출하

1	`/review → /cso → /qa → /ship`

패턴 6: 프로덕션 안전 작업

/guard → (작업) → /review → /qa → /ship → /land-and-deploy → /canary

Phase 2: Think & Plan 심화

/office-hours — 6가지 강제 질문

바로 구현부터 들어가면 “3일 코딩 → 이게 아니었는데” 발생. /office-hours는 코딩 전에 AI가 강제로 “왜?”를 물어보는 도구

"이 제품이 해결하는 진짜 문제가 뭐야?"
"왜 기존 방법으로는 안 돼?"
"누가 이걸 쓸 거야?"
"성공하면 어떤 모습이야?"
"가장 위험한 가정이 뭐야?"
"가장 작게 시작하려면?"

아웃풋: 디자인 독 → 이후 모든 Plan 스킬의 입력이 됨

매번 쓸 필요는 없다

상황	`/office-hours` 필요?
새 프로젝트, 아이디어가 막연함	필수
새 기능인데 방향이 확실함	선택
버그 수정, 리팩토링	불필요 — 바로 `/investigate`나 `/review`
기존 기능 개선	선택

Plan 스킬 3종 — 같은 문서를 다른 눈으로

           같은 디자인 독
          ┌──────┴──────┐
          │              │
   /plan-ceo-review   /plan-eng-review   /plan-design-review
          │              │                       │
    "너무 크잖아,       "이 구조면              "이 UI 흐름은
     MVP로 줄여"       DB 2개 필요해"          3클릭이 너무 많아"

스킬	관점	핵심 질문
`/plan-ceo-review`	비즈니스	“이 스코프가 맞아?”
`/plan-eng-review`	기술	“이 구조로 만들 수 있어?”
`/plan-design-review`	사용자	“사용자가 이걸 쓸 수 있어?”

/plan-eng-review 산출물

단순 “괜찮다/안 괜찮다”가 아니라 구체적 산출물:

아키텍처 다이어그램 확정
테스트 매트릭스 (뭘 테스트해야 하는지)
실패 모드 분석 (뭐가 터질 수 있는지)
숨겨진 가정 노출

→ 나중에 /review, /qa할 때의 기준이 됨. Plan에서 정했으니 Ship할 때 빠뜨릴 수 없는 구조

/autoplan — 실전에서는 이거면 끝

/autoplan 한 번 치면:
  → 프로젝트 타입 자동 감지
  → 필요한 리뷰만 자동 선택 (웹앱이면 design, API면 devex)
  → CEO → design → eng → DX 순서로 자동 실행
  → 사람한테는 "취향 결정"만 물어봄

실전 공식: /office-hours → /autoplan 이 두 개면 Think+Plan 끝

SuperClaude vs gstack 비교

항목	SuperClaude	gstack
목적	에이전트 + 도구 확장	스프린트 워크플로우
접근	기능별 명령어	역할별 전문가
강점	유연한 조합, 플래그 시스템	체계적 프로세스, 스킵 방지
약점	순서는 사용자가 결정	Build(코딩) 스킬 없음
핵심 메타포	도구상자	팀 조직도
코드 리뷰	`/sc:analyze` (같은 맥락)	`/review` (분리된 관점) + `/codex` (다른 모델)
보안	`/sc:analyze --focus security`	`/cso` (OWASP + STRIDE 전용)
배포	`/sc:git`	`/ship` → `/land-and-deploy` → `/canary` 체인