EP04에서 EP05로 — 사례에서 구조로
EP04가 "진짜로 작동한 것들"을 사례로 보여줬다면, EP05는 한 단계 더 들어간다. 가장 빠르게 성장하는 AI 회사들이 성장 프로세스 자체를 어떻게 AI화하고, 조직과 역할을 어떻게 재편하는지 보여준다.
이 에피소드는 두 개의 소스를 레이어링하는 구조로 만들어졌다. Kyle Poyar(Growth Unhinged)가 12개 AI-native 창업자를 직접 인터뷰한 데이터가 "왜 다른지"를 증명하고, Amol Avisari(Anthropic Head of Growth)가 Lenny's Podcast에서 공개한 내부 작동법이 "어떻게 하는지"를 보여준다. 데이터 없이 Anthropic만 다루면 팬보이 에피소드가 된다. 12개 회사의 패턴이 먼저 깔려야, Anthropic이 "대표 사례"로 설득력을 갖는다.
---
AI-Native 성장은 왜 다른가 — Kyle Poyar 데이터
$1M ARR까지의 속도가 2배
기존 SaaS에서 PMF를 찾고 $1M ARR에 도달하는 데 걸리는 시간은 약 2년이다. Figma, Airtable, Slack 같은 성공 사례조차 PMF까지 4년 이상 걸렸다. AI-native 회사들의 중앙값은 빌드 시작 후 12개월이다.
극단적 사례는 더 놀랍다. bolt.new는 런칭 4주 만에 $4M ARR을 찍었다. GrowthX는 창업 3개월 만에 $1M ARR을 돌파했다. Clay의 Varun Anand는 "전설적인 회사를 만드는 핵심 원칙은 바뀌지 않았다. 다만 모든 것이 훨씬 빨라졌다"고 말한다.
PMF가 바이너리하다
기존 스타트업에서 PMF는 점진적으로 느껴지는 경우가 많다. "조금씩 나아지고 있는 것 같다"는 감각. AI-native에서 PMF는 바이너리다. 극단적인 market pull이 있거나, 없거나.
bolt.new의 Alexander Berger: "Day one에 PMF를 느꼈다. 우리가 만든 것 중 가장 좋은 제품이라는 게 즉시 명확했다." Fyxer의 Archie Hollingsworth: "신규 유저가 너무 많아서 서비스를 꺼야 했다." GrowthX의 Marcel Santilli: "회사를 공식 발표하기도 전에 매출이 $2M이었다."
이 바이너리한 PMF 감각은 EP02에서 Beyond Product가 스스로에게 던진 질문과 직결된다. "심각한 문제를 겪는 수요가 충분한가?" AI-native에서 이 질문의 답은 모호하지 않다. 폭발적으로 끌려오거나, 아무 일도 안 일어나거나.
가격 저항이 소멸한다
AI가 실제 일을 해주면, 가격에 대한 저항이 급격히 떨어진다. GC AI는 ChatGPT 구독료의 20배 이상 가격인데도 빠르게 구매가 일어난다. 수업을 들은 사람의 23%가 제품을 구매한다. Gamma는 A/B 테스트 결과 가장 높은 가격($20/월)이 최고 전환율을 기록했다.
Gamma의 Jon Noronha: "생산성 앱에 월 $10 내게 하는 건 정말 어려웠다. AI에 월 $20 내게 하는 건 훨씬 쉽다." 이건 제품의 가치 전달 방식이 근본적으로 바뀌었기 때문이다. 기능(feature)을 파는 게 아니라 결과(outcome)를 파는 것이다. EP04에서 다룬 비동기 세일즈의 논리와 같은 맥락이다 — 바이어가 가치를 직접 체감하면, 가격 논쟁이 사라진다.
---
CASH — Claude Accelerates Sustainable Hypergrowth
Anthropic 내부 이니셔티브로, 성장 실험의 전 과정을 Claude로 자동화하는 프레임워크다. zoon이 이 에피소드에서 "가장 중요한 건 CASH"라고 했고, "AI가 성장을 자동화한다는 주제는 한국에서 거의 다뤄지지 않았다"고 강조했다.
4단계 프로세스
| 단계 | 내용 | 자동화 수준 |
|---|---|---|
| Discover | 트렌드/데이터 분석으로 성장 기회 파악 | Claude가 기회를 서제스트 |
| Build | 기능 구축 + 배포 준비 | 소규모 카피/UI 변경은 자동 |
| Test | 품질/브랜드 기준 부합 여부 테스트 | 가이드라인 기반 자동 리뷰 |
| Analyze | 배포 후 데이터 분석 + 교훈 도출 | 결과 분석 자동화 |
현재 성과는 경력 2~3년차 주니어 PM 수준의 성공률이다. 소규모 카피 변경, 미세한 UI 수정 같은 테스트 영역에서 "prints money"라는 평가를 받고 있다.
왜 이것이 중요한가
EP04에서 다룬 패턴 — "사람 수가 줄고 시스템 밀도가 올라간다" — 의 극단적 형태다. ClickUp이 SDR 40명을 2명으로 줄인 것이 GTM 실행의 자동화였다면, CASH는 GTM 전략 수립 자체의 자동화다. 실행이 아니라 판단을 AI에 위임하기 시작한 것이다.
물론 아직 인간 개입이 필요하다. 브랜드 가치 보호와 타 부서 이해관계 조율은 AI가 대체하기 어렵다. 하지만 Anthropic은 Claude에게 명확한 가이드라인을 "스킬"로 부여하면서, 인간 승인 절차도 점차 축소하고 있다. AI의 지수함수적 발전에 따라, 더 큰 규모의 실험도 자동화될 것이라는 게 팀의 판단이다.
한국 스타트업에 던지는 질문: 당신 회사의 그로스 실험은 몇 명이 몇 주에 걸쳐 실행하는가? CASH 같은 프레임워크가 없더라도, "이 실험의 어떤 부분을 AI에 맡길 수 있는가?"라는 질문 자체가 출발점이다.
---
큰 베팅 vs 작은 최적화 — 지수함수적 사고
일반적인 그로스 팀은 업무 시간의 70%를 마이크로 최적화에 쓴다. 전환율 12%를 13%로 올리는 작업. Anthropic은 정반대다. 50~70%를 큰 베팅에 투입한다.
Amol의 논리는 이렇다: AI 제품의 사용자 가치는 2년 뒤 현재의 100배~1,000배로 폭발한다. 그 전제에서, 지금 전환율을 1%포인트 올리는 게 의미가 있는가? "Linear charts are not cool. Only log linear charts."
이건 단순한 과장이 아니다. Amol은 업무 시간의 70%를 "Success disasters" 수습에 쓴다고 말한다. 급격한 성장에 수반되는 시스템 붕괴, 인프라 과부하, 조직 스케일링 문제. 능동적으로 성장을 최적화하는 데 쓰는 시간은 30%에 불과하다. 성장이 너무 빨라서, 성장을 따라잡는 것 자체가 일이 된 것이다.
한국 B2B에서의 시사점: "큰 베팅"은 리소스가 풍부한 회사만 할 수 있는 것처럼 보인다. 하지만 핵심은 리소스가 아니라 관점이다. "지금의 1% 최적화"와 "6개월 후의 10x 기회" 중 어디에 시간을 쓸 것인가? 한국 스타트업 대부분은 마이크로 최적화에 매몰되어 있다. 이건 안전해 보이지만, 제품 가치가 지수함수적으로 변하는 AI 시대에는 가장 위험한 선택일 수 있다.
---
PM의 죽음? 엔지니어가 미니PM이 되는 세계
이 에피소드에서 한국 맥락에서 가장 논쟁적인 파트다.
문제
Claude Code 같은 AI 코딩 도구로 엔지니어 생산성이 2~3배 폭발했다. 기존 비율(PM 1명 : 엔지니어 5~7명)로 배치된 PM과 디자이너가 갑자기 15~20명분의 업무량을 감당해야 한다. PM이 심각한 병목이 된 것이다.
Anthropic의 해법
2주 미만 엔지니어링 프로젝트는 엔지니어가 직접 Mini PM 역할을 수행한다. 엔지니어가 법무, 보안, 타 부서 소통을 직접 주도한다. PM은 조언자(advisor) 역할로 후퇴한다. PRD 작성 비율은 20~30%에 불과하다. 대부분은 Slack 대화 + 킥오프 미팅 + 프로토타이핑으로 진행된다.
PM이 사라지는 게 아니다. PM은 더 높은 차원으로 진화해야 한다: 전략적 방향 설정, 부서 간 복잡한 정렬, 엔지니어의 제품적 사고 코칭, 큰 규모의 cross-functional 문제 해결. 작은 기능 배포는 AI와 엔지니어가 대체한다.
한국에서 이게 가능한가
솔직히 어렵다. 한국의 조직 문화에서 엔지니어가 법무와 직접 소통하거나, PM 없이 기능 방향을 결정하는 것은 문화적 저항이 크다. "그건 PM 일이잖아"라는 반응이 기본이다.
하지만 이건 "가능한가"보다 "언제 불가피해지는가"의 문제다. AI 코딩 도구의 생산성 향상은 한국 기업에도 동일하게 적용된다. 엔지니어가 3배 빨라졌는데 PM 비율이 그대로면, 병목은 한국에서도 똑같이 발생한다. Anthropic이 이미 부딪힌 문제를 한국 기업은 6~12개월 뒤에 부딪힐 것이다. 미리 생각해둘 가치가 있다.
---
AI 제품이 작동하는지 판단하는 법 — 4 Layers
Kyle Poyar 리포트에서 가장 실용적인 프레임은 AI 제품 품질을 측정하는 4단계 시그널이다.
Layer 1: Explicit Signals (명시적 피드백)
Thumbs up/down 같은 직접적 피드백. Gamma는 이 시그널과 다운스트림 전환율 사이에 강한 상관관계를 발견했다. 단순하지만 강력하다.
Layer 2: Implicit Signals (암묵적 시그널)
사용자가 AI 아웃풋을 얼마나 수정하는가. GC AI는 응답의 20%가 그대로 복사된다는 데이터를 발견했다. 변호사들이 AI 응답을 실제 업무에 활용하는 증거다. Fyxer는 AI가 작성한 이메일 초안 중 실제 발송 비율을 측정한다.
Layer 3: Adoption Signals (채택 시그널)
Copilot 제품은 월간 편집 일수, DAU:MAU 비율. Agentic 제품은 일일 메시지 수 같은 consumption 메트릭. bolt.new는 DAU에서 DAU + 메시지 수/DAU로 핵심 지표를 진화시켰다.
Layer 4: Business Impact Signals (비즈니스 임팩트)
Intercom의 Fin.ai는 Resolution rate를 최상위 메트릭으로 놓고, CSAT와 Total automation rate를 보조 지표로 사용한다. HappyRobot은 배치된 AI agent 수, 대체/보강한 FTE 수, 완료한 작업 볼륨을 측정한다.
EP04에서 다룬 Lovable Score가 "좋은 제품"을 숫자로 만드는 시도였다면, 이 4 Layers는 "AI 제품이 실제로 일하고 있는지"를 숫자로 만드는 시도다. 측정이 바뀌면 행동이 바뀐다 — EP04의 세 번째 패턴이 여기서 다시 확인된다.
---
AI-Native GTM의 진화 — Self-serve에서 Hybrid로
Kyle Poyar 데이터에서 놀라운 발견: 12개 AI-native 회사 중 현재 self-serve only는 단 1개다. 75%가 self-serve + sales-assisted 하이브리드로 운영 중이다.
초기에는 절반이 self-serve로 시작했다. 하지만 스케일하면서 거의 모두 세일즈를 붙였다. 첫 AE 채용 시점의 중앙값은 $2~5M ARR로, 기존 SaaS(~$1M ARR)보다 훨씬 늦다. HeyGen과 Gamma는 $10M+ ARR까지 세일즈 없이 운영했다.
bolt.new의 사례가 이 전환을 가장 잘 보여준다. 초기 폭발적 self-serve 성장 후, 대부분의 가입이 개인 이메일이었고 리텐션과 마진에 문제가 생겼다. 2025년 Q4부터 B2B 업마켓 + sales-assisted로 전환했다.
AirOps의 Matt Hammel: "엔드유저 레벨과 리더십 레벨 양쪽에 붙어야 한다. 한 쪽만으로는 뿌리를 내리지 못한다." 동시에 경고도 있다: "AI 위원회에 팔지 마라. 상상의 예산 나라에 갇히게 된다."
이건 EP01에서 다룬 FDE vs Clay의 진화 버전이다. 초기에는 Clay(도구)로 빠르게 확산하고, 스케일하면서 FDE(사람)를 붙이는 것. Bottom-up discovery + top-down sales의 결합. 결국 양쪽 다 필요하다.
---
세일즈가 컨설팅이 된다
가장 성공적인 AI-native GTM 팀은 SaaS 셀러보다 컨설팅 펌에 가깝다. 기능을 파는 게 아니라 비즈니스 트랜스포메이션을 판다.
7AI는 AI Security Engineers를 모든 계정에 배치하고, 새벽 2시에도 전화를 받는다. HappyRobot은 forward-deployed engineers를 보내 고객 워크플로우에 파트너링한다. Intercom의 Des Traynor: "AI를 도구로 보는 마인드셋에서 벗어나, AI를 트랜스포메이션으로 포지셔닝하라."
EP01에서 zoon이 다룬 Palantir FDE 모델이 여기서 다시 등장한다. HappyRobot의 forward-deployed engineers, 7AI의 계정별 AI 배치는 FDE 모델의 AI-native 진화형이다. 사람을 보내되, 그 사람이 AI를 무기로 들고 간다.
---
시리즈 연결
- ← EP04: 실전 사례 6개에서 추출한 3가지 패턴이 EP05에서 구조적으로 확인됨
- ← EP01: FDE 모델이 AI-native 시대에 HappyRobot, 7AI로 진화. Clay 모델은 self-serve GTM의 시작점
- ← EP02: "PMF가 바이너리하다"는 발견이 EP02의 시장 프레임워크("수요가 있느냐 없느냐")와 직결
- ← EP03: 4루프 시스템이 AI-native에서 가속됨. Self-serve → hybrid 전환은 루프 2(관심→시도)와 루프 3(시도→습관)의 진화
- → EP06: TBD