EP04 해설 — GTM 에이전트부터 비동기 세일즈까지: 실전 사례로 본 GTM의 현재

왜 사례인가

EP01~03이 프레임워크와 시스템을 다뤘다면, EP04는 "진짜로 작동한 것들"을 보여준다.

이론은 설득력이 있다. 하지만 대표/파운더가 실제로 움직이게 만드는 건 구체적인 숫자다. "GTM 에이전트가 중요합니다"보다 "ClickUp이 SDR 40명을 2명으로 줄이고 인건비를 95% 절감했습니다"가 행동을 만든다. EP04는 의도적으로 주장을 최소화하고 데이터를 최대화했다.

6개 사례를 해부한 후 공통 패턴 3가지를 추출했다. 이 패턴들은 EP01~03의 프레임워크를 실전에서 검증하는 동시에, EP05의 AI-native 조직론으로 이어지는 다리가 된다.

---

사례 1: GTM 에이전트 — 2명이 40명을 이기다

AI가 SDR(영업개발담당)의 반복 작업을 흡수하면서, 소수 정예가 대규모 팀을 압도하는 사례가 나타나고 있다. 세 회사의 데이터를 나란히 놓으면 패턴이 보인다.

회사	Before	After	핵심
ClickUp	SDR 40명	2명	AI가 리서치+아웃리치 자동화. 인건비 95% 절감
Vercel	$60K 투자	$2M 절약	32x ROI. 데이터 파이프라인이 핵심
Sendoso	15명	4명	파이프라인 30% 증가하면서 인력 73% 감소

세 사례에 공통되는 원칙이 두 가지 있다.

"최고의 영업사원을 섀도잉하라"

AI 에이전트를 만들 때 흔한 실수는 하위 50%의 SDR이 하는 반복 작업을 자동화하는 것이다. ClickUp은 다르게 접근했다. 상위 10%의 영업사원이 하는 판단과 패턴을 AI에 복제했다. 평균을 자동화한 게 아니라 최고를 복제한 것이다.

이 차이는 결정적이다. 하위 50% 자동화는 "같은 일을 더 싸게"다. 상위 10% 복제는 "더 나은 일을 더 많이"다. 40명이 평균적으로 하던 것을 AI가 대체한 게 아니라, 2명이 상위 10% 수준으로 실행하면서 나머지 38명이 불필요해진 것이다.

"데이터가 진짜 프로젝트"

AI 에이전트의 품질은 프롬프트가 아니라 입력 데이터의 품질에 의존한다. Vercel이 $60K를 투자해서 $2M을 절약한 32x ROI의 핵심은 AI 모델이 아니라 데이터 파이프라인이었다. CRM 데이터 정리, 이벤트 데이터 연결, 웹사이트 행동 데이터 통합 — 이 "재미없는" 작업이 에이전트 품질의 80%를 결정한다.

한국 스타트업들이 "우리도 AI SDR 도입하겠다"고 할 때 간과하는 부분이 바로 이것이다. AI 에이전트는 "프롬프트 잘 쓰면 되는 것"이 아니라 "데이터 인프라 프로젝트"다. EP01에서 다룬 Clay 모델이 여기서 극단적으로 진화한 형태라고 볼 수 있다.

---

사례 2: Lovable Score — "좋은 제품"을 숫자로 만드는 법

"우리 제품 좋아요"는 주장이다. 모든 회사가 하는 주장이고, 따라서 아무도 안 믿는다. Lovable Score는 이 주장을 측정 가능한 지표로 만든다.

복합 지표 설계

단일 지표로는 "좋은 제품"을 측정할 수 없다. Lovable Score는 4개 지표를 가중 결합한 복합 지표다.

구성 요소	비중	측정하는 것
NPS (Net Promoter Score)	35%	추천 의향
PMF Survey	25%	"이 제품 없으면 얼마나 아쉬운가"
CSAT	20%	고객 만족도
CES (Customer Effort Score)	20%	사용 난이도

각 지표가 다른 측면을 포착한다. NPS는 추천 의향이지만 실제 행동과 괴리가 있을 수 있다. PMF Survey는 제품 의존도를 측정하지만 시장 상황에 영향을 받는다. CSAT는 현재 만족도이고, CES는 마찰 수준이다. 하나만 보면 편향되지만, 네 개를 결합하면 입체적인 그림이 나온다.

킬러 질문: "실제로 추천하셨습니까?"

NPS는 "추천하시겠습니까?"를 묻는다. 추천 의향이다. Lovable Score 설계에서 가장 날카로운 변형은 이 질문을 바꾼 것이다: "실제로 추천하셨습니까?" 의향이 아니라 실제 행동을 묻는다.

이 한 질문의 차이가 크다. NPS 9점(추천 의향 높음)인 고객이 실제로 추천하지 않는 경우가 비일비재하다. 역으로 NPS 7점이지만 이미 3명에게 추천한 고객도 있다. 의향과 행동 사이의 갭을 직접 측정하는 것이 Lovable Score의 핵심 혁신이다.

반직관적 인사이트: 스케일할수록 점수가 떨어진다

Lovable Score는 스케일할수록 하락한다. 제품이 더 다양한 유저에게 확산되면, 코어 유저가 아닌 peripheral 유저의 비중이 늘면서 평균 점수가 내려간다. 이건 버그가 아니라 자연스러운 현상이다.

따라서 Lovable Score의 목표는 "올리기"가 아니라 "지키기"다. 현재 점수 80+을 유지하는 것이 성장보다 어렵다. 이 관점은 "성장하면서 품질을 유지할 수 있는가?"라는 근본적인 질문으로 이어진다. EP05에서 다룰 4 Layers(Explicit/Implicit/Adoption/Impact) 프레임워크와 직결되는 지점이다.

---

사례 3: Personio — 미팅 없이 10만 달러를 클로징

Gartner에 따르면, 구매자 여정의 6%만 영업사원과 접촉한다. 나머지 94%는 스스로 리서치한다. 대부분의 B2B 회사가 이 6%에 모든 자원을 집중하는 동안, Personio는 나머지 94%를 설계했다.

Personio가 도입한 건 비동기 세일즈다. 디지털 세일즈룸이라는 공간에 맞춤형 비디오, 제안서, 가격표, FAQ를 올려놓고 바이어가 자기 페이스로 탐색하게 한다. "미팅 잡아주세요"가 아니라 "이 비디오 보세요, 질문 있으면 답장하세요."

숫자가 말하는 것

지표	수치
디지털 세일즈룸 도입 후 승률	+67%
딜 사이즈	+57%
CEO 대상 세일즈	6~9개월 비디오만 전송 → $100K 계약

세 번째 데이터가 핵심이다. CEO에게 6~9개월 동안 미팅 한 번 잡지 않고, 맞춤 비디오만 보냈더니 $100K 계약이 나왔다. CEO는 특히 미팅을 싫어하지만, 3분짜리 맞춤 비디오는 본다. 자기 페이스로, 자기 시간에, 필요한 정보만 골라서.

왜 비동기가 동기를 이기나

비동기 세일즈가 작동하는 이유는 바이어의 심리에 있다. "일정 맞추기"가 세일즈의 가장 큰 마찰이었다. 데모 미팅 하나 잡으려면 3~5번의 이메일 래리가 필요하고, 보통 2주가 걸린다. 그 사이에 바이어의 관심이 식거나, 경쟁사가 먼저 접근한다.

비동기는 이 마찰을 제거한다. 바이어가 새벽 2시에 제안서를 검토하든, 주말에 비디오를 보든, 영업사원의 일정과 무관하게 구매 여정이 진행된다. 이건 편의의 문제가 아니라 전환율의 문제다. 마찰이 줄면 전환율이 올라간다.

다만, 비동기가 작동하려면 콘텐츠 품질이 훨씬 높아야 한다. 미팅에서는 영업사원이 실시간으로 질문에 답하고 반응을 조정할 수 있다. 비동기에서는 콘텐츠가 그 역할을 혼자 해야 한다. "잘 만든 비디오 하나"의 가치가 "평범한 미팅 10개"를 넘어서야 비동기가 성립한다.

---

6개 사례를 관통하는 3가지 패턴

EP04에서 다룬 모든 사례를 관통하는 패턴이 세 가지로 수렴했다.

패턴 1: 사람 수가 줄고 시스템 밀도가 올라간다

ClickUp 40명→2명, Sendoso 15명→4명. 인력이 줄었지만 파이프라인은 늘었다. AI가 반복 작업을 흡수하면서, 남은 사람은 판단과 관계에 집중하게 된다.

이건 "해고"의 이야기가 아니라 "역할 재정의"의 이야기다. SDR이 없어지는 게 아니라, SDR의 업무 중 AI가 할 수 있는 부분(리서치, 초기 아웃리치, 데이터 정리)이 분리되고, 남은 사람은 AI가 할 수 없는 부분(복잡한 판단, 관계 구축, 예외 처리)에 특화된다.

EP05에서 이 패턴이 AI-native 회사 전체로 확장되는 것을 볼 수 있다.

패턴 2: 비동기가 동기를 이긴다

Personio의 미팅 없는 $100K 클로징이 대표 사례다. 구매자가 자기 페이스로 결정할 때 전환율이 올라간다. "일정 맞추기"가 세일즈에서 가장 큰 마찰이었고, 비동기는 그 마찰을 제거한다.

더 넓게 보면, 이건 B2B 세일즈의 소비자화(consumerization)다. B2C에서 소비자가 "알아서 검색하고 알아서 결제"하듯, B2B 바이어도 점점 같은 경험을 기대한다. EP03에서 다룬 B2C의 루프 2(관심 → 시도)에서 마찰을 최소화한 것과 동일한 원리가 B2B에서도 작동한다.

패턴 3: 측정이 바뀌면 행동이 바뀐다

Lovable Score가 만들어지자 "좋은 제품"에 대한 대화가 주관적 감상에서 데이터 기반 논쟁으로 바뀌었다. 복붙률 20%(GC AI), 발송률(Fyxer) — 측정 방식이 제품 방향을 결정한다.

이건 "측정하면 관리된다"는 피터 드러커 격언의 GTM 버전이다. 하지만 중요한 반론도 있다: 잘못된 지표를 측정하면 잘못된 방향으로 달린다. Lovable Score가 유효한 건 4개 지표를 복합적으로 보기 때문이다. NPS만 보면 추천 의향은 높지만 실제 추천은 안 하는 현상을 놓치고, CSAT만 보면 현재 만족도는 높지만 다른 옵션이 나오면 바로 이탈하는 고객을 간과한다.

---

한국 B2B에서의 시사점

GTM 에이전트: 한국 스타트업도 SDR 팀 대신 AI + 소수 정예가 가능하다. 하지만 한국어 데이터 소스가 병목이다. 영어권에서는 LinkedIn, Crunchbase, G2 등의 데이터를 Clay로 자동 수집하지만, 한국에서는 잡코리아, 로켓펀치, 네이버 블로그를 크롤링해야 하고 구조화된 API가 부족하다. 이 간극을 푸는 회사가 한국의 Clay가 될 수 있다.

Lovable Score: 한국 B2B는 아직 "NPS만 보는" 수준이다. 복합 지표를 설계하는 것 자체가 차별화다. "우리 NPS 70입니다"보다 "우리 Lovable Score 82입니다, NPS 72 + PMF 88 + CSAT 84 + CES 80"이 훨씬 설득력이 있다.

비동기 세일즈: 한국은 "만나서 얘기합시다" 문화다. 비동기가 작동하려면 콘텐츠 품질이 미국보다 훨씬 높아야 한다. 한국 바이어는 비디오 하나로 결정하지 않을 수 있다. 하지만 미팅 전에 비동기 콘텐츠를 미리 보내서 미팅의 질을 올리는 "하이브리드" 접근은 즉시 적용 가능하다.

---

시리즈 연결

← EP03: B2C GTM 시스템의 4루프 프레임을 실제 B2B 사례로 검증
→ EP05: AI-native 회사들이 이 패턴을 극단적으로 밀고 나감. bolt.new $40M, 7AI 새벽 2시 전화
← EP01: Clay 모델이 GTM 에이전트로 극단 진화. FDE 모델은 EP05 HappyRobot으로 진화