이 글은 토스의 성장 과정을 기록한 책 '유난한 도전'에 등장하는 장애 사례를 바탕으로 작성했습니다. 토스가 겪은 연속된 장애2017년 말, 토스는 사용자 600만 명을 바라보며 빠르게 성장하고 있었다. 간편송금, 신용등급 조회 등 잇달아 터지는 서비스 성공 덕분이었다. 그런데 팀 내부에는 해결되지 않은 긴장감(?)같은 게 있었고, 매월 10일이 되면 엔지니어들이 신경을 곤두세웠다. 중소기업과 아르바이트생의 급여일이 집중되는 날, 토스에 트래픽이 폭발적으로 몰렸기 때문이다. 결국 10월 10일, 우려가 현실이 됐다. 저녁 7시부터 무려 3시간 동안 고객 7만 명이 송금을 시도했다가 실패했다. 처음엔 일부 은행으로의 오류였지만, 곧 어떤 은행으로도 송금이 되지 않는 전면 장애로 번졌다. 고객 문의가 쏟아졌..