2019 9-10월호 범주적 사고의 위험 필립 페른백(Philip Fernbach)
바트 데랑헤(Bart De Langhe)

PSYCHOLOGY

범주적 사고의 위험

 

바르트 데랑헤

에사데경영대학원 교수

필립 페른백

리즈경영대학원 교수

 

 

인간의 뇌는 받아들인 정보를 여러 범주(그룹)로 분류하려는 성향이 있다. 그 때문에 오히려 좋은 결정을 내리지 못할 때도 있다.

 

 

 

 

IDEA IN BRIEF

문제

인간은 모두 범주적으로 생각한다. 거기에는 그럴듯한 이유가 있다. 범주적 사고는 세상을 더 쉽게 이해할 수 있게 해준다. 하지만 비즈니스 세계에서 범주적 사고는 의사결정의 심각한 오류로 이어지기도 한다.

 

부작용

우리는 뭔가를 범주로 분류할 때, 한 그룹에 속한 것들끼리 실제보다 유사성이 더 높은 것처럼 생각한다. 반면 범주 사이의 차이는 실제보다 크게 생각하고, 어떤 범주를 다른 범주보다 선호해 차별하며, 우리가 만든 분류구조가 불변인 것처럼 생각하며 ‘화석화(fossilize)’한다.

 

해결책

현명한 리더들은 네 가지 방식으로 범주적 사고의 폐해를 피할 수 있다. 범주화의 위험을 모두가 이해하도록 하고, 지속적인 데이터 분석 방법을 개발하며, 의사결정 분류기준에 의문을 제기하고, 범주의화석화를 적극 방지한다.

 

 

 

 

 

‘타’, ‘라고 말해 보라. 말할 때마다 입안의 구조가 이 소리를 어떻게 만드는지 느끼며 반복해 보라. 차이가 느껴지는가?

 

이것은 사실 함정 문제다. 두 소리의 입모양에는 사실 차이가 없다. ‘발성 시차가 다른 데에서 소리가 달라진다. 발성 시차는 혀를 움직이는 순간부터 성대에 진동을 주기 시작하는 데까지 걸리는 시간이다. 그 차이가 40밀리세컨드(1밀리세컨드=1000분의 1)보다 더 크면, 영어 사용자는 그 소리를로 듣는다. 그 차이가 40 밀리세컨드보다 작으면로 인식한다.

 

놀라운 것은이외의 다른 소리로는 들리지 않는다는 점이다. 만약 두 명의 화자가 40밀리세컨드를 기준으로 둘 다 길거나 둘 다 짧은 발성 시차를 갖는다면, 둘의 발성 시차가 크게 다르다 해도 같은 소리로 들리게 된다. 예를 들어 한 사람은 발성 시차가 80밀리세컨드고 다른 사람은 50밀리세컨드밖에 되지 않는다 해도, 두 사람의 발음은 모두로 들린다. 만약 두 사람이 40밀리세컨드 기준에서 각기 다른 쪽에 있다면, 겨우 10밀리세컨드의 차이도 다른 소리로 들린다. 만약 한 명의 발성 시차가 45밀리세컨드라면로 들린다. 다른 사람이 35밀리세컨드라면로 들린다. 이상하지만 사실이다.

 

최근 인터넷에서는 이렇게 우리의모 아니면 도마인드를 이용한 장난이 인기를 끌었다. 어떤 사람에게는야니, 어떤 사람에게는로렐로 들리는 음성파일이 인터넷을 휩쓴 적이 있다. 어떤 사람에게는 검은색/흰색으로, 어떤 사람에게는 흰색/금색으로 보이는 드레스 사진도 있었다. ‘소리와 마찬가지로 사람들은 범주로 나눈 기준선의 이쪽 또는 저쪽만을 선택했고, 자신의 인식이 맞다는 데 정말 목숨까지 걸려고 했다.

 

인간의 머릿속은 범주화 기계나 마찬가지다. 엄청난 양의 복잡한 데이터를 받아, 단순화하고 구조화하느라 바쁘다. 그래야 이 세상을 이해할 수 있기 때문이다. 이것은 우리 마음의 가장 중요한 능력 중 하나다. 뭔가를 힐끗 보고 한눈에 뱀인지 막대기인지 구분할 수 있다는 건 엄청난 능력이다.

 

이런 범주화는 두 가지 조건이 맞을 때 비로소 가치가 있다. 첫째, 근거가 타당해야 한다. 동질의 그룹을 임의로 나눌 수는 없다. 플라톤이 말했듯 타당한 범주란 뱀과 막대기를 구분하듯관절 부위를 기준으로 자연을 나누는 것이다. 둘째, 범주가 유용해야 한다. 당신에게 필요한 방식으로 차이점이 보여야 한다. 뱀과 막대기를 구분하는 것은 유용하다. 숲속을 산책하다가 죽지 않게 도와주기 때문이다.

 

 

거기까지는 괜찮다. 하지만 비즈니스를 할 때가 문제다. 우리는 때로 근거가 없거나, 쓸모가 없거나, 혹은 근거도 없고 쓸모도 없는 분류법을 만들고 거기 의존한다. 그러다 의사결정에서도 큰 실수를 저지르게 되기도 한다.

 

성격 테스트 도구인 MBTI(Myers-Briggs Type Indicator)를 생각해 보자. 이 테스트를 만드는 회사 측에 따르면 포천 500대 기업의 80%가 인사 결정에 MBTI를 참고한다. MBTI는 직원들에게 각각 답이 두 개 있는 93개의 질문지에 답을 하게 하고, 이 대답을 기반으로 해서 사람을 16개의 성격유형으로 분류한다. 문제는 이 질문지의 답변을 분석하는 것이 복잡하고 또 지속적으로 이뤄져야 하는 일이라는 것이다. ‘사실과 직관 중 무엇을 더 믿습니까?’라는 질문이 있다면 대다수는글쎄요 그때 그때 다릅니다라고 답할 것이다. 하지만 이 테스트에는 이런 보기가 없다. 응답자들은 사실 혹은 직관 둘 중 하나만을 택해야 한다. 이 시험을 다시 본다면 다시 고르지 않을 답을 하게 되기도 한다. 기업은 이런 대답들을 종합해 해당 응답자가외향적또는내향적이라거나판단자또는인식자라고 분류한다. 이런 분류법은 타당하지 않다. 유용하지도 않다. 성격 타입은 업무적 성공이나 업무 만족도와 같은 결과들을 예측할 수 없다.

 

그럼 MBTI는 왜 이렇게 인기가 있을까? 범주적 사고가 빚어내는 환상이 너무나 매혹적이기 때문이다.

 

범주적 사고는 다음 네 가지 측면에서 위험하다. 우리는 범주(그룹)의 구성원을 압축해서 실제보다 유사성이 더 높은 것처럼 생각한다. 범주 사이의 차이는 실제보다 확대해서 생각하고, 어떤 범주를 다른 범주보다 선호하고 차별하기도 한다. 또 우리가 만든 범주구조가 마치 화석화돼 불변인 것처럼 행동하며 고정관념을 갖는다.

 

압축

 

범주를 나눌 때는 가장 표준적인 형태를 먼저 생각하게 된다. 하지만 이렇게 되면 설정한 범주 내에 있는 다양성에 대해서는 잊어버리기 쉽다.

 

타깃고객이 존재한다는 편견.토드 로즈Todd Rose는 저서평균의 종말 >에서 이런 이야기를 들려준다. 1945년 클리블랜드의 어떤 신문사에서 평균 사이즈 여성을 찾는 콘테스트를 개최했다. 당시 어느 연구에서 신체의 여러 부위에 대한 평균 사이즈를 발표한 바 있었다. 이 신문사의 편집자들은 이 연구가 발표한 사이즈를 표준으로 삼아서 평균 사이즈의 여성을 모집했다. 3864명의 여성이 자신의 신체 사이즈를 제출했다. 여러 면에서 평균 사이즈에 가장 가까웠던 여성은 몇 명일까?

 

단 한 명도 없었다. 사람의 신체 사이즈는 부위마다 다 제각각이었고, 모든 부위의 평균에 가까운 사람은 없었다.

 

기업의 고객도 마찬가지다. 고객 세분화를 한 번 생각해 보자. 마케팅 부서에서 흔히 사용하는 방법이다. 세분화의 목적은 고객을 어떤 범주별로 나눈 다음 타깃고객군을 정하는 것이다. 타깃고객은 회사가 특별한 관심을 기울이고, 전략적으로 집중해야 하는 고객군이다.

 

세분화 연구는 일반적으로 고객들에게 그들의 행동과 욕구, 인구학적 특성 등을 묻는 것으로 시작한다. 이에 대한 응답을 가지고 군집화 알고리즘을 돌려서 고객을 여러 그룹으로 나눈다. 이런 유형의 분석이 차별성 높은 범주를 만들어내기는 어렵다. 하지만 타당성 여부를 진지하게 고민하지 않고 마케터들은 세분화 다음 단계를 바쁘게 진행시킨다. 평균값을 내고, 자료를 수집하고, 타깃고객을 특정한 인물로 유형화한다.

 

‘미니밴 맘과 같은 범주가 이런 식으로 탄생한다. 마케팅 부서의 누군가가 설문을 실시하고 그 안에서 매우 흥미로운 그룹을 찾아낸다고 해보자. 이 그룹에 속하는 사람 60%가 여성이고, 평균 나이는 40대 초반이며 평균 2.75명의 자녀가 있다. 이런 평균 수치들을 보다 보면 실제 데이터에서는 점점 멀어지게 되고, 이 대신 특정한 소비자의 모습을 상상하게 된다. ‘미니밴 맘이라는 타깃고객이 이렇게 탄생한다.

 

 

이런 꼬리표가 한 번 붙으면 이 범주 안에 존재하는 다양성은 놓치게 된다. 2011년 한 연구에서는 참가자들에게 체질량지수에 따라 달라지는 여성의 실루엣 이미지를 아홉 개 보여줬다. 이미지들은 동일한 간격으로 떨어져 있었다. 참가자들은 이 실루엣을 두 번씩 봤다. 첫 번째 세트는 그림1과 같았다. 두 번째 세트는 그림2와 같이 그림에거식증’ ‘정상’ ‘비만과 같은 라벨이 붙어 있었다.

 

참가자들은 여성의 실루엣에 라벨을 붙였을 때와 아닐 때, 이미지를 다르게 인식했다. 실루엣 자체는 달라진 것이 없었는데도 말이다. 예를 들어 여성7과 여성9를 모두비만카테고리로 묶자, 참가자들은 여성7와 여성9의 성격과 생활양식이 비슷할 것이라 추측했다. 여성4와 여성6에게정상이라고 표를 달았더니 응답자들은 이 둘이 비슷할 것이라 생각했다.

 

 

신체 유형과 마찬가지로, 기업이 주로 사용하는 분류법은 눈에 보이는 것만큼 분명한 기준이 아닐 수도 있다. 현실에서는 한 범주에 있는 고객들도 매우 다르게 행동하곤 한다. 압축효과에 속지 않으려면, “각각 다른 집단에 속하는 고객 두 명이 같은 집단에 속하는 고객 두 명 보다 더 비슷할 확률은 얼마나 될까라고 질문해볼 수 있다. 예를 들면, 어떤미니밴 맘이 좋아하는 의류브랜드가 다른 미니밴 맘보다 어떤아웃사이더 맘이 좋아하는 의류브랜드에 더 비슷할 확률은 얼마나 될까? 0~50% 사이겠지만 아마 50%쪽에 더 가까울 것이다.

 

선별효과.압축현상은 또한 채용결정을 왜곡시킬 수 있다. 당신이 회사에서 채용을 담당하고 있다고 생각해 보자. 채용 공고를 게시하자 20명이 지원했다. 당신은 이 중 1차로 가장 기술적 측면에서 뛰어난 다섯 명을 추려 면접을 보러 오도록 한다.

 

비록 이 다섯 명의 기술적 스킬에는 편차가 컸지만, 당신은 2차 면접에서는 이런 점을 크게 고려하지 않는다. 기술적 스킬을 기반으로 후보를 추리고 나면, 그 다음 단계까지 진출한 후보는 기술적 측면에서는 모두 비슷해 보인다. 이런 식의 범주적 사고 때문에 당신은 후보자들이 인터뷰에서 보일 소프트 스킬을 기반으로 주로 판단하게 된다. 사람이 얼마나 괜찮은지, 의사소통은 효과적인지 등이다. 이런 소프트 스킬도 물론 중요하지만, 직원 고용에 있어 가장 중요한 요건은 뛰어난 기술적 스킬이다. 선별효과 때문에 당신은 최적의 후보를 가려낼 수 없게 된다.

 

금융투자의 변칙성.압축현상은 금융시장에서도 발생한다. 주식투자자들은 기업의 규모(소형주와 대형주), 산업(에너지, 헬스케어), 위치한 지역 등에 따라 자산을 구분한다. 이런 구분을 통해 투자자들은 엄청난 가짓수의 투자옵션을 추려낼 수 있고, 이는 매우 중요하다. 하지만 이런 구분 때문에 리스크와 수익이라는 측면에서는 투자자본이 비효율적으로 배분되기도 한다. 1990년대 후반 인터넷 거품 시대, 사람들은 회사 이름에 닷컴이라는 말만 붙어도 큰 액수를 즉시 투자했다. 정작 이 회사들의 실체는 바뀐 것이 없었다. 투자자들은 이런 실수로 큰 대가를 치러야 했다. 다른 예도 있다. 어떤 주식이 S&P500에 상장되면, 이 주식은 그 인덱스에 속한 다른 기업들의 주가와 비슷하게 움직이기 시작한다. 사실 회사나 회사 주식의 본질에는 변한 것이 없는데도 말이다.

 

과대평가

 

범주적 사고를 하면 범주 간 차이를 과장하게 된다. 그러면 다른 그룹의 사람에 대해 고정관념을 갖게 되고, 결정을 내릴 때 임의로 기준을 세우고, 부정확한 결론을 내린다.

 

집단 역학.  과대평가는 당신이 사회적 혹은 정치적 그룹의 구성원들에 관해 가진 생각에 심각한 악영향을 미친다. 연구에 따르면 반대 정당을 지지하는 사람들끼리는 서로의 견해가 실제보다 더 극단적이라고 과대평가하는 경향이 있다.

 

사회적 평등에 대해 누가 더 관심이 많을까? 진보일까 보수일까? 진보라 답했다면 당신이 맞다. 평균적으로는 진보주의자들이 보수주의자들보다 사회적 평등을 더 중요하게 여긴다. 하지만 일부 보수주의자들은 진보주의자들보다 사회적 평등에 관심이 더 많다. 길에서 무작위로 두 명을 선택했는데, 첫 번째는 보수당 지지자, 두 번째는 진보당 지지자라고 가정해보자. 첫 번째 사람이 두 번째 사람보다 사회적 평등을 더 중요시할 확률은 얼마나 될까? 당신의 생각과는 달리 그 확률은 50% 가까이 될 것이다. 평균은 집단간의 공통점을 가리고 막연히 다를 것이란 편견을 키운다. 평균이 보여주는 것과는 달리, 진보주의자보다 사회적 평등에 관심이 많은 보수주의자들도 많다.

 

만약 당신이 미국에서 진보주의자로 살고 있다면, 당신은 보수주의자들 모두가 낙태, 총기규제, 사회적 안전망 확대에 반대할 것이라 추측할 것이다. 당신이 보수주의자라면 진보주의자들은 모두가 국경을 열고, 정부가 보편적 의료보험 정책을 시행하길 원한다고 믿을 것이다. 물론, 현실에서 보수주의자나 진보주의자들이 갖고 있는 사상과 정책 입장은 훨씬 다양한 스펙트럼을 보인다.

 

 

범주적 사고로 인한 과대평가는 빅데이터와 고객 프로파일링의 시대에 특히 우려해야 할 현상이다. 페이스북은 사용자의 인터넷 사용이력을 보고 사용자의 정치성향을 분류하고(중도, 보수, 진보) 광고주에게 이 정보를 제공한다. 이 때문에 광고주들은 페이스북 사용자 집단간의 차이를 실제보다 더 크게 인식하게 된다. 아이러니하게도 이 때문에 실제 집단간 차이도 더 커진다. 광고주가 각 그룹에 따라 맞춤화된 메시지를 전달하기 때문이다. 2016년 미국 대선과 영국의 브렉시트 기간 동안 벌어진 현상이 바로 이런 것이었다. 페이스북은 소위보수층진보층에 각기 다른 메시지를 수천 개씩 전달했다.

 

많은 기업이 이와 유사한 과대평가 현상 때문에 난처한 상황을 겪는다. 비즈니스의 성공은 주로 부서간 시너지 창출에 달려 있다. 하지만 범주적 사고 때문에 부서간 경계를 넘어 일할 수 있는 팀의 역량이 심각하게 과소평가될 수 있다. 사내 데이터 전문가가 기술적 전문성은 뛰어나지만 비즈니스의 운영에 대해서는 잘 모른다는 고정관념이 있고, 마케팅 매니저가 마케팅은 알지만 데이터는 잘 다루지 못한다는 고정관념이 있는 사람은 이 둘을 한 팀으로 묶어볼 생각은 하지 못한다. 그 때문에 수많은 애널리틱스 프로젝트가 실패하는 것이다.

 

의사결정.과대평가는 관리자의 의사결정을 미묘하게 바꾼다. NBA 감독들은 근소한 차로 이긴 경우(100–99)보다 근소한 차(100–101)로 패배한 뒤 선발 라인업을 바꾸는 경우가 17% 정도 더 많다. 이 두 가지 경우 상대 팀에게 내준 점수의 차이는 2점밖에 되지 않는데도 감독의 결정이 크게 달라지는 것이다. 하지만 100-108로 졌을 때와 100-106으로 졌을 때 감독의 결정이 달라지는 경우는 드물다. 이 경우도 상대팀에게 내준 점수의 차이는 똑같이 2점이다. 패배는 승리와는 질적으로 다르게 느껴진다. 스포츠에서는 결과를 연속선에 놓고 생각하지 않기 때문이다.

 

연속적으로 이어지는 일에 마디를 만들면서 결정내려야 하는 상황에서는 작은 차이를 과대평가하게 된다. 2008년 글로벌 금융위기 이후, 벨기에 정부는 BNP파리바의 자회사 포티스Fortis에 구제금융을 제공했다. 그 결과 벨기에 정부는 BNP파리바의 주식 수백만 주를 보유하게 됐다. 벨기에 신문 드 스탄다르트De Standaard에 따르면 2018 1월 말 기준, BNP파리바의 주식은 67유로를 약간 넘는 수준이었고, 정부는 68유로만 되면 모두 매각하기로 결정했다. 하지만 이런 일은 일어나지 못했다. 주가가 곤두박질쳤고, 지금 이 주식은 44유로밖에 되지 않는다.

 

벨기에 정부에서는 아무도 이렇게 주가가 크게 떨어질 것이라고는 예측하지 못했을 것이다. 하지만 정부의 실수는 주식 매각을모 아니면 도식의 베팅으로 만들어 버린 것이다. 주식 일부를 적당한 가격에 팔고, 일부를 다른 가격대에 팔기로 했다면 더 나은 전략이 됐을 것이다.

 

통계적 유의성.행동경제학과 데이터과학의 영향이 날로 커지면서 기업이 A/B테스트로 효율성을 평가하는 경우가 많아졌다. 실행과 분석이 쉽기 때문이다. A/B테스트에서는 변수 하나만 빼고 나머지 요소들은 모두 똑같게 설정된 상황을 두 개(A, B) 만든다. 그리고 참가자 한 그룹은 A 버전을, 다른 그룹은 B 버전을 경험하도록 한다. 그런 다음 이 두 그룹 간 행동이 얼마나 달라지는지를 측정한다. 이때, 두 그룹의 행동결과에는 반드시 차이가 있다. 우리가 다르게 설정한 변수가 그 차이를 가져왔을 수도 있지만, 순전히 우연일 수도 있다. 그러므로 변수의 영향이 있었는지를 판단하려면 통계적 테스트를 적용해야 한다. 변수 조작에 따른 차이가 전혀 없는데도 결과값이 달라질 확률을 통계학에서는 P(유의확률)이라고 부른다. 유의확률이 0에 가까울수록, 결과의 차이가 우연에 의해서 발생한 것이 아니라 실험자가 조작한 변수에 기인한다는 결론을 내릴 수 있다. 하지만 0에 가깝다는 게 대체 얼마나 가까워야 한다는 것일까?

 

1925년 영국 통계학자이자 유전학자인 로널드 피셔 경은 임의로 0.05가 편리한 기준이라 판단했다. 그게 0.03라 해도 이상하지 않았을 것이다. 사실 피셔는 유의확률 기준이 각 연구의 구체적 내용에 따라 다르게 설정돼야 한다고 했다. 하지만 그의 말에 주의를 기울인 사람이 별로 없었다. 이후 수십 년간 과학계는 맹목적으로 0.05를 신호와 잡음을 구분하는 마법과 같은 기준이라고 믿었고, 산업계에서도 이 수치를 기준으로 잡는 게 관행이 됐다.

 

이것이 문제다. A/B테스트에서 유의확률이 0.04로 나오면 해당 변수는 의미 있는 것으로 받아들여지지만 0.06이 나오면 해당 변수는 무시된다. p=0.04 p=0.06 사이의 차이는 너무 작아 그 자체로 별 의미가 없는데도 마찬가지다. 사태가 더 악화되는 건 많은 연구자들이 통계적 유의성을 구하기 위한 목적으로 데이터를 들여다본다는 것이다. 이들은 데이터를 계속 수집하며 관찰하다가 p값이 0.05 이하로 떨어지면 더 이상의 데이터 수집을 중단한다. 이렇게 의도를 가지고 데이터를 취하는 관행 때문에 연구자들은 특정 변수의 조작이 효과가 없는 경우에도 효과가 있다는 결론을 내리기가 쉬워졌다. 유명 온라인 플랫폼을 사용해 A/B테스트를 하는 연구자들의 관행을 조사해보니 대다수가 이런 ‘p-해킹(유의확률 조작)’을 저지르고 있었고, 허위 결론을 낼 확률이 33%에서 42%로 증가했다.

 

차별

 

범주적 구조가 한 번 결정되면, 사람들은 특정 범주만을 선호하게 된다. 하지만 다른 범주에 충분히 관심을 기울이지 않는다면 위험한 상황을 초래할 수 있다.

 

과도한 타기팅.지금 당신이 독특하고 창의적인 디자인 가구를 파는 온라인 쇼핑몰의 디지털마케팅 디렉터로 일하고 있다고 해보자. 당신은 고객 세분화 연구를 실시해 다음의 특징을 가진 타깃고객군을 찾아낸다. ‘남성, 직업이 있고, 18~34세로 패션, 마케팅, 미디어 분야에서 창의적인 일을 하는 사람으로서 가처분소득은 중간 정도.’ 주어진 디지털광고 집행예산은 1만 달러고, 당신에겐 세 가지 방안이 있다. (1)타기팅을 하지 않는다. 페이스북 사용자 모두에게 같은 확률로 광고가 보여지고, 비용은 클릭당 40센트다. (2)완전 타기팅. 광고를 타깃고객군에게만 보여지게 하고 클릭당 60센트다. (3)부분 타기팅. 예산의 반은 타깃고객군을 대상으로 한 마케팅에 쓰고, 나머지는 전체 사용자에 대한 광고에 사용한다. 비용은 클릭당 48센트다.

 

당신은 어떤 방안을 채택할 것인가? 아마 (2) 아니면 (3)일 것이다. 그래야 타깃 층의 폭을 좁힐 수 있으니까 말이다. 그렇지 않은가?

 

틀렸다. 최상의 선택은 (1), 타깃을 가장 넓게 잡은 방안이다. 타깃을 넓게 잡으면 좁게 잡을 때보다 투자수익률이 높다. 연구에 따르면 누군가가 온라인광고를 봐도 구매확률의 증가 폭은 1%에도 미치지 못한다. 광고를 보지 않고 물건을 구매할 확률이 0.10%라면, 광고에 노출됐을 때 이 확률이 0.13% 정도로 오른다. 타깃고객에 해당하는 사람이라면 광고의 긍정적 효과가 더 크게 나타날지도 모르겠지만, 클릭당 소요비용의 증가분까지 보상해 주지는 못한다. 그렇지만 보통 마케터들은 타깃고객에게 몰두한 나머지 다른 고객들로부터 뽑아낼 수 있는 가치는 무시한다.

 

페이스북은 너무 좁은 타기팅을 하는 것보다 광고 도달범위를 넓히는 것이 좋다는 것을 광고주에게 알리느라 애를 쓰고 있다. 페이스북은 이럴 때 한 맥주 브랜드의 사례를 든다. 이 맥주 브랜드는 주로 남성에게 초점을 맞춰왔다. 이 브랜드는 자신들의 타깃고객으로 범위를 좁혀 디지털광고를 시작했다. 괜찮은 아이디어 같았다. 하지만 실질적으로는 광고의 도달범위가 줄어들면서 판매실적 부진으로 이어지게 됐다. 조사를 통해 맥주회사는 자신의 고객 상당수는 여성임을 알게 됐다. 타깃과 광고메시지 대상을 확대하자, 바로 고무적인 결과가 나타나기 시작했다.

 

순추천지수.차별은 데이터가 해석되는 방식을 왜곡할 수 있다. 우리는 데이터 애널리틱스 수업을 할 때 학생들에게 순추천지수Net Promoter Score·NPS라는 지표에 대해 들어봤는지, 학생이 다니는 회사에서도 이 방법을 쓰고 있는지 물어보곤 한다. 항상 많은 학생이 쓴다고 답하며, 이유도 그럴싸하다. 프레더릭 F. 라이히헬트Frederick F. Reichheld HBR에 기고한 ‘The One Number You Need to Grow’(2013 12월호)에서 이 개념을 소개한 후, NPS는 빠르게 비즈니스에 가장 중요한 핵심성과지표(KPI)의 자리를 차지했고 지금도 중요하게 쓰인다.

 

NPS란 무엇이며 그 작동원리는 무엇인가? 기업이 고객(또는 직원)에게 질문한다. ‘친척이나 친구에게 우리 회사를 추천하겠는가라고. 그리고 그 답을 0부터 10까지의 숫자로 표시해 달라고 요청한다. 0전혀 아니다이고 10매우 그렇다이다. 응답자들은 세 범주로 분류된다. 비추천(0~6), 중립(7~8), 추천(9~10)이다. NPS는 각 범주의 고객이 차지하는 비중을 계산해, 추천인 비율에서 비추천인 비율을 뺀 값이다. 만약 한 회사의 고객 60%가 추천인이고, 10%가 비추천인이라면 NPS 50이다.

 

NPS는 사용해 볼 만하다. 직관적이고 이해가 쉽다. 범주적 사고에 동반되는 과대평가로 인한 편견에서도 자유롭다. 라이히헬트가 자신의 2013년도 아티클에서 말했듯, 기존의 고객만족도 평가에서는 중립보다 조금만 위에 있는 고객도 모두만족으로 간주하는 등급 인플레이션 현상이 있었지만 NPS는 이를 피할 수 있다.

 

이런 점에서 NPS는 유용하다. 하지만 NPS를 쓰기 때문에 정작 기업이 피하려 했던 일종의 과대평가 현상이 일어나기도 한다. 일례로, 점수가 6인 고객들은 0보다 7에 가깝지만 중립이 아니고 비추천인으로 뭉뚱그려진다. 6 7의 차이는 NPS 점수 결정에서 매우 중요하게 작용하지만, 0 6의 차이는 점수 결정에 아무런 영향을 주지 않는다.

 

NPS에는 범주적 사고로 인한 문제가 또 있다. 이 지표는 중립적인 사람들의 수를 무시한다. 극과 극의 설문조사 결과를 한 번 살펴보자. 어떤 기업에서 NPS를 조사했더니 추천과 비추천이 모두 0%가 나왔다. 다른 기업에서는 추천과 비추천이 각각 50%씩 나왔다. 두 회사의 NPS 점수는 모두 0으로 같다. 하지만 둘의 고객층은 매우 다르고, 따라서 매우 다르게 관리돼야 한다.

 

상관관계의 편향된 해석.범주적 사고는 데이터 해석도 왜곡할 수 있다. 당신이 고객서비스 데스크 관리 담당이라고 생각해보자. 당신은 직원들의 만족도가 고객 만족과도 연관될 것이라 믿고, 연구를 의뢰한다. 몇 주 후, HR 애널리틱스 팀이 당신에게 데이터를 보내왔다. 그림 1과 같은 산점도 그래프다.

 

 

당신이라면 고객만족도와 직원만족도 간 상관관계를 어떻게 해석할 것인가? 대부분은 상관관계가 매우 강하다고 해석한다.

 

하지만 그림 2의 그래프를 받았다면? 그 때는 그 상관관계를 어떻게 해석하겠는가?

 

대부분은 둘 사이의 관계가 약하거나 전혀 없다고 해석할 것이다. 하지만 두 그래프의 상관관계는 사실 거의 똑같다. 8개의 점들만 우측 상단 사분면에서 좌측 하단 사분면으로 이동시켰을 뿐, 나머지 점들의 위치는 동일하다.

 

그렇다면, 왜 사람들이 첫 번째 그래프의 상관관계를 더 강하게 봤을까? 보통 그래프에서 우측 상단 사분면을 특별하게 생각하기 때문이다. 첫 번째 그래프는 직원과 고객이 동시에 만족했다고 답한 경우가 많아 보이고, 따라서 그래프를 보는 사람은 상관관계가 상당히 강하다고 결론을 내린다. 두 번째 그래프에서는 그런 경우가 많지 않아서 상관관계가 약하다고 본다. 여기에 포인트가 있다. 모든 범주에 균등한 관심을 기울이지 않으면 변수 간 관계를 정확하게 발견할 수 없게 된다.

 

화석화

 

범주화는 세상을 보는 관점을 굳게 만든다. 현재 상황이 어떤지에 대한 감을 주지만, 누가 어떻게 그렇게 보이도록 했는지에 대해서는 알려주지 않는다. 존 메이너드 케인스는 이 점을 기막히게 표현한 바 있다. “어려운 건 새로운 아이디어를 내놓는 게 아니라 기존 아이디어에서 벗어나는 것이다.”

 

1950년대 슈윈 자전거회사Schwinn Bicycle Company는 미국 자전거시장을 장악하고 있었다. 슈윈은 청소년 시장에 초점을 두고 어린이들이 동네에서 타고 다닐 무겁고 크롬으로 도금된, 바퀴가 큰 자전거를 만들었다. 그러나 1950년대부터 1970년대까지 시장이 크게 변했다. 많은 성인들이 운동으로 자전거를 타면서 가벼운 고성능 자전거를 찾기 시작했다. 슈윈은 이런 변화에 적응하지 못했고 미국 소비자들은 유럽산과 일본산 자전거를 타기 시작했다. 슈윈의 고통스러운 침체기는 이렇게 시작됐다. 슈윈은 수십 년간 어린이들에게 성공적으로 자전거를 판매하면서 소비지형을 읽는 시각이 화석화되고 말았고, 구조적 변화를 읽어내지 못했다.

 

혁신. 범주적으로 생각하는 버릇을 고쳐야 혁신이 시작된다. 많은 기업이 범주화를 통해 운영 효율성을 높이려 한다. 사람에게 일을 배정하고, 팀에 사람을 배정한다. 이런 업무적 구분은 어떤 목적에는 부합하겠지만 역시나 대가가 따른다. 앞으로 기업이 해결해야 할 문제들은 과거의 문제를 해결하기 위해 만든 구분선 안으로 깔끔하게 들어오지 않을 것이다. 또한 기존 범주 안에서만 생각하면 지식의 생성이 더뎌질 수 있다. 인간은 여러 요소를 새로운 방식으로 엮는 능력이 있지만 범주적 사고가 자꾸 끼어들기 때문이다.

 

토론토대 연구팀은 2016 200명의 참가자를 대상으로 레고로 외계인을 만들어 보라 요청했다. 일부 참가자에게는 미리 구분을 지어놓은 블록을 이용하라고 했고, 다른 일부는 무작위로 아무 블록이나 쓰도록 했다. 세 번째 그룹에게는 솔루션의 창의성을 평가하도록 했다. 이들은 무작위로 블록을 사용한 외계인이 보다 창의적이라고 평가했다.

 

범주화가 굳어지면 사물이나 아이디어를 다른 방향으로 생각해 보지 못하게 된다. 이것이기능적 고정성functional fixedness의 문제다. 누가 당신에게 나사와 렌치를 주며 나사를 벽에 박아 달라고 하면 어떻게 해야 할까? 렌치로 나사 머리를 잡고 빙빙 돌려서 벽에 박아 넣으려 할 것이다. 이상하고 비효율적이지만 예상가능한 방식이다. 렌치를 망치처럼 이용해 때려 박는 것이 가장 효과적이지만 이런 생각은 잘 떠오르지 않을 것이다.

 

범주적 사고의 위험 완화

 

리더가 범주적 사고에서 오는 위험을 피할 수 있는 방법은 무엇일까? 우리는 네 단계 프로세스를 제안한다.

 

1. 범주화의 위험을 인식한다.  우리는 모두 범주적으로 사고하며 거기엔 그럴 만한 이유가 있다. 하지만 의사결정자라면 범주적 사고가 부추기는 과도한 단순화와 왜곡의 유혹, 내가 모든 걸 쉽게 이해하고 있다는 착각, 그리고 눈에 보이지 않는 편향성 등을 모두 인지하고 있어야 한다. 이런 함정을 가장 잘 피하는 기업은 직원들이 불확실성, 미묘함, 복잡함을 두려워하지 않도록 하는 회사들이다. 지금 우리가 범주화하는 방식이 정당한가? 아니면 유용한가? 이런 질문이 의사결정의 핵심에 포함돼야 한다.

 

2. 데이터를 지속적으로 분석하는 역량을 키운다.범주적 사고 때문에 발생하는 의사결정 오류를 피하려면 지속적인 애널리틱스는 필수다. 하지만 많은 기업이 노하우를 모른다. 고객 세분화에 대해서라면 전문기업에 애널리틱스를 아웃소싱할 수 있지만, 이렇게 사들인 정보를 제대로 해석하지 못한다. 이건 상대적으로 고치기 쉬운 문제다. 고객 세분화가 잘됐는지를 평가할 수 있는 효율적 지표들이 나와 있고, 약간의 훈련만 있으면 응용이 가능하다. 세분화 연구를 마케팅 업무의 일부로 또는 전략기획 업무의 일부로 사용하는 기업이 있다면 이런 지표들을 도입하고 사용법을 익혀야 한다. 스마트한 조직이 사내 전문지식을 개발하고 경쟁우위를 확보할 수 있는 절호의 기회다.

 

3. 결정 기준을 재검토하라.어떤 연속적인 속성에 있어서 자의적으로 정한 기준치를 통과한 이후에만 행동에 나서려는 기업이 많다. 여기에는 두 가지 문제가 따른다.

 

첫째, 리스크가 커진다. 어떤 회사가 신상품의 성공 여부를 알아보려 시장조사를 실시한다고 해보자. 대규모 설문을 통해 소비자의 평가가 사전에 정한 기준치 이상이 되거나, 실험 결과가 마법의 숫자 0.05보다 작은 유의확률을 내놓아야만 신상품을 시장에 내놓을 것이다. 하지만 기준에 부합하는 경우와 못 미치는 경우는 그 차이가 미미하다. 표본의 무작위적 변동이나 데이터 수집 방법의 작은 편향성 때문에 기준 이상이라는 결과가 나왔을 수 있다. 그러니 아주 작고 무의미한 차이로 엄청나게 다른 결정을 내리게 된다. 앞서 본 BNP파리바 사례에서 주가가 매각기준까지 오르지 못했을 때 벨기에 정부가 내린 판단처럼, 이 회사 역시 틀린 결정을 내리게 된다. 이 상황에서는 단계적 접근이 훨씬 낫다. 벨기에 정부도 양자택일식 기준을 쓰기보다는 계단식으로 투자규모를 조정하는 게 나았을 것이다.

 

 

두 번째, 임의적인 기준 설정은 현실로부터 무언가 배우는 것을 어렵게 만든다. 어느 기업이 특정 매출목표 달성에 실패한다면 조직개편을 단행할 것이란 계획을 세웠다고 해보자. 아슬아슬하게 목표 달성에 실패하면 뭔가 잘못됐구나 생각하고 조직 개편을 실시한다. 하지만 아슬아슬하게 목표를 달성하면 잘되고 있구나 생각하고 조직을 그대로 유지한다. 사실 두 경우의 매출 자체는 거의 같았는데도 말이다.

 

이런 문제를 피하려면 조직 전체의 의사결정 기준을 재검토할 것을 권한다. 놀라울 정도로 많은 결정이모 아니면 도식의 기준에 의거해서 이뤄진다. 하지만 늘 대안이 존재하기 마련이고 경쟁우위를 확보할 수 있는 또 다른 기회가 된다.

 

4. ‘화석화 방지회의를 정기적으로 개최하라.위의 세 단계를 따랐다 하더라도, 화석화의 위험은 여전히 존재한다. 이를 피하려면 정기적으로 브레인스토밍 회의를 열어 해당 산업에 대한 가장 기본 아이디어부터 점검한다. 회사가 인식하고 있는 고객 모델은 여전히 유효한가? 고객의 니즈와 욕구가 변하고 있지는 않나?

 

혁신의 방법 중 하나는 기존 범주를 구성하는 개별 요소를 성찰해 보고 이들에게 새로운 기능을 부여할 수 있을지 상상해 보는 것이다. 일례로 승용차는 사람들을 A에서 B로 이동시킬수 있고, 우편 배달부는 우편물을 A에서 B로 전달한다. 그렇지 않나?

 

맞다. 그렇지만 이렇게 생각한다면 흥미로운 기회를 간과하고 있는 것일지도 모른다. 아마존은 이 기회를 포착했다. 아마존은 승용차 기능에 의문을 가졌고, 승용차를 택배를 받는 용도로 쓸 수 있다는 걸 깨달았다. 미국에서 아마존은 프라임회원 소유의 승용차 트렁크로 물품을 배달하는 서비스를 시작했다. 네덜란드 우체국도 우체부의 역할에 대해 다시 생각해 보게 되었다. 그래서 생각해냈다. 우체부들이 늘 같은 길로 다니므로 잡초 사진을 정기적으로 찍을 수 있고, 그러면 제초제의 효과를 더 잘 파악할 수 있다는 것이었다. 범주적 사고방식만 따랐다면 이런 새로운 역할은 발견할 수 없었을 것이다.

 

범주는 우리가 세상을 이해하고 우리 아이디어를 다른 사람에게 전달하는 방식이다. 그러다 보니 우리는 기계처럼 범주화에 익숙해져서 범주가 없는 곳에서도 뭔가를 꼭 구분하고자 한다. 범주적 사고는 세상을 보는 시각을 뒤틀고 의사결정의 오류를 낳는다. 예전에는 이런 오류가 있어도 비즈니스를 그럭저럭 운영할 수 있었을 것이다. 그러나 데이터혁명이 진행 중인 오늘날에는 범주적 사고의 위험을 완화하는 방법을 배워야 비즈니스의 성공을 성취할 수 있다.

 

번역 송채영 에디팅 김성모

 

바르트 데랑헤(Bart de Langhe)는 바르셀로나의 에사데경영대학원 마케팅 교수다.

필립 페른백(Philip Fernbach)은 볼더 콜로라도대 리즈경영대학원 마케팅 교수이며, < 지식의 착각 >(세종서적, 2018)을 공저했다.

페이스북 트위터

2019 9-10월호 다른 아티클 보기

목록보기

무료 열람 가능 아티클 수 0/1 회원가입 | 서비스상품안내