티스토리 뷰

반응형

"탐색 그래프와 실제 사용자 합계의 차이" 예시 이미지


GA의 획득 데이터를 보던 중 그래프 상 숫자와 그 아래 테이블 상 숫자에 차이가 있는 것을 발견했고,

마케터들이 많이 모인다는 아이보스 사이트에 질문글을 올려봤지만 "중복" 이라는 단 두 음절의 답변만 받았다.

당연히 중복이겠지. 근데 "그래프 숫자 차이" 라거나 "획득 데이터 그래프 차이" 같은 걸로 아무리 검색해봐도 아이보스 사이트 내 검색 기능은 본문만 크롤링하는게 아니라 이전글/추천글 등도 함께 크롤링을 해주고 있어서 내가 쓴 글의 제목이 누군가에게 이전글이거나 추천글 등이 되면 다 같이 검색 결과가 노출되더라.

왜 이렇게 만들었는지 모르겠지만 아무튼 결론을 내면 사이트 내 검색으로 내가 원하는 답변을 얻지 못했다는 이야기.

그래서 "중복" 이라는 답변에 자극을 받아 이 포스팅을 적게 되었다는 이야기.


다행히 영문으로 구글링을 해보니 답변을 찾을 수 있었다.

결론부터 얘기하면 그래프 상 사용자 숫자나 일별/주별/월별로 끊어서 보는 사용자의 숫자는 의미가 없다더라.

내가 진짜로 보고 싶었던 데이터는 이 이벤트 URL로 유입된 사용자가 몇 명이었느냐 였으니까. 중복 사용자의 허수를 포함한게 아닌 진짜 사용자.


출처 : https://www.kaushik.net/avinash/standard-metrics-revisited-6-daily-weekly-monthly-unique-visitors/


왜냐하면 일별로/주별로/월별로 사용자를 끊어서 보면 그 기간별로 중복된 사용자가 있더라도 이를 다 포함하게 되어 획득에서 보이는 사용자 그래프의 숫자가 훨씬 커보이게 된다는 것.

그래프를 왜 띄워놓아서 여러사람 헷갈리게 만드는지 모르겠지만 아래 표에 있는 "사용자" 데이터만 확인하면 되겠다.


이게 무슨 소리지?? 하실 수 있어 조금 더 상세히 적어보자면



위 그림에서처럼 사용자 그래프 부분의 숫자들을 따로 합하면 사용자는 31이 된다.

그런데 아래 표에서 동일 기간 집계된 사용자의 합은 23이다. 8의 차이가 난다.

그리고 아래 표의 사용자 숫자도 9/12부터 9/21 까지의 기간으로 보지 않고 9/12~9/12, 9/13~9/13 처럼 일자별로 끊어서 보면 그래프에서의 숫자와 동일하다.

왜 이럴까 찾아보니 9/12~9/21의 기간 동안에 중복 발생한 사용자가 그래프에는 그대로 기록이 되고, 아래 표에서는 중복 사용자가 걸러진 숫자로 보여진다.

다시 말하면 그래프에 있는 숫자는 어제 방문한 방문자가 오늘 새로 방문하면 1명의 사용자로 카운팅을 한다. 그러나 아래 표에 있는 숫자는 어제 방문한 방문자가 오늘 또 방문했으면 카운팅 하지 않는다. 9/12~9/12 로 보면 7이던 사용자가 9/12~9/13으로 보면 7+2=9 가 아닐 수 있다는 얘기다. (내가 관리하는 GA 데이터에서는 9/12~9/13의 사용자가 실제로 "7" 로 기록되었다.)


어떤 데이터를 보고 싶으냐에 따라 참고할 값이 달라지는 것으로 생각하면 되겠다.

이 페이지를 설정한 기간 안에 접근한 사용자의 절대 수를 보고싶다면 아래 표의 사용자를, 절대 수는 상관 없고 그냥 페이지가 열린 횟수만 보고싶다면 그래프의 숫자를 참고하면 될 것 같다. (아마도 후자를 선택해 보고하는 마케터는 없을 것으로 생각된다.)


다만 이 "사용자"의 숫자도 일별/주별/월별로 끊어 보기 시작하면 그 끊어지는 기간 기준으로 중복된 사용자 누계가 있을 수 있으니 나처럼 일별로 사용자 숫자를 표로 만들어 합계를 구했다가 그게 전체 캠페인 진행 일자의 총 사용자 합과 숫자가 맞지 않아 3박 4일동안 머리를 싸매는 고통을 겪는 분들은 없기를....


이런 표 만들고 왜 합계에 차이가 발생하는지 자괴감에 빠지지 말라는게 결론


반응형
댓글