모바일 데이터 분석

29 May 2014

ndc14 data

요약

  • 시계열 분석 대신 시간대별 분석을 사용한다.
  • 유저의 특성에 따라 분석 결과를 개별적으로 적용한다.

모바일 특성 이해하기

  • 모바일 특성을 이해해야 어떻게 분석할 지 알 수가 있다.
  • 유저의 쏠림 현상
    • LifeStyle이 반영된다. mobile 기기의 특성 상 특정 시간대에 집중. eg) 출퇴근 시간
    • Marketing 효과가 크다. 특정 시간대 이벤트할 경우, Push 발송 등에 의해.
      • 최대치가 보통에 비해 2~4배 정도 차이가 남. 심하면 몇 십배까지도 차이가 난다.
  • Simple Context
    • Context: 목적을 달성하기 위해 이뤄지는 일련의 action
    • device의 특성 상 화면 크기가 제한적이고 operation이 제한적이어서 action 선택 가지 수가 제한적이다. (touch, swipe)
    • 평균 1분30초 ~ 5분의 session time내 play pattern이 결정되므로 만들어질 수 있는 context의 한계가 있음
  • 빠른 feedback
    • 만족하지 않으면 빠르게 이탈한다. 길어야 2~3달. (성공한 mobile game들이 top을 유지한 시간의 평균)

모바일 환경의 이슈들 - 데이터 처리

  • 데이터 처리
    • 수집 정리 (processing)
    • 분석, 지표화, 사업 반영/활용
  • 로그 포맷 이슈
    • 많은 간단한 데이터가 단 시간에 쏟아지는 경우 정의는 어떻게 할 것이며, 처리는 어떻게 할 것인가?
  • 로그 해상도 이슈
    • 어느 정도까지 자세히 남겨야 하나? 자세함과 logging 부담의 trade-off를 고려한다.
  • 로그 유실 관련 이슈
    • 모바일의 특성 상 유실이 심할 수 있다. 어떻게 correction할 것인가?
  • (위 주제에 대한 자세한 내용에 대해서는 화요일 세션에 발표했으므로 해당 발표를 참조하도록 한다.)

모바일 환경에서 데이터 분석

  • 지표의 정합성 확보
    • 잘못된 지표로 운영하면 망한다.
    • 잘못된 데이터 기반일 경우도 있으니 주의해야 한다.
    • eg) retention 값을 잘못 지정하고 luanching을 했다가 open 이후 marketing을 안해서 망했다.
    • LifeCycle이 짧으니까 삽질 한 번 잘못하면 회복할 기회가 없다.
    • 측정값과 대상값을 구분해야 한다.
      • install 수, 신규 유저, active 유저, session 수, session time, 매출, paying 유저, 구매 회수
    • 이상 징후가 잘못 집계될 수 있으니 주의해야 한다.
    • open 전 테스트 기간부터 위 값을 수집/분석하여 의도대로 결과가 나오는지 확인을 해야 한다.
  • interval 개념 전환
    • 일/주/월 단위 뿐만 아니라 시간대별 분석이 필요하다.
    • actionable data
    • 시계열 data는 현상을 볼 수는 있어도 왜 그런 현상이 일어나는지, 그래서 뭘 해야 하는지 알기가 어렵다.
    • eg) daily active user. 주말에 active user가 많다. 그래서?
    • 보는 방식을 바꾸자
    • eg) 위 데이터를 24시간으로 재배치해서 재구성. 그 중 평일/주말 방문 도수를 시간대 별로 보자.
      • 어떤 유저가 늘 접속하던 9시에 접속을 안했다.
      • 그 유저에게 뭔가를 해주어야 이탈하지 않을 가능성이 높다.
    • eg) Item 판매량을 시간대별로 재구성
  • 분석 결과를 user별 적용
    • 휴면 유저와 구매 유저는 구분해서 적용해야 한다.
    • 전체 data를 분석해서 pattern을 찾아도, 적용은 개별적으로 해야 한다.
    • eg) 시계열 graph로 휴면 유저를 보면, 그냥 휴면 유저가 늘고 있다는 것만 알 수 있다. 즉, 현상의 결과만 볼 수 있다.
      • 매일 방문 유저가 4일째 접속을 안할 경우,
      • 주말에 주로 접속하는 유저가 4일째 접소을 안할 경우,
      • 두 유저를 같은 유저로 취급해서 방문 push를 보내면 안된다.
      • 따라서 사용자의 play pattern, 구매 pattern을 개별 분석 후 적용해야 한다.
  • user별 이탈자 수 = {휴면기간} / {User 고유 접속 주기}
    • 고유 접속 주기는 매일 접속일 경우 1, 주말 접속일 경우 7이 된다.
    • 4일 접속 안한 평일/주말 플레이 유저의 이탈지수는 각각 3, 0.57이 된다.
    • 이 graph를 만들어 특정 구간을 넘어선 유저에 대해 push를 보낸다.
    • 구매에 대해서도 같은 방식을 적용할 수 있을 것이다.

정리

  • 정확한 지표를 확보하고
  • 시간대별 지표 분석이 필요하다.
  • 휴면/구매 유저 관리는 개별적으로 한다.

Q&A

  • 유저의 접속률을 장기적으로 만드려면 어떻게 해야 하나?
    • 우리나라는 초반 유입 집중이 심한 편이니 초반 1주일을 제대로 관리하고,
    • 장기적으로는 {이탈율} / {app 전체 총량} 마케팅을 장기적으로 지속 관리한다.
      • eg) 특정한 날 install한 유저를 추적 관리함
  • 유저별 시간대 행동 패터늘 어떻게 묶는 것이 좋을까?
    • 복잡한 통계 기법을 사용할 수도 있다.
    • 아니면 일단 가시적으로 보이는 group을 찾아보자.

  • 데이터 처리 방법이 궁금했던 것인데 그건 첫째 날 발표한 것이어서 이번 내용에는 빠졌다.
  • 사례에 대한 이야기도 많아서 짧은 시간에 폭풍같이 발표가 끝났다. 원래 아는 분야가 아니라 내용에 대해서는 할 말이 없다.
comments powered by Disqus