Git Product home page Git Product logo

Comments (3)

goodkse7 avatar goodkse7 commented on August 25, 2024 2

트랙9 등 일부 트랙 제외하여 회귀 분석 진행

<트랙9 제외한 데이터 회귀분석>

  1. 평균 매치 타임을 독립변수로 뒀을 때, 로그 변환 한 것과 안한 것 모두 R제곱이 하락함
    • 로그 변환 안한 것 : 0.164 -> 0.137
    • 로그 변환 한 것 : 0.233 -> 0.202

아래는 모두 로그 변환하여 진행함

  1. 평균 매치 타임 + 트랙길이 / 리타어율 모두 수정R제곱 상승, AIC BIC 하락. Pvalue<0.05

    • 로그 사용건수 <- 평균 매치 타임, 트랙길이 : 수정R제곱 0.270
    • 로그 사용건수 <- 평균 매치 타임, 리타이어율 : 수정R제곱 0.266
    • 로그 사용건수 <- 평균 매치 타임, 트랙길이, 리타이어율 : 수정R제곱 0.382
      특이한 건 리타이어율의 기울기가 양수.
  2. 그 외 지표

    • 로그 사용건수 <- 로그 평균 매치 타임, 맵 난이도 : 0.197, P-value>0.05
    • 로그 사용건수 <- 로그 평균 매치 타임, 연도 : 0.198, P-value>0.05
    • 로그 사용건수 <- 연도 : 0.000, P-value>0.05
    • 로그 사용건수 <- 월 : 0.000, P-value>0.05
    • 로그 사용건수 <- 랩 : 0.022, P-value>0.05 (0.146)
    • 로그 사용건수 <- 트랙길이 : 0.037, P-value>0.05 (0.057)

<트랙9 + 사막 버려진 오아시스, 노르테유 허공의 갈림길 제외한 데이터 회귀분석>

매치당 평균 플레이어수를 봤을 때 트랙9과 비슷한 성격을 가지고 있다고 생각한 두 트랙을 추가로 제외하여 분석 시도

결과적으로 트랙9만 제거한 데이터에 비해 모든 모델에서 R제곱이 하락함

from kartrider-game-analysis.

goodkse7 avatar goodkse7 commented on August 25, 2024 2

기존 데이터 추가 회귀 분석

<year과 month를 독립변수로 한 단순 회귀 분석>

-> 연, 월을 각각 따로 회귀분석을 했을 때 로그변환 한 것과 안한 것 모두 유의미한 결과가 나오지 않음.

  1. 로그변환 X
    • 사용건수 <- 연 : R제곱 0.009
    • 사용건수 <- 월 : R제곱 0.05
  2. 로그변환 O
    • 사용건수 <- 연 : R제곱 0.000
    • 사용건수 <- 월 : R제곱 0.000

<추가 회귀분석>

트랙9을 제외한 데이터에서 분석 결과가 좋았던 모델을 원본 데이터에도 적용해 봄.
-> 로그변환을 하지 않은 모델에서는 유의미한 결과를 얻지 못함

  1. 로그변환 X
    • 사용건수 <- 평균 매치타임 + 트랙길이 : 0.166 AIC 1355 BIC 1363 P-value 0.599
    • 사용건수 <- 평균 매치타임 + 리타이어율 : 0.164 AIC 1356 BIC 1364 P-value 0.907
  2. 로그변환 O
    • 사용건수 <- 평균 매치타임 : 0.233 AIC 324.4 BIC 329.6
    • 사용건수 <- 평균 매치타임 + 트랙길이 : 0.291 AIC 317.4 BIC 325.2
    • 사용건수 <- 평균 매치타임 + 리타이어율 : 0.295 AIC 316.9 BIC 324.7
    • 사용건수 <- 평균 매치타임 + 리타이어율 + 트랙길이 : 0.415 AIC 302.2 BIC 312.6

결과적으로 트랙9만 제거한 데이터에 비해 모든 모델에서 R제곱이 하락함

from kartrider-game-analysis.

hyeming-king avatar hyeming-king commented on August 25, 2024

Year 에 관련한 EDA

상위 트랙, 하위 트랙에 포함되는 트랙 제작 연도 횟수
image

image

  • 균등분포 형태가 아니므로 연도에 트랙이 영향을 것은 아니라고 할 수는 없지만 옛날에 나온 맵이 인기있다? 최근의 맵이 인기 없다? 고 말하기는 힘들어보임
  • 상위 트랙을 보면, 2004, 2011 옛날 트랙이 많이 있지만, 2021년, 2022년 등 최신 년도의 트랙도 상위에 랭크된 것을 볼 수 있음
  • 하위 트랙도 마찬가지로 2007년 등 옛날 연도의 트랙도 많이 포함된 것 + 최신 트랙 2022년.

-> 넥슨에서 연도별로 제작된 트랙의 개수 차이가 클 수도 있음 따라서 하위에도 상위에도 옛날 많이 들어갈 수도 있음.
ex) 2004년 맵 50개 제작, 2022 년 맵 3개 제작
-> 전체 기간을 한달 데이터, 상위 하위를 다시 나누어 살펴본다면, 다시 한번 진행해보면 결과 달라질 수도 있음!

from kartrider-game-analysis.

Related Issues (20)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.