Git Product home page Git Product logo

k-drama's Introduction

EDA 프로젝트 7조 저장소 / 칠면조 / 주제 : 2015-2023년 한국 드라마 분석


Project Description

[설명]

해외에서 급성장 하고있는 K드라마.
오징어게임의 흥행 이후 OTT 플랫폼을 바탕으로 K드라마는 급속도로 성장 중이며 올해 4월에는 넷플릭스는 한국에 향후 4년간 25억 달러를 투자하겠다고 발표했다.
급속도로 성장하는 K드라마의 특징 등을 다방면적으로 분석한다.

[주의사항]

MyDramaList는 국제 사이트 중 한국 드라마의 정보를 가장 많이 담고 있는 사이트이지만 동아시아, 동남아시아 문화권의 커뮤니티임을 유의해야한다.

[목표]

K드라마에 대해 전반적으로 분석하여 어떤 특징의 드라마가 흥행하는지 알아본다. 가능하면 추천 시스템 제작까지 진행.

[수집정보]

ID, 영문명, 한글명, 출시년도, 디렉터, 작가, 제작국가, 영상타입, 에피소드수, 플레이타임(초), 방영시작일, 방영종료일, 방영요일, 중계플랫폼, 제한연령, 시놉시스, 순위, 인기순위, 장르, 시청자수, 평점, 기여자수

총 22종

[분석방식]

  • 수집한 정보를 토대로 Feature별 인기도, 빈도수 분석.
  • Feature별 상관관계 분석.

[결과물]

ㅁㄴㅇㄹ

[결론]

  • 동아시아, 동남아시아에서 한국 드라마의 인기에 큰 영향을 준 요소는 다음과 같다.
  1. 작가와 감독은 작품 인기에 긍정적 영향을 준다
  2. 액션, 판타지 장르는 전반적으로 많은 인기를 끌었다.
  3. 로맨스 장르는 꾸준히 인기를 끌어 흥행의 보증수표 같은 장르이다.
  4. 스토리성을 좋게 평가 받은 작품은 많은 인기를 끌었다.
  5. 방영요일은 인기에 영향을 주지 않는 요소이다.
  6. 청춘 드라마는 대체로 부진하며 흥행에 부정적인 영향을 준다.

Site

  • MyDramaList 사이트 Alt text

  • 검색 리스트와 드라마 페이지는 크롤링을 막고 있지 않음.
    Alt text

  • 드라마 리스트에는 다음과 같이 옵션을 지정할 수 있으며, url의 변수를 바꿔서 옵션을 바꿔줄 수 있음. Alt text Alt text

Detail

Alt text (드라마의 상세 페이지)

  • 빨간색 박스는 고정적으로 있는 정보
  • 파란 박스는 유동적으로 존재하는 정보

Requires

[주요 라이브러리]

Python 3.10.12  
Pandas 2.0.3  
Matplotlib 3.7.2  
Seaborn 0.12.2  
BeautifulSoup 4.12.2  
PyQt5 5.15.9
NLTK 3.7  
scikit-learn 1.2.1   
WordCloud 1.9.2  

[부가 라이브러리]

missingno  
koreanize_matplotlib  
user-agent  
tqdm  
mysql

Directory

data

  • Datas from MyDramaList and Kaggle

MyDramaList
korean-drama-2015-23-actor-and-review(Kaggle)

src

  1. kdrama_2015_2023_ChoHongKi.ipynb - 조홍기

각자 데이터를 분석한 코드

  1. kdrama_2015_2023_SeoYoungMoon.ipynb - 문서영

각자 데이터를 분석한 코드

  1. kdrama_2015_2023_HanSeungJun.ipynb - 한승준

각자 데이터를 분석한 코드

  1. mydramalist_crawling.ipynb - 조홍기

MyDramaList 사이트에서 크롤링 하여 excel로 저장하는 코드

  1. kdrama_preprocessing.ipynb - 조홍기

mydramalist_crawling.ipynb 파일로 크롤링한 데이터를 전처리하는 코드

  1. upload_to_aws.ipynb - 조홍기

kdrama_preprocessing.ipynb 파일로 전처리까지 완료한 excel 파일을 aws에 업로드하는 코드

  1. create_table_kdrama.sql - 문서영

데이터 업로드 할 MySQL 테이블 제작 쿼리

  1. kinolights_crawling_pyqt.ipynb - 한승준

Kinolights 의 한국 드라마 랭킹을 크롤링 하여 GUI로 보여주는 코드

  1. recommender_systems.ipynb - 한승준

드라마, 영화 추천 GUI 시스템 (with TF-IDF, Vader)

trashcan

각자의 노력이 담겨있는 코드, 데이터들의 무덤

etc

  1. 한국드라마분석_7조(칠면조).pptx

2023.09.14에 발표한 PPT

k-drama's People

Contributors

chohongki avatar raematchaaa avatar hanseungjun avatar addinedu avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.