Git Product home page Git Product logo

cpbl-opendata's Introduction

CPBL Opendata

收集中華職棒球員的逐年成績及球隊逐年戰績

從中職官網上爬資料並進行勘誤

2021年中職官網改版

中職官網在2021年5月進行大改版,年度數據統計部份作了以下的改變:

  1. 球員、球團的ID系統換成了另一套新的
  2. 冬季聯盟、二軍業餘隊的數據都查不到了
  3. BB 數據配合MLB標準加入了 IBB
  4. 沒有投手救援失敗(BS)的統計

由於把部份非一軍的資料隱藏了,導致我沒辬法完美的將ID系統轉換過去,因此在 players.csvstandings.csv 保留了 Old ID 欄位供無法轉換ID系統的球員/球團仍可用舊的ID來對照。

修正的錯誤

  1. 若有球員在一季內有轉隊,在官網上的滾地出局(GO)及飛球出局(FO)數據會有錯誤,我用出局的計算及平均分佈的方式,給這兩個數字合理的值。
  2. 2020年二軍業餘球隊成績官方無完整建檔,我用人工補足估計打者和投手的合理數據,但大概還是錯的;守備數據直接拿官方的不完整資料,大概錯得很離譜。
  3. 修正部份球員有兩個ID的問題

使用上的注意事項

  1. 本資料集所記錄的球員姓名,並不會因為球員修改登錄名而跟著變化,全是以抓資料當下所使用的姓名,本表格不保證該球員在該年度所使用登錄名的正確性。
  2. 只有standings.csv上寫出的球隊名稱是正確的,在其他CSV檔中所寫的球隊名不保證正確性。
  3. 中華職棒在2005年才開始有中繼成功(HLD)及救援失敗(BS)的統計。
  4. 2018年冬季聯盟沒有 GO、FO 的統計。
  5. 2021年起沒有救援失敗(BS)的統計

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.