Git Product home page Git Product logo

ccf-bdci-2021's Introduction

CCF Big Data & Computing Intelligence Contest 2021

工程说明

选题:个贷违约预测

由于数据集文件太大,就不在GitHub上托管了。克隆本仓库后自行将数据集文件解压至根目录的data文件夹下。

data
├── submit_example.csv
├── test_public.csv
├── train_internet.csv
└── train_public.csv

0 directories, 4 files

数据背景

数据来源:个人贷款数据和网络信贷数据脱敏仿真。

文件清单和使用说明

训练数据

train_public.csv 个人贷款违约记录数据

train_internet_public.csv 某网络信用贷产品违约记录数据

测试数据

test_public.csv 用于测试的数据,获取榜单排名

训练数据说明

train_public.csv

字段 字段描述
loan_id 贷款记录唯一标识
user_id 借款人唯一标识
total_loan 贷款数额
year_of_loan 贷款年份
interest 当前贷款利率
monthly_payment 分期付款金额
grade 贷款级别
employment_type 所在公司类型(世界五百强、国有企业、普通企业...)
industry 工作领域(传统工业、商业、互联网、金融...)
work_year 工作年限
home_exist 是否有房
censor_status 审核情况
issue_month 贷款发放的月份
use 贷款用途类别
post_code 贷款人申请时邮政编码
region 地区编码
debt_loan_ratio 债务收入比
del_in_18month 借款人过去18个月逾期30天以上的违约事件数
scoring_low 借款人在贷款评分中所属的下限范围
scoring_high 借款人在贷款评分中所属的上限范围
known_outstanding_loan 借款人档案中未结信用额度的数量
known_dero 贬损公共记录的数量
pub_dero_bankrup 公开记录清除的数量
recircle_bal 信贷周转余额合计
recircle_util 循环额度利用率
initial_list_status 贷款的初始列表状态
app_type 是否个人申请
earlies_credit_mon 借款人最早报告的信用额度开立的月份
title 借款人提供的贷款名称
policy_code 公开可用的策略_代码=1新产品不公开可用的策略_代码=2
f系列匿名特征 匿名特征f0-f4,为一些贷款人行为计数特征的处理
early_return 借款人提前还款次数
early_return_amount 贷款人提前还款累积金额
early_return_amount_3mon 近3个月内提前还款金额

train_internet.csv

字段 字段描述
loan_id 网络贷款记录唯一标识
user_id 用户唯一标识
total_loan 网络贷款金额
year_of_loan 网络贷款期限(year)
interest 网络贷款利率
monthly_payment 分期付款金额
class 网络贷款等级
sub_class 网络贷款等级之子级
work_type 工作类型(公务员、企业白领、创业...)
employment_type 所在公司类型(世界五百强、国有企业、普通企业...)
industry 工作领域(传统工业、商业、互联网、金融...)
work_year 就业年限(年)
house_ownership 是否有房
house_loan_status 房屋贷款状况(无房贷、正在还房贷、已经还完房贷)
censor_status 验证状态
marriage 婚姻状态(未婚、已婚、离异、丧偶)
offsprings 子女状态(无子女、学前、小学、中学、大学、工作)
issue_date 网络贷款发放的月份
use 贷款用途
post_code 借款人邮政编码的前3位
region 地区编码
debt_loan_ratio 债务收入比
del_in_18month 借款人过去18个月信用档案中逾期60天内的违约事件数
scoring_low 借款人在信用评分系统所属的下限范围
scoring_high 借款人在信用评分系统所属的上限范围
pub_dero_bankrup 公开记录清除的数量
early_return 提前还款次数
early_return_amount 提前还款累积金额
early_return_amount_3mon 近3个月内提前还款金额
recircle_bal 信贷周转余额合计
recircle_util 循环额度利用率,或借款人使用的相对于所有可用循环信贷的信贷金额
initial_list_status 网络贷款的初始列表状态
earlies_credit_line 网络贷款信用额度开立的月份
title 借款人提供的网络贷款名称
policy_code 公开策略=1不公开策略=2
f系列匿名特征 匿名特征f0-f5,为一些网络贷款人行为计数特征的处理

其他数据文件

选手提交 submission.csv

字段名 字段说明
id 贷款记录ID
isDefault 是否违约

作品提交要求

提交格式

选手提交 submission.csv

字段名 字段说明 格式
id 文本ID int
isDefault 贷款违约预测结果 int/float

提交样例

id, isDefault
0,0
1,0
2,1
…

(说明:isDefault可以是小数)

评分与晋级

晋级规则

B榜评测结束后,按照B榜测试结果进行排名。组委会将对排行榜TOP10参赛队伍最优提交成绩的模型、完整代码(包含数据处理和模型训练)、报告、论文进行审核。对于未提交、复现未成功或审核不通过的队伍,将取消决赛资格和比赛奖励。最终,审核通过的队伍,复赛得分排名TOP5的参赛队伍进入决赛答辩环节。

评分方式

评价指标 AUC

本次挑战的是经典的预测任务,以AUC作为衡量标准。

评测指标

使用ROC曲线下面积AUC(Area Under Curve)作为评价指标。AUC值越大,预测越准确。

ccf-bdci-2021's People

Contributors

clysto avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.