个人常用的一些函数
- reduce_memory_usage 减少DataFrame所占内存
- dataframe_compare_all 比较两个数据集共有索引、变量的值是否相同
- dataframe_compare_sigle 查看两个数据集选定变量不等样本的值比较
- get_index_values 计算指定的指标值,目前支持缺失率"missing"、同质比"homogeny"、类别变量最大计数类别"category"、类别变量最大计数类别(包括缺失值)"category_miss"、相关性"collinear"、psi值"psi"、iv值"iv"、特征重要度"importance"
- get_ip_info_freeapi 调用freeapi接口解析ip
- get_ip_info_taobao 调用taobao接口解析ip
- get_ip_info_ip2region 调用ip2region解析ip,需准备ip2region.db和ip2Region.py
- get_ip_info_batch 调用ip2region批量解析ip,需准备ip2region.db和ip2Region.py