风控建模常用pandas语句
更新时间:2024-02-22 20:28:01 阅读量: 经典范文大全 文档下载
- 风控建模是什么推荐度:
- 相关推荐
pandas对象是Python常用的数据分析模块,它主要包括series对象,dataframe对象和index对象。每种对象都有自己所特有的方法和属性。今天小编更新下建模中常用的pandas语句。
导入pandas和numpy模块
import pandas as pd
import numpy as np
import os
查看并更改工作路径
pwd
os.chdir('更改的路径')
读入数据集
df = pd.read_csv(r'文件路径')
查看列数、行数
print(df1.columns.size,df.iloc[:,0].size)
查看列名
df.columns.tolist()
查看每个特征的类型
for col in fk_df.columns:
print(col, fk_df[col].dtype)
计算坏账率
badRate = df['target'].sum()/df['target'].count()
计算特征空值率
null_rate = 1-df.count()/df.shape[0]
保留空值率小于0.2的特征
cols = null_rate[null_rate<0.2].index.tolist()
查找数据集数值中型特征小于0的值并置为nan
def rep(x):
if type(x) !=str and x < 0:
print(x)
return np.nan
return x
df = df.applymap(rep)
设置新的索引
df = df.reindex()
检查常量特征
df1= df.loc[:,df1.apply(pd.Series.nunique) != 1]
查看是否有重复特征
len(set(list(df1.columns))) == df1.shape[1]
查看特征类别数
df1['education'].value_counts()
正在阅读:
风控建模常用pandas语句02-22
纺织产品开发学第六到九章02-03
修辞文体学视角下丘吉尔《论希特勒入侵苏联演讲稿》的词汇特点08-06
美国物流发展10-23
小故事201-13
领导科学课后练习及答案04-01
公文写作中的文章结构顺序排列技巧02-22
任务二阶梯轴的加工12-08
上海市青年文明号创建工作手册201205-22
基础会计 期末考卷B卷 答案10-24
- 关于实施新冠肺炎疫情精准防控的指导意见
- 学生党员在疫情期间做出的思想汇报
- 《深度工作》读书感悟
- 抗"疫"期间思想汇报5篇
- 学校承诺书|面对疫情,我们承诺
- 公司战“疫”感悟_我想和你们在一起
- 国培送教下乡培训感悟总结
- 只盼“樱花”早盛开,烂漫如当年
- 疫情防控工作感悟
- 关于疫情的几点思考及感悟
- 读蒋廷黻《中国近代史》有感
- 党小组长培训资料汇
- 2019年度副镇长述职述德述廉报告
- 疫情期间教师直播感悟
- 新型冠状病毒肺炎疫情防控心得体会4篇
- 在书记抓党建工作述职评议大会上的讲话
- 《老师请回答》观后感
- 2020年党组织书记党建工作考核办法
- 在疫情防控暨企业复工复产工作会议上的讲话
- 企业疫期复工管理方式与措施
- 建模
- 语句
- 常用
- pandas