我建议你看看sklearn
Imputer transformer
. 我不认为它可以删除列,但它可以定义为以“通用方式”填充列,例如,用相关列的中值填充缺少的值。
你可以这样使用它:
from sklearn.preprocessing import Imputer
imputer = Imputer(strategy='median')
num_df = df.values
names = df.columns.values
df_final = pd.DataFrame(imputer.transform(num_df), columns=names)
如果您希望进行其他转换,可以考虑进行转换
Pipeline
或者甚至可以自己制作变形金刚来完成定制任务。