我不知道说“标准化”分类变量字符串是否正确,但基本上我想创建一个函数,将以下列中的所有观察值F或F设置为0,将M或M设置为1:
> df['gender']
gender
f
F
f
M
M
m
我试过这个:
def padroniza_genero(x):
if(x == 'f' or x == 'F'):
replace(['f', 'F'], 0)
else:
replace(1)
df1['gender'] = df1['gender'].apply(padroniza_genero)
但我有个错误:
NameError: name 'replace' is not defined
有什么想法吗?谢谢