Py学习  »  BENY  »  全部回复
回复总数  5
3 年前
回复了 BENY 创建的主题 » Python Dataframe从行的每个列表中减去一个值

皈依 numpy array

df['A_new'] = df.A.map(np.array)-1
Out[455]: 
0       [0, 1]
1    [3, 4, 5]
Name: A, dtype: object

请注意,拆分为“,”

df["WORDS_list"] = df["WORDS"].str.split(", ")
df["WORDS_list"].apply(lambda x: list(set(x).intersection(set(wordsWeWant))))
Out[242]: 
0         [ball-sports, ball]
1    [bat, ball-sports, ball]
2                          []
3                      [ball]
Name: WORDS_list, dtype: object
3 年前
回复了 BENY 创建的主题 » Python:基于文本匹配替换值

你能行

更新如下:

df1.reset_index(inplace=True, drop=True)
df2.reset_index(inplace=True, drop=True)

#==================================
m = df1['Review_Text'].isin(df2['Review_Text'])
v = df1['Review_Text'].map(df2.set_index('Review_Text')['Final Coding'])
df1.loc[m,'Final Coding'] = v

或者我们可以

df1.update(df1['Review_Text'].map(df2.set_index('Review_Text')['Final Coding']).to_frame('Review_Text'))
3 年前
回复了 BENY 创建的主题 » dataframe str.replace中的列表不工作-python

你可以试试 explode 然后删除“”并 join 返回

df1['test_set'] = df1.test_set.explode().loc[lambda x : x!=''].groupby(level=0).agg('|'.join)
0    1001100|xxx|1100|PAR_200|21651947694|0|0|20210...
1    1001110|sss|1110|C-200|20210307|1630,51|1|7252...
2    1001115|ddd|1115|21|NO6520058050362|0|08|11043...
3                      1001120|fff|1120|MG|73895137480
4    101100|ees|1100|PAR_200|21653346587|0|0|202103...
5    101110|fsc|1110|C-200|20210307|1013,84|1|72520...
6    101115|fer|1115|1|LI1600081181694N2K346|0|06|1...
7                       101120|ter|1120|MG|17651232321
Name: test_set, dtype: object
3 年前
回复了 BENY 创建的主题 » 在Python中将数据帧转换为嵌套字典

我们能行 groupby 具有 agg dict items

d = df.set_index('B').groupby('A').agg(lambda x : [{k:v} for k, v in dict(x).items()])['C'].to_dict()
Out[574]: 
{1: [{'0': 1.5}, {'3,2': 6.09}, {'4': 7.9}],
 2: [{'5': 9.5}, {'0': 1.2}],
 3: [{'3': 2.4}]}