使用
GroupBy.size
具有
nlargest
或
sort_values
具有
iloc
选择最后一个值。
功能
remove_unused_levels
用于按删除的值删除多索引值
Series
.
a = (df.groupby(['Start Station','End Station'])
.size()
.nlargest(1)
.index.remove_unused_levels()
.tolist()
)
或:
a = (df.groupby(['Start Station','End Station'])
.size()
.sort_values()
.iloc[[-1]]
.index.remove_unused_levels()
.tolist()
)
print(a)
[('A', 'B')]
如果需要输出
DataFrame
:
df1 = (df.groupby(['Start Station','End Station'])
.size()
.reset_index(name='count')
.nlargest(1, 'count')[['Start Station','End Station']]
)
print (df1)
Start Station End Station
0 A B