如何在Pandas Groupby中将数据框行分组为列表?
2 402
1

现有一个df像这样的Pandas数据框:

a b
A 1
A 2
B 5
B 5
B 4
C 6

我想按第一列分组,之后获得第二列作为行中的列表:

A [1,2]
B [5,5,4]
C [6]

是否可以使用pandas groupby进行类似的操作?

收藏
2021-01-26 17:19 更新 han •  277
共 1 个回答
高赞 时间
0

你可以使用以下方法对感兴趣的列进行分组,然后apply (list)对每个分组进行分组:

In [1]: df = pd.DataFrame( {'a':['A','A','B','B','B','C'], 'b':[1,2,5,5,4,6]})
        df

Out[1]: 
   a  b
0  A  1
1  A  2
2  B  5
3  B  5
4  B  4
5  C  6

In [2]: df.groupby('a')['b'].apply(list)
Out[2]: 
a
A       [1, 2]
B    [5, 5, 4]
C          [6]
Name: b, dtype: object

In [3]: df1 = df.groupby('a')['b'].apply(list).reset_index(name='new')
        df1
Out[3]: 
   a        new
0  A     [1, 2]
1  B  [5, 5, 4]
2  C        [6]

收藏
2021-01-26 18:00 更新 玩手机的豆浆 •  691