Anders Wang


我所认识的每个人都是榜样,都有值得我去尊敬和学习的地方。


pandas中map和applymap及apply的区别

在pandas中,针对于行或者列又或者是每个元素的操作很容易让人混淆,下面我们来看看分别对应的几个函数区别。

apply()

apply()是pandas里DataFrame的函数,可以针对DataFrame中的行数据列数据应用操作。

注意:这里的apply是应用到每一行或者每一列操作,有专门的axis可以指定,默认是axis=0.

import pandas as pd  
import numpy as np

frame = pd.DataFrame(np.random.rand(4, 3), columns = list('abc'), index = ['Utah', 'Ohio', 'Texas', 'Oregon'])  
print(frame)  
# 输出如下:
#                a         b         c
# Utah    0.443188  0.919623  0.550259
# Ohio    0.013923  0.557696  0.723975
# Texas   0.865469  0.720604  0.081306
# Oregon  0.506174  0.212421  0.061561


func = lambda x: x.max() - x.min()  
print(frame.apply(func))  
# 输出如下:
# a    0.851545
# b    0.707202
# c    0.662415
# dtype: float64

applymap()

apply()是pandas里DataFrame的函数,但是它对DataFrame中所有的元素应用操作。

import pandas as pd  
import numpy as np

frame = pd.DataFrame(np.random.rand(4, 3), columns = list('abc'), index = ['Utah', 'Ohio', 'Texas', 'Oregon'])  
print(frame)  
# 输出如下:
#                a         b         c
# Utah    0.443188  0.919623  0.550259
# Ohio    0.013923  0.557696  0.723975
# Texas   0.865469  0.720604  0.081306
# Oregon  0.506174  0.212421  0.061561

func = lambda x: f'{x:.2f}%'  
print(frame.applymap(func))

# 输出如下:
#             a      b      c
# Utah    0.34%  0.43%  0.67%
# Ohio    0.75%  0.50%  0.14%
# Texas   0.68%  0.28%  0.90%
# Oregon  0.05%  0.86%  0.78%

map()

map() 是python自带的函数,也就是我们常说的高阶函数,但它在DataFrame中可以直接使用.map()后缀的方式调用,由于只能直接对序列元素的操作,所以必须对DataFrame的某列 (只针对于列) 应用操作。

import pandas as pd  
import numpy as np

frame = pd.DataFrame(np.random.rand(4, 3), columns = list('abc'), index = ['Utah', 'Ohio', 'Texas', 'Oregon'])  
print(frame)  
# 输出如下:
#                a         b         c
# Utah    0.443188  0.919623  0.550259
# Ohio    0.013923  0.557696  0.723975
# Texas   0.865469  0.720604  0.081306
# Oregon  0.506174  0.212421  0.061561

func = lambda x: f'{x:.2f}%'  
print(frame['a'].map(func))  
# 输出如下:
# Utah      0.65%
# Ohio      0.90%
# Texas     0.09%
# Oregon    0.72%
# Name: a, dtype: object
最近的文章

Python之WordCloud词云库

WordCloud(词云)是Python中一个非常优秀的第三方词云展示库,WordCloud以词语为基本单位,根据你给出的字符串,对词频进行统计,然后以不同的大小显示出来。说的直接点就是它可以更加直观…

Python, 技术博文详细阅读
更早的文章

在matplotlib中创建子图的多种方式

在用Matplotlib绘制图像时,有时候需要从多个角度对数据进行对比。为此子图的概念便提了出来,子图可以在较大的图形中同时放置一组较小的坐标轴。这些子图可能是画中画、网格图,或者是其他更复杂的布局形…

Python, 技术博文详细阅读
comments powered by Disqus