apply（）和aggregate（）函数之间的熊猫区别

agg有两种版本（aggregate的缩写）和适用：第一个版本在groupby对象上定义，第二个版本在DataFrames上定义。

如果您考虑groupby.agg 和groupby.apply，则主要区别在于申请是灵活的（docs）：

对分组数据进行的某些操作可能不适合聚合或转换类别。或者，您可能只是希望GroupBy推断如何合并结果。对于这些，请使用apply函数，在许多标准用例中，apply函数可用于聚合和转换。

注意：apply可以充当reducer，transformer或filter函数，具体取决于传递给apply的内容。因此，取决于采用的路径以及您要分组的对象。因此，分组的列可以被包括在输出中并且设置索引。

例如，有关如何自动更改返回类型的说明，请参见Python Pandas：如何将列中的分组列表作为dict返回。

groupby.agg，在另一方面，是用于将用Cython优化的函数（即，能够计算非常好'sum'，'mean'，'std'等非常快）。它还允许在不同的列上计算多个（不同）函数。例如，

df.groupby('some_column').agg({'first_column': ['mean', 'std'],
                               'second_column': ['sum', 'sem']}

在第一列上计算平均值和标准偏差，在第二列上计算平均值的和和标准误。有关更多示例，请参见dplyr总结熊猫等效项。

这些差异也总结了什么是熊猫AGG和应用功能之间的区别？但是，一个专注于之间的差异groupby.agg和groupby.apply。

DataFrame.agg是0.20版的新功能。之前，我们无法将多个不同的功能应用于不同的列，因为只有groupby对象才可以使用。现在，您可以通过在DataFrame的列上计算多个不同的函数来汇总它。来自的示例是否有dplyr:: summarise的等效熊猫？：

iris.agg({'sepal_width': 'min', 'petal_width': 'max'})

petal_width    2.5
sepal_width    2.0
dtype: float64

iris.agg({'sepal_width': ['min', 'median'], 'sepal_length': ['min', 'mean']})

        sepal_length  sepal_width
mean        5.843333          NaN
median           NaN          3.0
min         4.300000          2.0

无法使用DataFrame.apply。它可以逐列或逐行执行，并在该列/行上执行相同的功能。对于类似的单个函数，lambda x: x**2它们产生相同的结果，但其预期用途却大不相同。

其他 2022/1/1 18:25:19 有538人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

在Jenkins API中，有没有办法找到上一个版本的git commit？

在Jenkins API中，有没有办法找到上一个版本的git commit？

其他 2022-01-01 774
如何建立一个动态查询，该查询增加了迄今为止的天数，并使用标准API比较该日期与另一个日期？

如何建立一个动态查询，该查询增加了迄今为止的天数，并使用标准API比较该日期与另一个日期？

其他 2022-01-01 1019
HTML5 File API以文本和二进制形式读取

HTML5 File API以文本和二进制形式读取

其他 2022-01-01 698
使用Hibernate Criteria API编写HQL子句

使用Hibernate Criteria API编写HQL子句

其他 2022-01-01 800
如何在AngularJS中使用$ scope。$ watch和$ scope。$ apply？

如何在AngularJS中使用$ scope。$ watch和$ scope。$ apply？

其他 2022-01-01 732
Bootstrap CSS活动导航

Bootstrap CSS活动导航

CSS 2022-01-01 796
如何正确使用CipherOutputStream加密和解密使用log4j（RollingFileAppender）创建的日志

如何正确使用CipherOutputStream加密和解密使用log4j（RollingFileAppender）创建的日志

其他 2022-01-01 785
为什么新的Java 8日期时间API不具有纳秒精度？

为什么新的Java 8日期时间API不具有纳秒精度？

java 2022-01-01 825
如何在Azure网站上的React App中替换％PUBLIC_URL％

如何在Azure网站上的React App中替换％PUBLIC_URL％

其他 2022-01-01 778
服务应用程序和Google Analytics API V3：服务器到服务器的OAuth2身份验证？

服务应用程序和Google Analytics API V3：服务器到服务器的OAuth2身份验证？

Go 2022-01-01 809
在本地xampp / apache服务器上设置SSL

在本地xampp / apache服务器上设置SSL

其他 2022-01-01 884
如何以编程方式触发Bootstrap模式？

如何以编程方式触发Bootstrap模式？

其他 2022-01-01 665
无需连接数据库即可替代mysql_real_escape_string

无需连接数据库即可替代mysql_real_escape_string

MySQL 2022-01-01 593
从Web Api控制器返回http状态代码

从Web Api控制器返回http状态代码

其他 2022-01-01 672
使用Facebook的Graph API将照片上传到相册

使用Facebook的Graph API将照片上传到相册

其他 2022-01-01 622
我的applicationContext中可以有多个PropertyPlaceHolderConfigurer吗？

我的applicationContext中可以有多个PropertyPlaceHolderConfigurer吗？

其他 2022-01-01 725
apache mysql-3306上的“数据包出现故障”

apache mysql-3306上的“数据包出现故障”

MySQL 2022-01-01 628
如何使用Groovy API检索Jenkins构建参数？

如何使用Groovy API检索Jenkins构建参数？

其他 2022-01-01 702
Java Map为什么不扩展Collection？

Java Map为什么不扩展Collection？

java 2022-01-01 761
级联bean验证2.0不适用于Map中的嵌套对象

级联bean验证2.0不适用于Map中的嵌套对象

其他 2022-01-01 692

apply（）和aggregate（）函数之间的熊猫区别

撰写回答

推荐问题

在Jenkins API中，有没有办法找到上一个版本的git commit？

如何建立一个动态查询，该查询增加了迄今为止的天数，并使用标准API比较该日期与另一个日期？

HTML5 File API以文本和二进制形式读取

使用Hibernate Criteria API编写HQL子句

如何在AngularJS中使用$ scope。$ watch和$ scope。$ apply？

Bootstrap CSS活动导航

如何正确使用CipherOutputStream加密和解密使用log4j（RollingFileAppender）创建的日志

为什么新的Java 8日期时间API不具有纳秒精度？

如何在Azure网站上的React App中替换％PUBLIC_URL％

服务应用程序和Google Analytics API V3：服务器到服务器的OAuth2身份验证？

在本地xampp / apache服务器上设置SSL

如何以编程方式触发Bootstrap模式？

无需连接数据库即可替代mysql_real_escape_string

从Web Api控制器返回http状态代码

使用Facebook的Graph API将照片上传到相册

我的applicationContext中可以有多个PropertyPlaceHolderConfigurer吗？

apache mysql-3306上的“数据包出现故障”

如何使用Groovy API检索Jenkins构建参数？

Java Map为什么不扩展Collection？

级联bean验证2.0不适用于Map中的嵌套对象

分类汇总

您的鼓励是对我最大的支持