[Python话说NBA]pandas分组操作groupby方法与sort_values排序方法

发布时间:2022-07-03 发布网站:脚本宝典
脚本宝典收集整理的这篇文章主要介绍了[Python话说NBA]pandas分组操作groupby方法与sort_values排序方法脚本宝典觉得挺不错的,现在分享给大家,也给大家做个参考。

        在之前的几篇文章中,介绍了pandas分割函数str.splIT()的用法,并且使用该方法计算了NBA著名球星勒布朗詹姆斯2020-2021赛季常规赛的投篮命中率F1b;介绍了pandas文本数据方法str.startswith()函数,并且使用该方法计算了詹姆斯某个月份的得分、篮板、助攻等数据。很多小伙伴看过之后,给我发私信,想知道詹姆斯在对阵哪只NBA球队时发挥最出色,在对阵哪只NBA球队发挥最不理想。如果要得到詹姆斯对阵某只NBA球队的个人数据,需要用到pandas分组操作groupby方法以及sort_values排序方法。

1、groupby分组方法

        groupby的使用方法较为简单,比如我们要计算詹姆斯2020-2021赛季常规赛对阵所有NBA球队时的得分、篮板、助攻等平均数据,则:

DF = pd.read_csv(“lbj-2020-2021-regular.csv”,encoding="gbk")
df0 = df.groupby(['对手'])[['得分','篮板','助攻']].mean().round(2)
PRint(df0)

        其中,df.groupby(['对手'])[['得分','篮板','助攻']].mean()表示以对手进行分组,分别计算詹姆斯对阵NBA球队时得分、篮板、助攻的平均数据。

        round(2)表示计算得到的平均数据保留两位小数

        得到的结果为:

对手得分篮板助攻
76人34.006.006.00
公牛22.509.006.50
............

2、sort_values排序方法

        如果我们想知道詹姆斯对阵哪只NBA球队时发挥最出色或最不理想,需要对詹姆斯的得分、篮板、助攻等数据进行排序,此时要用到sort_values排序方法。

sort_values(by,ascending,na_position)主要涉及三个参数:

by:指定排序的列名或者列名的列表

ascending:指定是否升序排序,默认升序为True。如果降序排序的话,则为False。

na_position:指定缺失值的位置,值为‘First’或‘last’,默认为 ‘last'。

        使用sort_values()方法对詹姆斯的得分、篮板、助攻等数据进行排序:

df1 = df0.sort_values(by=['得分','篮板','助攻'],ascending=[False,False,False])
print(df1)

        得到的结果为:

对手得分篮板助攻
骑士 46.008.006.00
太阳38.005.006.00
............
国王16.008.007.00
老鹰15.504.006.50

        由结果可以看到,詹姆斯对阵骑士时发挥最出色,场均得分46分,场均篮板8个,场均助攻6个;对阵老鹰时发挥最不理想,场均得分15.50分,场均篮板4个,场均助攻6.5个。

脚本宝典总结

以上是脚本宝典为你收集整理的[Python话说NBA]pandas分组操作groupby方法与sort_values排序方法全部内容,希望文章能够帮你解决[Python话说NBA]pandas分组操作groupby方法与sort_values排序方法所遇到的问题。

如果觉得脚本宝典网站内容还不错,欢迎将脚本宝典推荐好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。