笔记内容整理自mooc上北京理工大学嵩天老师python系列课程数据分析与展示,本人小白一枚,如有不对,多加指正

0.pandas基于Numpy实现的,前者注重应用,后者注重结构

1.Series类型(索引和数据组合的类型,也就是个带索引的narray)

1.1

python-数据分析与展示(Numpy、matplotlib、pandas)---3-LMLPHP

1.2api

pd.Series.index/value     支持切片

1.3 。。。。。

2.DataFrame类型(共用相同索引的多维Series类型)

python-数据分析与展示(Numpy、matplotlib、pandas)---3-LMLPHP

2.1   .index()    .column()    .values()

2.2  .reindex(index/column = )重排行或列

2.3  index是索引类型(行跟列的表头都是index类型)

python-数据分析与展示(Numpy、matplotlib、pandas)---3-LMLPHP

2.4

python-数据分析与展示(Numpy、matplotlib、pandas)---3-LMLPHP一轴是x轴

3.总结

python-数据分析与展示(Numpy、matplotlib、pandas)---3-LMLPHP

4.数据排序和统计操作

4.1  对索引进行排序dataframe.sort_index()    对数据进行排序dataframe.sort_values()

4.2

python-数据分析与展示(Numpy、matplotlib、pandas)---3-LMLPHPpython-数据分析与展示(Numpy、matplotlib、pandas)---3-LMLPHP

python-数据分析与展示(Numpy、matplotlib、pandas)---3-LMLPHP

4.3累计统计函数

python-数据分析与展示(Numpy、matplotlib、pandas)---3-LMLPHPpython-数据分析与展示(Numpy、matplotlib、pandas)---3-LMLPHP

前者的累计统计函数不同于后者的滚动统计函数,后者是小范围的累计统计函数,范围由rolling(w)中w参数指定

5.数据的相关分析

python-数据分析与展示(Numpy、matplotlib、pandas)---3-LMLPHP

python-数据分析与展示(Numpy、matplotlib、pandas)---3-LMLPHPpython-数据分析与展示(Numpy、matplotlib、pandas)---3-LMLPHP

协方差描述并不准确跟严谨,所以提出了pearson相关系数等描述两个事物或随机变量的相关性

05-07 15:18