折返的Liung

我如溪水,静静流淌在山涧~~我如白云,俯瞰此生今生~~

Pandas学习笔记

通过索引方式返回的列只是相应数据的视图,因此,对返回的Series所做的任何就地修改都会反映到DataFrame上。通过Series的copy方法可显式地复制列。

DataFrame构造器可以接受的数据:

  • 二维ndarray:
  • 由数组、列表或元祖组成的字典:
  • Numpy的结构化、记录数组:
  • 由Series组成的字典:
  • 由字典组成的字典:
  • 字典或Series的列表:
  • 由列表或元祖组成的列表:
  • 另一个DataFrame:
  • Numpy的MaskedArray:

索引对象

Index对象是不可修改的

pandas中主要的index对象

  • Index:最泛化的Index对象,将轴标签表示为一个有Python对象组成的Numpy数组
  • Int64Index:针对整数的特殊Index
  • MultiIndex:“层次化”索引对象,表示单个轴上的多层索引。可以看做由元祖组成的数组
  • DatetimeIndex:存储纳秒级时间戳(用Numpy的datetime64类型表示)
  • PeriodIndex:针对Period数据(时间间隔)的特殊Index

Index的方法和属性

  • append:连接另一个Index对象,产生一个新的Index
  • diff:计算差集,并得到一个Index
  • intersection:计算交集
  • union:计算并集
  • isin:计算一个指示各值是否都包含在参数集合中的布尔型数组
  • delete:删除索引i处的元素,并得到新的Index
  • drop:删除传入的值,并得到新的Index
  • insert:将元素插入到索引i处,并得到新的Index
  • is_monotonic:当元素均大于等于前一个元素时,返回True
  • is_unique:当Index没有重复值时,返回True
  • unique:计算Index中唯一值的数组

基本方法

reindex:重新索引,当某个索引值当前不存在,就引入缺失值

(not over)

Comments