Pandas学习笔记

Sep 14, 2014

通过索引方式返回的列只是相应数据的视图，因此，对返回的Series所做的任何就地修改都会反映到DataFrame上。通过Series的copy方法可显式地复制列。

DataFrame构造器可以接受的数据：

二维ndarray：
由数组、列表或元祖组成的字典：
Numpy的结构化、记录数组：
由Series组成的字典：
由字典组成的字典：
字典或Series的列表：
由列表或元祖组成的列表：
另一个DataFrame：
Numpy的MaskedArray：

索引对象

Index对象是不可修改的

pandas中主要的index对象

Index：最泛化的Index对象，将轴标签表示为一个有Python对象组成的Numpy数组
Int64Index：针对整数的特殊Index
MultiIndex：“层次化”索引对象，表示单个轴上的多层索引。可以看做由元祖组成的数组
DatetimeIndex：存储纳秒级时间戳（用Numpy的datetime64类型表示）
PeriodIndex：针对Period数据（时间间隔）的特殊Index

Index的方法和属性

append：连接另一个Index对象，产生一个新的Index
diff：计算差集，并得到一个Index
intersection：计算交集
union：计算并集
isin：计算一个指示各值是否都包含在参数集合中的布尔型数组
delete：删除索引i处的元素，并得到新的Index
drop：删除传入的值，并得到新的Index
insert：将元素插入到索引i处，并得到新的Index
is_monotonic：当元素均大于等于前一个元素时，返回True
is_unique：当Index没有重复值时，返回True
unique：计算Index中唯一值的数组

基本方法

reindex：重新索引，当某个索引值当前不存在，就引入缺失值

(not over)

Comments