通过索引方式返回的列只是相应数据的视图,因此,对返回的Series所做的任何就地修改都会反映到DataFrame上。通过Series的copy
方法可显式地复制列。
DataFrame构造器可以接受的数据:
- 二维ndarray:
- 由数组、列表或元祖组成的字典:
- Numpy的结构化、记录数组:
- 由Series组成的字典:
- 由字典组成的字典:
- 字典或Series的列表:
- 由列表或元祖组成的列表:
- 另一个DataFrame:
- Numpy的MaskedArray:
索引对象
Index对象是不可修改的
pandas中主要的index对象
- Index:最泛化的Index对象,将轴标签表示为一个有Python对象组成的Numpy数组
- Int64Index:针对整数的特殊Index
- MultiIndex:“层次化”索引对象,表示单个轴上的多层索引。可以看做由元祖组成的数组
- DatetimeIndex:存储纳秒级时间戳(用Numpy的datetime64类型表示)
- PeriodIndex:针对Period数据(时间间隔)的特殊Index
Index的方法和属性
- append:连接另一个Index对象,产生一个新的Index
- diff:计算差集,并得到一个Index
- intersection:计算交集
- union:计算并集
- isin:计算一个指示各值是否都包含在参数集合中的布尔型数组
- delete:删除索引i处的元素,并得到新的Index
- drop:删除传入的值,并得到新的Index
- insert:将元素插入到索引i处,并得到新的Index
- is_monotonic:当元素均大于等于前一个元素时,返回True
- is_unique:当Index没有重复值时,返回True
- unique:计算Index中唯一值的数组
基本方法
reindex:重新索引,当某个索引值当前不存在,就引入缺失值
(not over)