pandas----索引-----(数据分析)

理论部分

  • 熟练掌握多种单层索引方式及其异同
  • 掌握和理解多级索引操作
  • 熟悉常用索引设定方法及其区别
  • 掌握索引函数、去重函数和抽样函数

练习部分

  • UFO数据集分析
  • 口袋妖怪数据集分析
    一、单级索引
  1. loc方法、iloc方法、[]操作符
    最常用的索引方法可能就是这三类,其中iloc表示位置索引,loc表示标签索引,[]也具有很大的便利性,各有特点
    (a)loc方法(注意:所有在loc中使用的切片全部包含右端点!)
    ① 单行索引:
    pandas----索引-----(数据分析)
    pandas----索引-----(数据分析)
    pandas----索引-----(数据分析)
    【练习一】 现有一份关于UFO的数据集,请解决下列问题:
    (a)在所有被观测时间超过60s的时间中,哪个形状最多? (b)对经纬度进行划分:-180°至180°以30°为一个划分,-90°至90°以18°为一个划分,请问哪个区域中报告的UFO事件数量最多?
  2. 问题
    【问题一】 如何更改列或行的顺序?如何交换奇偶行(列)的顺序?
    【问题二】 如果要选出DataFrame的某个子集,请给出尽可能多的方法实现。
    【问题三】 query函数比其他索引方法的速度更慢吗?在什么场合使用什么索引最高效?
    【问题四】 单级索引能使用Slice对象吗?能的话怎么使用,请给出一个例子。¶
    【问题五】 如何快速找出某一列的缺失值所在索引?
    【问题六】 索引设定中的所有方法分别适用于哪些场合?怎么直接把某个DataFrame的索引换成任意给定同长度的索引?
    【问题七】 多级索引有什么适用场合?
    【问题八】 什么时候需要重复元素处理?
    具体的操作步骤见我的下载中心,有关于索引的代码文件