随笔小记(十七)

AttributeError: ‘dict’ object has no attribute 'iteritems’
Python3.5中:iteritems变为items
pd.merge()
pd.merge()只能用于两个表的拼接,而且通过参数名称也能看出连接方向是左右拼接,一个左表一个右表,而且参数中没有指定拼接轴的参数,所以pd.merge()不能用于表的上下拼接。
如果需要拼接的两个表中,有相同的列信息,那么进行拼接的时候即使不指定以哪个字段作为主键函数也会默认用信息相同的列做主键对两个表进行拼接。
参考链接:https://zhuanlan.zhihu.com/p/132579724

python pandas 之drop()函数
drop() 删除行和列
drop([ ],axis=0,inplace=True)
drop([]),默认情况下删除某一行;
如果要删除某列,需要axis=1;
参数inplace 默认情况下为False,表示保持原来的数据不变,True 则表示在原来的数据上改变。
随笔小记(十七)随笔小记(十七)随笔小记(十七)随笔小记(十七)参考链接:https://blog.****.net/lhy2239705435/article/details/90052681

python as_matrix()
在我们读取一些excel/csv文件的数据后,在训练模型之前经常要对数据进行数组转化,很多时候取得的数据是DataFrame的形式,这个时候要记得转换成数组。
原始DataFrame
随笔小记(十七)运行结果是3行4列的DataFrame,DataFrame是一种表格型数据结构,有行索引,也有列索引。
用as_matrix()将Dataframe的表格型数据转换成数组:
随笔小记(十七)结果为3行4列的矩阵。
as_matrix()已淘汰,改使用values。上面的用法已面临淘汰,会出现警告。
替代用法:df.values
随笔小记(十七)
dataframe.values获取的是dataframe中的数据,形式为数组array
参考链接:https://blog.****.net/weixin_44668131/article/details/96600966?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.channel_param&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.channel_param

随笔小记(十七)随笔小记(十七)随笔小记(十七)
随笔小记(十七)
随笔小记(十七)