numpy数组的使用

机器学习的最基础模块就是numpy模块了,而numpy模块中的数组操作又是重中之重,所以我们要把数组的各种方法弄得明明白白的,以下就是数组的一些常用方法

1.创建各种各样的数组:

import numpy as np
import matplotlib.pyplot as plt

print(np.zeros(10))  #一维全零数组
print(np.zeros((3,3),dtype=np.int))  #多维tupple数组  3行3列  可以加数据类型
print(np.ones(10))   #一维全1数组
print(np.ones((4,4)))   #多维全1数组
print(np.full((3,5),8))  #可以指定数组元素的值
print(np.identity(4))   #创建单位矩阵
print(np.eye(4,4,1))    #4行4列单位矩阵 对角线从下标1开始


print(np.array([1,23,4,'ltf','fjf']))   #可以随便传入数据  一维数组
print(np.array([[1,2,3],['ltf','lsq','fjf'],['男','女','人妖']]))   #多维数组,随便定义、

a=np.array([[1,2,3],[4,3,6]])
b=np.full_like(a,3.2)
c=np.ones_like(a)
print(b)
print(c)

#根据一个向量创建斜对角线方阵 也可以指定对角线位置
arr2d=np.diag([1,2,3,4])
print(arr2d)

print(np.arange(1,6))  #类似于range 不包含上界
print(np.arange(1,10,2))   #开始 结束 步长
print(np.linspace(1,10,4))  #开始 结束 个数
print(np.logspace(1,4,4))     #分为4个等分点,形成数组【1,2,3,4】然后形成 对数的底数的指数
print(np.logspace(1,5,5,base=2))  #指定对数为2


#创建坐标系 其实可以用plt.show()
x=np.linspace(0,1,5)
y=np.linspace(0,1,3)
xv,yv=np.meshgrid(x,y)
print(xv)
print(yv)
plt.plot(xv,yv,'^')
plt.show()


#指数图
x=np.arange(-5,5,0.1)
y=np.power(2,x)
#print(y)
plt.plot(x,y)
#对数图
x=np.power(2,x)
y=np.log2(x)
plt.plot(x,y)
plt.show()


x1=np.arange(1,5,1)
y1=np.power(x1,3)  #x1的3次方
print(y1)

x2=np.array([1,8,27,64])
y2=np.power(x2,1/3)  #x2的1/3次方
print(y2)

2.数组的复制等各种操作

import numpy as np


#1  赋值 改变原数组
a=np.array([1,2,3,4,5])
b=a
b[0]=100
print(b)
print(a)

#2 拷贝 不改变原数组
a1=np.array([1,2,3,4,5])
b1=np.copy(a1)
b1[0]=20
print(a1)
print(b1)

#3  修改
arry=np.array([1,2,3,4,5])
#arry[2]=10
arry[0:2]=8  #包头不包尾
print(arry)

arr1=np.array([[1,2,3,4],[5,6,7,8]])
print(arr1.T)  #数组的转置
arr1.shape=4,2
print(arr1)    #简单分隔

#4 分隔
arr2=np.arange(0,20,1)
print(arr2.reshape(4,5))
newarr2=arr2.reshape(4,5)
newarr2[0:2,0]=8  #0行1行 的0列 为8
print(newarr2)

#5
newarr3=np.reshape(newarr2,(1,-1))  #行数为1,  列数 待定
print(newarr3)
newarr4=np.reshape(newarr2,(-1,1))  #列数为1, 行数 待定
print(newarr4)

newarr5=newarr3[0][:,np.newaxis]   #取第一行 即一维数组 在变成一列
print(newarr5)


#6 二维数组转一维数组
arr2d=np.arange(1,21,1).reshape(4,5) #4行5列
print(arr2d)
arr2d1=np.ravel(arr2d)
print(arr2d1)  #arr2d1和arr2d共享同一块内存
print(arr2d.flatten())   #不共享内存

#7 resize使用
arrresize=np.resize(arr2d,(5,2))  #5行2列  本来有20个元素 只取其中的10个也可以 不像reshape必须全取
print(arrresize)

#8 转置  多维转换置换 
arr3d=np.arange(1,28,1).reshape(3,3,3)
print(arr3d)
arr3d1=np.transpose(arr3d)
print(arr3d1)

3.数组的修改等各种操作

import numpy as np


#1.访问二维数组
a=np.arange(1,16,1).reshape(3,5) #3行5列数组
print(a)
print(a[1])  #访问第一行
print(a[1,1])  #访问第一行第一列的元素
print(a[1][1])  #访问第一行第一列的元素

#2.访问二维数组部分元素
print('-'*20)
b=np.arange(1,16,1).reshape(3,5) #3行5列二维数组
print(b)
print(b[0:1,2:4]) #第一行下标为2和下标为3的元素
print(b[:,3])     #所有行下标为3的列数的所有元素
print(b[:,2:5])   #所有行,2,3,4列元素


#3.删除元素
print('-'*20)
c=np.arange(1,16,1).reshape(3,5) #3行5列二维数组
print(c)
print(np.delete(c,1))  #删除行号 返回一位数组
print(np.delete(c,[2,3,8,9]))  #返回一位数组 删除下标为2,3,8,9的元素

#4.删除列元素
print('-'*20)
d=np.arange(1,16,1).reshape(3,5) #3行5列二维数组
print(d)
print(np.delete(d,1,axis=0))  #删除下标为1这一行
print(np.delete(d,[2,3],axis=1))  #删除下标为2和3 的这两列


#5.插入元素
print('-'*20)
e=np.array([[1,2],[3,4],[5,6]])
print(e)
print(np.insert(e,1,5)) #返回一维数组 把5插入到1号索引后
print(np.insert(e,1,5,axis=1))  #插入一列 该列元素全为5
print(np.insert(e,1,[0,2,5],axis=1)) #插入一列 为0,2,5
print(np.insert(e,len(e),[[7,8]],axis=0))  #在最后一列插入一行
print(np.c_[e,np.array([1,1,1])]) #在最后一行后面加一列
print(np.append(e,[[7,8]],axis=0))  #append追加一列

4.数组的组合拼接等等

import numpy as np

#1.数组的行拼接
a=np.array([[1,2],[3,4]])
b=np.array([[5,6]])
c=np.concatenate((a,b),axis=0)  #axis=0 按行
d=np.vstack((a,b))  #行 方法
print(c)
print(d)

#2.数组的列拼接
a=np.array([[1,2],[3,4]])
b=np.array([[5],[6]])
c=np.concatenate((a,b),axis=1)  #axis=1 按列 要求具有同样的列数
d=np.hstack((a,b))  #列方法
print(c)
print(d)

#3.竖直方向将二维数组拆分成若干个数组
a=np.arange(1,21,1).reshape(4,5)
b=np.split(a,2)
c=np.vsplit(a,2)
print(b)
print(c)

#4.水平方向将二维数组拆分成若干个数组
a=np.arange(1,21,1).reshape(4,5)
b=np.hsplit(a,5)
print(b)

5.数组的查找,排序,统计

import numpy as np


#1.检查符合条件的元素
a=np.array([1,0,0,3,4,5,0,8])
b=np.nonzero(a)
print(b)  #不为0的下标
c=a[b]
print(c)  #输出不为0的元素 1,3,4,5,8

#2.二维数组查找
a=np.array([[1,2,0],[4,0,6],[0,8,9]])
b=np.nonzero(a)
c=a[b]
print(c)   #输出一维数组1,2,4,6,8,9

#3.查找指定条件
a=np.arange(10)
print(a)
b=np.where(a>5)
print(a[b])  #查找大于5的

#4.返回条件为true
a=np.arange(5)
b=np.array([True,False,True,True,False])
print(a[b]) #输出0,2,3
print(b[a])

#5.返回指定索引的若干个元素
a=np.array([4,3,5,7,6,8])
b=np.take(a,[0,1,4]) #返回索引为0,1,4的元素
print(b)


#5.数组排序
a=np.arange(5)
print(a[::-1])  #倒序,,-1指定步长为-1 倒数
b=np.array([3,4,1,8,4,9,5,6,9])
print(np.sort(b))  #一维数组排序

a=np.array([[3,1,5],[2,4,0]])
print(a)
b=np.sort(a,axis=0) #沿着行索引增加方向排序,也就是对每一列排序
print(b)
c=np.sort(a,axis=1) #沿着列索引增加方向排序,也就是对每一行排序
print(c)

#5.分界线排序
a=np.array([30,20,40,50,10,80,50,40,90,76])
b=np.partition(a,0)
print(b) #小于30的在左边 大于30的在右边 等于也在右边
c=np.partition(a,6)
print(c)  #小于50的在左边 大于50的在右边 等于也在右边

#6.数组统计
a=np.array([1,3,6,2,5,9,8,10,4])
print(a.max())  #最大值
print(np.max(a))  #最大值
print(np.min(a))  #最小值


a=np.arange(1,11,1).reshape(2,5) #2行5列2维数组
print(a)
print(np.max(a)) #所有元素里面的最大值
print(np.max(a,axis=0)) #行索引 找出每一列的最大值
print(np.max(a,axis=1)) #列索引 找出每一行的最大值

a=np.array([[1,3,9],[2,5,4],[6,7,8]])
print('-'*20)
print(np.max(a,axis=0)) #行索引 找出每一列的最大值
print(np.max(a,axis=1)) #列索引 找出每一行的最大值


#查找极值元素的索引
a=np.array([1,2,0,4,5,3,7,9])
print(np.argmax(a)) #索引号 7
print(np.argmin(a)) #索引号 2

a=np.array([[1,2,3],[6,5,4],[9,7,8]])  #3行3列
print(a)
print(np.argmax(a))
print(np.argmax(a,axis=0)) #每一列最大元素的索引
print(np.argmax(a,axis=1)) #每一行最大元素的索引

#计算数组平均值
a=np.arange(1,13,1).reshape(3,4)
print(a)
print(np.mean(a)) #输出 所有数的和的平均值
print(np.mean(a,axis=0)) #每一列的平均值
print(np.mean(a,axis=1)) #每一行的平均值

#计算数组加权平均值
a=np.arange(1,11)
print(a) #输出1-11的十个数
print(np.mean(a))  #没加权重
b=np.average(a,weights=np.array([1,3,1,0,0,1,1,0,1,2]))  #这是加了权重
print(b)

附上GitHub地址:

https://github.com/tyutltf/numpy_array_basic


  目录