python-axis的方向

Python中axis的方向(numpy, pandas, tensorflow)

版权声明:本文为CSDN博主「fangjian1204」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。 原文链接:https://blog.csdn.net/fangjian1204/article/details/53055219

axis的作用即如何理解

numpy是python进行科学计算必不可少的模块,随着深度学习越来越火,numpy也越来越流行。了解numpy的人知道,在numpy中,有很多的函数都涉及到axis,很多函数根据axis的取值不同,得到的结果也完全不同。可以说,axis让numpy的多维数组变的更加灵活,但也让numpy变得越发难以理解。这里通过详细的例子来学习下,axis到底是什么,它在numpy中的作用到底如何。

为什么会有axis这个东西,原因很简单:numpy是针对矩阵或者多为数组进行运算的,而在多维数组中,对数据的操作有太多的可能,我们先来看一个例子。比如我们有一个二维数组:

1>>> import numpy as np
2>>> data = np.array([
3... [1,2,1],
4... [0,3,1],
5... [2,1,4],
6... [1,3,1]])

这个数组代表了样本数据的特征,其中每一行代表一个样本的三个特征,每一列是不同样本的特征。如果在分析样本的过程中需要对每个样本的三个特征求和,该如何处理?简单:

1>>> np.sum(data, axis=1)
2array([4, 4, 7, 5])

那如果想求每种特征的最小值,该如何处理?也简单:

1>>> np.min(data, axis=0)
2array([0, 1, 1])

又如果想得知所有样本所有特征的平均值呢?还是很简单:

1>>> np.average(data)
21.6666666666666667

由此可以看出,通过不同的axis,numpy会沿着不同的方向进行操作:如果不设置,那么对所有的元素操作;如果axis=0,则沿着纵轴进行操作;axis=1,则沿着横轴进行操作。

但这只是简单的二位数组,如果是多维的呢?可以总结为一句话:设axis=i,则numpy沿着第i个下标变化的放下进行操作。例如刚刚的例子,可以将表示为:data =[[a00, a01],[a10,a11]],所以axis=0时,沿着第0个下标变化的方向进行操作,也就是a00->a10, a01->a11,也就是纵坐标的方向,axis=1时也类似。下面我们举一个四维的求sum的例子来验证一下

 1>>> data = np.random.randint(0, 5, [4,3,2,3])
 2>>> data
 3array([[[[4, 1, 0],
 4         [4, 3, 0]],
 5        [[1, 2, 4],
 6         [2, 2, 3]],
 7        [[4, 3, 3],
 8         [4, 2, 3]]],
 9
10       [[[4, 0, 1],
11         [1, 1, 1]],
12        [[0, 1, 0],
13         [0, 4, 1]],
14        [[1, 3, 0],
15         [0, 3, 0]]],
16
17       [[[3, 3, 4],
18         [0, 1, 0]],
19        [[1, 2, 3],
20         [4, 0, 4]],
21        [[1, 4, 1],
22         [1, 3, 2]]],
23
24       [[[0, 1, 1],
25         [2, 4, 3]],
26        [[4, 1, 4],
27         [1, 4, 1]],
28        [[0, 1, 0],
29         [2, 4, 3]]]])

当axis=0时,numpy验证第0维的方向来求和,也就是第一个元素值=a0000+a1000+a2000+a3000=11,第二个元素=a0001+a1001+a2001+a3001=5,同理可得最后的结果如下:

1>>> data.sum(axis=0)
2array([[[11,  5,  6],
3        [ 7,  9,  4]],
4
5       [[ 6,  6, 11],
6        [ 7, 10,  9]],
7
8       [[ 6, 11,  4],
9        [ 7, 12,  8]]])

当axis=3时,numpy验证第3维的方向来求和,也就是第一个元素值=a0000+a0001+a0002=5,第二个元素=a0010+a0011+a0012=7,同理可得最后的结果如下:

 1>>> data.sum(axis=3)
 2array([[[ 5,  7],
 3        [ 7,  7],
 4        [10,  9]],
 5
 6       [[ 5,  3],
 7        [ 1,  5],
 8        [ 4,  3]],
 9
10       [[10,  1],
11        [ 6,  8],
12        [ 6,  6]],
13
14       [[ 2,  9],
15        [ 9,  6],
16        [ 1,  9]]])