numpy.array基础

import numpy
numpy.__version__   #查询当前numpy的版本
'1.14.0'
import numpy as np
np.__version__
'1.14.0'

Python List 特点

L = [i for i in range(10)]
L
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
L[5]
5
L[5] = 20
L
[0, 1, 2, 3, 4, 20, 6, 7, 8, 9]
L[5] = 'hello'
L
[0, 1, 2, 3, 4, 'hello', 6, 7, 8, 9]

Python List 中的List是对元素类型没有进行限制的。也就是说什么类型都是可以赋值进去的。这样使得Python中List是非常灵活的,但是也导致了List的效率是比较低的。因为对于每个元素都必须去查找对应的元素类型。Python中array模块是对元素类型有限制的。

Python array模块的特点

import array
arr = array.array('i',[i for i in range(10)])
arr
array('i', [0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
arr[5]
5
arr[5] = 100
arr
array('i', [0, 1, 2, 3, 4, 100, 6, 7, 8, 9])
arr[5]= 'hello'  #限定类型
---------------------------------------------------------------------------

TypeError                                 Traceback (most recent call last)

<ipython-input-19-53429961e592> in <module>()
----> 1 arr[5]= 'hello'


TypeError: an integer is required (got type str)

类型限定,但是效率比List更高,但是只是把数据当成数组来看,并没有将数据当作矩阵来看,所以不适合在大数据和人工智能上使用。

Python中 numpy.array的使用

nparr = np.array([i for i in range(10)])
nparr
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
nparr[5]
5
nparr[5] = 100
nparr
array([  0,   1,   2,   3,   4, 100,   6,   7,   8,   9])

numpy会对类型进行限制

nparr[5] = 'sdfsd'    #类型限制
nparr
---------------------------------------------------------------------------

ValueError                                Traceback (most recent call last)

<ipython-input-25-011f26deb6f3> in <module>()
----> 1 nparr[5] = 'sdfsd'
      2 nparr


ValueError: invalid literal for int() with base 10: 'sdfsd'
查看类型
nparr.dtype   #数据类型
dtype('int32')
nparr[5] = 5.0
nparr
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
进行了一次隐式的类型转换

其他创建 numpy.array的方法

创建由10个整数0组成的 int 矩阵
np.zeros(10,dtype=int)
array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0])
创建一个3行5列全部由0组成的 float 矩阵
np.zeros((3,5),dtype=float)
array([[0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.]])
创建一个3行5列全为1的 float 矩阵
np.ones((3,5),dtype=float)
array([[1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.]])
创建一个指定值的矩阵
np.full(shape=(3,5),fill_value=666.0)
array([[666., 666., 666., 666., 666.],
       [666., 666., 666., 666., 666.],
       [666., 666., 666., 666., 666.]])
numpy.arange方法
[i for i in range(0,20,2)]   #0至20 步长为2的数组
[0, 2, 4, 6, 8, 10, 12, 14, 16, 18]
0至20 步长为2的数组
np.arange(0,20,2)
array([ 0,  2,  4,  6,  8, 10, 12, 14, 16, 18])
numpy.linspace方法
np.linspace(0,20,10)
array([ 0.        ,  2.22222222,  4.44444444,  6.66666667,  8.88888889,
       11.11111111, 13.33333333, 15.55555556, 17.77777778, 20.        ])
np.linspace(0,20,11)
array([ 0.,  2.,  4.,  6.,  8., 10., 12., 14., 16., 18., 20.])

0至20 等长步长的一共11个元素,包含0也包含20

numpy.random 方法
np.random.randint(0,10)
7
np.random.randint(4,8,size=(3,5))
array([[6, 4, 4, 4, 4],
       [6, 4, 5, 6, 7],
       [4, 7, 5, 7, 7]])

生成一个随机值在4至8之间的 3行5列的矩阵

np.random.seed(666)
np.random.randint(4,8,size=(3,5))
array([[4, 6, 5, 6, 6],
       [6, 5, 6, 4, 5],
       [7, 6, 7, 4, 7]])

设置一个随机数种子

np.random.random()
0.2811684913927954

生成一个0--1之间的随机数

np.random.random((3,5))
array([[0.46284169, 0.23340091, 0.76706421, 0.81995656, 0.39747625],
       [0.31644109, 0.15551206, 0.73460987, 0.73159555, 0.8578588 ],
       [0.76741234, 0.95323137, 0.29097383, 0.84778197, 0.3497619 ]])

生成一个3行5列的随机数矩阵

np.random.normal()
-0.21326813235544162

生成一个符合均值为0,方差为1分布的随机数

np.random.normal(10,100)
54.07669166918434

生成一个符合均值为10,方差为100分布的随机数

np.random.normal(0,1,size = (3,5))
array([[ 0.69339587,  0.03820097, -0.18592982, -0.35371521, -1.95332994],
       [-0.34376486, -1.47693162, -0.70022971,  0.77605168,  1.18063598],
       [ 0.06102404,  1.07856138, -0.79783572,  1.1701326 ,  0.1121217 ]])

生成一个符合均值为0,方差为1分布的 3行5列的随机数

当对方法不清楚的时候可以使用 方法?的格式查询使用方法

np.random.normal?

help()使用

help(np.random)