小小千想和您聊一聊

当前位置: 首页> 技术分享> 编程语言Theano中的符号变量

编程语言Theano中的符号变量

  使用编程语言进行编程时,需要用到各种变量来存储各种数据信息,Theano虽然是基于Python和Numpy实现的数值计算工具库,但其有自己独立的变量体系。Theano的变量类型被称为符号变量(TensorVariable),它是Theano表达式和运算操作的基本单元。Theano中所有符号变量来源于一个基类:Tensorvariable(),即这些符号变量都是这个类的实例化,而这些符号变量本身的数据类型,通过实例化给定,通过访问对象属性得到object.type,这些在Theano的tensor模块中。

  一般情况下,首先需要导入Theano,否则会返回异常。Theano目前支持7种变量类型:col、matrix、row、scalar、tensor3、tensor4、vector。接下来演示如何使用内置方法定义向量类型的变量,具体如下所示:

  >>>import theano

  >>>import theano.tensor as T

  >>>x=T.vector(name='变量名称',dtype=‘该实例化的符号变量的数据类型’)

  其中,vector()函数需要指定以下两个参数:

  name:指定变量的名称。

  dtype:指定变量的数据类型。目前Theano变量支持的数据类型有以下8种:int8、int16、int32、int64、float32、float64、complex64、complex128。

  在创建其他类型的变量时,将vector替换成对应的变量类型即可,比如通过将vector替换成matrix即可创建矩阵类型的变量:T.matrix。

  表2.1列出了常见的符号类型以及符号变量的数据类型。

  表2.1 常见的符号类型

1
2
3


4


  表2.1中第一栏里面是符号变量的类型,第二栏是符号变量的数据类型,最后一栏broadcastable属性的作用是表示不同shape的矩阵之间是否可以广播。

  上述使用Theano内置的变量定义方法,只适用于处理四维以下的变量,当需要处理更高维的数据时,需要采用自定义变量类型的方法进行定义,自定义变量的一般形式如下所示:

  >>>import theano

  >>>import theano.tensor as T

  >>>mytype=T.TensorType(dtype,broadcastable,name=None,sparse_grad=Fasle)

  使用上述TensorType函数进行自定义变量操作时,需要指定4个参数,其中dtype和broadcastable是必须指定的,也是最常用的参数。

  name:指定变量的名称。

  dtype:指定变量的数据类型。目前Theano变量支持的数据类型有以下8种:int8、int16、int32、int64、float32、float64、complex64、complex128。

  broadcastable:是一个由True或Fasle值构成的布尔类型元组,元组的大小等于变量的维度大小,如果元组中的某一个值为True,则表示变量在对应的维度上的数据可以进行广播(broadcast),否则数据不能广播。

  接下来分别演示几种常见的变量定义方法。

  返回一个0维的numpy.ndarray:

  >>>theano.tensor.scalar(name=None, dtype=config.floatX)

  返回一个1维的numpy.ndarray:

  >>>theano.tensor.vector(name=None, dtype=config.floatX)

  返回一个2维的numpy.ndarray,但是行数保证是1:

  >>>theano.tensor.row(name=None, dtype=config.floatX)

  返回一个2维的numpy.ndarray,但是列数保证是1:

  >>>theano.tensor.col(name=None, dtype=config.floatX)

  返回一个2维的numpy.ndarray:

  >>>theano.tensor.matrix(name=None, dtype=config.floatX)

  返回一个3维的numpy.ndarray:

  >>>theano.tensor.tensor3(name=None, dtype=config.floatX)

  返回一个4维的numpy.ndarray:

  >>>theano.tensor.tensor4(name=None, dtype=config.floatX)

  如果想要创建一个非标准的类型的变量,就需要用到自定义的TensorType。这需要将dtype和broadcasting pattern传入声明函数中。

  创建一个五维向量的代码如下所示。

  dtensor5 = TensorType('float64', (False,)*5)

  x = dtensor5()

  z = dtensor5('z')

  可以通过以下代码对已存在的类型进行重构。

  my_dmatrix = TensorType('float64', (False,)*2)

  x = my_dmatrix() # 定义一个矩阵变量

  print my_dmatrix == dmatrix # 输出为“True”

  TensorType函数有一项重要的参数broadcastable,该参数对变量是否可以进行广播产生影响。广播机制使得不同维度的张量进行加法或者乘法运算成为可能,它可以让程序直接执行异构数据间的运算操作,避开异构数据间运算时维度转换的过程。例如,将一个向量数据与一个高维矩阵相加,如果没有广播的机制,则需要先将低维的数据转换成高维数据才能进行相应的操作符运算。通过广播机制,标量可以直接与矩阵相加,向量可以直接和矩阵相加,标量可以直接和向量相加,广播的运算机制如图2.11所示。


图片1

  图2.11 Broadcast的运算机制

  图2.11演示了广播一个行矩阵的过程,其中,T和F分别表示True和False,表示广播沿着哪个维度进行。如果第二个参数是向量,它的维度为(2,),广播模式为(False,)。它将会自动向左展开,匹配矩阵的维度,最终得到维度为(1,2)和Boradcastable为(True,Fale)。

  与numpy的广播机制不同,Theano需要知道哪些维度需要进行广播。当维度可以广播时,广播信息将会以变量的类型给出。

  下面的代码演示了在向量和矩阵的加法运算过程中,行和列是如何进行广播的:

  import theano

  import numpy

  import theano.tensor as T

  r = T.row()

  r.broadcastable

  # (True, False)

  mtr = T.matrix()

  mtr.broadcastable

  # (False, False)

  f_row = theano.function([r, mtr], [r + mtr])

  R = numpy.arange(3).reshape(1,3)

  # R

  # array([[0, 1, 2]])

  M = numpy.arange(9).reshape(3, 3)

  # M

  # array([[0, 1, 2],

  # [3, 4, 5],

  # [6, 7, 8]])

  f_row(R, M)

  # [array([ [ 0., 2., 4.],

  # [ 3., 5., 7.],

  # [ 6., 8., 10.]])]

  c = T.col()

  c.broadcastable

  # (False, True)

  f_col = theano.function([c, mtr], [c + mtr])

  C = numpy.arange(3).reshape(3, 1)

  # C

  # array([[0],

  # [1],

  # [2]])

  M = numpy.arange(9).reshape(3, 3)

  f_col(C, M)

  # [array([ [ 0., 1., 2.],

  # [ 4., 5., 6.],

  # [ 8., 9., 10.]])]

  接下来通过TensorType方法创建一个五维张量类型,将其broadcastable设置成(False,)*5。此时,通过自定义方法新使创建的变量在5个维度上都不再支持广播机制。

  import theano

  import theano.tensor as T

  mytype=T.TensorType('float32',(False,)*5)

  data=mytype('x')

  data.type()

  结果如下所示。

     <TensorType(float32,5D)>

  可以从结果看出,已经成功修改了所创建变量的属性,使其在5个维度上不再支持广播。

上一篇:HTML5工具初识之网页编辑器

下一篇:区块链之共识算法