小小千想和您聊一聊

当前位置: 首页> 技术分享> 解密Theano中的常用Debug调试技巧

解密Theano中的常用Debug调试技巧

  Theano是最老牌的深度学习库之一。它灵活的特点使其非常适合学术研究和快速实验,但是,与Tensoflow等商业框架相比,Theano的调试功能非常薄弱。其实Theano本身提供了很多辅助调试的手段,下面千锋Python培训老师就个大家介绍一些调试的技巧,让Theano调试不再那么困难。

  1.通过eval查看或调试表达式结果

  对于shared变量,可以通过value或者get_value来查看变量的值,但对于其他Tensorvariable,符号变量是无法查看对应的值的,这时可以调用eval函数来进行查看。 具体方法如下所示:

  >>>import theano

  >>>import numpy

  >>>a = theano.shared(value = numpy.array([[0,0,1],[1,0,0]]))

  >>>b = a.reshape(shape=(3,2))

  >>>b.eval()

  array([ [0,0],

  [1,1],

  [0,0]])

  除了语法错误,在编写项目时还会遇到许多逻辑错误,比如除0问题

  2.对出错位置定位

  Theano的神经网络在出错时,往往会提供一些出错信息。但是出错信息往往非常模糊,让人难以直接看出具体是哪一行代码出现了问题。这是因为Theano的计算图进行了一些优化,导致出错的时候难以与原始代码对应起来。此时可以通过关闭计算图的优化功能来避免这种问题的发生。THEANO_FLAGS的参数optimizer默认值是“fast_run”,代表最大程度的优化,正常使用中一般会保持该状态,但是如果想让调试信息更详细,就需要关闭一部分优化,将默认值修改为“fast_compile”或者关闭全部优化,将默认值修改为“None”。

  THEANO_FLAGS="device=gpu0,floatX=float32,optimizer=None" python test.py

  3.打印中间结果

  通常有Test Value和Print两种打印中间结果的方法,接下来将分别对这两种方法进行介绍。

  (1)Test Value

  Theano在0.4.0之后的版本中,加入了test values机制,其作用是在计算图编译之前,为symbolic设定一个test_value,这样Theano就可以将这些数据,代入到symbolic表达式的计算过程中,从而完成计算过程的验证,并可以打印出中间过程的运算结果。

  值得注意的是,如果需要使用test_value,需要对compute_test_value的标记进行设置,常见设置如下所示。

  off: 关闭。建议在调试完成后,关闭test_value以提高程序速度。

  ignore: test_value计算出错,不会报错。

  warn: test_value计算出错,进行警告。

  raise: test_value计算出错,会产出错误。

  pdb: test_value计算出错,会进入pdb调试。pdb是python自带的调试工具,功能非常强大,可以在pdb中单步查看各变量的值,甚至可以执行任意python代码,通过import pdb 可以在查看详细中间过程的同时避免过多的使用print。

  (2)Print

  通过 Print方法来输出中间结果,示例如下。

  import theano

  import numpy

  import theano.tensor as T

  x = theano.tensor.dvector('x')

  x_printed = theano.printing.Print('important value')(x)

  f = theano.function([x], x + 3)

  f_with_print = theano.function([x], x_printed +3)

  f([1, 2, 3]) #输出时不打印任何信息

  f_with_print([1, 2, 3]) #输出时打印文字信息及x对应的中间值

  输出如下所示。

  array ([4.,5.,6.])

  important value __str__=[1.,2.,3.]

  array ([4.,5.,6.])

  因为theano是基于计算图以拓扑顺序运行程序的,因此各变量在计算图中被调用执行的顺序,不一定和原代码的顺序一样,无法准确的控制打印出的变量顺序。

  Print方法会严重拖慢模型的训练速度,应该尽量避免在用于训练的代码中加入Print方法。该方法可能会阻止一些计算图的优化,例如结果稳定性的优化等,如果程序出现Nan异常,可以考虑把Print去除。

上一篇:HTML5工具初识之网页编辑器

下一篇:认识HTML

QQ技术交流群

千锋Python官方①群
790693323

加入群聊