鉴于咱是外行,先简单介绍一下tensorboard:
官方:TensorBoard是一套Web应用程序,用于检查和了解您的TensorFlow运行和图形。TensorBoard旨在完全脱机运行,而无需访问Internet。例如,它可能位于您的本地计算机上,公司防火墙之后或数据中心中。
本人解释:tensorboard就是一个和tensorflow配套的可视化程序,当你安装好tensorflow的时候,一般来说tensorboard都已经被装到你的电脑里面啦!这个程序运行以后,你就可以通过浏览器简单的看到你所运行的tensorflow网络的结构,训练状态等等,是训练网络的好帮手。
本人在研究如何可视化的看到dcgan训练情况的时候发现了这个,所以花了一天时间尝试使用tensorboard。
咱也不知道为啥,使用tensorboard的时候一开始总是报错,显示:OSError:[Errno 22] Invalid argument
后来根据这篇文章的方法:将tensorboard卸载后重装为1.11版本,就正常运行了,tensorboard1.13.1似乎有点问题
重装方法:首先激活tensorflow环境
activate tensorflow-gpu
之后卸载tensorboard
pip uninstall tensorboard
再之后安装其他版本tensorboard
pip install tensorboard == 1.11
这时候tensorboard就可以运行了!
运行tensorboard的时候可能得多开一个终端窗口,比如我们在windows下进行训练,可以先开一个Anaconda Prompt 执行我们的训练程序,再开一个窗口运行tensorboard。
如果显示错误:tensorboard: error: unrecognized arguments: –logdirs= ./ 说明你指定的log文件夹地址不对
在运行tensorboard需要指定正在训练的logs文件夹的地址,需要首先进入这个文件夹(通过cd命令将当前目录移动到训练中的目录),
例: 首先进入C:\Users\Administrator\dcgan\out\20200608.171519 – data – train – x128.z100.uniform_signed.y128.b64\logs>tensorboard –logdir=…
再执行以下命令:
tensorboard –logdir …
注意,如果报错的话建议手动输入,我也不知道为嘛就容易报错
这一部的目的是:执行tensorboard命令,通过 –logdir这个命令来指定模型的记录存在的目录 后面空格加目录地址就行,一定记得要用/而不是\ 斜杠不对可能指定的目录不对,也就打不开啦!
这时候会给你显示一行地址,但是这行地址是按照你的计算机命名显示出来的,所以直接复制可能会导致不能打开,可以直接把下面的这个地址复制到chrome内核的浏览器(比如360极速浏览器或者谷歌浏览器chrome)来访问tensorboard
http://localhost:6006
这时候就可以打开tensorboard的页面啦,可以清楚的看到自己训练的模型的损失函数什么的,其他功能还有待发掘。看不懂英文的话在空白位置右键点击翻译成中文就好了~
点击右上角的齿轮,可以调节更新的时间间隔等等~
其他tensorboard命令有:
tensorboard [-h] [–helpfull] [–logdir PATH] [–host ADDR]
[–port PORT] [–purge_orphaned_data BOOL]
[–reload_interval SECONDS] [–db URI] [–db_import]
[–inspect] [–tag TAG] [–event_file PATH]
[–path_prefix PATH] [–window_title TEXT]
[–max_reload_threads COUNT]
[–samples_per_plugin SAMPLES_PER_PLUGIN]
[–master_tpu_unsecure_channel ADDR]
[–debugger_data_server_grpc_port PORT]
[–debugger_port PORT]
end