DL：深度学习框架Pytorch、 Tensorflow各种角度对比

相关文章
DL：深度学习框架Pytorch、 Tensorflow各种角度对比
DL：深度学习框架Pytorch、 Tensorflow各种角度对比——案例代码实现

先看两个框架实现同样功能的代码

1、Pytorch、Tensorflow代码比较

DL框架之PyTorch：PyTorch的简介、安装、使用方法之详细攻略
DL框架之Tensorflow：Tensorflow的简介、安装、使用方法之详细攻略
DL：深度学习框架Pytorch、 Tensorflow各种角度对比——案例代码实现

2、Tensorflow(数据即是代码，代码就是数据)+Pytorch(随着进展定义、更改和执行节点)

两种框架都在张量上运行，把任何模型都看作一个有向非循环图（DAG），但对于如何定义它们，PyTorch 和 TensorFlow 区别很大。

在便利性和上手难度上，PyTorch 远胜于TensorFlow ，
(1)、原因是PyTorch 是基于动态图，而TensorFlow 是基于静态计算图，因此PyTorch 能随时打印tensor的值，但是TensorFlow 需要设置回调的方法才能打印.
如果想在TensorFlow 中想判断一个变量的值的正确性，只能使用assert方法，这一点确实TensorFlow 不及PyTorch ，
上手难度上PyTorch 也是比TensorFlow 容易。

TensorFlow 遵循“数据即是代码，代码就是数据”的理念。在 TensorFlow 中，在跑模型之前会静态的定义图形。和外界的所有联系都是通过 tf.Session 对象和 tf.Placeholder，它们都是会在模型运行被外部数据取代的张量。
在 PyTorch 中，会更动态一些：你可以随着进展定义、更改和执行节点，没有特殊的会话界面或占位符。
整体来看，PyTorch 和 Python 结合的更紧凑些，多数时候会感觉更原生。而在 TensorFlow 里写东西时，有时你会觉得你的模型好像躲在一堵墙后面一样，就通过墙上的几个洞洞跟你交流。当然了，这也看每个人的喜好和品味。 PyTorch 更适用于研究、爱好者和小规模项目的快速原型开发。TensorFlow 更适合大规模部署，尤其是涉及跨平台和嵌入式部署时。

3、TensorFlow —Google—像框架+静态图+公司好手，不易调试+额外概念(会话、图、变量范围、占位符)，序列化更强大+支持移动和嵌入式部署+大规模分布式+强大的可视化工具

PyTorch 开始会看起来很像一个框架。回想一下，编程框架会在特定领域为我们提供有用的抽象，用它们可以很方便的解决具体问题。而这是框架和库的的本质区别之处。

(1)、TensorFlow基于静态图：在 TensorFlow 中，图结构是静态的，也就是说图在「编译」之后再运行。需要先构建一个计算图，构建好了之后，这样一个计算图是不能够变的了，然后再传入不同的数据进去，进行计算。即固定了计算的流程，所以变得不太灵活。
1)、如果要去改变计算的逻辑，或者随着时间变化的计算逻辑，这样的动态计算TensorFlow是实现不了的，或者是很麻烦。
(2)、TensorFlow不易调试：调试 TensorFlow 则没这么容易。它有两个选择，一是从会话中请求你想检查的变量，而是学会使用 TensorFlow 调试器（tfdbg）。
1)、TensorFlow 则不同，你可以选择用一个叫 tfdbg 的特殊工具，它能让你在运行时评估 TensorFlow 表达式，浏览所有张量，在会话范围中操作。当然，无法用它调试 Python 代码，因此无需单独使用 pdb。
(3)、TensorFlow上手需学习额外概念—会话、图、变量范围、占位符：可以将 TensorFlow 看作是一种嵌入 Python 的编程语言。当你编写 TensorFlow 代码时，它会被 Python编译成图（graph），然后由 TensorFlow 执行引擎运行。
1)、所以，TensorFlow 还有一些需要额外学习的概念，比如会话（session）、图、变量范围、占位符。要让基本的模型跑起来也需要更多样板代码。上手 TensorFlow 的时间肯定会比 PyTorch 长。
(4)、TensorFlow的序列化更强大：TensorFlow 的 Saver 对象也很容易使用，而且也为检查点提供了更多选择。TensorFlow 在序列化方面的主要优势是整个计算图都可以保存为 protocol buffer。这既包括参数，也包括运算。然后这个图可以用其它支持的语言（C++、Java）加载。对于不支持 Python 的部署环境来说，这是非常重要的功能。而且理论上，这个功能也可以在你修改模型的源代码，但又想运行旧模型时为你提供帮助。
(5)、TensorFlow 支持移动和嵌入式部署：但是在 TensorFlow 上，要将模型部署到安卓或 iOS 上需要不小的工作量，但至少你不必使用 Java 或 C++ 重写你模型的整个推理部分。
1)、对于高性能服务器上的部署，还有 TensorFlow Serving 可用。除了性能方面的优势，TensorFlow Serving 的另一个重要特性是无需中断服务，就能实现模型的热插拔。
(6)、TensorFlow 的数据加载比较复杂：我还没找到 TensorFlow 的非常有用的数据加载工具（读取器、队列、队列运行器等等）。部分原因是要将你想并行运行的所有预处理代码加入到 TensorFlow 图中并不总是那么简单直接（比如计算频谱图）。另外，TensorFlow 的 API 本身也更加冗长，学习起来也更难。
(7)、TensorFlow 的设备管理默认即可：设备管理的无缝性能非常好，通常你不需要指定任何东西，因为默认的设置就很好。比如说，TensorFlow 假设如果存在可用的 GPU，你就希望在 GPU 上运行。
1)、TensorFlow 设备管理的唯一缺陷是它会默认占用所有可用的 GPU 上的所有内存，即使真正用到的只有其中一个。但也有一种简单的解决方案，就是指定 CUDA_VISIBLE_DEVICES。有时候人们会忘记这一点，就会让 GPU 看起来很繁忙，尽管实际上它们啥也没干。
(8)、TensorFlow的强大的可视化工具TensorBoard：TensorBoard 是一个用于可视化训练机器学习模型各个方面的工具。它是 TensorFlow 项目产出的最有用的功能之一。仅需在训练脚本中加入少许代码，你就可以查看任何模型的训练曲线和验证结果。TensorBoard 作为一个网页服务运行，可以尤其方便地可视化存储在 headless 节点上的结果。
1)、展示模型图形、绘制标量变量、可视化分布和直方图、可视化图形播放音频
(9)、TensorFlow持支持分布式执行、支持大规模分布式训练：在GPU的分布式计算上更为出色，在数据量巨大时效率比pytorch要高一些。

4、PyTorch —FaceBook—像库+动态图+科研好手，易理解且易调试+结合NumPy更易上手，小规模项目+支持分布式执行+暂时不支持分布式训练

TensorFlow 给人的感觉更像是一个库，而非一个框架：所有的操作都为低阶操作，你需要写很多样板代码，即便你可能并不想写（比如，一遍又一遍的定义方差和权重···）。

(1)、PyTorch基于动态图：创建和运行计算图可能是这两个框架差别最大的地方。在 PyTorch 中，图结构是动态的，也就是说图是在运行时创建的。即就和python的逻辑是一样的，要对变量做任何操作都是灵活的。
(2)、PyTorch容易理解且易调试：简单的图构建方式更容易理解，但也许更重要的是也更容易调试。调试 PyTorch 代码就跟调试 Python 代码一样。你可以使用 pdb，并且可以在任何地方设置断点。
1)、 PyTorch 的计算图是在运行时定义，可以用 pdb，ipdb，PyCharm 这些 Python 调试工具或者以前的可靠的打印语句也行。
(3)、PyTorch结合NumPy更易上手：PyTorch 本质上是支持 GPU 的 NumPy 替代，配备了可用于构建和训练深度神经网络的更高级的功能。所以如果你熟悉 NumPy、Python 和常用的深度学习抽象（卷积层、循环层、SGD 等），那 PyTorch 就很容易学。
(4)、PyTorch序列化的API比较简单：在这两种框架中，保存和加载模型都很简单。PyTorch 有一个非常简单的 API，既可以保存模型的所有权重，也可以 pickle（加工）整个类。
(5)、PyTorch不支持移动和嵌入式部署：而包括 PyTorch 在内的很多深度学习框架都没有这个能力。
(6)、PyTorch的数据加载 API 设计得很好：数据集、采样器和数据加载器的接口都是特定的。数据加载器可以接收一个数据集和一个采样器，并根据该采样器的调度得出数据集上的一个迭代器（iterator）。并行化数据加载很简单，只需为数据加载器传递一个 num_workers 参数即可。
(7)、PyTorch 的设备管理必须指定：而在 PyTorch 中，你必须在启用了 CUDA 之后明确地将所有东西移到 GPU 上。
(8)、PyTorch 的可视化只能调用matplotlib 、seaborn等库：目前 PyTorch 并没有可以和 Tensorboard 匹敌的工具，不过倒是存在一些集成功能。虽然也能用一些绘图工具比如 matplotlib 和 seaborn
(9)、PyTorch 支持支持分布式执行、暂时不支持分布式训练：