如何用tensorflow实现多任务代码？一个分类一个检索

2024-05-18 02:23

1. 如何用tensorflow实现多任务代码？一个分类一个检索

多任务的一个特点是单个tensor输入(X)，多个输出(Y_1,Y_2...)。因此在定义占位符时要定义多个输出。同样也需要有多个损失函数用于分别计算每个任务的损失。

2. Tensorflow 做LSTM 恢复模型测试时相同输入数据给出的输出却不一样，这是怎么回事？

应该是dropout设置了随机取值

3. 将该TensorFlow CNN改为二分类

预测一个样本的时候同样可以看做是预测一批样本, 只不过这一批只有一个
X-test = [ x0,x1,x2 ... ]
model.predict(X-test)   
或者  model.predict( [ x0 ] )  
或者  model.predict(  X-test[0:1] )  
都是可以的

将该TensorFlow CNN改为二分类

4. tensorflow cnn 分类怎么只能预测一批样本，不能预测一个样本

预测一个样本的时候同样可以看做是预测一批样本, 只不过这一批只有一个
X-test = [ x0,x1,x2 ... ]
model.predict(X-test)   
或者  model.predict( [ x0 ] )  
或者  model.predict(  X-test[0:1] )  
都是可以的

5. 用tensorflow实现堆叠自编码器并对mnist进行分类，怎么实现

实现分类，只需要:
1.提取特征(如文本任务上，使用rnn在句子上得到最后一层的hidden state)
2.在特征的基础上使用分类器(如:在特征上做softmax得到概率)

用tensorflow实现堆叠自编码器并对mnist进行分类，怎么实现

6. tensorflow的各种优化算法怎么实现的

如何高效的学习TensorFlow代码?目前TensorFlow代码已超过40w行，从代码量上来看，绝不是一个能够迅速上手的小项目。所以，想要精通TensorFlow的同学需要做好心理准备。对于想要学习TensorFlow（以下简称TF）的人，根据目的不同，可以简单分为以下2类：1.研究学者，仅仅需要TF这个平台实现深度学习算法，无需了解太多底层原理2.好学的行业内人员（比如我⊙﹏⊙），不仅需要了解算法模型，同时还要熟悉TF平台的原理。在算子、通信、模型优化等方面进行平台的二次开发的人。研究学者：你们可以考虑使用Keras，Python写的深度神经网络库，已经实现了绝大部分神经网络，如：RNN、GRU、LSTM，CNN，Pooling，Full-Connected，以及sigmoid、tanh、Relu、PRelu、SRelu等各种激活函数。并且采用TF/Theano作为后端计算引擎，自己本身拥有一套更高层的API，可以同时跑在TF/Theano平台上。相对于TF来说，这个学习压力小了很多，我们公司负责算法的同事也是用Keras来写模型，然后我再用TF的API来实现分布式部署。附：开发人员：对于我们这类人来说，首先需要弄清平台的很多名称、概念、定义，@贾扬清曾说过TF有太多的Abstraction需要学习。诚然，这加大了我们的学习难度。但是，这也说明Google是想要把这个平台做大做强的，所以才会花时间去设计这一套框架和统一的结构。特别是读了部分源码后，更有这种感触。那么，具体要怎么开始呢？极客学院有翻译部分TF的官方文档，对于初步了解Tensor、DAG、Operator、Variable、Device、Optimizer等是帮助的。在看完这些概念后，有一个MNIST的例子程序作为TF的入门。这个样例用一个简单的Softmax实现了手写体数字识别的神经网络，只有一层参数。同时还介绍了Session、tf.placeholder、图的计算等重要概念。在看完这个样例后，如果理解了DAG和Session，可以继续看用卷积神经网络实现的MNIST，准确率上升到了99%，相对于单层Softmax的92%左右，已经接近目前最高的准确率了。TFv0.8发布了分布式模型，我也研究了将近1个月，才把Seq2seq机器翻译改造成了分布式，但是现在公司不让发布出来ORZ。好消息是，我改写了社区的MNIST分布式程序，并且已经合并到master分支了。所以，如果想要继续学习分布式的话，我建议可以看一下那份代码。比较遗憾的是，极客学院目前没有翻译分布式的教程，所以大家得移步TF官网（貌似被墙了）。由于分布式的资料较少，我这里简单梳理下概念，大家在官网会看到他们的定义：TF采用了PS/Worker的结构来定义集群，其中PS(parameterserver)：存储variable（模型参数），主要负责参数更新和发放；Worker：存储operator，主要负责图计算和梯度计算（TF使用Optimizer实现了自动化的梯度计算）；job：由于工作类型不同，用job_name来区分ps和workertask：对于每个worker来说，具体做什么任务（算什么图）也有可能不同，用task_index区分device：指具体的CPU/GPU，通常PS绑定到CPU上，Worker绑定到GPU上，各取所长。syncReplicaOptimizer：同步优化器，其本质仍然是用普通优化器进行梯度计算，但是通过Queue机制和Coordinator多线程协同实现了所有worker的梯度汇总和平均，最终将梯度传回PS进行参数更新。以上几个概念对于分布式的理解非常重要。当然，想要完全弄懂，还得不断的看文档和源码。源码我推荐几个python目录下非常值得看的基础类定义：framework/Ops.py：定义了Tensor、Graph、Opreator类等Ops/Variables.py：定义了Variable类

7. tensorflow implementation of the social lstm model的源代码要怎么使用

域名末端的结束语

tensorflow implementation of the social lstm model的源代码要怎么使用

8. 如何用tensorflow实现多任务代码？一个分类一个检索

1.稳定网络：Tensorflow毕竟自Google官文档访问稳定且般说于英文文档资料疑问Google搜索结要比Baidu（偏见各所气图电影啥百度做）

2.Github：源程序网站Linux内核网站托管Github核Git种版本控制系统已经逐渐取代SVN网站托管高质量或者说世界顶尖源项目比Tensorflow习网站何使用注册账号习Git使用网站自tutorialguide

3.Linux: Tensorflow主要运行平台Linux目前Windows运行案虚拟机深度习计算要求比较高虚拟机效率太高推荐原Linux运行新手推荐发行版Ubuntu 或者Linux mint自行搜索习Linux处源软件都only linux

如何用tensorflow实现多任务代码？一个分类一个检索

1. 如何用tensorflow实现多任务代码？一个分类一个检索

2. Tensorflow 做LSTM 恢复模型测试时相同输入数据 给出的输出却不一样，这是怎么回事？

3. 将该TensorFlow CNN改为二分类

4. tensorflow cnn 分类怎么只能预测一批样本，不能预测一个样本

5. 用tensorflow实现堆叠自编码器并对mnist进行分类，怎么实现

6. tensorflow的各种优化算法怎么实现的

7. tensorflow implementation of the social lstm model的源代码要怎么使用

8. 如何用tensorflow实现多任务代码？一个分类一个检索

2. Tensorflow 做LSTM 恢复模型测试时相同输入数据给出的输出却不一样，这是怎么回事？