0%

Transformer详解

Transformer由论文《Attention is All You Need》提出,现在是谷歌云TPU推荐的参考模型。论文相关的Tensorflow的代码可以从GitHub获取,其作为Tensor2Tensor包的一部分。哈佛的NLP团队也实现了一个基于PyTorch的版本,并注释该论文。

首先将这个模型看成黑箱操作,在机器翻译中,这个就是输入一种语言,然后输出另一种语言。它由编码器和解码器构成

transformer 图片

一个编码器的内部

一个编码器

客官,投个币吧 ฅ՞•ﻌ•՞ฅ