Perfee's Blog

Transformer

发表于 2020-07-30 分类于笔记，算法
本文字数： 2.4k 阅读时长 ≈ 2 分钟

Transformer 出处

论文地址：https://arxiv.org/abs/1706.03762

Transformer 特点

讲这个算法呢首先我觉得应该了解到他的优点和解决的问题，为什么有了CNN和RNN等类型的网络Transformer还会火起来，他解决了两个问题：

与CNN相比他能捕获长距离特征
RNN也可以捕获长距离特征，但是RNN捕获是通过把当前词嵌入与之前的词嵌入向量通过神经元节点激活值结合，也就是前一时刻的计算，无法做到并行，而Transformer使用的是self-attention不会出现这种时间上的依赖，可以做到并行。
阅读全文 »

循环神经网络文本分类

发表于 2019-06-27 分类于笔记，算法
本文字数： 1.7k 阅读时长 ≈ 2 分钟

TextRNN出处

论文出处: Recurrent Neural Network for Text Classification with Multi-Task Learning

TextRNN原理

在自然语言处理中，我们的语言序列往往不是孤立的，比如说词性预测，动词后面往往大概率是跟随的是名词，跟随动词的几率会很小，RNN可以很好的处理带有序列的问题，并具有短时记忆能力。
RNN的主要改变是将上一次的激活值a，输入到下次时间步骤中参与计算，下一时刻的计算不仅要考虑输入数据x也要使用上一时刻的激活值a。

阅读全文 »