(NLP 연구) The Long-Document Transformer 03.03

Encoder, Maxlength = 6일때
- Sent1: i am looking for happiness {x1, x2, x3, x4, x5, </s>}

Q x K → Scaled → Pad token masking

Self-Attended 자기자신을 보고 자신이 어디가 중요한지 보게됨

Concat

(NLP 연구) The Long-Document Transformer 03.10 (0)	2022.03.24
(NLP 연구) The Long-Document Transformer 03.08 (0)	2022.03.24
(NLP 연구) The Long-Document Transformer 03.04 (0)	2022.03.24
(NLP 연구) The Long-Document Transformer 03.02 (0)	2022.03.24
(NLP 연구) The Long-Document Transformer 03.01 (0)	2022.03.24

티스토리툴바