PyTorch Pretrained Bert Annotation

This BERT annotation repo is for my personal study.

Arch

The BertModel and BertForMaskedLM arch.

BertEmbeddings
- word_embeddings: Embedding(30522, 768)
- position_embeddings: Embedding(512, 768)
- token_type_embeddings: Embedding(2, 768)
- LayerNorm: BertLayerNorm()
- dropout: Dropout(p=0.1)
BertEncoder
- BertLayer: (12 layers)
  - BertAttention
    - BertSelfAttention
      - query: Linear(in_features=768, out_features=768, bias=True)
      - key: Linear(in_features=768, out_features=768, bias=True)
      - value: Linear(in_features=768, out_features=768, bias=True)
      - dropout: Dropout(p=0.1)
    - BertSelfOutput
      - dense: Linear(in_features=768, out_features=768, bias=True)
      - LayerNorm: BertLayerNorm()
      - dropout: Dropout(p=0.1)
  - BertIntermediate
    - dense: Linear(in_features=768, out_features=3072, bias=True)
    - activation: gelu
  - BertOutput
    - dense: Linear(in_features=3072, out_features=768, bias=True)
    - LayerNorm: BertLayerNorm()
    - dropout: Dropout(p=0.1)
BertPooler
- dense: Linear(in_features=768, out_features=768, bias=True)
- activation: Tanh()

Name		Name	Last commit message	Last commit date
Latest commit History 34 Commits
.idea		.idea
docker		docker
download_data		download_data
examples		examples
notebooks		notebooks
pytorch_pretrained_bert		pytorch_pretrained_bert
samples		samples
tests		tests
.gitignore		.gitignore
LICENSE		LICENSE
MANIFEST.in		MANIFEST.in
README.md		README.md
README_bert.md		README_bert.md
requirements.txt		requirements.txt
setup.py		setup.py