norbert4-small / modeling_gptbert.py

Commit History

Using max_position_embeddings instead of max_sequence_length to standardise with HF

9894fa3
verified

lgcharpe commited on Mar 6

Fix causal mode

0ac9186
verified

davda54 commited on Mar 6

fixed output format

b4ba7c8
verified

davda54 commited on Feb 24

fix NaNs

f694326
verified

davda54 commited on Feb 24

make FlashAttention logic more robust

7df4bf5
verified

davda54 commited on Aug 1, 2025

fix

d8479bb
verified

davda54 commited on Jul 11, 2025

removed SDPA

2c0c592
verified

davda54 commited on Jun 17, 2025

Update modeling_gptbert.py

67e8a0f
verified

davda54 commited on Jun 17, 2025

fixed SDPA for older PyTorch versions

8537e95
verified

davda54 commited on Jun 17, 2025

FlashAttention support

9aae5ff
verified

davda54 commited on Jun 7, 2025

Update modeling_gptbert.py

a3f5ab3
verified

lgcharpe commited on May 27, 2025

Upload folder using huggingface_hub

460fdd7
verified

davda54 commited on Apr 14, 2025

Commit History

Using max_position_embeddings instead of max_sequence_length to standardise with HF 9894fa3 verified

Fix causal mode 0ac9186 verified

fixed output format b4ba7c8 verified

fix NaNs f694326 verified

make FlashAttention logic more robust 7df4bf5 verified

fix d8479bb verified

removed SDPA 2c0c592 verified

Update modeling_gptbert.py 67e8a0f verified

fixed SDPA for older PyTorch versions 8537e95 verified

FlashAttention support 9aae5ff verified

Update modeling_gptbert.py a3f5ab3 verified

Upload folder using huggingface_hub 460fdd7 verified

Using max_position_embeddings instead of max_sequence_length to standardise with HF

9894fa3
verified

Fix causal mode

0ac9186
verified

fixed output format

b4ba7c8
verified

fix NaNs

f694326
verified

make FlashAttention logic more robust

7df4bf5
verified

fix

d8479bb
verified

removed SDPA

2c0c592
verified

Update modeling_gptbert.py

67e8a0f
verified

fixed SDPA for older PyTorch versions

8537e95
verified

FlashAttention support

9aae5ff
verified

Update modeling_gptbert.py

a3f5ab3
verified

Upload folder using huggingface_hub

460fdd7
verified