Guillaume Wenzek
|
c31926c1a8
working out new way of saving hparams
|
há 1 ano atrás |
Ning
|
1589c529bf
unity.cpp speech_encoder_frontend+speech_encoder+adaptor (#81)
|
há 1 ano atrás |
Guillaume Wenzek
|
e38442d1f0
rename mask to attn_mask in MultiheadAttention_forward
|
há 1 ano atrás |
Guillaume Wenzek
|
6fbb465f2b
generate_sequence return full results
|
há 1 ano atrás |
Guillaume Wenzek
|
1756897d23
simplify _finalize_hypothesis
|
há 1 ano atrás |
Guillaume Wenzek
|
f49763de86
fix beam size and scores
|
há 1 ano atrás |
Guillaume Wenzek
|
c28db8c8ac
wip beam-size=2
|
há 1 ano atrás |
Guillaume Wenzek
|
b24dbe3030
batching -> TransformerEmbeddingFrontend_forward
|
há 1 ano atrás |
Guillaume Wenzek
|
86993cbd00
fix StandardTransformerEncoder
|
há 1 ano atrás |
Guillaume Wenzek
|
28ed039370
fix MultiheadAttention_forward
|
há 1 ano atrás |
Guillaume Wenzek
|
81cdf80eb9
WIP: MultiheadAttention_forward
|
há 1 ano atrás |
Guillaume Wenzek
|
eb80195345
use ggml_diag_mask_inf
|
há 1 ano atrás |
Guillaume Wenzek
|
88b0690a72
split tests files
|
há 1 ano atrás |
Guillaume Wenzek
|
bfbafd9603
fix generation with beam_size=1
|
há 1 ano atrás |
Guillaume Wenzek
|
45f986055a
add naive tweaking of lprobs
|
há 1 ano atrás |
Guillaume Wenzek
|
7c9b2a1b95
pass correct prefix sequence in test
|
há 1 ano atrás |
Guillaume Wenzek
|
c7b89f32f4
disable flash attn because of cross attention
|
há 1 ano atrás |
Guillaume Wenzek
|
dcb9535666
wip: generate_sequence
|
há 1 ano atrás |
Guillaume Wenzek
|
78e7c9a311
fix TransformerEmbeddingFrontend
|
há 1 ano atrás |
Guillaume Wenzek
|
2238cea072
SinusoidalPositionEncoder + WIP: TransformerEmbeddingFrontend
|
há 1 ano atrás |
Guillaume Wenzek
|
2fb09f34fb
generate fairseq2.cpp
|
há 1 ano atrás |
Guillaume Wenzek
|
f1f33dbec1
has_layer + transformer decoder
|
há 1 ano atrás |
Guillaume Wenzek
|
e1faba0c5d
text encoder
|
há 1 ano atrás |
Guillaume Wenzek
|
b81061704c
StandardTransformerEncoderLayer_forward
|
há 1 ano atrás |
Guillaume Wenzek
|
e7c3b7a4ba
allow flash attn
|
há 1 ano atrás |
Guillaume Wenzek
|
b07a08102a
MultiheadAttention_forward
|
há 1 ano atrás |
Guillaume Wenzek
|
be236b8584
remove size/init functions
|
há 1 ano atrás |
Guillaume Wenzek
|
fa85f05545
test flash_attn
|
há 1 ano atrás |
Guillaume Wenzek
|
06d4ed1475
ggml.ne != np.shape
|
há 1 ano atrás |
Guillaume Wenzek
|
c2e6384e29
nb
|
há 1 ano atrás |