Guillaume Wenzek
|
a768cdf55f
Unity inc (#159)
|
1 ano atrás |
Guillaume Wenzek
|
eb7810b81f
force little-endian
|
1 ano atrás |
Guillaume Wenzek
|
c31926c1a8
working out new way of saving hparams
|
1 ano atrás |
Guillaume Wenzek
|
184c1e1da3
};
|
1 ano atrás |
Guillaume Wenzek
|
f1f33dbec1
has_layer + transformer decoder
|
1 ano atrás |
Guillaume Wenzek
|
b07a08102a
MultiheadAttention_forward
|
1 ano atrás |
Guillaume Wenzek
|
fa85f05545
test flash_attn
|
1 ano atrás |
Guillaume Wenzek
|
c2e6384e29
nb
|
1 ano atrás |
Guillaume Wenzek
|
3f5912b973
forward
|
1 ano atrás |
Guillaume Wenzek
|
2b6130855c
handle 4 dims tensors and eof
|
1 ano atrás |
Guillaume Wenzek
|
772f90dfdc
load_fairseq2_ggml_file
|
1 ano atrás |
Guillaume Wenzek
|
506dee42d8
move layers to fairseq2.cpp
|
1 ano atrás |
Guillaume Wenzek
|
e7dc2b86fc
add ggml python bindings
|
1 ano atrás |
Naji El Hachem
|
853b53bad0
start working out the loader api
|
1 ano atrás |