1 tahun lalu · 2b6130855c
--- a/ggml/examples/unity/model_loader.cpp
+++ b/ggml/examples/unity/model_loader.cpp
@@ -1,6 +1,8 @@
 
				 #include <string>
			
 
				 #include "model_loader.h"
			
 
				 
			
 
				+#define DEBUG 1
			
 
				+
			
 
				 std::ifstream open_ggml_file(const char* fname) {
			
 
				     printf("%s: loading model from '%s'\n", __func__, fname);
			
 
				 
			
@@ -24,78 +26,47 @@ model_loader::load_model_weights(fairseq2_model &model, std::ifstream &fin)
 
				 {
			
 
				     size_t total_size = 0;
			
 
				     while (!fin.eof()) {
			
 
				-        auto tensor = next_tensor(fin, model);
			
 
				-        load_tensor_value(fin, tensor);
			
 
				+        std::string name = get_name(fin);
			
 
				+        if (name.length() == 0)
			
 
				+            break;
			
 
				+        auto tensor = load_tensor_value(fin, model.ctx);
			
 
				+        model.tensors[name] = tensor;
			
 
				+        if (DEBUG) {
			
 
				+            printf("%s [%5ld, %5ld], type = %6s, %6.2f MB, %9zu bytes\n", name.c_str(), tensor->ne[0], tensor->ne[1], ggml_type_name(tensor->type), ggml_nbytes(tensor)/1024.0/1024.0, ggml_nbytes(tensor));
			
 
				+        }
			
 
				         total_size += ggml_nbytes(tensor);
			
 
				     }
			
 
				 
			
 
				     printf("%s: model size  = %8.2f MB\n", __func__, total_size/1024.0/1024.0);
			
 
				 };
			
 
				 
			
 
				-ggml_tensor *
			
 
				-model_loader::next_tensor(std::ifstream &fin, fairseq2_model &model)
			
 
				-{
			
 
				-    auto name = get_name(fin);
			
 
				-    std::cout << "loading tensor: " << name << std::endl;
			
 
				-
			
 
				-    if (model.tensors.find(name) == model.tensors.end()) {
			
 
				-        fprintf(stderr, "%s: unknown tensor '%s' in model file\n", __func__, name.c_str());
			
 
				-        throw std::invalid_argument("failed to open file."); // TODO Merge error message.
			
 
				-    }
			
 
				-
			
 
				-    return model.tensors[name];
			
 
				-};
			
 
				-
			
 
				-void
			
 
				-model_loader::load_tensor_value(std::ifstream &fin, ggml_tensor *tensor)
			
 
				+ggml_tensor* load_tensor_value(std::ifstream &fin, ggml_context* ctx)
			
 
				 {
			
 
				     int32_t n_dims;
			
 
				-    int32_t ttype;
			
 
				+    int32_t raw_type;
			
 
				 
			
 
				     fin.read(reinterpret_cast<char *>(&n_dims), sizeof(n_dims));
			
 
				-    fin.read(reinterpret_cast<char *>(&ttype),  sizeof(ttype));
			
 
				+    fin.read(reinterpret_cast<char *>(&raw_type),  sizeof(raw_type));
			
 
				+    ggml_type type = ggml_type(raw_type);
			
 
				 
			
 
				-    int32_t nelements = 1;
			
 
				-    int32_t ne[3] = {1, 1, 1};
			
 
				+    int64_t ne[4] = {1, 1, 1, 1};
			
 
				     for (int i = 0; i < n_dims; ++i) {
			
 
				         fin.read(reinterpret_cast<char *>(&ne[i]), sizeof(ne[i]));
			
 
				-        nelements *= ne[i];
			
 
				     }
			
 
				-
			
 
				-    if (ggml_nelements(tensor) != nelements) {
			
 
				-        std::cout << ggml_nelements(tensor) << std::endl;
			
 
				-        std::cout << nelements << std::endl;
			
 
				-        throw std::runtime_error("tensor has wrong size in model file.");
			
 
				-    }
			
 
				-
			
 
				-    if (tensor->ne[0] != ne[0] || tensor->ne[1] != ne[1]) {
			
 
				-        fprintf(stderr, "%s: tensor '%s' has wrong shape in model file: got [%d, %d], expected [%d, %d]\n",
			
 
				-                __func__, (int) tensor->ne[0], (int) tensor->ne[1], ne[0], ne[1]);
			
 
				-        throw std::runtime_error("tensor has wrong shape in file."); // TODO Merge error message.
			
 
				-    }
			
 
				-
			
 
				-    // for debugging
			
 
				-    if (0) {
			
 
				-        printf("%[%5d, %5d], type = %6s, %6.2f MB, %9zu bytes\n", ne[0], ne[1], ggml_type_name(ggml_type(ttype)), ggml_nbytes(tensor)/1024.0/1024.0, ggml_nbytes(tensor));
			
 
				-    }
			
 
				-
			
 
				-    const size_t bpe = ggml_type_size(ggml_type(ttype));
			
 
				-
			
 
				-    if ((nelements * bpe)/ggml_blck_size(tensor->type) != ggml_nbytes(tensor)) {
			
 
				-        fprintf(stderr, "%s: tensor has wrong size in model file: got %zu, expected %zu\n",
			
 
				-                __func__, ggml_nbytes(tensor), nelements * bpe);
			
 
				-        throw std::runtime_error("tensor has wrong size in file."); // TODO Merge error message.
			
 
				-    }
			
 
				-
			
 
				+    ggml_tensor* tensor = ggml_new_tensor(ctx, type, n_dims, ne);
			
 
				     fin.read(reinterpret_cast<char *>(tensor->data), ggml_nbytes(tensor));
			
 
				+    return tensor;
			
 
				 };
			
 
				 
			
 
				 std::string
			
 
				 model_loader::get_name(std::ifstream& fin)
			
 
				 {
			
 
				-    std::uint32_t length;
			
 
				+    std::uint32_t length = 0;
			
 
				     fin.read(reinterpret_cast<char *>(&length), sizeof(length));
			
 
				     std::string name(length, 0);
			
 
				+    if (length == 0) {
			
 
				+        return name;
			
 
				+    };
			
 
				     fin.read(&name[0], length);
			
 
				 
			
 
				     return name;
			
--- a/ggml/examples/unity/model_loader.h
+++ b/ggml/examples/unity/model_loader.h
@@ -32,11 +32,11 @@ public:
 
				 private:
			
 
				     ggml_tensor * next_tensor(std::ifstream &fin, fairseq2_model &model);
			
 
				 
			
 
				-    // TODO Move these two to helpers
			
 
				-    void load_tensor_value(std::ifstream &fin, ggml_tensor *tensor);
			
 
				     std::string get_name(std::ifstream &fin);
			
 
				 };
			
 
				 
			
 
				+ggml_tensor* load_tensor_value(std::ifstream &fin, ggml_context* ctx);
			
 
				+
			
 
				 std::ifstream open_ggml_file(const char* fname);
			
 
				 
			
 
				 template<typename T>
			
@@ -53,8 +53,6 @@ void load_fairseq2_ggml_file(fairseq2_model& model, const char* fname) {
 
				     };
			
 
				     model.ctx = ggml_init(params);
			
 
				 
			
 
				-    // TODO: should we delay weights loading/allocating ?
			
 
				-    loader.tensors_alloc(model);
			
 
				     loader.load_model_weights(model, fin);;
			
 
				 }
			
 
				 
			
--- a/ggml/examples/unity/unity_model_loader.cpp
+++ b/ggml/examples/unity/unity_model_loader.cpp
@@ -14,68 +14,18 @@
 
				 
			
 
				 void unity_model_loader::load_hparams(fairseq2_model& model, std::ifstream &fin)
			
 
				 {
			
 
				-    auto& hparams = (unity_hparams&)model.hparams;
			
 
				-
			
 
				-    fin.read((char*) &hparams.model_dim, sizeof(hparams.model_dim));
			
 
				-    fin.read((char*) &hparams.w2v2_encoder_config__model_dim, sizeof(hparams.w2v2_encoder_config__model_dim));
			
 
				-    fin.read((char*) &hparams.w2v2_encoder_config__max_seq_len, sizeof(hparams.w2v2_encoder_config__max_seq_len));
			
 
				-    fin.read((char*) &hparams.w2v2_encoder_config__feature_dim, sizeof(hparams.w2v2_encoder_config__feature_dim));
			
 
				-    fin.read((char*) &hparams.w2v2_encoder_config__use_fbank, sizeof(hparams.w2v2_encoder_config__use_fbank));
			
 
				-    fin.read((char*) &hparams.w2v2_encoder_config__first_pass_dropout_p, sizeof(hparams.w2v2_encoder_config__first_pass_dropout_p));
			
 
				-    fin.read((char*) &hparams.w2v2_encoder_config__layer_norm_features, sizeof(hparams.w2v2_encoder_config__layer_norm_features));
			
 
				-    fin.read((char*) &hparams.w2v2_encoder_config__feature_extractor_bias, sizeof(hparams.w2v2_encoder_config__feature_extractor_bias));
			
 
				-    fin.read((char*) &hparams.w2v2_encoder_config__feature_extractor_layer_norm_convs, sizeof(hparams.w2v2_encoder_config__feature_extractor_layer_norm_convs));
			
 
				-    fin.read((char*) &hparams.w2v2_encoder_config__feature_grad_scale, sizeof(hparams.w2v2_encoder_config__feature_grad_scale));
			
 
				-    fin.read((char*) &hparams.w2v2_encoder_config__num_fbank_channels, sizeof(hparams.w2v2_encoder_config__num_fbank_channels));
			
 
				-    fin.read((char*) &hparams.w2v2_encoder_config__fbank_stride, sizeof(hparams.w2v2_encoder_config__fbank_stride));
			
 
				-    fin.read((char*) &hparams.w2v2_encoder_config__sample_fbank_every_k, sizeof(hparams.w2v2_encoder_config__sample_fbank_every_k));
			
 
				-    fin.read((char*) &hparams.w2v2_encoder_config__pos_encoder_depth, sizeof(hparams.w2v2_encoder_config__pos_encoder_depth));
			
 
				-    fin.read((char*) &hparams.w2v2_encoder_config__pos_conv_kernel_size, sizeof(hparams.w2v2_encoder_config__pos_conv_kernel_size));
			
 
				-    fin.read((char*) &hparams.w2v2_encoder_config__num_pos_conv_groups, sizeof(hparams.w2v2_encoder_config__num_pos_conv_groups));
			
 
				-    fin.read((char*) &hparams.w2v2_encoder_config__use_conformer, sizeof(hparams.w2v2_encoder_config__use_conformer));
			
 
				-    fin.read((char*) &hparams.w2v2_encoder_config__num_encoder_layers, sizeof(hparams.w2v2_encoder_config__num_encoder_layers));
			
 
				-    fin.read((char*) &hparams.w2v2_encoder_config__num_encoder_attn_heads, sizeof(hparams.w2v2_encoder_config__num_encoder_attn_heads));
			
 
				-    fin.read((char*) &hparams.w2v2_encoder_config__ffn_inner_dim, sizeof(hparams.w2v2_encoder_config__ffn_inner_dim));
			
 
				-    fin.read((char*) &hparams.w2v2_encoder_config__dropout_p, sizeof(hparams.w2v2_encoder_config__dropout_p));
			
 
				-    fin.read((char*) &hparams.w2v2_encoder_config__attn_dropout_p, sizeof(hparams.w2v2_encoder_config__attn_dropout_p));
			
 
				-    fin.read((char*) &hparams.w2v2_encoder_config__layer_drop_p, sizeof(hparams.w2v2_encoder_config__layer_drop_p));
			
 
				-    fin.read((char*) &hparams.w2v2_encoder_config__norm_order, sizeof(hparams.w2v2_encoder_config__norm_order));
			
 
				-    fin.read((char*) &hparams.w2v2_encoder_config__depthwise_conv_kernel_size, sizeof(hparams.w2v2_encoder_config__depthwise_conv_kernel_size));
			
 
				-    fin.read((char*) &hparams.nllb_config__model_dim, sizeof(hparams.nllb_config__model_dim));
			
 
				-    fin.read((char*) &hparams.nllb_config__max_seq_len, sizeof(hparams.nllb_config__max_seq_len));
			
 
				-    fin.read((char*) &hparams.nllb_config__vocabulary_size, sizeof(hparams.nllb_config__vocabulary_size));
			
 
				-    fin.read((char*) &hparams.nllb_config__pad_idx, sizeof(hparams.nllb_config__pad_idx));
			
 
				-    fin.read((char*) &hparams.nllb_config__num_encoder_layers, sizeof(hparams.nllb_config__num_encoder_layers));
			
 
				-    fin.read((char*) &hparams.nllb_config__num_decoder_layers, sizeof(hparams.nllb_config__num_decoder_layers));
			
 
				-    fin.read((char*) &hparams.nllb_config__num_encoder_attn_heads, sizeof(hparams.nllb_config__num_encoder_attn_heads));
			
 
				-    fin.read((char*) &hparams.nllb_config__num_decoder_attn_heads, sizeof(hparams.nllb_config__num_decoder_attn_heads));
			
 
				-    fin.read((char*) &hparams.nllb_config__ffn_inner_dim, sizeof(hparams.nllb_config__ffn_inner_dim));
			
 
				-    fin.read((char*) &hparams.nllb_config__dropout_p, sizeof(hparams.nllb_config__dropout_p));
			
 
				-    fin.read((char*) &hparams.t2u_config__model_dim, sizeof(hparams.t2u_config__model_dim));
			
 
				-    fin.read((char*) &hparams.t2u_config__unit_max_seq_len, sizeof(hparams.t2u_config__unit_max_seq_len));
			
 
				-    fin.read((char*) &hparams.t2u_config__unit_vocabulary_size, sizeof(hparams.t2u_config__unit_vocabulary_size));
			
 
				-    fin.read((char*) &hparams.t2u_config__unit_pad_idx, sizeof(hparams.t2u_config__unit_pad_idx));
			
 
				-    fin.read((char*) &hparams.t2u_config__num_encoder_layers, sizeof(hparams.t2u_config__num_encoder_layers));
			
 
				-    fin.read((char*) &hparams.t2u_config__num_decoder_layers, sizeof(hparams.t2u_config__num_decoder_layers));
			
 
				-    fin.read((char*) &hparams.t2u_config__num_encoder_attn_heads, sizeof(hparams.t2u_config__num_encoder_attn_heads));
			
 
				-    fin.read((char*) &hparams.t2u_config__num_decoder_attn_heads, sizeof(hparams.t2u_config__num_decoder_attn_heads));
			
 
				-    fin.read((char*) &hparams.t2u_config__ffn_inner_dim, sizeof(hparams.t2u_config__ffn_inner_dim));
			
 
				-    fin.read((char*) &hparams.t2u_config__dropout_p, sizeof(hparams.t2u_config__dropout_p));
			
 
				-    fin.read((char*) &hparams.use_text_encoder, sizeof(hparams.use_text_encoder));
			
 
				-    fin.read((char*) &hparams.use_conformer_adaptor, sizeof(hparams.use_conformer_adaptor));
			
 
				-    fin.read((char*) &hparams.num_adaptor_layers, sizeof(hparams.num_adaptor_layers));
			
 
				-    fin.read((char*) &hparams.adaptor_kernel_size, sizeof(hparams.adaptor_kernel_size));
			
 
				-    fin.read((char*) &hparams.adaptor_stride, sizeof(hparams.adaptor_stride));
			
 
				-    fin.read((char*) &hparams.adaptor_layer_norm, sizeof(hparams.adaptor_layer_norm));
			
 
				-    fin.read((char*) &hparams.adaptor_dropout_p, sizeof(hparams.adaptor_dropout_p));
			
 
				-};
			
 
				+    unity_hparams* hparams = (unity_hparams*)model.hparams;
			
 
				+    read_unity_hparams(hparams, fin);
			
 
				+    if (hparams->__end_of_hparams__ != 6877961321223123048) {
			
 
				+        throw std::invalid_argument("");
			
 
				+    }
			
 
				+}
			
 
				 
			
 
				 std::size_t
			
 
				 unity_model_loader::compute_context_size(void* raw_hparams)
			
 
				 {
			
 
				-    // TODO
			
 
				-    auto hparams = (unity_hparams&)raw_hparams;
			
 
				-    return hparams.model_dim * 1024 * 100;
			
 
				+    auto* hparams = (unity_hparams*)raw_hparams;
			
 
				+    return hparams->model_byte_size;
			
 
				 };
			
 
				 
			
 
				 struct UnityArch {
			
--- a/ggml/examples/unity/unity_model_loader.h
+++ b/ggml/examples/unity/unity_model_loader.h
@@ -12,62 +12,127 @@
 
				 
			
 
				 // TODO Merge with Ning implementation
			
 
				 struct unity_hparams {
			
 
				-    int32_t model_dim;
			
 
				-    int32_t w2v2_encoder_config__model_dim;
			
 
				-    int32_t w2v2_encoder_config__max_seq_len;
			
 
				-    int32_t w2v2_encoder_config__feature_dim;
			
 
				-    int32_t w2v2_encoder_config__use_fbank;
			
 
				+    std::int64_t model_dim;
			
 
				+    std::int64_t w2v2_encoder_config__model_dim;
			
 
				+    std::int64_t w2v2_encoder_config__max_seq_len;
			
 
				+    std::int64_t w2v2_encoder_config__feature_dim;
			
 
				+    std::int64_t w2v2_encoder_config__use_fbank;
			
 
				     float w2v2_encoder_config__first_pass_dropout_p;
			
 
				-    int32_t w2v2_encoder_config__layer_norm_features;
			
 
				-    int32_t w2v2_encoder_config__feature_extractor_bias;
			
 
				-    int32_t w2v2_encoder_config__feature_extractor_layer_norm_convs;
			
 
				-    int32_t w2v2_encoder_config__feature_grad_scale;
			
 
				-    int32_t w2v2_encoder_config__num_fbank_channels;
			
 
				-    int32_t w2v2_encoder_config__fbank_stride;
			
 
				-    int32_t w2v2_encoder_config__sample_fbank_every_k;
			
 
				-    int32_t w2v2_encoder_config__pos_encoder_depth;
			
 
				-    int32_t w2v2_encoder_config__pos_conv_kernel_size;
			
 
				-    int32_t w2v2_encoder_config__num_pos_conv_groups;
			
 
				-    int32_t w2v2_encoder_config__use_conformer;
			
 
				-    int32_t w2v2_encoder_config__num_encoder_layers;
			
 
				-    int32_t w2v2_encoder_config__num_encoder_attn_heads;
			
 
				-    int32_t w2v2_encoder_config__ffn_inner_dim;
			
 
				+    std::int64_t w2v2_encoder_config__layer_norm_features;
			
 
				+    // Error: Unsupported type <class 'list'> w2v2_encoder_config__feature_extractor_layer_descs;
			
 
				+    std::int64_t w2v2_encoder_config__feature_extractor_bias;
			
 
				+    std::int64_t w2v2_encoder_config__feature_extractor_layer_norm_convs;
			
 
				+    std::int64_t w2v2_encoder_config__feature_grad_scale;
			
 
				+    std::int64_t w2v2_encoder_config__num_fbank_channels;
			
 
				+    std::int64_t w2v2_encoder_config__fbank_stride;
			
 
				+    std::int64_t w2v2_encoder_config__sample_fbank_every_k;
			
 
				+    // Error: Unsupported type <class 'str'> w2v2_encoder_config__pos_encoder_type;
			
 
				+    std::int64_t w2v2_encoder_config__pos_encoder_depth;
			
 
				+    std::int64_t w2v2_encoder_config__pos_conv_kernel_size;
			
 
				+    std::int64_t w2v2_encoder_config__num_pos_conv_groups;
			
 
				+    std::int64_t w2v2_encoder_config__use_conformer;
			
 
				+    std::int64_t w2v2_encoder_config__num_encoder_layers;
			
 
				+    std::int64_t w2v2_encoder_config__num_encoder_attn_heads;
			
 
				+    std::int64_t w2v2_encoder_config__ffn_inner_dim;
			
 
				     float w2v2_encoder_config__dropout_p;
			
 
				     float w2v2_encoder_config__attn_dropout_p;
			
 
				     float w2v2_encoder_config__layer_drop_p;
			
 
				-    int32_t w2v2_encoder_config__norm_order;
			
 
				-    int32_t w2v2_encoder_config__depthwise_conv_kernel_size;
			
 
				-    int32_t nllb_config__model_dim;
			
 
				-    int32_t nllb_config__max_seq_len;
			
 
				-    int32_t nllb_config__vocabulary_size;
			
 
				-    int32_t nllb_config__pad_idx;
			
 
				-    int32_t nllb_config__num_encoder_layers;
			
 
				-    int32_t nllb_config__num_decoder_layers;
			
 
				-    int32_t nllb_config__num_encoder_attn_heads;
			
 
				-    int32_t nllb_config__num_decoder_attn_heads;
			
 
				-    int32_t nllb_config__ffn_inner_dim;
			
 
				+    std::int32_t w2v2_encoder_config__norm_order;
			
 
				+    std::int64_t w2v2_encoder_config__depthwise_conv_kernel_size;
			
 
				+    std::int64_t nllb_config__model_dim;
			
 
				+    std::int64_t nllb_config__max_seq_len;
			
 
				+    std::int64_t nllb_config__vocabulary_size;
			
 
				+    std::int64_t nllb_config__pad_idx;
			
 
				+    std::int64_t nllb_config__num_encoder_layers;
			
 
				+    std::int64_t nllb_config__num_decoder_layers;
			
 
				+    std::int64_t nllb_config__num_encoder_attn_heads;
			
 
				+    std::int64_t nllb_config__num_decoder_attn_heads;
			
 
				+    std::int64_t nllb_config__ffn_inner_dim;
			
 
				     float nllb_config__dropout_p;
			
 
				-    int32_t t2u_config__model_dim;
			
 
				-    int32_t t2u_config__unit_max_seq_len;
			
 
				-    int32_t t2u_config__unit_vocabulary_size;
			
 
				-    int32_t t2u_config__unit_pad_idx;
			
 
				-    int32_t t2u_config__num_encoder_layers;
			
 
				-    int32_t t2u_config__num_decoder_layers;
			
 
				-    int32_t t2u_config__num_encoder_attn_heads;
			
 
				-    int32_t t2u_config__num_decoder_attn_heads;
			
 
				-    int32_t t2u_config__ffn_inner_dim;
			
 
				+    std::int64_t t2u_config__model_dim;
			
 
				+    std::int64_t t2u_config__unit_max_seq_len;
			
 
				+    std::int64_t t2u_config__unit_vocabulary_size;
			
 
				+    std::int64_t t2u_config__unit_pad_idx;
			
 
				+    std::int64_t t2u_config__num_encoder_layers;
			
 
				+    std::int64_t t2u_config__num_decoder_layers;
			
 
				+    std::int64_t t2u_config__num_encoder_attn_heads;
			
 
				+    std::int64_t t2u_config__num_decoder_attn_heads;
			
 
				+    std::int64_t t2u_config__ffn_inner_dim;
			
 
				     float t2u_config__dropout_p;
			
 
				-    int32_t use_text_encoder;
			
 
				-    int32_t use_conformer_adaptor;
			
 
				-    int32_t num_adaptor_layers;
			
 
				-    int32_t adaptor_kernel_size;
			
 
				-    int32_t adaptor_stride;
			
 
				-    int32_t adaptor_layer_norm;
			
 
				+    std::int64_t use_text_encoder;
			
 
				+    std::int64_t use_conformer_adaptor;
			
 
				+    std::int64_t num_adaptor_layers;
			
 
				+    std::int64_t adaptor_kernel_size;
			
 
				+    std::int64_t adaptor_stride;
			
 
				+    std::int64_t adaptor_layer_norm;
			
 
				     float adaptor_dropout_p;
			
 
				+    std::int64_t model_byte_size;
			
 
				+    std::int64_t __end_of_hparams__;
			
 
				+
			
 
				+};
			
 
				+
			
 
				+void read_unity_hparams(unity_hparams* out, std::ifstream &fin) {
			
 
				+    fin.read((char*) &out->model_dim, sizeof(out->model_dim));
			
 
				+    fin.read((char*) &out->w2v2_encoder_config__model_dim, sizeof(out->w2v2_encoder_config__model_dim));
			
 
				+    fin.read((char*) &out->w2v2_encoder_config__max_seq_len, sizeof(out->w2v2_encoder_config__max_seq_len));
			
 
				+    fin.read((char*) &out->w2v2_encoder_config__feature_dim, sizeof(out->w2v2_encoder_config__feature_dim));
			
 
				+    fin.read((char*) &out->w2v2_encoder_config__use_fbank, sizeof(out->w2v2_encoder_config__use_fbank));
			
 
				+    fin.read((char*) &out->w2v2_encoder_config__first_pass_dropout_p, sizeof(out->w2v2_encoder_config__first_pass_dropout_p));
			
 
				+    fin.read((char*) &out->w2v2_encoder_config__layer_norm_features, sizeof(out->w2v2_encoder_config__layer_norm_features));
			
 
				+    fin.read((char*) &out->w2v2_encoder_config__feature_extractor_bias, sizeof(out->w2v2_encoder_config__feature_extractor_bias));
			
 
				+    fin.read((char*) &out->w2v2_encoder_config__feature_extractor_layer_norm_convs, sizeof(out->w2v2_encoder_config__feature_extractor_layer_norm_convs));
			
 
				+    fin.read((char*) &out->w2v2_encoder_config__feature_grad_scale, sizeof(out->w2v2_encoder_config__feature_grad_scale));
			
 
				+    fin.read((char*) &out->w2v2_encoder_config__num_fbank_channels, sizeof(out->w2v2_encoder_config__num_fbank_channels));
			
 
				+    fin.read((char*) &out->w2v2_encoder_config__fbank_stride, sizeof(out->w2v2_encoder_config__fbank_stride));
			
 
				+    fin.read((char*) &out->w2v2_encoder_config__sample_fbank_every_k, sizeof(out->w2v2_encoder_config__sample_fbank_every_k));
			
 
				+    fin.read((char*) &out->w2v2_encoder_config__pos_encoder_depth, sizeof(out->w2v2_encoder_config__pos_encoder_depth));
			
 
				+    fin.read((char*) &out->w2v2_encoder_config__pos_conv_kernel_size, sizeof(out->w2v2_encoder_config__pos_conv_kernel_size));
			
 
				+    fin.read((char*) &out->w2v2_encoder_config__num_pos_conv_groups, sizeof(out->w2v2_encoder_config__num_pos_conv_groups));
			
 
				+    fin.read((char*) &out->w2v2_encoder_config__use_conformer, sizeof(out->w2v2_encoder_config__use_conformer));
			
 
				+    fin.read((char*) &out->w2v2_encoder_config__num_encoder_layers, sizeof(out->w2v2_encoder_config__num_encoder_layers));
			
 
				+    fin.read((char*) &out->w2v2_encoder_config__num_encoder_attn_heads, sizeof(out->w2v2_encoder_config__num_encoder_attn_heads));
			
 
				+    fin.read((char*) &out->w2v2_encoder_config__ffn_inner_dim, sizeof(out->w2v2_encoder_config__ffn_inner_dim));
			
 
				+    fin.read((char*) &out->w2v2_encoder_config__dropout_p, sizeof(out->w2v2_encoder_config__dropout_p));
			
 
				+    fin.read((char*) &out->w2v2_encoder_config__attn_dropout_p, sizeof(out->w2v2_encoder_config__attn_dropout_p));
			
 
				+    fin.read((char*) &out->w2v2_encoder_config__layer_drop_p, sizeof(out->w2v2_encoder_config__layer_drop_p));
			
 
				+    fin.read((char*) &out->w2v2_encoder_config__norm_order, sizeof(out->w2v2_encoder_config__norm_order));
			
 
				+    fin.read((char*) &out->w2v2_encoder_config__depthwise_conv_kernel_size, sizeof(out->w2v2_encoder_config__depthwise_conv_kernel_size));
			
 
				+    fin.read((char*) &out->nllb_config__model_dim, sizeof(out->nllb_config__model_dim));
			
 
				+    fin.read((char*) &out->nllb_config__max_seq_len, sizeof(out->nllb_config__max_seq_len));
			
 
				+    fin.read((char*) &out->nllb_config__vocabulary_size, sizeof(out->nllb_config__vocabulary_size));
			
 
				+    fin.read((char*) &out->nllb_config__pad_idx, sizeof(out->nllb_config__pad_idx));
			
 
				+    fin.read((char*) &out->nllb_config__num_encoder_layers, sizeof(out->nllb_config__num_encoder_layers));
			
 
				+    fin.read((char*) &out->nllb_config__num_decoder_layers, sizeof(out->nllb_config__num_decoder_layers));
			
 
				+    fin.read((char*) &out->nllb_config__num_encoder_attn_heads, sizeof(out->nllb_config__num_encoder_attn_heads));
			
 
				+    fin.read((char*) &out->nllb_config__num_decoder_attn_heads, sizeof(out->nllb_config__num_decoder_attn_heads));
			
 
				+    fin.read((char*) &out->nllb_config__ffn_inner_dim, sizeof(out->nllb_config__ffn_inner_dim));
			
 
				+    fin.read((char*) &out->nllb_config__dropout_p, sizeof(out->nllb_config__dropout_p));
			
 
				+    fin.read((char*) &out->t2u_config__model_dim, sizeof(out->t2u_config__model_dim));
			
 
				+    fin.read((char*) &out->t2u_config__unit_max_seq_len, sizeof(out->t2u_config__unit_max_seq_len));
			
 
				+    fin.read((char*) &out->t2u_config__unit_vocabulary_size, sizeof(out->t2u_config__unit_vocabulary_size));
			
 
				+    fin.read((char*) &out->t2u_config__unit_pad_idx, sizeof(out->t2u_config__unit_pad_idx));
			
 
				+    fin.read((char*) &out->t2u_config__num_encoder_layers, sizeof(out->t2u_config__num_encoder_layers));
			
 
				+    fin.read((char*) &out->t2u_config__num_decoder_layers, sizeof(out->t2u_config__num_decoder_layers));
			
 
				+    fin.read((char*) &out->t2u_config__num_encoder_attn_heads, sizeof(out->t2u_config__num_encoder_attn_heads));
			
 
				+    fin.read((char*) &out->t2u_config__num_decoder_attn_heads, sizeof(out->t2u_config__num_decoder_attn_heads));
			
 
				+    fin.read((char*) &out->t2u_config__ffn_inner_dim, sizeof(out->t2u_config__ffn_inner_dim));
			
 
				+    fin.read((char*) &out->t2u_config__dropout_p, sizeof(out->t2u_config__dropout_p));
			
 
				+    fin.read((char*) &out->use_text_encoder, sizeof(out->use_text_encoder));
			
 
				+    fin.read((char*) &out->use_conformer_adaptor, sizeof(out->use_conformer_adaptor));
			
 
				+    fin.read((char*) &out->num_adaptor_layers, sizeof(out->num_adaptor_layers));
			
 
				+    fin.read((char*) &out->adaptor_kernel_size, sizeof(out->adaptor_kernel_size));
			
 
				+    fin.read((char*) &out->adaptor_stride, sizeof(out->adaptor_stride));
			
 
				+    fin.read((char*) &out->adaptor_layer_norm, sizeof(out->adaptor_layer_norm));
			
 
				+    fin.read((char*) &out->adaptor_dropout_p, sizeof(out->adaptor_dropout_p));
			
 
				+    fin.read((char*) &out->model_byte_size, sizeof(out->model_byte_size));
			
 
				+    fin.read((char*) &out->__end_of_hparams__, sizeof(out->__end_of_hparams__));
			
 
				+
			
 
				 };
			
 
				 
			
 
				 
			
 
				 
			
 
				+
			
 
				+
			
 
				 // Embedding
			
 
				 std::size_t compute_embed_size(int32_t vocab_size, int32_t dim)
			
 
				 {