1 year ago · f2b5007277
--- a/ggml/ggml.py
+++ b/ggml/ggml.py
@@ -59,6 +59,7 @@ def nb(tensor: Union[ggml_tensor, ggml_tensor_p]) -> Tuple[int, ...]:
 
				         tensor = tensor.contents
			
 
				     return tuple([tensor.nb[i] for i in range(4)])
			
 
				 
			
 
				+
			
 
				 def ne(tensor: Union[ggml_tensor, ggml_tensor_p]) -> Tuple[int, ...]:
			
 
				     if isinstance(tensor, ctypes._Pointer):
			
 
				         tensor = tensor.contents
			
@@ -362,6 +363,13 @@ def forward(
 
				         return fwd(model, std_prefix, *inputs)  # ignore: type[no-any-return]
			
 
				 
			
 
				 
			
 
				+def build_and_compute(
			
 
				+    ctx: ggml_context_p, tensor: ggml_tensor_p, num_threads: int = 1
			
 
				+) -> None:
			
 
				+    gf = ggml_build_forward(tensor)
			
 
				+    ggml_graph_compute_with_ctx(ctx, ctypes.pointer(gf), num_threads)
			
 
				+
			
 
				+
			
 
				 @c_fn(lib)
			
 
				 def causal_attention_mask(
			
 
				     ctx: ggml_context_p, seqs: Ptr[ggml_tensor]
			
--- a/ggml/test_unity_cpp.py
+++ b/ggml/test_unity_cpp.py
@@ -108,35 +108,47 @@ def test_causal_attention_mask(ctx: Ctx):
 
				     assert np.all(mask == mask_exp)
			
 
				 
			
 
				 
			
 
				-def test_forward_ffn(ctx: Ctx, g_model: c_void_p, pt_model: Any) -> None:
			
 
				-    x = torch.empty((21, 1024))  # (seq_len, model_dim)
			
 
				-    torch.nn.init.uniform_(x, -1 / 32, 1 / 32)
			
 
				 
			
 
				-    # Test FFN without LayerNorm
			
 
				-    y_exp = pt_model.text_encoder.layers[0].ffn(x).numpy()
			
 
				+def test_LayerNorm_forward(ctx: Ctx, g_model: c_void_p, pt_model: Any) -> None:
			
 
				+    x = torch.empty((2, 21, 1024))
			
 
				+    torch.nn.init.uniform_(x, -1, 1)
			
 
				+
			
 
				+    y_exp = pt_model.text_encoder.layers[0].ffn_layer_norm(x).numpy()
			
 
				     gx = ggml.from_numpy(ctx, x)
			
 
				-    gy = ggml.forward(
			
 
				-        "StandardFeedForwardNetwork", g_model, "text_encoder.layers.0.ffn", gx
			
 
				-    )
			
 
				-    gf = ggml.ggml_build_forward(gy)
			
 
				-    ggml.ggml_graph_compute_with_ctx(ctx, ctypes.pointer(gf), 1)
			
 
				+    gy = ggml.forward("LayerNorm", g_model, "text_encoder.layers.0.ffn_layer_norm", gx)
			
 
				+    ggml.build_and_compute(ctx, gy)
			
 
				 
			
 
				-    y = ggml.to_numpy(gf.nodes[gf.n_nodes - 1])
			
 
				+    y = ggml.to_numpy(gy)
			
 
				     assert np.allclose(y_exp, y, atol=1e-5)
			
 
				 
			
 
				 
			
 
				-def test_forward_layer_norm(ctx: Ctx, g_model: c_void_p, pt_model: Any) -> None:
			
 
				-    x = torch.empty((21, 1024))
			
 
				+def test_Linear_forward(ctx: Ctx, g_model: c_void_p, pt_model: Any) -> None:
			
 
				+    x = torch.empty((2, 21, 1024))
			
 
				     torch.nn.init.uniform_(x, -1, 1)
			
 
				 
			
 
				-    y_exp = pt_model.text_encoder.layers[0].ffn_layer_norm(x).numpy()
			
 
				+    y_exp = pt_model.text_encoder.layers[0].ffn.inner_proj(x).numpy()
			
 
				     gx = ggml.from_numpy(ctx, x)
			
 
				-    gy = ggml.forward("LayerNorm", g_model, "text_encoder.layers.0.ffn_layer_norm", gx)
			
 
				-    gf = ggml.ggml_build_forward(gy)
			
 
				-    ggml.ggml_graph_compute_with_ctx(ctx, ctypes.pointer(gf), 1)
			
 
				+    gy = ggml.forward("Linear", g_model, "text_encoder.layers.0.ffn.inner_proj", gx)
			
 
				+    ggml.build_and_compute(ctx, gy)
			
 
				+
			
 
				+    y = ggml.to_numpy(gy)
			
 
				+    assert np.allclose(y_exp, y, atol=1e-5)
			
 
				+
			
 
				+
			
 
				+def test_FeedForwardNetwork_forward(ctx: Ctx, g_model: c_void_p, pt_model: Any) -> None:
			
 
				+    x = torch.empty((2, 21, 1024))  # (bs, seq_len, model_dim)
			
 
				+    torch.nn.init.uniform_(x, -1 / 32, 1 / 32)
			
 
				+
			
 
				+    # Test FFN without LayerNorm
			
 
				+    y_exp = pt_model.text_encoder.layers[0].ffn(x).numpy()
			
 
				+    gx = ggml.from_numpy(ctx, x)
			
 
				+    gy = ggml.forward(
			
 
				+        "StandardFeedForwardNetwork", g_model, "text_encoder.layers.0.ffn", gx
			
 
				+    )
			
 
				+    ggml.build_and_compute(ctx, gy)
			
 
				 
			
 
				-    y = ggml.to_numpy(gf.nodes[gf.n_nodes - 1])
			
 
				-    assert np.allclose(y_exp, y, rtol=1e-3, atol=1e-4)
			
 
				+    y = ggml.to_numpy(gy)
			
 
				+    assert np.allclose(y_exp, y, atol=1e-5)
			
 
				 
			
 
				 
			
 
				 def _name(tensor: ggml.ggml_tensor_p) -> bytes: