[refactor] Simplify and unify Activation task graph setup logic

orionpapadakis · orionpapadakis · commit 3aa399b05292 · 2026-03-27T12:57:09.000+02:00
diff --git a/src/main/java/org/beehive/gpullama3/tornadovm/layers/AbstractLayer.java b/src/main/java/org/beehive/gpullama3/tornadovm/layers/AbstractLayer.java
@@ -27,6 +27,9 @@ protected AbstractLayer(String taskGraphName, State state, Weights weights, Conf
         this.config = config;
     }
 
+    /**
+     * Ensures weights are of the expected type.
+     */
     @SuppressWarnings("unchecked")
     protected static <T> T requireWeightsType(Object weights, Class<T> expectedType, String layerName, String layout) {
         if (expectedType.isInstance(weights)) {
diff --git a/src/main/java/org/beehive/gpullama3/tornadovm/layers/Activation.java b/src/main/java/org/beehive/gpullama3/tornadovm/layers/Activation.java
@@ -7,55 +7,49 @@
 import org.beehive.gpullama3.tornadovm.layerplanner.WorkerGridFactory;
 import uk.ac.manchester.tornado.api.GridScheduler;
 import uk.ac.manchester.tornado.api.ImmutableTaskGraph;
-import uk.ac.manchester.tornado.api.KernelContext;
 import uk.ac.manchester.tornado.api.TaskGraph;
 import uk.ac.manchester.tornado.api.WorkerGrid;
-import uk.ac.manchester.tornado.api.WorkerGrid1D;
 import uk.ac.manchester.tornado.api.enums.DataTransferMode;
 import uk.ac.manchester.tornado.api.types.arrays.ByteArray;
 import uk.ac.manchester.tornado.api.types.arrays.HalfFloatArray;
 
 public class Activation extends AbstractLayer {
-    private final TaskGraph activationUpdate;
-
-    public Activation(String taskGraphHandle, State state, Weights weights, Configuration config) {
-        super(taskGraphHandle, state, weights, config);
-
-        KernelContext kernelContext = new KernelContext();
-
-        // @formatter:off
-        switch (config.quantization()) {
-            case "FP16" -> {
-                this.activationUpdate = new TaskGraph(taskGraphHandle)
-                        .transferToDevice(DataTransferMode.EVERY_EXECUTION, state.embeddingX)
-                        .task("updateX", TransformerComputeKernels::convertFP16toFP32, kernelContext, (HalfFloatArray) state.embeddingX, state.wrapX)
-                        .persistOnDevice(state.wrapX);
-            }
-            case "Q8_0" -> {
-                this.activationUpdate = new TaskGraph(taskGraphHandle)
-                        .transferToDevice(DataTransferMode.EVERY_EXECUTION, state.embeddingX)
-                        .task("updateX", TransformerComputeKernels::convertQ8_0toFP32, kernelContext, (ByteArray) state.embeddingX, state.wrapX)
-                        .persistOnDevice(state.wrapX);
-            }
+    private final TaskGraph activationTaskGraph;
+
+    public Activation(String name, State state, Weights weights, Configuration config) {
+        super(name, state, weights, config);
+        this.activationTaskGraph = setupActivationTaskGraph(name);
+    }
+
+    // @formatter:off
+    protected TaskGraph setupActivationTaskGraph(String name) {
+        return switch (config.quantization()) {
+            case "FP16" -> new TaskGraph(name)
+                    .transferToDevice(DataTransferMode.EVERY_EXECUTION, state.embeddingX)
+                    .task("updateX", TransformerComputeKernels::convertFP16toFP32, context, (HalfFloatArray) state.embeddingX, state.wrapX)
+                    .persistOnDevice(state.wrapX);
+            case "Q8_0" -> new TaskGraph(name)
+                    .transferToDevice(DataTransferMode.EVERY_EXECUTION, state.embeddingX)
+                    .task("updateX", TransformerComputeKernels::convertQ8_0toFP32, context, (ByteArray) state.embeddingX, state.wrapX)
+                    .persistOnDevice(state.wrapX);
             default -> throw new UnsupportedOperationException("Unsupported quantization format: " + config.quantization());
-        }
-        // @formatter:on
+        };
     }
+    // @formatter:on
 
     @Override
     public GridScheduler updateGridScheduler(GridScheduler scheduler) {
-        WorkerGrid worker = new WorkerGrid1D(config.dim());
-        worker.setLocalWork(128, 1, 1);
-        scheduler.addWorkerGrid("activationUpdate.updateX", worker);
+        WorkerGrid worker = WorkerGridFactory.genericWorker(config.dim(), 128);
+        scheduler.addWorkerGrid(activationTaskGraph.getTaskGraphName() + ".updateX", worker);
         return scheduler;
     }
 
     public TaskGraph getTaskGraph() {
-        return activationUpdate;
+        return activationTaskGraph;
     }
 
     public ImmutableTaskGraph getImmutableTaskGraph() {
-        return activationUpdate.snapshot();
+        return activationTaskGraph.snapshot();
     }
 
 }
diff --git a/src/main/java/org/beehive/gpullama3/tornadovm/layers/ActivationGranite.java b/src/main/java/org/beehive/gpullama3/tornadovm/layers/ActivationGranite.java
@@ -4,40 +4,37 @@
 import org.beehive.gpullama3.inference.weights.Weights;
 import org.beehive.gpullama3.model.granite.GraniteConfiguration;
 import org.beehive.gpullama3.tornadovm.kernels.GraniteKernels;
-import uk.ac.manchester.tornado.api.GridScheduler;
-import uk.ac.manchester.tornado.api.ImmutableTaskGraph;
-import uk.ac.manchester.tornado.api.KernelContext;
 import uk.ac.manchester.tornado.api.TaskGraph;
-import uk.ac.manchester.tornado.api.WorkerGrid;
-import uk.ac.manchester.tornado.api.WorkerGrid1D;
 import uk.ac.manchester.tornado.api.enums.DataTransferMode;
 import uk.ac.manchester.tornado.api.types.arrays.ByteArray;
 import uk.ac.manchester.tornado.api.types.arrays.HalfFloatArray;
 
+/**
+ * Granite-specific activation: applies an embedding scale factor during the FP32 conversion.
+ * Overrides only the task graph builder; all other behaviour is inherited from Activation.
+ */
 public class ActivationGranite extends Activation {
-    private final TaskGraph activationUpdate;
 
     // Granite is a special case where activation X is scaled by embedding scale float value that inside model.
     public ActivationGranite(String taskGraphHandle, State state, Weights weights, GraniteConfiguration config) {
         super(taskGraphHandle, state, weights, config);
+    }
 
-        KernelContext kernelContext = new KernelContext();
-
-        // @formatter:off
-        switch (config.quantization()) {
-            case "FP16" -> {
-                this.activationUpdate = new TaskGraph(taskGraphHandle)
-                        .transferToDevice(DataTransferMode.EVERY_EXECUTION, state.embeddingX)
-                        .task("updateX", GraniteKernels::convertFP16toFP32withGraniteScale, kernelContext, (HalfFloatArray) state.embeddingX, state.wrapX,  config.embeddingScale())
-                        .persistOnDevice(state.wrapX);
-            }
-            case "Q8_0" -> {
-                this.activationUpdate = new TaskGraph(taskGraphHandle)
-                        .transferToDevice(DataTransferMode.EVERY_EXECUTION, state.embeddingX)
-                        .task("updateX", GraniteKernels::convertQ8_0toFP32withGraniteScale, kernelContext, (ByteArray) state.embeddingX, state.wrapX, config.embeddingScale())
-                        .persistOnDevice(state.wrapX);
-            }
+    // @formatter:off
+    @Override
+    protected TaskGraph setupActivationTaskGraph(String handle) {
+        GraniteConfiguration cfg = (GraniteConfiguration) config;
+        return switch (config.quantization()) {
+            case "FP16" -> new TaskGraph(handle)
+                    .transferToDevice(DataTransferMode.EVERY_EXECUTION, state.embeddingX)
+                    .task("updateX", GraniteKernels::convertFP16toFP32withGraniteScale, context, (HalfFloatArray) state.embeddingX, state.wrapX, cfg.embeddingScale())
+                    .persistOnDevice(state.wrapX);
+            case "Q8_0" -> new TaskGraph(handle)
+                    .transferToDevice(DataTransferMode.EVERY_EXECUTION, state.embeddingX)
+                    .task("updateX", GraniteKernels::convertQ8_0toFP32withGraniteScale, context, (ByteArray) state.embeddingX, state.wrapX, cfg.embeddingScale())
+                    .persistOnDevice(state.wrapX);
             default -> throw new UnsupportedOperationException("Unsupported quantization format: " + config.quantization());
-        }
-        // @formatter:on
+        };
     }
+    // @formatter:on
+}

Original file line number	Diff line number	Diff line change
`@@ -27,6 +27,9 @@ protected AbstractLayer(String taskGraphName, State state, Weights weights, Conf`
`27`	`27`	`this.config = config;`
`28`	`28`	`}`
`29`	`29`
	`30`	`+ /**`
	`31`	`+ * Ensures weights are of the expected type.`
	`32`	`+ */`
`30`	`33`	`@SuppressWarnings("unchecked")`
`31`	`34`	`protected static <T> T requireWeightsType(Object weights, Class<T> expectedType, String layerName, String layout) {`
`32`	`35`	`if (expectedType.isInstance(weights)) {`