Fix jagged_hstu_attn mapping and use quick autotuning in TPU benchmark

norx1991 · norx1991 · commit 5dff8ec7b187 · 2026-04-05T21:57:35.000-07:00
- Fix wrong kernel function name: jagged_hstu_attn -&gt; _helion_jagged_attention_kernel
- Add HELION_AUTOTUNE_EFFORT=quick to CI workflow — full effort times out
  for 5/11 kernels (welford, attention, geglu, grpo_loss, swiglu)
diff --git a/.github/workflows/benchmark_tpu.yml b/.github/workflows/benchmark_tpu.yml
@@ -17,6 +17,7 @@ jobs:
     env:
       HELION_BACKEND: pallas
       HELION_AUTOTUNE_LOG_LEVEL: INFO
+      HELION_AUTOTUNE_EFFORT: quick
 
     runs-on: linux.google.tpuv7x.1
 
diff --git a/benchmarks/run_tpu.py b/benchmarks/run_tpu.py
@@ -111,7 +111,7 @@ def _softmax_shapes() -> list[tuple[str, tuple[Any, ...]]]:
     "bmm": ("bmm", "bmm", None, None),
     "geglu": ("geglu", "geglu", None, None),
     "grpo_loss": ("grpo_loss", "grpo_loss_forward", None, None),
-    "jagged_hstu_attn": ("jagged_hstu_attn", "jagged_hstu_attn", None, None),
+    "jagged_hstu_attn": ("jagged_hstu_attn", "_helion_jagged_attention_kernel", None, None),
     "low_mem_dropout": ("low_mem_dropout", "low_mem_dropout", None, None),
     "swiglu": ("swiglu", "swiglu_fwd", None, None),
 }

Original file line number	Diff line number	Diff line change
`@@ -111,7 +111,7 @@ def _softmax_shapes() -> list[tuple[str, tuple[Any, ...]]]:`
`111`	`111`	`"bmm": ("bmm", "bmm", None, None),`
`112`	`112`	`"geglu": ("geglu", "geglu", None, None),`
`113`	`113`	`"grpo_loss": ("grpo_loss", "grpo_loss_forward", None, None),`
`114`		`- "jagged_hstu_attn": ("jagged_hstu_attn", "jagged_hstu_attn", None, None),`
	`114`	`+ "jagged_hstu_attn": ("jagged_hstu_attn", "_helion_jagged_attention_kernel", None, None),`
`115`	`115`	`"low_mem_dropout": ("low_mem_dropout", "low_mem_dropout", None, None),`
`116`	`116`	`"swiglu": ("swiglu", "swiglu_fwd", None, None),`
`117`	`117`	`}`