changes

abidlabs · abidlabs · commit 9438de5b1ac7 · 2026-04-20T14:05:37.000-07:00
diff --git a/examples/traces/basic-trace.py b/examples/traces/basic-trace.py
@@ -1,19 +1,40 @@
+import random
+
 import trackio
 
+PROJECT_ID = random.randint(100000, 999999)
+PROJECT_NAME = f"trace-demo-basic-{PROJECT_ID}"
+
+examples = [
+    ("What is 2 + 2?", "2 + 2 = 4."),
+    ("What is the capital of Australia?", "The capital of Australia is Canberra."),
+    (
+        "Give me a one-sentence summary of Trackio.",
+        "Trackio is a lightweight experiment tracking dashboard for ML and agent workflows.",
+    ),
+    ("Translate 'hello' to Spanish.", "Hola."),
+]
 
-trackio.init(project="trace-demo-basic")
+for run_idx in range(2):
+    trackio.init(project=PROJECT_NAME, name=f"basic-run-{run_idx}")
 
-trackio.log(
-    {
-        "trace": trackio.Trace(
-            messages=[
-                {"role": "system", "content": "You are a concise assistant."},
-                {"role": "user", "content": "What is 2 + 2?"},
-                {"role": "assistant", "content": "2 + 2 = 4."},
-            ],
-            metadata={"model_version": "demo-v1"},
+    for step, (prompt, completion) in enumerate(examples):
+        trackio.log(
+            {
+                "trace": trackio.Trace(
+                    messages=[
+                        {"role": "system", "content": "You are a concise assistant."},
+                        {"role": "user", "content": prompt},
+                        {"role": "assistant", "content": completion},
+                    ],
+                    metadata={
+                        "model_version": f"demo-basic-v{run_idx + 1}",
+                        "trace_kind": "basic",
+                        "example_index": step,
+                    },
+                )
+            },
+            step=step,
         )
-    }
-)
 
-trackio.finish()
+    trackio.finish()
diff --git a/examples/traces/complex-trace.py b/examples/traces/complex-trace.py
@@ -1,51 +1,74 @@
+import random
+
 import numpy as np
 
 import trackio
 
+PROJECT_ID = random.randint(100000, 999999)
+PROJECT_NAME = f"trace-demo-complex-{PROJECT_ID}"
 
-trackio.init(project="trace-demo-complex")
 
-fake_screenshot = np.random.randint(0, 255, size=(240, 320, 3), dtype=np.uint8)
+def make_screenshot(seed: int):
+    rng = np.random.default_rng(seed)
+    return rng.integers(0, 255, size=(240, 320, 3), dtype=np.uint8)
 
-trackio.log(
-    {
-        "agent_trace": trackio.Trace(
-            messages=[
-                {"role": "system", "content": "You are a browser agent."},
-                {
-                    "role": "user",
-                    "content": [
-                        {"type": "text", "text": "Inspect the page and summarize it."},
-                        trackio.Image(fake_screenshot, caption="browser screenshot"),
-                    ],
-                },
-                {
-                    "role": "assistant",
-                    "content": "I will inspect the page and call a tool if needed.",
-                    "tool_calls": [
+
+for run_idx in range(2):
+    trackio.init(project=PROJECT_NAME, name=f"complex-run-{run_idx}")
+
+    for step in range(4):
+        screenshot = make_screenshot(run_idx * 10 + step)
+        trackio.log(
+            {
+                "agent_trace": trackio.Trace(
+                    messages=[
+                        {"role": "system", "content": "You are a browser agent."},
+                        {
+                            "role": "user",
+                            "content": [
+                                {
+                                    "type": "text",
+                                    "text": f"Inspect page variant {step} and summarize it.",
+                                },
+                                trackio.Image(
+                                    screenshot,
+                                    caption=f"browser screenshot run={run_idx} step={step}",
+                                ),
+                            ],
+                        },
+                        {
+                            "role": "assistant",
+                            "content": "I will inspect the page and call a tool if needed.",
+                            "tool_calls": [
+                                {
+                                    "id": f"call_{run_idx}_{step}",
+                                    "type": "function",
+                                    "function": {
+                                        "name": "extract_title",
+                                        "arguments": '{"selector": "title"}',
+                                    },
+                                }
+                            ],
+                        },
+                        {
+                            "role": "tool",
+                            "content": f'{{"title": "Trackio Demo {run_idx}-{step}"}}',
+                            "tool_call_id": f"call_{run_idx}_{step}",
+                        },
                         {
-                            "id": "call_1",
-                            "type": "function",
-                            "function": {
-                                "name": "extract_title",
-                                "arguments": '{"selector": "title"}',
-                            },
-                        }
+                            "role": "assistant",
+                            "content": f"The page variant {step} appears to be a Trackio demo with a visible screenshot and an extracted title.",
+                        },
                     ],
-                },
-                {
-                    "role": "tool",
-                    "content": '{"title": "Trackio Demo"}',
-                    "tool_call_id": "call_1",
-                },
-                {
-                    "role": "assistant",
-                    "content": "The page appears to be a Trackio demo with a visible screenshot and a simple title.",
-                },
-            ],
-            metadata={"model_version": "agent-preview", "environment": "browser"},
+                    metadata={
+                        "model_version": f"agent-preview-{run_idx}",
+                        "environment": "browser",
+                        "trace_kind": "complex",
+                        "step_variant": step,
+                    },
+                )
+            },
+            step=step,
         )
-    }
-)
 
-trackio.finish()
+    trackio.finish()
diff --git a/examples/traces/trl-trace-integration.py b/examples/traces/trl-trace-integration.py
@@ -1,39 +1,121 @@
-from trl import GRPOConfig, GRPOTrainer
+# /// script
+# dependencies = [
+#   "trackio",
+#   "trl",
+#   "datasets",
+#   "transformers",
+#   "torch",
+# ]
+# ///
+
+import random
+
+from datasets import Dataset
+from transformers import AutoModelForCausalLM, AutoTokenizer, TrainerCallback
+from trl import SFTConfig, SFTTrainer
 
 import trackio
 
+PROJECT_ID = random.randint(100000, 999999)
+PROJECT_NAME = f"trace-demo-trl-{PROJECT_ID}"
+MODEL_NAME = "sshleifer/tiny-gpt2"
+
+tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
+if tokenizer.pad_token is None:
+    tokenizer.pad_token = tokenizer.eos_token
+
+examples = [
+    {"prompt": "What is 2 + 2?", "completion": "2 + 2 = 4."},
+    {
+        "prompt": "What color is the sky on a clear day?",
+        "completion": "The sky is typically blue on a clear day.",
+    },
+    {"prompt": "Translate 'good morning' to French.", "completion": "Bonjour."},
+    {
+        "prompt": "Name the capital of Japan.",
+        "completion": "Tokyo is the capital of Japan.",
+    },
+    {
+        "prompt": "Give one use of Trackio.",
+        "completion": "Trackio can be used to inspect training logs and traces.",
+    },
+]
+
+
+def format_example(example):
+    return {
+        "text": (
+            "### Instruction:\n"
+            f"{example['prompt']}\n\n"
+            "### Response:\n"
+            f"{example['completion']}"
+        )
+    }
+
 
-trackio.init(project="trace-demo-trl")
+dataset = Dataset.from_list([format_example(example) for example in examples * 2])
 
 
-def log_rollouts(prompts, completions, rewards, step, model_version):
-    trackio.log(
-        {
-            "traces": [
-                trackio.Trace(
+class TraceLoggingCallback(TrainerCallback):
+    def __init__(self, prompt_examples, run_label):
+        self.prompt_examples = prompt_examples
+        self.run_label = run_label
+
+    def on_log(self, args, state, control, logs=None, **kwargs):
+        if not logs or state.global_step <= 0:
+            return
+
+        sample = self.prompt_examples[
+            (state.global_step - 1) % len(self.prompt_examples)
+        ]
+        reward = max(0.0, 1.0 - float(logs.get("loss", 0.0)))
+        trackio.log(
+            {
+                "trace": trackio.Trace(
                     messages=[
-                        {"role": "user", "content": prompt},
-                        {"role": "assistant", "content": completion},
+                        {
+                            "role": "system",
+                            "content": "You are a supervised fine-tuning demo model.",
+                        },
+                        {"role": "user", "content": sample["prompt"]},
+                        {"role": "assistant", "content": sample["completion"]},
                     ],
                     metadata={
-                        "reward": float(reward),
-                        "step": step,
-                        "model_version": model_version,
+                        "model_version": self.run_label,
+                        "trainer": "trl-sft",
+                        "loss": float(logs.get("loss", 0.0)),
+                        "reward": reward,
+                        "global_step": int(state.global_step),
                     },
                 )
-                for prompt, completion, reward in zip(prompts, completions, rewards)
-            ]
-        },
-        step=step,
-    )
+            },
+            step=int(state.global_step),
+        )
 
 
-trainer = GRPOTrainer(
-    model="Qwen/Qwen2.5-0.5B",
-    reward_funcs=[],
-    args=GRPOConfig(output_dir="out", report_to="trackio"),
-    train_dataset=[],
-)
+for run_idx in range(2):
+    run_name = f"trl-run-{run_idx}"
+    trackio.init(project=PROJECT_NAME, name=run_name)
+
+    model = AutoModelForCausalLM.from_pretrained(MODEL_NAME)
+
+    trainer = SFTTrainer(
+        model=model,
+        args=SFTConfig(
+            output_dir=f"./trl_trace_output_{PROJECT_ID}_{run_idx}",
+            per_device_train_batch_size=2,
+            max_steps=5,
+            logging_steps=1,
+            save_strategy="no",
+            report_to="none",
+            learning_rate=5e-5,
+            dataset_text_field="text",
+            max_length=64,
+        ),
+        train_dataset=dataset,
+        processing_class=tokenizer,
+        callbacks=[TraceLoggingCallback(examples, run_name)],
+    )
 
-# Wire `log_rollouts(...)` into your callback or reward loop.
-# trainer.train()
+    trainer.train()
+    trackio.finish()
diff --git a/tests/unit/test_trace.py b/tests/unit/test_trace.py
@@ -72,8 +72,6 @@ def test_trace_logging_and_query(temp_dir):
     assert len(searched) == 1
     assert searched[0]["metadata"]["model_version"] == "step-2150"
 
-    filtered = SQLiteStorage.get_traces(
-        "proj", "trace-run", model_version="step-2000"
-    )
+    filtered = SQLiteStorage.get_traces("proj", "trace-run", model_version="step-2000")
     assert len(filtered) == 1
     assert filtered[0]["messages"][2]["content"] == "Sydney."
diff --git a/trackio/frontend/src/App.svelte b/trackio/frontend/src/App.svelte
@@ -88,8 +88,6 @@
   let spaceId = $state(null);
   let availableSystemDevices = $state([]);
   let selectedSystemDevices = $state([]);
-  let traceModel = $state("All models");
-  let traceModelChoices = $state(["All models"]);
 
   function runKey(run) {
     return run?.id ?? run?.name;
@@ -410,8 +408,6 @@
       {metricColumns}
       {availableSystemDevices}
       bind:selectedSystemDevices
-      bind:traceModel
-      {traceModelChoices}
       {spaceId}
       {logoUrls}
       {darkMode}
@@ -444,8 +440,6 @@
         <Traces
           project={selectedProject}
           selectedRuns={selectedRunRecords}
-          bind:traceModel
-          bind:traceModelChoices
         />
       {:else if currentPage === "system"}
         <SystemMetrics
diff --git a/trackio/frontend/src/components/Sidebar.svelte b/trackio/frontend/src/components/Sidebar.svelte
@@ -18,8 +18,6 @@
     selectedRuns = $bindable([]),
     availableSystemDevices = [],
     selectedSystemDevices = $bindable([]),
-    traceModel = $bindable("All models"),
-    traceModelChoices = [],
     smoothing = $bindable(10),
     xAxis = $bindable("step"),
     logScaleX = $bindable(false),
@@ -413,19 +411,6 @@
           {/if}
         </div>
 
-        {#if currentPage === "traces"}
-          <span class="section-label">Trace Filters</span>
-
-          <div class="section">
-            <Dropdown
-              label="Model Version"
-              choices={traceModelChoices}
-              bind:value={traceModel}
-              filterable={false}
-            />
-          </div>
-        {/if}
-
         {#if currentPage === "metrics" || currentPage === "system"}
           <span class="section-label">Display Settings</span>
 
diff --git a/trackio/frontend/src/pages/Traces.svelte b/trackio/frontend/src/pages/Traces.svelte
diff --git a/trackio/sqlite_storage.py b/trackio/sqlite_storage.py
diff --git a/trackio/trace.py b/trackio/trace.py