feat: allign metrics naming on llm proxy

michel-barret · michel-barret · commit a53be09f81b3 · 2025-11-13T09:39:17.000+01:00
diff --git a/src/main/java/io/gravitee/policy/ai/token/track/AiTokenTrackPolicy.java b/src/main/java/io/gravitee/policy/ai/token/track/AiTokenTrackPolicy.java
@@ -51,16 +51,16 @@ private Completable extracted(HttpPlainExecutionContext ctx) {
         var extractedData = providerExtractor.apply(ctx);
         return extractedData
             .doOnSuccess(data -> {
-                ctx.metrics().putAdditionalMetric("long_ai-prompt-token-sent", data.input());
-                ctx.metrics().putAdditionalMetric("long_ai-prompt-token-receive", data.output());
+                ctx.metrics().putAdditionalMetric("long_llm-proxy_tokens-sent", data.input());
+                ctx.metrics().putAdditionalMetric("long_llm-proxy_tokens-received", data.output());
                 if (data instanceof Tokens.TokensAndModel<?> tokensAndModel) {
-                    ctx.metrics().putAdditionalKeywordMetric("keyword_ai-prompt-token-model", tokensAndModel.model());
+                    ctx.metrics().putAdditionalKeywordMetric("keyword_llm-proxy_model", tokensAndModel.model());
                 }
                 configuration
                     .getCost(data)
                     .ifPresent(cost -> {
-                        ctx.metrics().putAdditionalMetric("double_ai-prompt-token-sent-cost", cost.input());
-                        ctx.metrics().putAdditionalMetric("double_ai-prompt-token-receive-cost", cost.output());
+                        ctx.metrics().putAdditionalMetric("double_llm-proxy_sent-cost", cost.input());
+                        ctx.metrics().putAdditionalMetric("double_llm-proxy_received-cost", cost.output());
                     });
             })
             .ignoreElement();
diff --git a/src/test/java/io/gravitee/policy/ai/token/track/AiTokenTrackPolicyIntegrationTest.java b/src/test/java/io/gravitee/policy/ai/token/track/AiTokenTrackPolicyIntegrationTest.java
@@ -45,9 +45,9 @@ void should_extract_tokens_usage_from_gpt_response(HttpClient client, VertxTestC
                         .extracting(Metrics::getAdditionalMetrics)
                         .asInstanceOf(InstanceOfAssertFactories.SET)
                         .containsExactlyInAnyOrder(
-                            new AdditionalMetric.LongMetric("long_ai-prompt-token-sent", 500000L),
-                            new AdditionalMetric.LongMetric("long_ai-prompt-token-receive", 750000L),
-                            new AdditionalMetric.KeywordMetric("keyword_ai-prompt-token-model", "gpt-4")
+                            new AdditionalMetric.LongMetric("long_llm-proxy_tokens-sent", 500000L),
+                            new AdditionalMetric.LongMetric("long_llm-proxy_tokens-received", 750000L),
+                            new AdditionalMetric.KeywordMetric("keyword_llm-proxy_model", "gpt-4")
                         )
                 )
                 .ignoreElements();
@@ -67,11 +67,11 @@ void should_extract_tokens_usage_and_pricing_from_gpt_response(HttpClient client
                         .extracting(Metrics::getAdditionalMetrics)
                         .asInstanceOf(InstanceOfAssertFactories.SET)
                         .containsExactlyInAnyOrder(
-                            new AdditionalMetric.LongMetric("long_ai-prompt-token-sent", 500000L),
-                            new AdditionalMetric.LongMetric("long_ai-prompt-token-receive", 750000L),
-                            new AdditionalMetric.KeywordMetric("keyword_ai-prompt-token-model", "gpt-4"),
-                            new AdditionalMetric.DoubleMetric("double_ai-prompt-token-sent-cost", 0.2),
-                            new AdditionalMetric.DoubleMetric("double_ai-prompt-token-receive-cost", 0.6)
+                            new AdditionalMetric.LongMetric("long_llm-proxy_tokens-sent", 500000L),
+                            new AdditionalMetric.LongMetric("long_llm-proxy_tokens-received", 750000L),
+                            new AdditionalMetric.KeywordMetric("keyword_llm-proxy_model", "gpt-4"),
+                            new AdditionalMetric.DoubleMetric("double_llm-proxy_sent-cost", 0.2),
+                            new AdditionalMetric.DoubleMetric("double_llm-proxy_received-cost", 0.6)
                         )
                 )
                 .ignoreElements();
@@ -97,9 +97,9 @@ void should_extract_tokens_usage(HttpClient client, VertxTestContext context) {
                         .extracting(Metrics::getAdditionalMetrics)
                         .asInstanceOf(InstanceOfAssertFactories.SET)
                         .containsExactlyInAnyOrder(
-                            new AdditionalMetric.LongMetric("long_ai-prompt-token-sent", 500000L),
-                            new AdditionalMetric.LongMetric("long_ai-prompt-token-receive", 750000L),
-                            new AdditionalMetric.KeywordMetric("keyword_ai-prompt-token-model", "gemini-2")
+                            new AdditionalMetric.LongMetric("long_llm-proxy_tokens-sent", 500000L),
+                            new AdditionalMetric.LongMetric("long_llm-proxy_tokens-received", 750000L),
+                            new AdditionalMetric.KeywordMetric("keyword_llm-proxy_model", "gemini-2")
                         )
                 )
                 .ignoreElements();
@@ -119,11 +119,11 @@ void should_extract_tokens_usage_and_pricing(HttpClient client, VertxTestContext
                         .extracting(Metrics::getAdditionalMetrics)
                         .asInstanceOf(InstanceOfAssertFactories.SET)
                         .containsExactlyInAnyOrder(
-                            new AdditionalMetric.LongMetric("long_ai-prompt-token-sent", 500000L),
-                            new AdditionalMetric.LongMetric("long_ai-prompt-token-receive", 750000L),
-                            new AdditionalMetric.KeywordMetric("keyword_ai-prompt-token-model", "gemini-2"),
-                            new AdditionalMetric.DoubleMetric("double_ai-prompt-token-sent-cost", 0.2),
-                            new AdditionalMetric.DoubleMetric("double_ai-prompt-token-receive-cost", 0.6)
+                            new AdditionalMetric.LongMetric("long_llm-proxy_tokens-sent", 500000L),
+                            new AdditionalMetric.LongMetric("long_llm-proxy_tokens-received", 750000L),
+                            new AdditionalMetric.KeywordMetric("keyword_llm-proxy_model", "gemini-2"),
+                            new AdditionalMetric.DoubleMetric("double_llm-proxy_sent-cost", 0.2),
+                            new AdditionalMetric.DoubleMetric("double_llm-proxy_received-cost", 0.6)
                         )
                 )
                 .ignoreElements();
@@ -149,9 +149,9 @@ void should_extract_tokens_usage(HttpClient client, VertxTestContext context) {
                         .extracting(Metrics::getAdditionalMetrics)
                         .asInstanceOf(InstanceOfAssertFactories.SET)
                         .containsExactlyInAnyOrder(
-                            new AdditionalMetric.LongMetric("long_ai-prompt-token-sent", 500000L),
-                            new AdditionalMetric.LongMetric("long_ai-prompt-token-receive", 750000L),
-                            new AdditionalMetric.KeywordMetric("keyword_ai-prompt-token-model", "claude-3")
+                            new AdditionalMetric.LongMetric("long_llm-proxy_tokens-sent", 500000L),
+                            new AdditionalMetric.LongMetric("long_llm-proxy_tokens-received", 750000L),
+                            new AdditionalMetric.KeywordMetric("keyword_llm-proxy_model", "claude-3")
                         )
                 )
                 .ignoreElements();
@@ -171,11 +171,11 @@ void should_extract_tokens_usage_and_pricing(HttpClient client, VertxTestContext
                         .extracting(Metrics::getAdditionalMetrics)
                         .asInstanceOf(InstanceOfAssertFactories.SET)
                         .containsExactlyInAnyOrder(
-                            new AdditionalMetric.LongMetric("long_ai-prompt-token-sent", 500000L),
-                            new AdditionalMetric.LongMetric("long_ai-prompt-token-receive", 750000L),
-                            new AdditionalMetric.KeywordMetric("keyword_ai-prompt-token-model", "claude-3"),
-                            new AdditionalMetric.DoubleMetric("double_ai-prompt-token-sent-cost", 0.2),
-                            new AdditionalMetric.DoubleMetric("double_ai-prompt-token-receive-cost", 0.6)
+                            new AdditionalMetric.LongMetric("long_llm-proxy_tokens-sent", 500000L),
+                            new AdditionalMetric.LongMetric("long_llm-proxy_tokens-received", 750000L),
+                            new AdditionalMetric.KeywordMetric("keyword_llm-proxy_model", "claude-3"),
+                            new AdditionalMetric.DoubleMetric("double_llm-proxy_sent-cost", 0.2),
+                            new AdditionalMetric.DoubleMetric("double_llm-proxy_received-cost", 0.6)
                         )
                 )
                 .ignoreElements();
@@ -201,9 +201,9 @@ void should_extract_tokens_usage(HttpClient client, VertxTestContext context) {
                         .extracting(Metrics::getAdditionalMetrics)
                         .asInstanceOf(InstanceOfAssertFactories.SET)
                         .containsExactlyInAnyOrder(
-                            new AdditionalMetric.LongMetric("long_ai-prompt-token-sent", 500000L),
-                            new AdditionalMetric.LongMetric("long_ai-prompt-token-receive", 750000L),
-                            new AdditionalMetric.KeywordMetric("keyword_ai-prompt-token-model", "mistral-1")
+                            new AdditionalMetric.LongMetric("long_llm-proxy_tokens-sent", 500000L),
+                            new AdditionalMetric.LongMetric("long_llm-proxy_tokens-received", 750000L),
+                            new AdditionalMetric.KeywordMetric("keyword_llm-proxy_model", "mistral-1")
                         )
                 )
                 .ignoreElements();
@@ -223,11 +223,11 @@ void should_extract_tokens_usage_and_pricing(HttpClient client, VertxTestContext
                         .extracting(Metrics::getAdditionalMetrics)
                         .asInstanceOf(InstanceOfAssertFactories.SET)
                         .containsExactlyInAnyOrder(
-                            new AdditionalMetric.LongMetric("long_ai-prompt-token-sent", 500000L),
-                            new AdditionalMetric.LongMetric("long_ai-prompt-token-receive", 750000L),
-                            new AdditionalMetric.KeywordMetric("keyword_ai-prompt-token-model", "mistral-1"),
-                            new AdditionalMetric.DoubleMetric("double_ai-prompt-token-sent-cost", 0.2),
-                            new AdditionalMetric.DoubleMetric("double_ai-prompt-token-receive-cost", 0.6)
+                            new AdditionalMetric.LongMetric("long_llm-proxy_tokens-sent", 500000L),
+                            new AdditionalMetric.LongMetric("long_llm-proxy_tokens-received", 750000L),
+                            new AdditionalMetric.KeywordMetric("keyword_llm-proxy_model", "mistral-1"),
+                            new AdditionalMetric.DoubleMetric("double_llm-proxy_sent-cost", 0.2),
+                            new AdditionalMetric.DoubleMetric("double_llm-proxy_received-cost", 0.6)
                         )
                 )
                 .ignoreElements();
@@ -253,9 +253,9 @@ void should_extract_tokens_usage(HttpClient client, VertxTestContext context) {
                         .extracting(Metrics::getAdditionalMetrics)
                         .asInstanceOf(InstanceOfAssertFactories.SET)
                         .containsExactlyInAnyOrder(
-                            new AdditionalMetric.LongMetric("long_ai-prompt-token-sent", 500000L),
-                            new AdditionalMetric.LongMetric("long_ai-prompt-token-receive", 750000L),
-                            new AdditionalMetric.KeywordMetric("keyword_ai-prompt-token-model", "custom-1")
+                            new AdditionalMetric.LongMetric("long_llm-proxy_tokens-sent", 500000L),
+                            new AdditionalMetric.LongMetric("long_llm-proxy_tokens-received", 750000L),
+                            new AdditionalMetric.KeywordMetric("keyword_llm-proxy_model", "custom-1")
                         )
                 )
                 .ignoreElements();
@@ -275,11 +275,11 @@ void should_extract_tokens_usage_and_pricing(HttpClient client, VertxTestContext
                         .extracting(Metrics::getAdditionalMetrics)
                         .asInstanceOf(InstanceOfAssertFactories.SET)
                         .containsExactlyInAnyOrder(
-                            new AdditionalMetric.LongMetric("long_ai-prompt-token-sent", 500000L),
-                            new AdditionalMetric.LongMetric("long_ai-prompt-token-receive", 750000L),
-                            new AdditionalMetric.KeywordMetric("keyword_ai-prompt-token-model", "custom-1"),
-                            new AdditionalMetric.DoubleMetric("double_ai-prompt-token-sent-cost", 0.2),
-                            new AdditionalMetric.DoubleMetric("double_ai-prompt-token-receive-cost", 0.6)
+                            new AdditionalMetric.LongMetric("long_llm-proxy_tokens-sent", 500000L),
+                            new AdditionalMetric.LongMetric("long_llm-proxy_tokens-received", 750000L),
+                            new AdditionalMetric.KeywordMetric("keyword_llm-proxy_model", "custom-1"),
+                            new AdditionalMetric.DoubleMetric("double_llm-proxy_sent-cost", 0.2),
+                            new AdditionalMetric.DoubleMetric("double_llm-proxy_received-cost", 0.6)
                         )
                 )
                 .ignoreElements();
@@ -305,10 +305,10 @@ void should_extract_tokens_usage_and_pricing_event_dont_find_model(HttpClient cl
                         .extracting(Metrics::getAdditionalMetrics)
                         .asInstanceOf(InstanceOfAssertFactories.SET)
                         .containsExactlyInAnyOrder(
-                            new AdditionalMetric.LongMetric("long_ai-prompt-token-sent", 500000L),
-                            new AdditionalMetric.LongMetric("long_ai-prompt-token-receive", 750000L),
-                            new AdditionalMetric.DoubleMetric("double_ai-prompt-token-sent-cost", 0.2),
-                            new AdditionalMetric.DoubleMetric("double_ai-prompt-token-receive-cost", 0.6)
+                            new AdditionalMetric.LongMetric("long_llm-proxy_tokens-sent", 500000L),
+                            new AdditionalMetric.LongMetric("long_llm-proxy_tokens-received", 750000L),
+                            new AdditionalMetric.DoubleMetric("double_llm-proxy_sent-cost", 0.2),
+                            new AdditionalMetric.DoubleMetric("double_llm-proxy_received-cost", 0.6)
                         )
                 )
                 .ignoreElements();
@@ -333,10 +333,10 @@ void should_extract_tokens_usage_and_pricing_event_dont_find_model(HttpClient cl
                     assertThat(metrics.getAdditionalMetrics())
                         .extracting(AdditionalMetric::name)
                         .doesNotContain(
-                            "long_ai-prompt-token-sent",
-                            "long_ai-prompt-token-receive",
-                            "double_ai-prompt-token-sent-cost",
-                            "double_ai-prompt-token-receive-cost"
+                            "long_llm-proxy_tokens-sent",
+                            "long_llm-proxy_tokens-received",
+                            "double_llm-proxy_sent-cost",
+                            "double_llm-proxy_received-cost"
                         )
                 )
                 .ignoreElements();