Token Control 4.0 – Release Notes

Mehr Transparenz, mehr Kontrolle, mehr Modelle: Mit Token Control 4.0 heben wir KI-Governance und FinOps auf das nächste Level – von einer noch detaillierteren Kostenberechnung über eine überarbeitete Oberfläche bis hin zur Unterstützung neuer Modelle und Azure AI Foundry.

TL;DR

  • Neue Modelle: text-embedding-3-largeGPT-4.1-nanoGPT-4o, vollständige GPT‑5‑Familie, image-1
  • Native Unterstützung für Azure AI Foundry (inkl. Model Router)
  • Detailliertere Kostenberechnung über alle Modell‑SKUs und Anbieter hinweg
  • Überarbeitete Oberfläche für schnellere Analysen und Drill‑downs in die Daten
  • Gruppen‑Sync für Microsoft 365- und Sicherheitsgruppen (Entra ID)
  • Verbesserte SKU‑Darstellung für maximale Preistransparenz
  • Fein granulare Modellfreigaben und Rate Limits pro Kostenstelle

Was ist neu – und warum es wichtig ist?

Neue unterstützte Modelle

Wir erweitern die Modellabdeckung, damit Sie Use Cases passgenau und kosteneffizient umsetzen können – vom Chat über Embeddings bis Bildgenerierung:

  • text-embedding-3-large (Embeddings): Höchste Embedding‑Qualität für Suche, RAG und Relevanzbewertung. In Release 4.0 werden Embedding‑Kosten nun separat und präzise erfasst (Kosten pro 1K Tokens), wodurch Workloads für Retrieval‑Augmented Generation (RAG) exakt budgetiert und reportet werden können.
  • GPT-4.1-nano (kosteneffizientes Textmodell): Ideal für „High‑throughput“-Szenarien, kleine Agenten‑Aufgaben und AI‑Chat‑Use‑Cases. Kombiniert mit TPM/RPM‑Limits in Token Control behalten Sie Lastspitzen im Griff – ohne Überraschungen am Monatsende.
  • GPT-4o (konversations-/textorientiertes Modell): Starke Chat‑ und Tool‑Use‑Fähigkeiten für Assistenten und Orchestrierungen. In Release 4.0 können Sie GPT-4o gezielt pro Kostenstelle oder Anwendung erlauben/verbieten und getrennte Budgets definieren.
  • Alle GPT‑5‑Modelle (vollständige GPT‑5‑Familie): Zukunftssichere Unterstützung der gesamten Familie (z. B. Chat/Mini/Nano). Governance‑Regeln (Modelle, Limits, Budgets) greifen konsistent – unabhängig davon, welches GPT‑5‑Derivat Ihr Team einsetzt.
  • image-1: Bildgenerierung endlich mit exakter Kostensteuerung. Wir erfassen Aufwände pro Request/RPM und stellen die Kosten mit den passenden SKU‑Metriken dar – getrennt von Text/Embeddings.

Unterstützung von Azure AI Foundry

Token Control 4.0 integriert sich nahtlos in Azure AI Foundry – inklusive Model Router und moderner Authentifizierung:

  • Einfache Anbindung: Nutzen Sie Azure AI Foundry Endpoints, ohne Codeänderungen an Ihren bestehenden OpenAI‑kompatiblen Clients.
  • Model Router ready: Profitieren Sie vom „model‑router“, der zwischen passenden Modellen auswählt – Token Control sichert Governance und Kostenlimits dennoch pro fachlicher Entität ab.
  • In Kombination mit unserem API‑Key‑Management erhalten Sie maximale Sicherheit und Transparenz. Zusätzlich kann Entra ID (Keyless) genutzt werden, um Kosten bis auf Benutzerebene nachzuvollziehen.
  • Quotas & Limits: Wir spiegeln die Foundry‑Limits (TPM/RPM/Concurrency) in Ihre Governance‑Regeln – so werden technische und organisatorische Limits konsistent durchgesetzt.

Detailliertere Kostenberechnung

Unser Abrechnungs‑Core wurde umfassend überarbeitet:

  • Provider‑ und SKU‑genaue Kostenermittlung (Input/Output‑Tokens, Embeddings, Images)
  • Korrekte Zuordnung pro Kostenstelle, Anwendung, Projekt, Team oder Nutzer
  • Verbesserte Monatsberichte und aussagekräftige Exporte für FinOps/Controlling
  • Transparentes Reporting von Agenten‑Pfaden: Wo fallen die Kosten wirklich an?
Kostenberechnung

Ergebnis: Weniger „Kostennebel“, mehr Planbarkeit – besonders bei Agentic‑Mustern mit Tool‑Aufrufen und Handoffs.

Überarbeitete UI

Schneller zur Erkenntnis, weniger Klicks:

  • Start‑Dashboard mit Budgetstatus, Top‑Verbrauchern und Abweichungen
  • Intuitive Drill‑downs bis auf Modell‑, App‑ oder Nutzer‑Ebene
  • Klarere Visualisierungen für Limits, Drosselungen und Ausreißer
Token Control Dashboard

Gruppen‑Sync für M365 & Sicherheitsgruppen

Bringen Sie Ihre Organisationsstruktur direkt in die Governance:

  • Synchronisierung von Microsoft 365‑ und Sicherheitsgruppen (Microsoft Entra ID)
  • Abbildung fachlicher Identitäten wie Benutzergruppen, Abteilungen und Kostenstellen
  • Automatisierte Zuweisung von Rechten, Budgets, Modellen und Limits pro Gruppe

So wird „Least Privilege“ endlich praxistauglich – ohne manuelle Pflege.

Organisationsstruktur über M365 Gruppen

Bessere SKU‑Darstellung

Transparenz schafft Vertrauen:

  • Klare Anzeige von Modell, SKU/Meter, Region und Abrechnungseinheit
  • Nachvollziehbare Preise je Anbieter – inklusive Unterschiede für Text, Embeddings und Images
  • Einheitliche Darstellung über Azure AI Foundry, (Azure) OpenAI und weitere Provider

Flexible Steuerung pro Kostenstelle

Fein granulare Kontrolle, wo sie gebraucht wird:

  • Modelle pro Kostenstelle/Team/App erlauben oder sperren
  • Rate Limits (TPM/RPM/Concurrency) auf Ebene von Kostenstellen, Projekten oder Agenten
  • Eigene Budgets je Entität – inkl. Kappung und Live‑Monitoring

Für wen ist Token Control 4.0 besonders relevant?

  • Unternehmen, die Azure AI Foundry produktiv nutzen oder einführen
  • Teams mit wachsendem Agentic‑Einsatz (LangGraph, LangChain, Semantic Kernel, Flock)
  • Softwarehersteller/Distributoren/Partner, die Token Control in Produkte/Portale integrieren
  • FinOps/Controlling, die konsistente Berichte über alle Workloads benötigen

Jetzt starten

Bringen Sie Ordnung in Kosten, Limits und Zugriffe – ohne Ihre bestehenden Lösungen umbauen zu müssen.

Mit Token Control 4.0 setzen Sie KI‑Governance und FinOps dort um, wo sie zählen: nah an den Modellen, nah an den Teams – und 100% transparent in den Kosten.