AIMARKETING /

Marketing AI

Koszty AI w marketingu: czas na limity tokenów

Zarządzanie kosztami AI przestało być pobocznym tematem dla zespołu operacyjnego. W 2026 roku problemem nie jest już sam dostęp do modeli, tylko brak kontroli nad tym, kto ich używa, do czego i z jakim kosztem na wynik. W wielu firmach AI weszło do marketingu i sprzedaży przez pojedyncze narzędzia, automatyzacje i osobne klucze API. Efekt jest przewidywalny: koszty rosną w tle, a budżet nie pokazuje, które wdrożenia faktycznie dowożą wynik biznesowy.

To nie jest jeszcze temat dla działu compliance. To temat dla managera, który ma budżet, kilka zespołów i coraz więcej agentów działających równolegle. Jeśli firma nie ustawi limitów tokenów, właścicieli procesów i prostych KPI kosztowych, AI zaczyna działać jak rozproszony wydatek bez centrum kontroli.

Dlaczego AI zjada budżet, zanim ktoś to zauważy

Koszty AI najczęściej nie eksplodują jedną fakturą. Rozchodzą się po subskrypcjach, automatyzacjach i osobnych integracjach API, więc długo wyglądają niegroźnie.

Firmy zwykle nie wdrażają AI jako jednego systemu z budżetem i zasadami użycia. W praktyce dział content bierze własne narzędzie do generowania treści, zespół SDR uruchamia agenta do analizy firm, a marketing performance testuje osobny workflow do raportów i segmentacji. Każde z tych rozwiązań może działać sensownie lokalnie. Problem pojawia się wtedy, gdy nikt nie widzi sumy.

To dlatego rozmowa o AI w marketingu przesuwa się z pytania „czy to działa” na pytanie „ile kosztuje jedna sensowna jednostka wyniku”. Bez tego firma widzi aktywność, ale nie widzi ekonomiki.

Jeśli budżet ma się spinać, AI trzeba traktować jak normalny koszt operacyjny: z limitem, właścicielem i rozliczeniem do procesu.

Ile naprawdę kosztuje jeden agent AI

Jeden agent może kosztować kilkadziesiąt złotych miesięcznie, ale może też szybko wejść w przedział liczony w tysiącach. Decyduje nie samo „AI”, tylko model, długość kontekstu, liczba wywołań i to, czy zespół korzysta z cache.

Poniżej stawki API, które da się potwierdzić na oficjalnych cennikach dostawców na 9 czerwca 2026 roku:

Model	Input / 1M tokenów	Cached input / 1M tokenów	Output / 1M tokenów	Typowe użycie
GPT-4o mini	$0.15	$0.075	$0.60	klasyfikacja, krótkie drafty, routing
GPT-4o	$2.50	$1.25	$10.00	analiza, raporty, bardziej złożone zadania
Claude Haiku 3.5	$0.80	$0.08 przy cache read	$4.00	szybkie zadania, preselekcja, routing
Claude Sonnet 4	$3.00	$0.30 przy cache read	$15.00	prospecting, analiza, agent z większym kontekstem

Źródła: https://developers.openai.com/api/docs/pricing, https://docs.claude.com/en/docs/about-claude/pricing

Dla managera ważniejszy od samej stawki jest jednak przelicznik na realny proces. Jeśli agent do prospectingu przetwarza miesięcznie 3-5 mln tokenów i generuje długie odpowiedzi, koszt samego API może wejść w kilkaset albo kilka tysięcy złotych. Do tego dochodzi koszt narzędzia, które agenta uruchamia, oraz koszt błędów: niepotrzebnych iteracji, zbyt szerokiego kontekstu i złego doboru modelu.

W praktyce najbardziej boli nie to, że modele są drogie. Najbardziej boli to, że zespół uruchamia zadanie klasy „mini” na modelu klasy „premium”, a nikt tego nie zatrzymuje.

Cztery pułapki, przez które koszty AI rosną za szybko

Nieplanowane wydatki na AI zwykle nie biorą się z jednej złej decyzji. Najczęściej są skutkiem kilku powtarzalnych wzorców.

1. Za długi kontekst

Agent dostaje przy każdym wywołaniu tę samą instrukcję systemową, ten sam opis produktu, te same reguły formatowania i tę samą bazę wiedzy. Jeśli część zmienna zajmuje 200 tokenów, a część stała 20-30 tys. tokenów, firma płaci głównie za tło, nie za właściwe zadanie.

2. Duplikowanie podobnych agentów

Marketing, sprzedaż i produkt potrafią równolegle budować bardzo podobne procesy: analizę firm, scoring leadów, podsumowania rozmów, generowanie szkiców wiadomości. Każdy przypadek osobno wydaje się uzasadniony, ale łącznie oznacza powtarzalny koszt bez wspólnej kontroli.

3. Niewykorzystany cache

OpenAI i Anthropic nie traktują dziś cache jako dodatku, tylko jako realną warstwę kosztową. OpenAI pokazuje osobną stawkę dla cached input na stronie cenowej, a Anthropic rozdziela standardowy input, cache write i cache read. Przy Anthropic cache read kosztuje 0.1x ceny bazowego inputu, czyli 90% mniej niż zwykłe wejście. Źródła: https://developers.openai.com/api/docs/pricing, https://docs.claude.com/en/docs/about-claude/pricing

4. Brak limitu na wywołania i koszt

Najdroższy agent to często nie ten najbardziej ambitny, tylko ten bez warunku stopu. Jedna zapętlona automatyzacja albo zbyt liberalny retry potrafią wygenerować koszt, którego nikt nie zobaczy do momentu rozliczenia.

Jak ustawić limity tokenów bez blokowania pracy zespołu

Najskuteczniejszy model kontroli kosztów nie polega na ręcznym sprawdzaniu faktur. Polega na ustawieniu limitów i alertów tam, gdzie koszt powstaje.

Pierwsza warstwa to limit na agenta albo proces. Każdy agent powinien mieć własny identyfikator kosztowy: osobny klucz, projekt, workspace albo metadane. Dzięki temu da się zobaczyć, ile kosztuje prospecting, ile scoring, a ile generowanie treści.

Druga warstwa to limit na użytkownika albo zespół. To szczególnie ważne wtedy, gdy kilka osób korzysta z jednej bramki LLM albo jednego narzędzia wewnętrznego.

Trzecia warstwa to alerty przed przekroczeniem budżetu, a nie dopiero po fakcie. Manager nie potrzebuje od razu twardego stopu wszędzie. Często wystarczy próg ostrzegawczy przy 70-80% planu i dopiero później blokada.

Na poziomie narzędzi wygląda to dziś dość konkretnie:

LiteLLM opisuje proxy jako warstwę do śledzenia kosztów i ustawiania budżetów per project oraz spend management per project/user: https://docs.litellm.ai/
Helicone wspiera rate limiting globalny, per-user i per-property, także w oparciu o koszt: https://docs.helicone.ai/features/advanced-usage/custom-rate-limits
Azure OpenAI opiera quota management na TPM i RPM per region, per subscription i per model/deployment type: https://learn.microsoft.com/en-us/azure/foundry/openai/quotas-limits
Anthropic udostępnia usage tracking w Console, a w Admin API raporty grupowane m.in. po modelu, workspace i API key: https://docs.claude.com/en/docs/about-claude/pricing oraz https://docs.anthropic.com/zh-CN/api/admin-api/usage-cost/get-messages-usage-report

Ważne zastrzeżenie: te rozwiązania nie są równie „bezklikowe”. Część da się wdrożyć z poziomu panelu, a część wymaga lekkiej konfiguracji gatewaya lub nagłówków metadanych. Ale to nadal jest prostsze niż ręczne rozbijanie kosztów po fakturach i arkuszach.

Jakie KPI mają sens przy kosztach AI

Jeśli zespół raportuje tylko wzrost produktywności, to nadal nie wiadomo, czy AI poprawia ekonomię procesu. Potrzebne są dwa proste KPI kosztowe.

Koszt na jednostkę wyniku

Ile kosztuje wygenerowanie jednej wiadomości, jednego scoringu, jednego podsumowania rozmowy albo jednej analizy firmy? To podstawowy wskaźnik, bo pozwala porównać AI z poprzednim procesem ręcznym albo z tańszym modelem.

Koszt na wynik kwalifikowany

Nie każda aktywność wygenerowana przez agenta ma wartość biznesową. Jeśli agent produkuje 500 kontaktów, ale tylko 50 trafia w ICP, koszt trzeba liczyć do tych 50, nie do całej aktywności.

Najprostsza tabela do pierwszego przeglądu może wyglądać tak:

Metryka	Przykład
Liczba wyników miesięcznie	500 wiadomości
Koszt API	900 zł
Koszt narzędzia	300 zł
Łączny koszt AI	1200 zł
Koszt poprzedniego procesu	3000 zł
Oszczędność	1800 zł
Zwrot względem poprzedniego procesu	dodatni

Taki model nie daje jeszcze pełnego ROI. Daje jednak coś ważniejszego na start: wspólny język do rozmowy między marketingiem, sprzedażą i finansami.

Audyt budżetu AI w czterech krokach

Pierwszy sensowny audyt kosztów AI da się zrobić bez dużego projektu. Trzeba tylko przestać patrzeć na narzędzia osobno.

Krok 1: spisz wszystkie źródła kosztu

Lista powinna objąć subskrypcje, klucze API, automatyzacje, workflow w Make albo n8n, integracje z CRM i wszystkie wewnętrzne narzędzia, które wywołują modele w tle.

Krok 2: sprawdź usage po dostawcy i po procesie

Sama suma z faktury nie wystarczy. Trzeba zobaczyć, które procesy wygenerowały koszt: content, prospecting, klasyfikacja, raportowanie, czat wewnętrzny, agent sprzedażowy.

Krok 3: znajdź miejsca bez limitu

To zwykle najszybsza wygrana. Jeśli agent nie ma limitu kosztu, limitu wywołań albo chociaż alertu, właśnie tam jest największe ryzyko budżetowe.

Krok 4: przypisz właściciela i KPI

Każdy agent powinien mieć właściciela biznesowego. Jeśli firma nie umie odpowiedzieć, kto odpowiada za koszt i wynik konkretnego agenta, to nie ma problemu technicznego. Ma problem zarządczy.

Co już widać w 2026 roku

Najważniejsza zmiana nie polega na tym, że AI jest wszędzie. Polega na tym, że dostawcy i narzędzia infrastrukturalne coraz wyraźniej rozliczają użycie, cache i limity jako osobne elementy ekonomiki.

Po pierwsze, cache staje się standardową częścią cennika, a nie ukrytą optymalizacją. Widać to zarówno u OpenAI, jak i u Anthropic. To ma znaczenie szczególnie tam, gdzie agenty wielokrotnie korzystają z tego samego kontekstu.

Po drugie, quota i rate limiting schodzą niżej do poziomu projektu, użytkownika i właściwości żądania. W praktyce oznacza to, że da się mierzyć koszt nie tylko „na konto”, ale też na kampanię, proces albo osobę.

Po trzecie, różnica między warstwą mini i premium jest dziś operacyjnie ważniejsza niż sama obecność AI w procesie. W wielu zadaniach marketingowych największą oszczędność daje nie rezygnacja z AI, tylko przeniesienie prostych zadań na tańszy model i zostawienie droższego tylko tam, gdzie rzeczywiście daje przewagę.

Podsumowanie

Koszty AI w marketingu nie wymykają się spod kontroli dlatego, że modele są z definicji drogie. Wymykają się wtedy, gdy firma nie łączy kosztu z konkretnym procesem, właścicielem i limitem użycia.

Najprostszy wniosek dla managera jest dziś taki: nie trzeba ograniczać samego użycia AI, tylko wprowadzić zasady jego rozliczania. Osobny koszt na agenta, alert przed przekroczeniem budżetu, sensowny cache i dwa KPI kosztowe dają więcej niż kolejna dyskusja o „produktywności zespołu”.

W 2026 roku przewagę zyskują nie te firmy, które mają najwięcej agentów. Wygrywają te, które wiedzą, ile kosztuje jeden sensowny wynik i potrafią ten koszt obniżać bez psucia jakości.

agenty-ai, ai-governance, budzet-marketingowy, Helicone, koszty-ai, limity-tokenow, LiteLLM, marketing-ai, sprzedaz-ai

Błażej Pianowski

Marketer B2B, twórca serwisu AI Marketing i właściciel agencji B2B Lab.

Wszystkie wpisy autora

AI BRIEF

Raz w tygodniu. Bez hype'u.

Trzy newsy, jedno narzędzie, jeden prompt tygodnia.

OSTATNIO DODANE

Który temat ma szansę na wynik? Połącz Search Console, GA4 i dane konkurencji

Marketing AI

Koszty AI w marketingu: czas na limity tokenów

Koszty AI w marketingu: czas na limity tokenów

Dlaczego AI zjada budżet, zanim ktoś to zauważy

Ile naprawdę kosztuje jeden agent AI

Cztery pułapki, przez które koszty AI rosną za szybko

Jak ustawić limity tokenów bez blokowania pracy zespołu

Jakie KPI mają sens przy kosztach AI

Audyt budżetu AI w czterech krokach

Co już widać w 2026 roku

Podsumowanie

Błażej Pianowski

Raz w tygodniu. Bez hype'u.

Który temat ma szansę na wynik? Połącz Search Console, GA4 i dane konkurencji

Tematy z GSC i GA4 trzeba wybierać pod sprzedaż, nie tylko ruch

Najpierw opisz proces leadów. Dopiero potem buduj automat w n8n

Przykładowe skille

Podobne artykuły

Koszty AI w marketingu: czas na limity tokenów

Koszty AI w marketingu: czas na limity tokenów

Dlaczego AI zjada budżet, zanim ktoś to zauważy

Ile naprawdę kosztuje jeden agent AI

Cztery pułapki, przez które koszty AI rosną za szybko

Jak ustawić limity tokenów bez blokowania pracy zespołu

Jakie KPI mają sens przy kosztach AI

Audyt budżetu AI w czterech krokach

Co już widać w 2026 roku

Podsumowanie

Błażej Pianowski

Raz w tygodniu. Bez hype'u.

Który temat ma szansę na wynik? Połącz Search Console, GA4 i dane konkurencji

Tematy z GSC i GA4 trzeba wybierać pod sprzedaż, nie tylko ruch

Najpierw opisz proces leadów. Dopiero potem buduj automat w n8n

Przykładowe skille

Podobne artykuły

Który temat ma szansę na wynik? Połącz Search Console, GA4 i dane konkurencji

Tematy z GSC i GA4 trzeba wybierać pod sprzedaż, nie tylko ruch

Newsletter, który w 5 minut oszczędzi Ci tydzień.

Dołącz do AI Brief