GitHub CopilotAI CodingAgentic DevelopmentKoszty

4 agenty × 8 godzin = 80 dolarów dziennie.
Dlaczego GitHub Copilot stał się ciężkim wyborem

Opublikowano · 8 min czytania · Tomasz Dłuski

Myśleliśmy, że rozumiemy ekonomię developmentu wspomaganego AI. Dla jednej osoby uruchamiającej cztery agenty równolegle, osiem godzin dziennie - pisząc prawdziwy produkcyjny kod i długie artykuły techniczne - rachunek poszedł z przewidywalnych ~700 dolarów miesięcznie na 80 dolarów każdego dnia. Sam workflow się nie zmienił. Zmieniła się tylko cena. To historia tego, co się zepsuło - i dlaczego wciąż szukamy modelu, który działa przy takiej intensywności.

1. Dzień za 80 dolarów, który kazał nam się zatrzymać

Płaciliśmy za GitHub Copilot Business i było nam z tym wygodnie. Kwota była przewidywalna - około 700 dolarów miesięcznie. Spokojna. Łatwo ją było uzasadnić. Workflow był już wtedy ciężki: jedna osoba uruchamiała cztery agenty równolegle, przez pełne osiem godzin dziennie. Jeden agent implementacja, drugi testy i refaktoryzacja, trzeci zamieniał pracę w długie artykuły techniczne, czwarty research i spikes. To był normalny tryb pracy.

Nic w procesie się nie zmieniło. Nadal robiliśmy dokładnie ten sam setup czterech agentów równolegle dla jednej osoby. Zmieniło się tylko to, ile ten workflow nagle zaczął kosztować.

Kiedy po raz pierwszy zobaczyliśmy dzienny koszt rzędu 80 dolarów, założyliśmy, że to błąd. Nie był. Przy takim tempie wychodziło około 2000 dolarów miesięcznie tylko na warstwę AI coding - zanim jeszcze zapłacimy ludziom.

Szybka matematyka na serwetce: 80 dolarów/dzień × ~22 dni robocze = 1760 dolarów/miesiąc. To 2,5 raza więcej niż budżetowaliśmy na „nielimitowaną” pomoc AI. A dopiero rozkręcaliśmy intensywność.

Najgorsze nie była nawet sama kwota. Najgorsze było to, że workflow, do którego już dawno przeszliśmy - cztery agenty mielące równolegle dla jednej osoby - nagle przestał być ekonomicznie sensowny. Ta sama intensywność pracy, która kiedyś mieściła się w stałej subskrypcji, teraz spalała 80 dolarów dziennie.

2. Jak wyglądało „agentyczne kodowanie” w praktyce

To nie był jeden programista, który od czasu do czasu prosił Copilota o dokończenie funkcji. To była świadoma próba pomnożenia outputu.

Ale najwięcej zżerała analiza cross-cutting concerns przez wiele plików w dużych codebase'ach.

Uruchamialiśmy wiele niezależnych sesji (różne modele, różne narzędzia, czasem różne maszyny) i rzucaliśmy je na kawałki tego samego projektu. Jeden agent implementował funkcję według specyfikacji. Drugi od razu zaczynał pisać testy i łapać edge case'y. Trzeci zamieniał to w długi artykuł - taki 2000-4000 słów o rozszerzeniach przeglądarki i CRXJS, jakie publikujemy.

Pisanie tych przewodników po extensionach z ciężką pomocą AI jest zresztą jednym z rzeczy, które najbardziej windowały zużycie. Model nie tylko dopisywał linię - musiał trzymać cały model mentalny Manifest V3, pułapki Shadow DOM, wnętrzności CRXJS, prawdziwe wzorce produkcyjne z 100+ wypuszczonych wersji i zamieniać to w spójny, czytelny, lekko clickbaitowy tekst.

Za każdym razem, kiedy agent musiał „pomyśleć”, generował tokeny. Za każdym razem, kiedy używał narzędzi, przeszukiwał kontekst albo iterował po złym wyniku - kolejne tokeny. Cztery takie rzeczy przez osiem godzin to zupełnie inny profil zużycia niż czterech programistów, którzy tylko lekko tab-completują.

3. Matematyka, której nikt nie chce pokazywać

Niewygodna prawda jest taka, że większość publicznych dyskusji o narzędziach AI do kodowania nadal operuje w kategoriach anegdot „10× developer” i stałych miesięcznych opłat. Rzeczywistość intensywnego użycia agentów wygląda bardziej tak:

Przed (ten sam workflow, stała cena)

Jedna osoba. Cztery agenty uruchomione jednocześnie. Osiem godzin dziennie. Pisanie produkcyjnego kodu + testów + długich artykułów technicznych. Dokładnie ten wzorzec użytkowania był pokryty przez subskrypcję GitHub Copilot Business za ~700 dolarów miesięcznie. Drogo, ale do przeżycia.

Po (ten sam workflow, nowa cena)

Identyczny setup - jedna osoba, cztery agenty równolegle, cały dzień pracy - teraz kosztuje 70-85 dolarów dziennie. Niektóre dni wyżej, kiedy konteksty zostają duże i agenty robią wieloetapowe planowanie oraz pętle weryfikacji. Dzienna stawka spalania stała się jedyną liczbą, która się liczyła.

To jest na jedną osobę. Nie jesteśmy wielką korporacją. Jesteśmy małym, skupionym zespołem, który shippuje rozszerzenia przeglądarki, narzędzia wewnętrzne i czasem infrastrukturę (jesteśmy kontrybutorami CRXJS, wtyczki Vite, która napędza sporo nowoczesnego developmentu extensionów). Kiedy uruchomienie jednej osoby na pełnej intensywności agentycznej zaczyna wyglądać jak kolejny pełny etat tylko na AI, model trzeba na nowo przemyśleć.

Obietnica brzmiała zawsze „płać stałą kwotę, zyskaj ogromną dźwignię”. Wyłaniająca się rzeczywistość dla każdego, kto naprawdę pcha agentyczny model pracy, brzmi „płać za każdy token, który pochłania rój, kiedy jest użyteczny”.

4. Dlaczego równoległe agenty rozwalały założenia o stałej cenie

Pojedynczy senior używający Copilota tylko do lekkiego autouzupełniania generuje pewien poziom ruchu. Ten sam programista uruchamiający cztery agenty równolegle - ciągle czytające duże fragmenty codebase'u, piszące plany, wykonujące kroki, weryfikujące output, a potem piszące dokumentację i artykuły na bloga - to zupełnie inny profil obciążenia. I to był już nasz standard.

Workflow agentyczne kochają kontekst. Kochają iterowanie. Kochają wywoływanie narzędzi i rozumowanie nad wynikami. Wszystko to jest niesamowicie wartościowe, kiedy działa - i niesamowicie drogie, kiedy model cenowy ma jeszcze jedną nogę w erze „sprytnego autouzupełniania”.

GitHub Copilot (w momencie pisania tego tekstu) nadal mocno sprzedaje się na idei, że możesz używać go ile chcesz w ramach planu. Przy normalnych ludzkich wzorcach użytkowania to w dużej mierze prawda. Przy jednej osobie uruchamiającej cztery agenty mielące osiem godzin dziennie definicja „normalnego” już nie obowiązuje - mimo że to był już nasz ustalony sposób pracy.

Nie zaczęliśmy nagle pracować ciężej. Robiliśmy dokładnie to samo co wcześniej. Tylko ekonomia pod nami się posypała.

5. Nie sprzedajemy tu żadnego rozwiązania

Ten post jest celowo ubogi w rekomendacje. Nie jesteśmy firmą od narzędzi AI do kodowania. Nie mamy modelu, który chcemy Ci wcisnąć. Budujemy rozszerzenia przeglądarki, kontrybuujemy do open source'u (CRXJS) i realizujemy projekty dla klientów. Narzędzia AI są dla nas infrastrukturą, nie produktem.

Wciąż aktywnie szukamy zrównoważonego sposobu na prowadzenie tego poziomu pracy agentycznej, bez tego, żeby dzienny koszt spalał sens całego przedsięwzięcia. Próbowaliśmy różnych kombinacji modeli, różnych setupów lokalnych, różnego batchowania pracy, różnych strategii promptowania, które zmniejszają liczbę rund. Niektóre rzeczy pomagają. Nic jeszcze w pełni tego nie rozwiązało.

Jeśli jesteś w podobnym miejscu - uruchamiasz ciężkie, równoległe sesje AI coding i patrzysz, jak koszty rosną szybciej niż wartość outputu - nie mamy dla Ciebie magicznego linku. Tylko liczby i szczere przyznanie, że my też wciąż to ogarniamy.

Jedyne, w czym jesteśmy w miarę pewni, to że obecna generacja agentycznego cennika opartego na zużyciu wygeneruje jeszcze sporo takich historii, kiedy więcej zespołów przejdzie z „autouzupełniania, które czasem pogada” do prawdziwych workflow multi-agent.

6. Co to oznacza, jeśli obecnie shippujesz z AI

Jeśli jesteś solo founderem albo małym zespołem i traktujesz agentów AI jak mnożniki siły, policz matematykę wcześnie. Śledź rzeczywiste dzienne wydatki przy Twoim prawdziwym workflow, a nie przy optymistycznym scenariuszu „będziemy używać trochę więcej”.

Dźwignia jest realna. Zshippowaliśmy rzeczy szybciej, zbadaliśmy więcej pomysłów i napisaliśmy więcej (i lepszego) długiego contentu technicznego, niż dalibyśmy radę bez dzisiejszych narzędzi. Artykuły związane z CRXJS, głębokie nurkowania w architekturę extensionów, case studies - niemała część tego wolumenu i jakości powstała dzięki temu, że mieliśmy partnerów AI, którzy mogli trzymać kontekst na tysiącach linii, podczas gdy my sterowaliśmy kierunkiem.

Ale dźwignia bez zrównoważonej ekonomii jednostkowej to tylko drogi teatr. W pewnym momencie pytanie przestaje brzmieć „jak bardzo możemy przyspieszyć?” a zaczyna brzmieć „czy stać nas na takie tempo?”.

Będziemy dalej eksperymentować. Różne kombinacje narzędzi, większe wykorzystanie modeli lokalnych do niektórych zadań, bardziej zdyscyplinowane określanie, co naprawdę wymaga dużych modeli granicznych, a co da radę ogarnąć mniejsze, tańsze albo self-hostowane. Jeśli trafimy na coś, co będzie stabilne i przewidywalne, być może o tym napiszemy. Na razie to raport z pola z środka eksperymentu.

Powiązane artykuły

Też walczysz z podobnymi kosztami narzędzi AI?

Nie mamy jeszcze wszystkich odpowiedzi, ale jesteśmy głęboko w tych samych eksperymentach. Jeśli budujesz prawdziwe oprogramowanie (szczególnie rozszerzenia przeglądarki albo narzędzia automatyzacji) i chcesz porównać notatki - daj znać.

Kto za tym stoi

Tomasz Dłuski

Tomasz Dłuski

Założyciel & CEO

Senior Software Engineer z 10+ letnim doświadczeniem. W poprzedniej firmie był częścią firmy, która wyskalowała się z 5 do 50+ inżynierów. Teraz buduje Optymized — firmę, która łączy doświadczenie w dostarczaniu projektów enterprise z własnymi produktami SaaS. Maintainer CRXJS (3.9k stars na GitHubie), jednego z najpopularniejszych narzędzi do budowy rozszerzeń przeglądarek.

Porozmawiajmy o Twoim projekcie

Potrzebujesz rozszerzenia do przeglądarki, dedykowanego zespołu, czy konsultacji technicznej? Znajdźmy najlepsze podejście razem.

lub napisz do nas