LLM 1 lipca 2026

Claude Sonnet 5: nowy model AI od Anthropic — co zmienia się dla firm B2B?

Phoebe
Phoebe 1 lipca 2026
Claude Sonnet 5: nowy model AI od Anthropic — co zmienia się dla firm B2B?

Claude Sonnet 5: nowy model AI od Anthropic — co zmienia się dla firm B2B?

30 czerwca 2026 Anthropic wypuściło Claude Sonnet 5 — następcę Sonnet 4.6. Dla developera to kolejny wpis w changelogu. Dla Ciebie, jeśli zastanawiasz się nad wdrożeniem AI w firmie, to moment, żeby sprawdzić, czy narzędzie w końcu dogoniło to, co obiecywano od dwóch lat: samodzielną pracę na realnych zadaniach, a nie tylko generowanie tekstu na żądanie.

Krótko: model jest wyraźnie lepszy od poprzednika w planowaniu, korzystaniu z narzędzi i pracy wymagającej wielu kroków. Anthropic porównuje go do własnego topowego modelu Opus 4.8 — i wypada blisko, przy znacznie niższej cenie. Nie porównuje go za to do konkurencji (ChatGPT, Gemini) — tego w ogłoszeniu po prostu nie ma.

Poniżej rozkładam to na czynniki, które faktycznie mają znaczenie biznesowe: koszt, zastosowania, bezpieczeństwo i dostępność.

Co nowego w skrócie — bez żargonu

Zapomnij o benchmarkach na chwilę. Praktyczna różnica jest taka: Sonnet 5 lepiej radzi sobie z zadaniami, które trwają dłużej niż jedno pytanie-odpowiedź.

Model potrafi:

  • Planować wieloetapowo — rozbić duże zadanie na kroki i trzymać się planu, zamiast gubić wątek w połowie.
  • Samodzielnie korzystać z narzędzi — przeglądarki, terminala, systemów firmowych — żeby dokończyć zadanie bez podpowiadania każdego kroku.
  • Działać dłużej bez nadzoru — Anthropic podkreśla, że model „utrzymuje” złożone zadania techniczne w bałaganiarskim, realnym kontekście, a nie tylko w laboratoryjnych warunkach.

Twarde liczby są tu akurat mniej jednoznaczne, niż mogłoby się wydawać: konkretne wyniki podane wprost w tekście ogłoszenia (Humanity’s Last Exam — 34,6% bez narzędzi, 46,8% z narzędziami; OSWorld-Verified — 78,5%) dotyczą poprzednika, Sonnet 4.6, nie samego Sonnet 5. Wyniki nowego modelu na tych samych testach Anthropic pokazało tylko na wykresach, bez liczby podanej słownie — więc nie ma się do czego rzetelnie odnieść, jeśli chodzi o konkretny procent dla Sonnet 5.

Jeden szczegół wart odnotowania po drugiej stronie: w teście Exploit Development (na przykładzie przeglądarki Firefox 147) model nie wygenerował ani jednego pełnego, działającego exploita — 0,0%. To dobra wiadomość, jeśli martwi Cię, że mocniejszy model AI to też mocniejsze narzędzie w złych rękach.

Czego nie ma w ogłoszeniu: żadnych danych o SWE-bench (popularny benchmark programistyczny) — Anthropic go po prostu nie podało, więc nie ma się do czego odnieść.

Ile to kosztuje i czy warto wdrażać teraz

To pytanie, które realnie decyduje o budżecie na AI w firmie. Krótka odpowiedź: teraz jest taniej niż będzie za dwa miesiące.

Okres Input (za milion tokenów) Output (za milion tokenów)
Cena wprowadzająca (do 31.08.2026) 2 USD 10 USD
Cena docelowa (od 1.09.2026) 3 USD 15 USD

Dla porównania: mocniejszy model Opus 4.8 kosztuje 5 USD za input i 25 USD za output — czyli Sonnet 5 nawet po podwyżce zostaje wyraźnie tańszą opcją.

Jest jednak zastrzeżenie, które łatwo przeoczyć: Anthropic zmienił tokenizer (mechanizm dzielący tekst na jednostki rozliczeniowe). Ten sam kawałek tekstu w Sonnet 5 to od 1,0 do 1,35 razy więcej tokenów niż wcześniej. Innymi słowy — możesz zapłacić więcej za to samo zapytanie, nawet przy niezmienionej stawce za token. Anthropic twierdzi, że niższa cena wprowadzająca ma to zbilansować („roughly cost-neutral”) — w praktyce oznacza to, że efektywny koszt powinien zostać podobny do Sonnet 4.6, przynajmniej do końca sierpnia.

Co to oznacza praktycznie: jeśli planujesz test lub pilotaż, okno do 31 sierpnia 2026 to najlepszy moment na start — płacisz stawkę wprowadzającą, a dłuższy tokenizer jest nią zrekompensowany. Po tej dacie koszt wzrośnie o 50% na papierze, choć realny wzrost obciążenia zależy od tego, jak bardzo Twoje zapytania „napęczniały” przez nowy tokenizer.

Nowość, która pomaga kontrolować budżet: effort levels — możesz regulować balans między kosztem a jakością odpowiedzi w zależności od zadania. Proste zapytanie nie musi kosztować tyle, co złożona analiza.

Konkretne zastosowania biznesowe

Anthropic opublikowało cytaty partnerów, którzy testowali model przed premierą. To nie marketing w próżni — to opisy realnych zastosowań, które warto przełożyć na Twoją branżę.

Programowanie i przegląd kodu. Zimu Li opisuje, że model „dobrze radzi sobie z długotrwałym kodowaniem, korzystaniem z narzędzi i debugowaniem w bałaganiarskich, technicznych kontekstach” — czyli tam, gdzie wcześniej model gubił się po kilku krokach. Neel Chotai dodaje konkretny przykład: model bez podpowiedzi napisał test odtwarzający błąd i wdrożył poprawkę. Yusuke Kaji potwierdza podobne doświadczenie — model doprowadził każde zadanie do przetestowanego, zweryfikowanego rezultatu samodzielnie.

Dla firmy oznacza to mniej godzin senior developera spędzonych na code review i debugowaniu rutynowych problemów.

Automatyzacja procesów biznesowych. Daniel Shepard komentuje wprost: „To wcześniej się zacinało w połowie. Do codziennej automatyzacji to oczywisty wybór.” Mowa o zadaniach typu aktualizacje w Salesforce czy komunikacja z klientami enterprise — czyli powtarzalna praca administracyjna, która pochłania czas zespołu.

Analiza danych na żywo, prawo, ubezpieczenia. Wśród zastosowań wymienianych przez partnerów: bieżąca analiza danych, research prawny oraz procesy ubezpieczeniowe — intake klienta, zgłoszenia szkód (FNOL) i przegląd historii szkodowości (loss runs). To obszary, gdzie dokumentacja jest nieustrukturyzowana, a AI ma pomagać w wyciąganiu sensu z bałaganu, nie tylko odpowiadać na proste pytania.

Fabian Hedin zwraca uwagę na coś, co często umyka w dyskusjach o AI: „Model, który wie, kiedy powiedzieć nie, jest tak samo ważny jak taki, który wie, jak coś zbudować.” Dla firmy wdrażającej agenta z dostępem do systemów to bardzo praktyczna uwaga — chcesz narzędzia, które rozpoznaje granice zadania, a nie generuje odpowiedź za wszelką cenę.

Bezpieczeństwo — istotne, jeśli dajesz AI dostęp do systemów

Jeśli planujesz agenta AI z dostępem do CRM-u, poczty czy wewnętrznych narzędzi, to nie jest sekcja do pominięcia.

Anthropic deklaruje niższą stopę niepożądanych zachowań w Sonnet 5 niż w Sonnet 4.6, oraz że model jest bezpieczniejszy w kontekstach agentowych — czyli tam, gdzie działa samodzielnie, wykonując kolejne kroki bez nadzoru człowieka przy każdym z nich.

Jednocześnie model ma celowo niższą zdolność do zadań związanych z cyberbezpieczeństwem niż Opus — potwierdza to zresztą wynik 0,0% w teście Exploit Development wspomniany wyżej. Domyślnie włączone są też zabezpieczenia cybernetyczne (cyber safeguards).

Praktyczny wniosek: model jest projektowany z myślą o bezpiecznym działaniu autonomicznym, ale to nie zwalnia Cię z ustawienia właściwych uprawnień i monitoringu po stronie firmy — szczególnie przy dostępie do systemów z danymi klientów.

Gdzie dostępny

Claude Sonnet 5 jest dostępny od razu na wszystkich planach — Free, Pro, Max, Team i Enterprise — i jest domyślnym modelem dla kont Free i Pro.

Znajdziesz go w:

  • Claude.ai (interfejs czatu)
  • Claude Code (środowisko do pracy z kodem)
  • Claude Platform / API (integracje własne)

Pod względem infrastruktury chmurowej model działa natywnie u Anthropic, a także przez AWS i Microsoft Foundry. Google Vertex AI ma dostęp „wkrótce” (coming soon) — jeśli Twoja firma jest mocno osadzona w ekosystemie Google Cloud, to jedyny punkt, na który warto poczekać przed pełnym wdrożeniem.

Co to oznacza dla Twojej firmy

Sonnet 5 to nie kolejna aktualizacja czatbota — to model wyraźnie celowany w zadania, które do tej pory wymagały człowieka pilnującego każdego kroku: wieloetapowe procesy, praca z dokumentacją, automatyzacja w systemach, których używasz na co dzień. Cena wprowadzająca do 31 sierpnia to konkretne okno czasowe na przetestowanie, zanim stawki wzrosną.

Pytanie, które warto sobie zadać, nie brzmi „czy wdrożyć AI”, tylko „które z naszych powtarzalnych, wieloetapowych procesów nadają się do automatyzacji już teraz”. Jeśli nie wiesz, od czego zacząć — audyt procesów pod kątem automatyzacji AI to dokładnie to, czym zajmuje się B2B Solution. Chętnie pokażemy, gdzie w Twojej firmie taki model realnie odciąży zespół, zamiast dokładać kolejne narzędzie do stosu, którego nikt nie używa.


Phoebe

O autorze: Phoebe

Cześć od ponad 3 lat zasuwam i tworzę content na potrzeby nasze i naszych klientów. Oprócz tego 24/7 wertuję internet we wszystkich językach po to by przygotować czytelną treść dla Ciebie. Staram się być przy tym bardzo skrupulatna, ale ze znaną mi sporą dozą humoru i czasem oderwania od rzeczywistości. W tzw. międzyczasie korzystając z ElevenLabs śpiewam wszystkim 'Smelly Cat 🐈'. Także Enjoy your silent 😁