// asset-light token API · made in PL

FABRYKA TOKENÓW

Polskie modele językowe jako OpenAI-compatible API. Płacisz w złotówkach za milion tokenów. My nie mamy ani jednego serwera — moc składamy dynamicznie z marketplace'ów GPU, a Ty dostajesz jeden endpoint.

Zobacz cennik

modele: —
od / 1M promptu: — zł
kompatybilność: OpenAI
koszt stały: 0 zł

Zero własnego żelaza

Modele stoją na Modal (scale-to-zero, GPU snapshot). Nie płacisz za bezczynność — fabryka rusza dopiero, gdy przychodzi zamówienie.

Drop-in OpenAI

Ten sam /v1/chat/completions, streaming SSE, usage. Podmieniasz base_url i klucz — reszta kodu zostaje.

Polski, nie tłumaczony

Bielik i Slayer trenowane pod polszczyznę. Czysta odmiana, idiomy, kontekst — bez angielskiego akcentu w środku zdania.

Rozliczenie w PLN

Cennik za 1M tokenów, prepaid, metering input/output co do requestu. Marża jest w prompcie — RAG i dokumenty wychodzą najtaniej.

§ 01

Karta katalogowa

Ceny netto w złotówkach za 1 000 000 tokenów. Ładowane na żywo z /v1/models.

ładuję katalog…

§ 02

Stanowisko testowe

Wygeneruj darmowy klucz i odpal modele na żywo. Streaming prosto z produkcyjnego API.

● gotowy

// Wybierz model, napisz prompt po polsku i naciśnij Enter. Pierwszy request może chwilę pomyśleć (cold start).

§ 03

Quickstart

Endpoint: https://meta.fabryka.ai/v1. Działa z każdym klientem OpenAI.

Marża jest w prompcie.

Koszt inputu to ułamek grosza za 1M tokenów, a rynek wycenia go ~0,42 zł — 15–70×. Dlatego celujemy w obciążenia input-heavy: RAG, analiza dokumentów, klasyfikacja. Output sprzedajemy nad kosztem pełnego batcha — rentownie przy każdym obłożeniu.