Zero własnego żelaza
Modele stoją na Modal (scale-to-zero, GPU snapshot). Nie płacisz za bezczynność — fabryka rusza dopiero, gdy przychodzi zamówienie.
// asset-light token API · made in PL
Polskie modele językowe jako OpenAI-compatible API. Płacisz w złotówkach za milion tokenów. My nie mamy ani jednego serwera — moc składamy dynamicznie z marketplace'ów GPU, a Ty dostajesz jeden endpoint.
Modele stoją na Modal (scale-to-zero, GPU snapshot). Nie płacisz za bezczynność — fabryka rusza dopiero, gdy przychodzi zamówienie.
Ten sam /v1/chat/completions, streaming SSE, usage. Podmieniasz base_url i klucz — reszta kodu zostaje.
Bielik i Slayer trenowane pod polszczyznę. Czysta odmiana, idiomy, kontekst — bez angielskiego akcentu w środku zdania.
Cennik za 1M tokenów, prepaid, metering input/output co do requestu. Marża jest w prompcie — RAG i dokumenty wychodzą najtaniej.
Ceny netto w złotówkach za 1 000 000 tokenów. Ładowane na żywo z /v1/models.
Wygeneruj darmowy klucz i odpal modele na żywo. Streaming prosto z produkcyjnego API.
Endpoint: https://meta.fabryka.ai/v1. Działa z każdym klientem OpenAI.
Marża jest w prompcie.
Koszt inputu to ułamek grosza za 1M tokenów, a rynek wycenia go ~0,42 zł — 15–70×. Dlatego celujemy w obciążenia input-heavy: RAG, analiza dokumentów, klasyfikacja. Output sprzedajemy nad kosztem pełnego batcha — rentownie przy każdym obłożeniu.