Jak zatrudnić AI Engineers w Polsce w 2026 (i co naprawdę znaczy "AI engineer")

Chief Scientist OpenAI jest Polakiem. Tak samo jeden ze współzałożycieli. Szef MIT Center for Deployable Machine Learning jest Polakiem, a do zeszłego roku był też szefem bezpieczeństwa w OpenAI. Założyciele ElevenLabs, firmy voice-AI, która w lutym zamknęła rundę Series D na 11 miliardów dolarów, są Polakami.
To, co następuje, to playbook rekrutacyjny, który sami chcieliśmy dostać do ręki w 2019: jak zatrudniać z sieci, która tych ludzi wydała, nie spalając przy tym kwartału kosztów płacowych. Skąd faktycznie pochodzi talent. Jak odróżnić prawdziwego AI engineera od kogoś, kto puścił kilka demek LangChain. Co budżetować. Kiedy zatrudnienie, do którego się szykujesz, nie jest tym, którego naprawdę potrzebujesz.
Jeśli masz już ogarnięty taksonomię ról (czym AI engineer różni się od ML engineera i od data scientista), w zeszłym roku napisaliśmy pełny przewodnik na ten temat. Nie czytaj go ponownie. Ten tekst zakłada, że z grubsza wiesz, jakiego kształtu szukasz, i chcesz wiedzieć, jak to faktycznie zatrudnić.
"AI engineer" to siedem zawodów, nie jeden
Największy hiring mistake w 2026 to tytuł stanowiska. "AI engineer" może oznaczać dowolne z: AI Engineer, Applied AI Engineer, GenAI Engineer, LLM Engineer, Prompt Engineer, RAG Engineer, AI Software Engineer. Praca jest z grubsza nie do odróżnienia. Wynagrodzenie i oczekiwania już tak.
Jeśli kiedyś zastanawiałeś się, dlaczego dwóch kandydatów z identyczną historią na GitHubie podaje stawki różniące się o 40%, to jest powód. Tytuł jest pochodną pytania.
Pełną taksonomię ról omówiliśmy w zeszłorocznym tekście: sześć kategorii, argument, że prompt-engineering to skill, a nie rola, aliasy tytułów prompt/GenAI/GPT. Zamiast to powtarzać, oto co liczy się dla samego zatrudnienia: większość firm w USA i UK, które proszą o "AI engineera", chce jednego z trzech konkretnych zawodów.
Chcesz LLM application engineera, jeśli twoim problemem jest "mamy produkt, chcemy dodać funkcjonalność wykorzystującą LLM". Czyli RAG pipelines, agent loops, eval harnesses, prompt-iteration, cały stack rocznika 2025. Z grubsza 80% zatrudnień "AI engineer" to ten przypadek.
Chcesz applied ML engineera, jeśli twoim problemem jest "mamy model, który trzeba wytrenować lub fine-tuneować na naszych danych". Inna osoba. Mocniejszy PyTorch, słabszy odruch LangChainowy.
Chcesz ML infrastructure engineera, jeśli twoim problemem jest "mamy model i nie umiemy go postawić w produkcji". Czyli serving infrastructure, vector DBs, model registries, strona Kubeflow i MLflow. Często źle zatrudniany jako "AI engineer" i rozczarowuje obie strony.
Dane o trendach rynkowych, wg Curioz.io (który śledzi polskie ogłoszenia IT zestawione z danymi z podpisanych kontraktów), pokazują, że warstwa LLM application engineer rośnie najszybciej. Najdroższe i najtrudniejsze do obsadzenia zatrudnienia pozostają po stronie infra i applied ML. Doprecyzuj pytanie, zanim usiądziesz do pisania ogłoszenia.
Skąd faktycznie pochodzą polscy AI engineerzy
Trzy pipeline'y zasilają polski rynek pracy w AI. Produkują różnych ludzi. Kupujący, którzy nie wiedzą, że istnieją, zatrudniają jedną osobę, mając na myśli drugą.
Pipeline akademicki. Uniwersytet Warszawski, AGH w Krakowie, Politechnika Wrocławska. To uczelnie, na których Jakub Pachocki i Wojciech Zaremba zrobili licencjat, zanim trafili odpowiednio na CMU i NYU. Polska tradycja olimpiad informatycznych to niedoceniany element: Pachocki zdobył srebro na International Olympiad in Informatics w 2009; Zaremba zdobył srebro na International Mathematical Olympiad w 2007. To te zawody są kanałem, którym polski top-tier ML talent identyfikuje samego siebie, zanim w ogóle dotrze na studia.
Ta kohorta publikuje na NeurIPS i ICML. Trenują modele na realnych GPU. ICM na Uniwersytecie Warszawskim prowadzi centrum superkomputerowe z klastrem Okeanos Cray XC40 (ponad 1000 compute nodes), klastrem Topola (ponad 6000 rdzeni CPU) i klastrem GPU Rysy z NVIDIA V100. Większość amerykańskich engineering-buyerów nawet nie wie, że to istnieje. Mamy też IDEAS NCBR, polski narodowy instytut badań nad AI, założony w 2021, mieszczący się w warszawskim Varso Tower. To pierwsza ELLIS Unit w Polsce, europejskiej federacji czołowych labów AI. Jeśli kandydat ma publikację z IDEAS NCBR lub spędził czas w ICM, rozmawiasz z górną częścią krzywej.
Sieć alumni frontier-labów. Senior engineerzy, którzy pracowali w OpenAI, Anthropic, DeepMind, Meta AI lub ElevenLabs i teraz chcą budować coś po europejskiej stronie Atlantyku. Mniejsza pula. Premium stawki. Często tylko z polecenia; ci ludzie nie siedzą na job boardach. Wzorzec ma znaczenie, bo polscy engineerzy są mocno nadreprezentowani we frontier labach: Pachocki, Zaremba czy Mądry w OpenAI; Krzysztof Choromanski (badania nad architekturą transformerów) w Google DeepMind; zespół ML Dąbkowskiego w ElevenLabs. Zatrudniając z tej kohorty, podpinasz się do sieci z wewnętrznymi sygnałami rekrutacyjnymi, które omijają LinkedIn w całości.
Kohorta przekwalifikowanych backendowców. Największa pula wolumenowo, najbardziej niedoceniana i najczęściej trafiona pod rolę LLM application. Senior Python i backend engineerzy, którzy między 2023 a 2025 weszli w AI engineering, przez fast.ai, Neural Networks: Zero to Hero Andreja Karpathy'ego i pracę projektową. Ich LinkedIn brzmi typowo: "Backend Engineer 2019–2023, AI Engineer 2023–now." Kilka danych potwierdza, że ten pipeline jest realny i duży:
- Python to najczęstszy język w polskich ogłoszeniach IT (z grubsza 19% udziału) i to język zarówno backendu, jak i AI/ML. Koszt tranzycji jest niski.
- Polskie ogłoszenia AI wzrosły z grubsza o 100% między 2023 a początkiem 2025, skok, którego sama pula akademicka nie byłaby w stanie obsłużyć. Według wcześniejszej analizy rynkowej Pawła na tym blogu, średnie polskie ogłoszenie AI engineer zamyka się w 23 dni wobec 27 globalnie. Popyt przewyższa podaż z pipeline'u akademickiego; ciąg idzie z sąsiednich puli seniorskiego engineeringu.
- Senior salary premium dla ról AI/ML względem senior backendu tworzy bodziec finansowy, który napędza ten pivot.
Jeśli przesiewasz tych kandydatów po słowach kluczowych w starym tytule stanowiska, ich nie zobaczysz. Jeśli przesiewasz po tym, co dostarczyli w ostatnich 18 miesiącach, znajdziesz jedne z najmocniejszych zatrudnień na rynku.
Co oceniać podczas screeningu
Pięć pytań oddziela prawdziwych AI engineerów od kandydatów, których praktyczne doświadczenie to jeden weekend z LangChain.
1. Pokaż mi evala, którego dowiozłeś do produkcji. Każdy potrafi zbudować demo RAG. Mało kto potrafi zbudować, dowieźć i utrzymywać eval harness, który łapie regresje w produkcji. Poproś o jednego konkretnego evala, który kandydat ownerował: jaką metrykę śledził, jaki był baseline, co się stało, kiedy eval pierwszy raz coś sflagował, co z tym zrobili. Mgliste odpowiedzi oznaczają, że dowozili dema, nie produkty.
2. Gdzie jest budżet kosztu i latencji? Koszty tokenów i latencja inferencji to operacyjna rzeczywistość produktów LLM. Senior AI engineer powinien mieć opinię na temat tego, kiedy streaming jest wymagany, a kiedy batched inference wystarcza, jak agresywnie cache'ować bez zatruwania wyników, kiedy zamienić frontier model na mniejszy hostowany. Polska kohorta jest pod tym względem ostrzejsza niż amerykańskie odpowiedniki. Polskie startupy nie mogą rozwiązywać problemów rzucaniem w nie wydatkami na GPU jak Series B z Bay Area, a inżynieria pod ograniczonym budżetem wytwarza lepszą intuicję kosztową.
3. Fine-tune czy prompt-engineering? Większość kandydatów nadmiernie proponuje fine-tuning, bo brzmi to bardziej imponująco niż prompt-iteration. Seniorska odpowiedź traktuje fine-tuning jako opcję ostatniej szansy: najpierw retrieval, potem prompt-iteration, potem mniejszy hostowany model, a fine-tune dopiero wtedy, kiedy nic z tego nie wystarcza. Ci, którzy najpierw wybierają nudną ścieżkę, to ci, którzy dowożą.
4. Czy wystawiałeś agents na produkcję? Infrastruktura pod agents to differentiator roku 2026. Obsługa błędów tooli, retry policies, observability, dyscyplina evali, która trzyma agents w ryzach. Spytaj o konkretnego agenta, którego dowiózł: jakie toole wołał, jak propagowały się błędy, jaki był najgorszy failure mode w produkcji.
5. Pytanie o upgrade do nowego modelu. Kiedy wychodzi nowy frontier model, co robią? Sygnał seniority jest w procesie: odpalają evale na canary, porównują koszt i latencję, dopiero potem decydują. Każdy, kto odpowiada "wrzucam i patrzę, co się stanie", jedzie na vibes tam, gdzie powinna być dyscyplina evali. To pojedynczy najbardziej wiarygodny sygnał seniority w 2026.
Jeśli już przesiewasz kandydatów AI engineering po tej liście, zobacz, jak pakujemy ten model, zanim umówisz call.
Matematyka stawek: ta sama osoba, różne ceny
Nie podajemy konkretnych liczb PLN-za-godzinę ani dolar-za-godzinę publicznie, bo właściwa liczba zależy od stacku, seniority, długości kontraktu i tego, czy chcesz exclusive time, czy shared. Po aktualne widełki rynkowe odsyłamy do Curioz.io, który kompiluje dane z podpisanych kontraktów z tysięcy polskich engagementów IT miesięcznie. Sami używamy ich feedów wewnętrznie do ustawiania stawek.
Co warto zrozumieć, zanim spojrzysz na jakiekolwiek widełki:
Foundation-model researcherzy kosztują więcej, niż sugerowałyby amerykańskie stawki senior-engineerów. Mogą iść do OpenAI lub Anthropic na role zdalne za six figures w górnej części przedziału — i wiedzą o tym. Jeśli twój problem rzeczywiście potrzebuje tej kohorty, licz się z konkurencją z compensation frontier-labów, nie z normalnymi stawkami nearshore. Większość firm tego nie potrzebuje.
LLM application engineerzy są wyceniani jako senior-engineer plus skromne premium. Premium odzwierciedla fakt, że dowozili modele do produkcji. Jest mniejsze, niż sugerowałby tytuł, bo większość stacku LLM application w 2026 jest dobrze udokumentowana, a przekwalifikowani backendowcy łapią go szybko.
Kohorta przekwalifikowanych backendowców to najbardziej niedoceniana warstwa rynku. Ich LinkedIn wciąż pokazuje "backend" przed "AI", a rynek wycenia ich odpowiednio. Ale jeśli dowożą LLM features od 18 miesięcy, płacisz stawki senior-Python za senior-AI capability. To miejsce, w którym wygrywają kupujący przesiewający po umiejętnościach, nie po tytule.
Data engineerzy, którzy przemianowali się na "AI engineer", są wyceniani jak AI engineers. Tutaj kupujący tracą pieniądze. Przesiewaj po tym, co dowieźli, nie po nagłówku na LinkedIn.
Zatrudnianie ślepe na rozróżnienie kohort to dokładnie sposób, w jaki budżety eksplodują. Kotwiczenie na widełkach z podpisanych kontraktów z Curioz.io, a nie na tym, co odpowiada LLM, kiedy go zapytasz, to pojedynczy największy ruch ochrony kosztów, jaki możesz wykonać przed startem wyszukiwania. Paweł opisał dlaczego podejście „spytaj LLM o dane o pensjach" zawodzi tak samo często, jak działa, razem z bazowymi danymi testowymi.
Kiedy AI engineering nie jest właściwym kształtem zatrudnienia
To jest sekcja, której życzylibyśmy sobie u większego grona buyer's guides.
Czasami właściwą odpowiedzią na "potrzebujemy AI engineera" jest zupełnie inne zatrudnienie.
Jeśli twoje dane nie są jeszcze wpięte w pipeline'y, które możesz odpytywać z prędkością, najpierw potrzebujesz data engineera. Projekty AI zatrzymują się, zanim w ogóle wystartują, kiedy warstwa danych nie jest gotowa. Zatrudnianie AI engineera, żeby budował na nieustrukturyzowanym chaosie, spala sześć tygodni czyjegoś czasu, zanim ktokolwiek zauważy problem.
Jeśli potrzebujesz kilku tygodni seniorskiej ekspertyzy (architecture review, sprint na model-selection, eval audit przed launchem), nie potrzebujesz 12-miesięcznego engagementu. Potrzebujesz fractional gig. Staff-aug minima czynią to drogim; gigs nie.
Jeśli potrzebujesz stałego seniora na swoim payrollu, wpiętego w plan equity, budującego instytucjonalną wiedzę ML latami, chcesz rekrutacji, nie augmentation.
Jeśli twoim problemem jest "chcemy robić to, co ChatGPT", zapłać 20 dolarów miesięcznie za SaaS, który już to robi, i nie zatrudniaj nikogo. Największa pułapka kosztowa w hiringu AI to budowanie czegoś, co już istnieje.
Partner, którego warto zatrudnić, mówi ci, jakiego kształtu naprawdę potrzebujesz. Ten drugi rodzaj sprzeda ci to, co im się najłatwiej upycha.
Pytania, które CTOs z USA i UK zadają przed podpisaniem
Sześć pytań ląduje na prawie każdym pierwszym callu. Krótkie odpowiedzi.
GDPR, dane treningowe AI i EU AI Act. Polska jest w UE, więc przetwarzanie danych osobowych w Krakowie jest pod GDPR ok by default. EU AI Act z lat 2024–2026 dorzuca obowiązki specyficzne dla systemów AI: klasyfikację ryzyka, dokumentację danych treningowych, wymogi transparentności. Jeśli twój model jest w scope, to powierzchnia kontraktowa, nie deal-breaker. Udokumentuj wymagania w engagemencie, żeby twój engineer wiedział, w jakich ramach działa.
IP na fine-tunes modeli. Standardowe klauzule IP pokrywają kod. Czasem nie pokrywają wag fine-tuneowanego modelu. Warto dorzucić konkretną klauzulę, jeśli twój model jest częścią IP, za którego budowę płacisz.
Czy polski AI engineer może ciągnąć z compute hostowanego w USA? Tak. Azure OpenAI, AWS Bedrock i Vertex AI obsługują Polskę z mniej więcej 120ms round-trip do US-East. W porządku dla batched inference. UX streamingu to miejsce, w którym latencja staje się odczuwalnym ograniczeniem. Polski engineer pracujący przeciw amerykańskiemu endpointowi streamingu widzi to samo opóźnienie UX co twoi amerykańscy klienci, co bywa pożyteczne dla empatii i okazjonalnie irytujące dla developmentu.
Dorzucenie polskiego AI engineera do istniejącego amerykańskiego zespołu AI. Cultural fit rzadko bywa źródłem tarcia. Tarcie zwykle bierze się ze współdzielonego dostępu do compute, model registries i produkcyjnych sekretów, plus klauzul IP-residency, które muszą czysto ogarniać rozproszone zespoły.
Jak odróżnić prawdziwego eval engineera od prompt-pokera? Poproś, żeby opisał evala, który padł w produkcji. Ci, którzy potrafią konkretnie opowiedzieć, co poszło nie tak, co próbowali i czego się nauczyli, dowieźli. Ogólnikowe odpowiedzi oznaczają, że nie.
Czy mogę ich zatrudnić na stałe później? Tak, z klauzulą buyout. Zakres od kilku miesięcy fee do flat number. Wpisz tę liczbę w kontrakt, nie w wątek mailowy.
Jak my to robimy w Inuits
Jesteśmy firmą Talent-as-a-Service z Krakowa. Plasujemy senior polskich engineerów w produktowych zespołach USA i UK od 2019, a warstwa AI i ML tej pracy to nasza najszybciej rosnąca linia od momentu, kiedy GPT-3 wszedł do produktów konsumenckich.
Jeden realny przykład. DigiTrans buduje AI-powered document automation dla firm logistycznych. Przyjmują dokumenty shippingowe, które przychodzą w dziesiątkach layoutów i języków, ekstraktują pola strukturalne i wrzucają je do transport management systems i ERP-ów. Wbudowaliśmy data scientistę i zespół engineeringowy do zbudowania warstwy modelu: PyTorch do klasyfikacji dokumentów, Tesseract OCR z preprocessingiem OpenCV, Google Translate do obsługi wielojęzycznej, Nomad i Docker do deploymentu. Pipeline NLP dla kroku ekstrakcji strukturalnej. MLOps dla produkcyjnego handoffu. To kształt engagementu AI, który dowozi, a nie demuje.
Kilka rzeczy nietypowych w sposobie, w jaki pracujemy.
Mamy cztery modele usług: Staff Augmentation, dedykowane zespoły nearshore, rekrutacja IT i (od niedawna) fractional gigs. Zarekomendujemy ten, który pasuje do twojego problemu, nawet jeśli oznacza to dla nas mniej revenue. To obejmuje powiedzenie ci, że właściwe zatrudnienie to data scientist, ML infra engineer, a w niektórych przypadkach w ogóle nikt.
Rozmawiasz ze swoim engineerem bezpośrednio. Kiedy coś wymaga eskalacji, rozmawiasz z founderem, nie z warstwą delivery.
Jeśli próbujesz ustalić, czy następne właściwe zatrudnienie to w ogóle AI engineer, nie mówiąc już o tym, gdzie go znaleźć, napisz nam, co próbujesz zbudować. Wrócimy w ciągu jednego dnia roboczego z odpowiedzią, czy właściwe zatrudnienie to AI engineer, ML engineer, data scientist, czy coś zupełnie innego.
Appendix: polskie nazwiska, które warto znać w AI
Sieć alumni frontier-AI. Nie wyczerpująca, ale przydatny primer dla każdego oceniającego polski talent AI:
- Jakub Pachocki, Chief Scientist OpenAI od maja 2024. Prowadził rozwój GPT-4. Licencjat na Uniwersytecie Warszawskim, doktorat na CMU. Urodzony w Gdańsku. Sam Altman: "easily one of the greatest minds of our generation."
- Wojciech Zaremba, współzałożyciel OpenAI, urodzony w Kluczborku. Prowadził pracę robotyczną OpenAI (ramię rozwiązujące kostkę Rubika), potem Codex, który stał się engineeringowym fundamentem pod ChatGPT.
- Aleksander Mądry, MIT, dyrektor Center for Deployable Machine Learning. Był Head of Preparedness w OpenAI; przeniesiony w połowie 2024 do prowadzenia badań nad AI reasoning.
- Mati Staniszewski i Piotr Dąbkowski, współzałożyciele ElevenLabs. Wycena 11 mld dolarów przy rundzie Series D w lutym 2026. Obaj wychowani w Polsce; poznali się w Imperial College London.
- Krzysztof Choromanski, Google DeepMind, badania nad architekturą transformerów. Polak, doktorat na Columbii.
- Piotr Sankowski, współzałożyciel IDEAS NCBR, profesor Uniwersytetu Warszawskiego. Akademicki silnik za polskim narodowym labem badań AI.
Jeśli na poważnie zatrudniasz polskich AI engineerów, prędzej czy później odkryjesz, że ktoś, z kim rozmawiasz, albo pracował z kimś z tej listy, albo studiował pod kimś z niej, albo był przez kogoś z niej zatrudniony. Sieć jest gęstsza, niż sugerowałaby populacja kraju — i to jest sieć, do której się podpinasz.
Chcesz z nami współpracować?
Porozmawiajmy o tym, jak możemy pomóc Twojemu zespołowi dostarczać szybciej.


