AI pro češtinu: výzvy a řešení — níže praktický pohled pro české firmy.
Výzva
Čeština je menší jazyk s bohatou morfologií; ne každý model na ni umí stejně dobře.
Řešení
Silné multijazyčné modely (Mistral, Llama, Qwen) zvládají češtinu dobře; české LLM existují zatím jako výzkumné projekty (CSMPT-7B, OpenEuroLLM). Modelovou vrstvu lze volit jako evropskou nebo open-weight: Mistral (Francie, EU, řada modelů pod Apache 2.0, data ve výchozím stavu v EU) je evropská vlajková loď, k tomu open-weight Llama, Qwen či Gemma, které lze provozovat self-hostované nebo lokálně. České LLM existují zatím jen na výzkumné úrovni (CSMPT-7B z VUT Brno, evropský OpenEuroLLM koordinovaný z ÚFAL Univerzity Karlovy) — uvádíme je jako kontext, ne jako komerční vlajkovou loď.
Praktický postup
Otestujte modely na vašich datech a vyberte podle citlivosti dat. osFoundry je hybridní AI-orchestrační platforma: BYOK (připojíte vlastní klíče k modelům), kód je source-available, nasazení je možné ve vlastní infrastruktuře a lokální inference (přes llama.cpp) umožňuje, aby data neopustila váš perimetr.
Suverenita a rezidence dat
V Česku neexistuje plnohodnotný region žádného z hyperscalerů: nejbližší jsou AWS eu-central-1 (Frankfurt), Microsoft Azure Germany West Central (Frankfurt) nebo Poland Central (Varšava) a Google Cloud europe-west3 (Frankfurt) či europe-central2 (Varšava). Vzdálenost je malá (Praha–Frankfurt ~400 km), takže problém suverenity není o latenci, ale o jurisdikci. US CLOUD Act (2018) a FISA Section 702 umožňují americkým orgánům vynutit u poskytovatelů kontrolovaných z USA vydání dat uložených kdekoli na světě — jurisdikce se řídí vlastnictvím firmy, ne umístěním serveru. Region „v EU“ tedy zajistí datovou rezidenci a GDPR, ale neznamená „mimo americkou jurisdikci“; to potvrzuje i rozsudek Schrems II a neřeší to ani EU-US Data Privacy Framework. Kam ukládat data pro AI — EU region (vlastní účet), čeští/EU poskytovatelé, on-premise, nebo lokální inference.
Protože osFoundry lze provozovat ve vlastní infrastruktuře a připojit evropské či open-weight modely, může běžet ve vašem vlastním účtu v EU regionu nebo on-premise — cesta k rezidenci a suverenitě dat, ne „krabice“ ze zahraničí. (Poctivě: osFoundry má řízený EU region, ale NEMÁ řízený český region; pro data v ČR pod českou jurisdikcí je cesta self-host ve vlastní infrastruktuře nebo u českého poskytovatele, případně local-first.)
Nezávislost a poctivost
dgm je nezávislý integrační partner (není spojen s osFoundry / OS LLC) a není právní ani daňový poradce. dgm zatím nemá dokončené zákaznické integrace, takže níže uvedené scénáře jsou popsány jako typické nebo možné, ne jako realizované projekty.
Závěr
Kontaktujte dgm a proberte svůj scénář a návrh architektury.