Tomáš Kubica

https://tomaskubica.cz/ Tomáš Kubica 2025-07-08T12:04:20+02:00 Tomáš Kubica https://tomaskubica.cz/ Jekyll © 2025 Tomáš Kubica /assets/img/favicons/favicon.ico /assets/img/favicons/favicon-96x96.png Jak na jednoduchou AI analýzu textu? Mám použít LLM, finetuning, vlastní model nebo hrátky nad embeddingy? A za kolik to všechno? 2025-07-08T00:00:00+02:00 2025-07-08T00:00:00+02:00 https://tomaskubica.cz/post/2025/ai-sentiment-varianty/ Tomáš Kubica

Před desetilety byl svět AI práce s jazykem (Natural Language Processing, NLP) zaměřený na z dnešního pohledu jednoduché úlohy, pro které se ale vytvářel specializovaný a výpočetně (a tedy i nákladově) nenáročný model. Dnešní svět velkých jazykových modelů (LLM) a jeho schopnost následovat vaše instrukce může dokázat totéž bez trénování vlastních modelů nebo extenzivních znalostí. Pojďme na pří...

Jak a kdy dělám vibe coding 2025-07-03T00:00:00+02:00 2025-07-03T00:00:00+02:00 https://tomaskubica.cz/post/2025/jak-delam-vibe-coding/ Tomáš Kubica

Jak postupuji, když chci vytvořit aplikaci, která není ohraná a triviální (tzn. je mimo možnosti no-code platforem) a nebudu psát žádný kód? Kdy něco takového chci a kdy ne? Nasdílím pár triků s GitHub Copilot a podobnými platformami. Kdy používám čistý vibe coding a kdy “jen” AI asistenta Vibe coding rozhodně nepoužívám vždy, většinou je to spíše AI coding agent ve formě kolegy, ale čisté pro...

Aplikační architektura škálovatelného AI chatu - observabilita 2025-06-25T00:00:00+02:00 2025-06-25T00:00:00+02:00 https://tomaskubica.cz/post/2025/scalable-ai-observability/ Tomáš Kubica

Ve škálovatelné distribuované architektuře jsou určitě větší nároky na observabilitu. Pro účely tohoto článku jsem vybral její za mě zásadní úsek a to jsou: Logování Trasování requestů pro možnost sledovat flow requestů napříč službami nebo identifikaci slabých míst Metriky pro sledování výkonu a zdraví systému Spotřeba zdrojů, zejména LLM tokenů, přes nejrůznější dimenze pro možnost o...

Aplikační architektura škálovatelného AI chatu - historie a dlouhodobá paměť 2025-06-16T00:00:00+02:00 2025-06-16T00:00:00+02:00 https://tomaskubica.cz/post/2025/scalable-ai-chat-memory/ Tomáš Kubica

V AI chat aplikaci bychom měli jednak udržovat historii konverzací, aby se k nim mohl uživatel vracet, ale také dlouhodobou paměť uživatele. Ta by měla jednak sloužit k zapamatování důležitých faktů o něm jako jsou jeho preference, zájmy a další věci co prozradí a druhak k udržování přehledu kdy a o čem se s AI bavil, aby na to bylo možné navázat v budoucnu nebo se na to odkázat v rámci konverz...

Aplikační architektura škálovatelného AI chatu - asynchronní chat, zpracování i streamování 2025-06-03T00:00:00+02:00 2025-06-03T00:00:00+02:00 https://tomaskubica.cz/post/2025/scalable-ai-chat-app-architecture-1/ Tomáš Kubica

Typický začátek AI chatbota je nějaký monolit. Vezme se třeba frontend příjemný pro Python vývojáře (Gradio, Streamlit) nebo se napíše v Reactu, Vue.js či Svetle a k tomu backend, který přijímá dotazy uživatele, posílá je do LLM a streamuje odpovědi. Pro PoC výborné, jenže není to aplikační architektura vytvořená pro škálování. Výpadky spojení často končí chybou, stavový backend se rozbije nebo...

<id>https://tomaskubica.cz/</id>

<title>Tomáš Kubica</title>

<name>Tomáš Kubica</name>

<uri>https://tomaskubica.cz/</uri>

</author>

<generator uri="https://jekyllrb.com/" version="4.4.1">Jekyll</generator>

<icon>/assets/img/favicons/favicon.ico</icon>

<logo>/assets/img/favicons/favicon-96x96.png</logo>

<entry>

<title>Jak na jednoduchou AI analýzu textu? Mám použít LLM, finetuning, vlastní model nebo hrátky nad embeddingy? A za kolik to všechno?</title>

<id>https://tomaskubica.cz/post/2025/ai-sentiment-varianty/</id>

<name>Tomáš Kubica</name>

</author>

<summary>Před desetilety byl svět AI práce s jazykem (Natural Language Processing, NLP) zaměřený na z dnešního pohledu jednoduché úlohy, pro které se ale vytvářel specializovaný a výpočetně (a tedy i nákladově) nenáročný model. Dnešní svět velkých jazykových modelů (LLM) a jeho schopnost následovat vaše instrukce může dokázat totéž bez trénování vlastních modelů nebo extenzivních znalostí. Pojďme na pří...</summary>

</entry>

<entry>

<title>Jak a kdy dělám vibe coding</title>

<id>https://tomaskubica.cz/post/2025/jak-delam-vibe-coding/</id>

<name>Tomáš Kubica</name>

</author>

<summary>Jak postupuji, když chci vytvořit aplikaci, která není ohraná a triviální (tzn. je mimo možnosti no-code platforem) a nebudu psát žádný kód? Kdy něco takového chci a kdy ne? Nasdílím pár triků s GitHub Copilot a podobnými platformami. Kdy používám čistý vibe coding a kdy “jen” AI asistenta Vibe coding rozhodně nepoužívám vždy, většinou je to spíše AI coding agent ve formě kolegy, ale čisté pro...</summary>

</entry>

<entry>

<title>Aplikační architektura škálovatelného AI chatu - observabilita</title>

<id>https://tomaskubica.cz/post/2025/scalable-ai-observability/</id>

<name>Tomáš Kubica</name>

</author>

<summary>Ve škálovatelné distribuované architektuře jsou určitě větší nároky na observabilitu. Pro účely tohoto článku jsem vybral její za mě zásadní úsek a to jsou: Logování Trasování requestů pro možnost sledovat flow requestů napříč službami nebo identifikaci slabých míst Metriky pro sledování výkonu a zdraví systému Spotřeba zdrojů, zejména LLM tokenů, přes nejrůznější dimenze pro možnost o...</summary>

</entry>

<entry>

<title>Aplikační architektura škálovatelného AI chatu - historie a dlouhodobá paměť</title>

<id>https://tomaskubica.cz/post/2025/scalable-ai-chat-memory/</id>

<name>Tomáš Kubica</name>

</author>

<summary>V AI chat aplikaci bychom měli jednak udržovat historii konverzací, aby se k nim mohl uživatel vracet, ale také dlouhodobou paměť uživatele. Ta by měla jednak sloužit k zapamatování důležitých faktů o něm jako jsou jeho preference, zájmy a další věci co prozradí a druhak k udržování přehledu kdy a o čem se s AI bavil, aby na to bylo možné navázat v budoucnu nebo se na to odkázat v rámci konverz...</summary>

</entry>

<entry>

<title>Aplikační architektura škálovatelného AI chatu - asynchronní chat, zpracování i streamování</title>

<id>https://tomaskubica.cz/post/2025/scalable-ai-chat-app-architecture-1/</id>

<name>Tomáš Kubica</name>

</author>

<summary>Typický začátek AI chatbota je nějaký monolit. Vezme se třeba frontend příjemný pro Python vývojáře (Gradio, Streamlit) nebo se napíše v Reactu, Vue.js či Svetle a k tomu backend, který přijímá dotazy uživatele, posílá je do LLM a streamuje odpovědi. Pro PoC výborné, jenže není to aplikační architektura vytvořená pro škálování. Výpadky spojení často končí chybou, stavový backend se rozbije nebo...</summary>

</entry>

</feed>