U ovom radu predstavljen je univerzalni arhitekturni okvir za razvoj domenski specifičnih digitalnih asistenata temeljenih na velikim jezičkim modelima (LLM). Predloženi okvir dizajniran je da omogući fleksibilnu integraciju različitih izvora znanja kroz primjenu pristupa zasnovanog na Retrieval-Augmented Generation (RAG), te povezanost sa postojećim operativnim sistemima putem standardiziranih API-ja. Okvir omogućava konfiguraciju LLM modela i unošenje specifičnih sistemskih instrukcija za finu kontrolu njihovog ponašanja.Arhitektura platforme jasno razdvaja funkcionalnosti kroz nekoliko slojeva: sloj memorije (Memory), sloj definisanja i dodjele uloga agentima (Agent Roles), sloj za planiranje (Planner), sloj izvršenja definisanih akcija (Executor) te sloj za integraciju specijaliziranih alata (Tools/Skills). Modularnost ovog pristupa omogućava implementaciju različitih obrazaca ponašanja u agentičkim sistemima kao što su samostalni agenti (solo agent), delegacija zadataka među agentima (agent-to-agent) ili njihova kompleksnija orkestracija. Opisane funkcionalnosti omogućavaju korisnicima da brzo prilagode digitalne asistente specifičnim potrebama, uključujući automatizaciju korisničke podrške, optimizaciju internih poslovnih procesa, te specijaliziranu podršku zaposlenima ili građanima. Tehnička realizacija platforme uključuje sljedeće komponente:
Primjena navedenog okvira demonstrirana je kroz konkretan slučaj automatizirane prijave smetnje. U ovom scenariju, digitalni asistent na osnovu korisničkog opisa problema te autentikacije korisnika vrši klasifikaciju zahtjeva, zatim realizira potrebne provjere na mrežnim elementima, billing sistemima i ostalim relevantnim IT i telekomunikacijskim sistemima. Nakon prikupljenih rezultata, agent odlučuje o daljem toku interakcije, bilo da automatski generiše prijavu smetnje ili korisniku pruži informaciju o već evidentiranoj prijavi. Dodatno, agent prikuplja ključne tehničke parametre mrežne opreme koji omogućavaju kontekstualno bogato informisanje ljudskih agenata na terenu. Poseban fokus dat je aspektima sigurnosti podataka, kontroli troškova korištenja LLM modela, te održivosti i operativnoj efikasnosti sistema. Koncept Minimalno zavisnog agenta (Minimal Self-Contained Agent - MSC) razmatran je kao smjer budućeg razvoja, omogućavajući agentima autonomno planiranje aktivnosti, upravljanje memorijskim resursima i samostalno korištenje dostupnih alata u skladu s ciljevima zadatka. Jedna od ključnih faza razvoja platforme odnosi se na implementaciju lokalnih LLM modela unutar interne infrastrukture BH Telecoma, čime se osiguravaju potpuna privatnost i integritet svih korisničkih podataka.
Osnovni koncepti rada jezičkim modela (LLM), osnovni koncepti procesiranja prirodnog jezika (NLP), API integracija, RAG