Naziv projekta: Hibridni pristupi umjetne inteligencije u obradi prirodnoga jezika i generiranju znanja (uniri-iz-25-215)
Vrsta projekta: Institucionalni istraživački projekt NPOO
Trajanje: 1.10.2025. – 30.9.2029.
Voditelj: doc. dr. sc. Slobodan Beliga
Suradnici na projektu:
- Prof. dr. sc. Ana Meštrović
- Prof. dr. sc. Mihaela Matešić
- Izv. prof. dr. sc. Slavko Žitnik
- Dr. sc. Ivana Filipović Petrović, viša znanstvena suradnica
- Dr. sc. Karlo Babić
Sažetak:
Ovo istraživanje analizira potencijale hibridnih pristupa umjetne inteligencije obradi prirodnoga jezika i generiranju znanja u kontekstu novih paradigmi integrirane umjetne inteligencije. Kombiniranjem reprezentacijske preciznosti i objašnjivosti simboličkih sustava s kapacitetom učenja i fleksibilnošću neuronskih arhitektura, neurosimboličke metode nude obećavajući put prema robusnijim, interpretabilnijim i semantički utemeljenim AI sustavima. Projekt je strukturiran oko triju problemskih domena: (1) semantička i kontekstualna verifikacija teksta (npr. provjera činjenica, detekcija dezinformacija), (2) semantički vođena modifikacija jezičnih struktura (npr. pojednostavljivanje jezika za ciljne skupine), i (3) strojna analiza semantičko-pragmatičkih modela (npr. obrada figurativnog jezika, sarkazma, toksičnog jezika). Takve će domene služiti kao eksperimentalna okruženja za evaluaciju učinkovitosti, prilagodljivosti i društvenog utjecaja hibridnih sustava u stvarnim kontekstima. Istraživanje se usredotočuje na dvije ključne dimenzije: (1) razvoj i primjenu hibridnih modela koji povezuju simboličke baze znanja – poput grafova znanja i ontologija – s velikim jezičnim modelima (LLM), i (2) dvosmjernu interakciju između razumijevanja jezika i generiranja znanja. Sustavi će se razvijati i testirati uz primjenu prompt inženjeringa, RAG arhitektura, kao i automatske ekstrakcije ontoloških entiteta iz LLM-ova. Posebno će se istraživati i mogućnost da se iz samih LLM-ova generiraju strukturirani resursi, kao i da se simbolički resursi injektiraju natrag u modele. Projekt se temelji na primjeni razvijenih pristupa u semantički zahtjevnim i društveno relevantnim kontekstima te ima potencijal izgradnje jezičnih resursa i alata primjenjivih za različite ciljne skupine. Time projekt odgovara na izazove pouzdanosti generativne AI i doprinosi razvoju transparentnijih i primjenjivijih jezičnih tehnologija.
Project name:
Hybrid AI Approaches to Natural Language Processing and Knowledge Generation (uniri-iz-25-215)
Project type: Institutional research projects (National Recovery and Resilience Plan)
Project duration: 1 October 2025 – 30 September 2029
Principal Investigator (PI): Assistant Prof. Slobodan Beliga, PhD
Members of the research team:
- Prof. Ana Meštrović, PhD
- Prof. Mihaela Matešić, PhD
- Assoc. Prof. Slavko Žitnik, PhD
- Ivana Filipović Petrović, PhD, Senior Research Associate
- Karlo Babić, PhD
Abstract:
This research explores the potential of hybrid artificial intelligence approaches in natural language processing and knowledge generation within the framework of emerging integrated AI paradigms. By combining the representational precision and explainability of symbolic systems with the learning capacity and flexibility of neural architectures, neuro-symbolic methods offer a promising pathway toward more robust, interpretable, and semantically grounded AI systems. The project is structured around three core problem domains: (1) semantic and contextual verification of text (e.g., fact-checking, misinformation detection), (2) semantically driven modification of linguistic structures (e.g., text simplification for target user groups), and (3) computational analysis of semantic-pragmatic models (e.g., figurative language, sarcasm, toxic language). These domains will serve as experimental environments for evaluating the effectiveness, adaptability, and social impact of hybrid AI systems in real-world contexts. The research focuses on two key dimensions: (1) the development and application of hybrid models that connect symbolic knowledge bases—such as knowledge graphs and ontologies—with large language models (LLMs), and (2) the bidirectional interaction between language understanding and knowledge generation. Systems will be developed and tested using techniques such as prompt engineering, retrieval-augmented generation (RAG), and automated extraction of ontological entities from LLMs. Special attention will be given to the possibility of generating structured knowledge resources directly from LLMs, as well as injecting symbolic resources back into the models. The project applies these approaches to semantically complex and socially relevant contexts and holds strong potential for developing language resources and tools applicable across diverse user groups. In doing so, it addresses critical challenges related to the trustworthiness of generative AI and contributes to the development of more transparent and usable language technologies.
