Arkitekturen bag F2 AI Assistant
F2 AI Assistant er et fuldt integreret modul i F2, som overholder de gældende adgangsbegrænsninger i F2. I det følgende beskrives den overordnede arkitektur for F2 AI Assistant med fokus på de enkelte komponenter og dataudvekslingen imellem komponenterne.
Kontakt cBrain for yderligere informationer. |
Læs mere om de individuelle komponenter og sammenhængen mellem dem i de efterfølgende afsnit.
Komponenter i F2 AI Assistants arkitektur
Der indgår fem overordnede komponenter i F2 AI Assistants arkitektur. I figuren vises forholdet mellem dem. De enkelte komponenter beskrives under figuren.
F2-database
F2’s standardarkitektur består af en SQL-database, der opbevarer alle data fra F2. Dette inkluderer metadata for akter, sager og dokumenter samt procesdata og logs. Databasen kan både hostes on-premise og via en cloud-tjeneste. Denne gennemgang tager udgangspunkt i en on-premise løsning, således at ingen data forlader det lokale setup.
F2-klient
F2-klienten indeholder F2’s standard forretningslogikker til at understøtte en sikker forvaltningsmodel og processere den relevante data. Det er her i applikationslaget, at brugerne gennem brugerfladen kan tilgå og ændre i data ud fra den adgangsstyring, der ligger i forretningslogikken.
Large Language Model-server
cBrain hoster en on-premise Large Language Model-server (LLM). På denne server er der installeret en Foundation Model fra cBrain, der kan bruges som LLM-motor til F2’s AI-løsninger. Denne model kan løbende udskiftes, når der udvikles nyere og bedre LLM-modeller.
Det er også muligt at udstille sin egen LLM eller bruge en tredjepartsudbyder.
Natural Language Processing brugergrænseflade
cBrain har udviklet flere forskellige brugergrænseflader til Natural Language Processing (NLP), som giver adgang til en LLM. Disse brugergrænseflader gør det muligt at stille spørgsmål og få svar fra LLM’en baseret på det input, som brugeren sender med. F2 AI Assistant er et eksempel på en anvendelse af disse brugergrænseflade, der er indlejret direkte i F2’s brugerflade.
Vektordatabase
En vektordatabase gemmer information som vektorer. Vektorer er numeriske repræsentationer af dataobjekter, som også kaldes vektorudtræk.
Vektordatabasen er effektiv til at indeksere og søge gennem store datasæt af ustrukturereret data og semi-strukturerede data. Det er en forudsætning for at LLM’en kan tilgå datainputtet.
Vektordatabasen installeres samme sted som F2-databasen. Den er derfor beskyttet af de samme sikkerhedsmæssige mekanismer som F2-databasen, og begge databaser synkroniseres løbende, som dokumenter gemmes i F2.
Sammenhængen mellem F2 AI-komponenterne
De fem komponenter indgår i en sammenhæng, som gør det muligt at bruge en integreret AI-løsning som F2 AI Assistant. Figur 2 viser sammenhængen, og tallene på figuren henviser til beskrivelsen af forbindelserne mellem komponenterne. Beskrivelserne kan læses i tabellen under figuren.
Nummer | Beskrivelse |
---|---|
1 |
Dataudveksling mellem F2-databasen og F2-klienten Al data forbliver i F2-miljøet og forlader derfor ikke det lukkede on-premise setup. |
2 |
Vektorisering af dokumenter For at LLM’en kan tilgå det dokument, der bruges som kontekst, skal indholdet overføres til en vektordatabase. Denne overførsel sker løbende, hver gang et dokument gemmes i F2-databasen, således at alle dokumenter og akter er tilgængelige og opdaterede. |
3 |
NLP-brugergrænseflade til datasættet F2 LLM (eller en anden LLM) anvendes til at udstille et chat-brugergrænseflade i brugerfladen, som gør det muligt at stille spørgsmål til datasættet. Her kan brugeren spørge bredt ind til datasættet og få et svar tilbage baseret på den valgte funktion. Adgangen til de konkrete dataelementer overholder fortsat F2’s adgangsstyring. |
4 |
Spørgsmål og svar mellem LLM-server og F2-klienten F2 AI Assistant giver brugeren mulighed for kalde nogle standardanmodninger med et givet input. Det vil sige, at brugeren på forhånd skal fremfinde den chat, akt eller det dokument, der er konteksten for anmodningen, så F2 kan sende det med i inputtet. Datakontrollen overholdes, ved at brugere kun kan finde og sende data, som de allerede har adgang til. Det er altså ikke muligt for brugere at få et resume af data, som de ikke har adgang til. |