LLM står for Large Language Model – stor språkmodell på norsk. Det er en type KI-modell som er trent på enorme mengder tekst og har lært seg mønstre i menneskelig språk så godt at den kan skrive, oppsummere, oversette og svare på spørsmål på en måte som virker menneskelig.
GPT-4 (bak ChatGPT), Claude (fra Anthropic) og Gemini (fra Google) er alle eksempler på store språkmodeller.
Hvordan trenes en LLM?
Treningen skjer i to hoveddeler:
1. Forhåndstrening (pre-training)
Modellen leser enorme mengder tekst – milliarder av sider fra internett, bøker, Wikipedia, kode og mye mer. Den lærer å forutsi hvilket ord som kommer neste i en setning. Etter nok trening har modellen absorberte mønstre, fakta og resonneringsevner.
2. Finjustering med menneskelig tilbakemelding (RLHF)
Den rå modellen er ikke alltid nyttig. Den finjusteres videre ved at menneskelige trenere vurderer svar og velger de beste. Modellen lærer seg å svare hjelpsomt, trygt og presist – ikke bare sannsynlig.
Hva kan en LLM gjøre?
- Svare på spørsmål og forklare komplekse emner
- Skrive tekst – e-poster, artikler, kode, kreativt innhold
- Oppsummere lange dokumenter på sekunder
- Oversette mellom språk
- Analysere og debugge kode
- Føre naturlige samtaler
Hva kan en LLM ikke gjøre?
En LLM er ikke allvitende eller ufeilbarlig. Kjente begrensninger:
- Kunnskapsgrense: Modellen kjenner bare til det den ble trent på. Hendelser etter treningsdatoen vet den lite om.
- Hallusinasjoner: Den kan finne på fakta, kilder eller datoer som ikke eksisterer – og presentere det selvsikkert. Les mer om hallusinasjoner.
- Ingen logisk kerne: LLM-er er ikke kalkulatorer. De kan gjøre matematiske feil.
- Kontekstvindu: Den kan bare lese en begrenset mengde tekst på én gang.
De viktigste LLM-ene i dag
- GPT-4o (OpenAI) – driver ChatGPT. Svært allsidig, støtter tekst, bilde og lyd.
- Claude 3.5 / 4 (Anthropic) – kjent for lange, gjennomtenkte svar og sterk etikk-fokus.
- Gemini (Google) – integrert i Google-produkter og god på søk.
- LLaMA (Meta) – åpen kildekode-modell du kan kjøre lokalt.
- Mistral – europeisk åpen modell med god ytelse for størrelsen.
Vanlige spørsmål
-
Er ChatGPT en LLM?
ChatGPT er en chatbot-tjeneste bygget på OpenAIs GPT-modeller, som er LLM-er. Selve modellen heter GPT-4o; ChatGPT er brukergrensesnittet du snakker med.
-
Hva betyr «large» i Large Language Model?
Det viser til antall parametre – de justerbare tallverdiene i modellen. Moderne LLM-er har hundrevis av milliarder parametre, trent på billioner av ord.
-
Kan jeg kjøre en LLM på min egen PC?
Ja, med verktøy som Ollama kan du kjøre åpne modeller som LLaMA eller Mistral lokalt. Du trenger en relativt kraftig maskin, men det er fullt mulig.
-
Hva er forskjellen på LLM og KI?
KI er det brede feltet; LLM er en spesifikk type KI som fokuserer på språk. Alle LLM-er er KI, men ikke all KI er LLM-er.