Moniagenttiorkestrointi 2026: LangGraph-o…

Tekoälyagenttien aikakausi on todellakin saapunut — ja tällä kertaa kyse ei ole pelkästä hypestä. Vuonna 2026 moniagenttijärjestelmät ovat siirtyneet kokeellisista prototyypeistä aitoon tuotantokäyttöön, ja ne muokkaavat yritysohjelmistojen kenttää tavalla, jota harva osasi vielä pari vuotta sitten ennakoida. Gartnerin tutkimusten mukaan tekoälyagentteihin liittyvät kyselyt kasvoivat 1445 prosenttia vuosien 2023 ja 2025 välillä. Markkinan koko? Arviolta 8,5 miljardia dollaria. Ja ennusteiden mukaan 80 prosenttia yritysten sovelluksista sisältää agenttipohjaisia komponentteja vuoteen 2026 mennessä.

Mutta miksi yksi agentti ei riitä?

Samasta syystä kuin miksi yksittäinen mikropalvelu ei korvaa koko järjestelmää. Monimutkaiset liiketoimintaprosessit vaativat erikoistuneita toimijoita, jotka kommunikoivat, koordinoivat ja täydentävät toistensa kyvykkyyksiä. Tässä oppaassa sukelletaan syvälle moniagenttijärjestelmien orkestroinnin käytäntöihin, keskittyen kahteen johtavaan kehykseen: LangGraph ja CrewAI.

Käydään läpi keskeisimmät orkestointimallit, rakennetaan käytännön koodiesimerkkejä ja tarkastellaan tuotantoympäristön parhaita käytäntöjä. Olipa tavoitteenasi automatisoida tutkimusprosesseja, rakentaa älykkäitä asiakaspalvelujärjestelmiä tai luoda monimutkaisia datapipeliinejä — tämä opas antaa työkalut ja ymmärryksen niiden toteuttamiseen.

Mitä moniagenttiorkestrointi tarkoittaa?

Moniagenttiorkestrointi on arkkitehtuurimalli, jossa useat erikoistuneet tekoälyagentit työskentelevät koordinoidusti yhteisen tavoitteen saavuttamiseksi. Jokainen agentti on itsenäinen toimija, jolla on oma roolinsa, työkalunsa ja päätöksentekokykynsä. Orkestroija — olipa se sitten toinen agentti tai määritelty työnkulku — koordinoi agenttien välistä viestintää ja työnjakoa.

Mikropalveluanalogia

Ajatellaan asiaa mikropalveluarkkitehtuurin kautta. Perinteinen monoliittinen LLM-sovellus on kuin yksittäinen valtava palvelu, joka yrittää tehdä kaiken: hakea tietoa, analysoida dataa, kirjoittaa raportteja ja tehdä päätöksiä. Ei kuulosta kovin kestävältä, eihän? Moniagenttijärjestelmässä jokainen näistä vastuista on eriytetty omalle agentilleen:

Tutkija-agentti — erikoistunut tiedonhakuun ja lähteiden analysointiin
Analyytikko-agentti — keskittyy datan prosessointiin ja tilastolliseen analyysiin
Kirjoittaja-agentti — tuottaa lopullisen sisällön selkeässä ja johdonmukaisessa muodossa
Tarkistaja-agentti — validoi tuotoksen laadun ja tarkkuuden
Koordinaattori-agentti — ohjaa työnkulkua ja jakaa tehtäviä

Tämän lähestymistavan edut ovat merkittäviä. Erikoistuneet agentit voivat käyttää eri kielimalleja — esimerkiksi edullisempi malli yksinkertaisiin tehtäviin ja tehokkaampi malli monimutkaisiin päätöksiin. Niillä on erilliset konteksti-ikkunat, eivätkä ne kärsi yksittäisen agentin kontekstin rajoituksista. Ja mikä parasta: ne voidaan testata, päivittää ja skaalata itsenäisesti.

Milloin moniagenttijärjestelmä kannattaa?

Rehellisesti sanottuna moniagenttiarkkitehtuuri ei ole aina oikea ratkaisu. Se tuo mukanaan monimutkaisuutta viestinnän, tilan hallinnan ja virheenkäsittelyn osalta. Yleissääntönä voidaan sanoa, että moniagenttijärjestelmä kannattaa silloin kun:

Tehtävä vaatii useita erillisiä osaamisalueita tai työkaluja
Prosessi hyötyy rinnakkaisesta suorituksesta
Tarvitaan itsekorjaavia palautesilmukoita
Järjestelmän tulee skaalautua dynaamisesti eri tehtävätyyppien mukaan
Ihmisen valvonta tarvitaan kriittisissä päätöksentekokohdissa

Sen sijaan yksinkertaisiin kysymys-vastaus-sovelluksiin, yksittäisiin RAG-hakuihin tai tilanteisiin, joissa latenssi on kriittistä, yksittäinen agentti tai suora LLM-kutsu on usein parempi valinta. Monimutkaisuudella on aina hintansa — sekä suorituskyvyn, kustannusten että ylläpidettävyyden kannalta.

Keskeiset orkestointimallit

Moniagenttijärjestelmien suunnittelussa on vakiintunut joukko perusmalleja, joita voidaan yhdistellä monimutkaisempien työnkulkujen rakentamiseksi. Nämä mallit eivät ole toisiaan poissulkevia — tuotantojärjestelmissä niitä yhdistetään eri tasoilla. Käydään läpi viisi tärkeintä.

Sekvenssimalli (Pipeline)

Tämä on yksinkertaisin orkestointimalli, jossa agentit suorittavat tehtäviä peräkkäin ketjussa. Jokaisen agentin tuotos siirtyy seuraavan agentin syötteeksi. Sopii erinomaisesti lineaarisiin prosesseihin — kuten sisällöntuotantoputkiin, joissa työ etenee luonnollisesti vaiheesta toiseen.

# Sekvenssimalli: Agentti A -> Agentti B -> Agentti C
# Esimerkki: Tutkimus -> Kirjoitus -> Tarkistus

tyonkulku = [
    tutkija_agentti,     # Vaihe 1: Kerää taustatiedot
    kirjoittaja_agentti,  # Vaihe 2: Kirjoita artikkeli
    tarkistaja_agentti    # Vaihe 3: Tarkista ja viimeistele
]

# Jokaisen agentin tuotos siirtyy seuraavalle
tulos = alkuperainen_syote
for agentti in tyonkulku:
    tulos = agentti.suorita(tulos)

Sekvenssimallin vahvuus on sen yksinkertaisuus ja ennustettavuus. Heikkous? Se ei hyödynnä rinnakkaisuutta eikä tue dynaamista reititystä — jokainen vaihe suoritetaan aina samassa järjestyksessä.

Rinnakkaismalli (Fan-out/Fan-in)

Rinnakkaismallissa tehtävä jaetaan useille agenteille, jotka työskentelevät samanaikaisesti. Tulokset kootaan yhteen kokoaja-agentin tai -funktion toimesta. Tämä malli lyhentää suoritusaikaa merkittävästi silloin, kun tehtävät ovat toisistaan riippumattomia.

# Rinnakkaismalli: Fan-out -> rinnakkainen suoritus -> Fan-in
import asyncio

async def rinnakkainen_haku(kysymys: str):
    # Fan-out: Jaa tehtävä useille agenteille samanaikaisesti
    tehtavat = [
        web_haku_agentti.suorita(kysymys),      # Verkkohaku
        tietokanta_agentti.suorita(kysymys),     # Tietokantahaku
        dokumentti_agentti.suorita(kysymys),     # Dokumenttihaku
    ]

    # Rinnakkainen suoritus — kaikki agentit toimivat yhtä aikaa
    tulokset = await asyncio.gather(*tehtavat)

    # Fan-in: Yhdistä ja syntetisoi tulokset
    yhdistetty = kokoaja_agentti.yhdista(tulokset)
    return yhdistetty

Rinnakkaismalli on erityisen tehokas tiedonhaussa, jossa sama kysymys voidaan ohjata useille eri lähteille samanaikaisesti. On hyvä pitää mielessä, että rinnakkaissuoritus lisää API-kutsujen määrää (ja siten kustannuksia), mutta lyhentää kokonaissuoritusaikaa merkittävästi.

Orkestroija-Työntekijä-malli

Tässä mallissa keskitetty orkestroija-agentti vastaanottaa tehtävän, analysoi sen ja delegoi osatehtävät sopivimmille työntekijäagenteille dynaamisesti. Toisin kuin sekvenssimallissa, jossa järjestys on ennalta määrätty, orkestroija päättää suorituksen aikana mitä agenttia kutsutaan seuraavaksi — ja millaisella ohjeistuksella.

# Orkestroija-Työntekijä-malli
class Orkestroija:
    def __init__(self, tyontekijat: dict):
        self.tyontekijat = tyontekijat  # Käytettävissä olevat agentit
        self.llm = ChatOpenAI(model="gpt-4o")

    def suorita(self, tehtava: str):
        # Orkestroija analysoi tehtävän ja luo suunnitelman
        suunnitelma = self.analysoi_tehtava(tehtava)

        tulokset = []
        for vaihe in suunnitelma:
            # Valitse sopivin agentti kullekin vaiheelle
            agentti_nimi = vaihe["agentti"]
            agentti = self.tyontekijat[agentti_nimi]
            tulos = agentti.suorita(vaihe["ohje"])
            tulokset.append(tulos)

            # Orkestroija voi muuttaa suunnitelmaa tulosten perusteella
            suunnitelma = self.paivita_suunnitelma(suunnitelma, tulos)

        return self.kokoa_lopputulos(tulokset)

Orkestroija-työntekijä-malli on joustava ja sopeutuu erilaisiin tehtäviin ilman koodimuutoksia. Se on erityisen hyödyllinen tilanteissa, joissa tehtävien luonne vaihtelee ja tarvitaan adaptiivista reititystä.

Hierarkkiset tiimit

Hierarkkinen malli laajentaa orkestroija-työntekijä-mallia lisäämällä useita tasoja. Ylimmän tason koordinaattori jakaa työn tiiminvetäjille, jotka puolestaan koordinoivat omia erikoistuneita agenttejaan. Tämä skaalautuu erityisen hyvin suuriin ja monimutkaisiin projekteihin, joissa yksi orkestroija ei yksinkertaisesti kykene hallinnoimaan kaikkia yksittäisiä agentteja.

# Hierarkkinen tiimimalli
# Pääkoordinaattori -> Tiiminvetäjät -> Erikoistuneet agentit

tiimi_rakenne = {
    "paakoordinaattori": {
        "tutkimustiimi": {
            "vetaja": tutkimus_vetaja,
            "jasenet": [web_tutkija, akateeminen_tutkija, data_analyytikko]
        },
        "sisaltotiimi": {
            "vetaja": sisalto_vetaja,
            "jasenet": [copywriter, graafikko, seo_asiantuntija]
        },
        "laadunvarmistus": {
            "vetaja": qa_vetaja,
            "jasenet": [faktan_tarkistaja, kielentarkistaja]
        }
    }
}

Käytännössä hierarkkiset tiimit ovat tehokkaimpia organisaatioissa, jotka ovat jo mallintaneet prosessinsa tiimirakenteena. Malli mahdollistaa vastuualueiden selkeän eriyttämisen ja vähentää yksittäisen orkestroijan kognitiivista kuormaa — mikä on tärkeämpää kuin miltä ensi kuulemalta kuulostaa.

Reflektio- ja itsekorjaussilmukat

Tämä on oma henkilökohtainen suosikkini. Reflektiomallissa agentti arvioi omaa tai toisen agentin tuotosta ja lähettää sen takaisin parannettavaksi, jos laatu ei täytä vaatimuksia. Se on yksi tehokkaimmista malleista tuotoksen laadun parantamiseen, erityisesti koodin generoinnissa, analyyttisessä kirjoittamisessa ja päätöksenteossa. Tutkimukset osoittavat, että reflektiosilmukka parantaa tuotoksen laatua tyypillisesti 15–30 prosenttia verrattuna yksittäiseen generointiin.

# Reflektiosilmukka: Tuota -> Arvioi -> Paranna -> Toista
MAX_ITERAATIOT = 3

def reflektiivinen_tuotanto(tehtava: str):
    tuotos = kirjoittaja.tuota(tehtava)

    for kierros in range(MAX_ITERAATIOT):
        # Arvioija-agentti analysoi tuotoksen
        arviointi = arvioija.arvioi(tuotos)

        if arviointi["hyvaksytty"]:
            break  # Laatu riittävä, lopeta silmukka

        # Anna palaute ja paranna tuotosta
        tuotos = kirjoittaja.paranna(
            alkuperainen=tuotos,
            palaute=arviointi["palaute"]
        )

    return tuotos

Käytännössä näitä viittä mallia yhdistellään usein samassa järjestelmässä. Esimerkiksi hierarkkinen tiimi voi käyttää rinnakkaismallia tiiminvetäjien tasolla ja reflektiosilmukoita yksittäisten agenttien tasolla. Työnkulkujen suunnittelu on aina kompromissi laadun, latenssin ja kustannusten välillä — ja sen tasapainon löytäminen vaatii kokeilua.

LangGraph: Syväsukellus

LangGraph on LangChainin päälle rakennettu kehys, joka mahdollistaa monimutkaisten agenttityönkulkujen rakentamisen suunnattuina syklisinä graafeina (directed cyclic graphs). Vuonna 2026 se on vakiinnuttanut asemansa yhtenä joustavimmista ja tehokkaimmista moniagenttikehyksistä, erityisesti tuotantoympäristöissä. Sen LangGraph Platform tarjoaa tuotantovalmiin infrastruktuurin agenttien käyttöönottoon ja hallintaan.

StateGraph-arkkitehtuuri

LangGraphin ytimessä on StateGraph-konsepti. Jokainen työnkulku määritellään graafina, jonka keskeisiä rakennuspalikkoja ovat:

Tila (State) — tyypitetty tietorakenne, joka kulkee solmujen läpi ja kerää tietoa prosessin edetessä; tila on koko graafin jaettu muisti
Solmut (Nodes) — Python-funktioita tai kokonaisia agentteja, jotka vastaanottavat tilan, suorittavat toimenpiteitä ja palauttavat päivitetyn tilan
Reunat (Edges) — yhteydet solmujen välillä, jotka määrittävät työnkulun etenemisen; reunat voivat olla staattisia tai ehdollisia
Tarkistuspisteet (Checkpoints) — automaattinen tilan tallennusmekanismi, joka mahdollistaa palautumisen virhetilanteista ja ihmisen väliintulon

LangGraphin erityinen vahvuus on sen kyky hallita syklisiä työnkulkuja. Toisin kuin monet kilpailevat kehykset, se tukee luontaisesti silmukoita, ehdollisia haarautumisia ja dynaamista reititystä. Tämä tekee siitä luonnollisen valinnan reflektiosilmukoita ja iteratiivisia prosesseja sisältäviin järjestelmiin.

Solmut ja reunat käytännössä

Jokaisella solmulla on selkeä vastuu. Solmu voi olla yksinkertainen funktio, LLM-kutsu tai kokonainen aligraafi. Reunat määrittelevät, miten kontrolli siirtyy solmujen välillä — ja ehdolliset reunat mahdollistavat dynaamisen reitityspäätöksen tilan perusteella, mikä tekee työnkulusta adaptiivisen.

from langgraph.graph import StateGraph, START, END
from typing import TypedDict, Annotated, List
import operator

# Määritellään jaettu tilarakenne
class TutkimusTila(TypedDict):
    kysymys: str                                          # Alkuperäinen tutkimuskysymys
    tutkimustulokset: Annotated[List[str], operator.add]  # Kumulatiiviset tulokset
    luonnos: str                                          # Artikkelin luonnos
    palaute: str                                          # Arvioijan palaute
    lopullinen_teksti: str                                # Viimeistelty teksti
    iteraatio: int                                        # Nykyinen iteraatiokierros

# Luodaan graafi tilakuvauksella
graafi = StateGraph(TutkimusTila)

Huomaa Annotated[List[str], operator.add] -tyypitys: se kertoo LangGraphille, että tutkimustulokset ovat kumulatiivisia — jokainen solmu lisää omansa aiempien jatkoksi sen sijaan, että korvaisi ne. Tämä on keskeinen mekanismi tiedon keräämiseen monivaiheisissa työnkuluissa, ja sen ymmärtäminen säästää paljon päänvaivaa myöhemmin.

Koodiesimerkki: Tutkimustiimin rakentaminen

Nyt päästään asiaan. Rakennetaan käytännön esimerkki kolmen agentin tutkimustiimistä, joka koostuu koordinaattorista, tutkijasta ja kirjoittajasta. Tämä esimerkki havainnollistaa orkestroija-työntekijä-mallia yhdistettynä reflektiosilmukkaan — tyypillinen tuotantotason arkkitehtuuri.

from langgraph.graph import StateGraph, START, END
from langchain_openai import ChatOpenAI
from langchain_core.messages import HumanMessage, SystemMessage
from typing import TypedDict, Annotated, List, Literal
import operator
import json

# --- Tilamäärittely ---
class TutkimusTila(TypedDict):
    aihe: str
    tutkimustulokset: Annotated[List[str], operator.add]
    luonnos: str
    palaute: str
    lopullinen_teksti: str
    kierros: int
    valmis: bool

# --- Kielimallien alustus ---
# Käytetään tehokkaampaa mallia koordinointiin, edullisempaa tutkimukseen
koordinaattori_llm = ChatOpenAI(model="gpt-4o", temperature=0)
tutkija_llm = ChatOpenAI(model="gpt-4o-mini", temperature=0.1)
kirjoittaja_llm = ChatOpenAI(model="gpt-4o", temperature=0.3)

# --- Solmufunktiot ---
def koordinaattori_solmu(tila: TutkimusTila) -> dict:
    """Koordinaattori analysoi tehtävän ja luo tutkimussuunnitelman."""
    viesti = koordinaattori_llm.invoke([
        SystemMessage(content="""Olet tutkimustiimin koordinaattori.
        Analysoi annettu aihe ja luo yksityiskohtainen tutkimussuunnitelma.
        Määrittele 3-5 keskeistä tutkimuskysymystä, jotka tulee selvittää.
        Priorisoi kysymykset tärkeysjärjestykseen."""),
        HumanMessage(content=f"Tutkimusaihe: {tila['aihe']}")
    ])
    return {
        "tutkimustulokset": [f"SUUNNITELMA: {viesti.content}"],
        "kierros": 0,
        "valmis": False
    }

def tutkija_solmu(tila: TutkimusTila) -> dict:
    """Tutkija-agentti hakee ja analysoi tietoa useista lähteistä."""
    aiemmat_tulokset = "\n".join(tila["tutkimustulokset"])
    viesti = tutkija_llm.invoke([
        SystemMessage(content="""Olet erikoistunut tutkija-agentti.
        Etsi ja analysoi tietoa annetusta aiheesta perusteellisesti.
        Käytä lähdekritiikkiä ja merkitse jokaisen väitteen lähde.
        Keskity tuoreimpaan tietoon ja vertaisarvioituihin lähteisiin."""),
        HumanMessage(content=f"""
        Aihe: {tila['aihe']}
        Tutkimussuunnitelma ja aiemmat tulokset: {aiemmat_tulokset}
        Tuota kattava tutkimusyhteenveto edellä mainittujen pohjalta.
        """)
    ])
    return {"tutkimustulokset": [viesti.content]}

def kirjoittaja_solmu(tila: TutkimusTila) -> dict:
    """Kirjoittaja-agentti tuottaa artikkelin tutkimustulosten pohjalta."""
    tutkimus = "\n---\n".join(tila["tutkimustulokset"])
    palaute = tila.get("palaute", "Ei aiempaa palautetta.")

    viesti = kirjoittaja_llm.invoke([
        SystemMessage(content="""Olet ammattimainen tekninen kirjoittaja.
        Kirjoita selkeä, johdonmukainen ja teknisesti tarkka artikkeli
        tutkimustulosten pohjalta. Käytä konkreettisia esimerkkejä.
        Jos sait palautetta aiemmasta versiosta, huomioi se tarkasti."""),
        HumanMessage(content=f"""
        Aihe: {tila['aihe']}
        Tutkimustulokset: {tutkimus}
        Aiempi palaute: {palaute}
        Kirjoita artikkeli edellä mainittujen pohjalta.
        """)
    ])
    return {"luonnos": viesti.content}

def arvioija_solmu(tila: TutkimusTila) -> dict:
    """Arvioi luonnoksen laadun ja päättää hyväksytäänkö vai jatketaanko."""
    viesti = koordinaattori_llm.invoke([
        SystemMessage(content="""Olet kriittinen arvioija ja laadunvarmistaja.
        Arvioi artikkelin laatu asteikolla 1-10 seuraavien kriteerien mukaan:
        - Tekninen tarkkuus (ovatko faktat oikein?)
        - Johdonmukaisuus (eteneekö argumentti loogisesti?)
        - Kattavuus (käsitelläänkö aihe riittävän laajasti?)
        - Luettavuus (onko teksti selkeää ja sujuvaa?)
        Jos kokonaispistemäärä on yli 7, hyväksy artikkeli.
        Muussa tapauksessa anna konkreettinen ja toiminnallinen parannuspalaute.
        Vastaa JSON-muodossa: {"pisteet": X, "hyvaksytty": true/false, "palaute": "..."}"""),
        HumanMessage(content=f"Artikkeli arvioitavaksi:\n{tila['luonnos']}")
    ])

    try:
        arvio = json.loads(viesti.content)
    except json.JSONDecodeError:
        arvio = {"pisteet": 5, "hyvaksytty": False, "palaute": viesti.content}

    uusi_kierros = tila["kierros"] + 1

    # Hyväksy jos pisteet riittävät tai maksimikierrokset saavutettu
    if arvio.get("hyvaksytty", False) or uusi_kierros >= 3:
        return {
            "lopullinen_teksti": tila["luonnos"],
            "palaute": arvio.get("palaute", "Hyväksytty"),
            "kierros": uusi_kierros,
            "valmis": True
        }

    return {
        "palaute": arvio["palaute"],
        "kierros": uusi_kierros,
        "valmis": False
    }

# --- Ehdollinen reititys ---
def tarkista_valmius(tila: TutkimusTila) -> Literal["kirjoittaja", "lopetus"]:
    """Ehdollinen reuna: jatketaanko kirjoittamista vai lopetetaanko."""
    if tila.get("valmis", False):
        return "lopetus"
    return "kirjoittaja"

# --- Graafin rakentaminen ---
graafi = StateGraph(TutkimusTila)

# Lisätään solmut
graafi.add_node("koordinaattori", koordinaattori_solmu)
graafi.add_node("tutkija", tutkija_solmu)
graafi.add_node("kirjoittaja", kirjoittaja_solmu)
graafi.add_node("arvioija", arvioija_solmu)

# Lisätään reunat (lineaarinen aloitusosa)
graafi.add_edge(START, "koordinaattori")
graafi.add_edge("koordinaattori", "tutkija")
graafi.add_edge("tutkija", "kirjoittaja")
graafi.add_edge("kirjoittaja", "arvioija")

# Ehdollinen reuna: arvioija päättää jatketaanko iterointia
graafi.add_conditional_edges(
    "arvioija",
    tarkista_valmius,
    {"kirjoittaja": "kirjoittaja", "lopetus": END}
)

# Käännetään suoritettavaksi sovellukseksi
sovellus = graafi.compile()

# --- Suoritus ---
tulos = sovellus.invoke({
    "aihe": "Tekoälyn vaikutus ohjelmistokehitykseen vuonna 2026",
    "tutkimustulokset": [],
    "luonnos": "",
    "palaute": "",
    "lopullinen_teksti": "",
    "kierros": 0,
    "valmis": False
})

print(tulos["lopullinen_teksti"])

Tämä esimerkki havainnollistaa useita LangGraphin keskeisiä ominaisuuksia: tyypitettyä tilaa TypedDict-rakenteella, kumulatiivisia tilakenttiä Annotated-tyypityksellä, ehdollisia reunoja dynaamiseen reititykseen, syklistä työnkulkua reflektiosilmukalla sekä eri kielimallien käyttöä eri agenteille kustannusoptimointia varten. Kokonaisuutena aika elegantti rakenne.

LangGraph Platform ja tuotantokäyttö

LangGraph Platform tarjoaa tuotantoympäristöön suunnitellun infrastruktuurin, joka menee huomattavasti pelkkää kehyskirjastoa pidemmälle:

LangGraph Server — HTTP-rajapinta agenttien käyttöönottoon, hallintaan ja skaalaukseen; tukee sekä synkronista että asynkronista suoritusta
Suoratoistoprotokolla — reaaliaikainen tulostus käyttöliittymiin, jossa käyttäjä voi seurata agentin työskentelyä vaihe vaiheelta
Tarkistuspisteet — automaattinen tilan persistointi PostgreSQL-, Redis- tai SQLite-tietokantaan; mahdollistaa palautumisen ja pitkäkestoisten työnkulkujen hallinnan
Cron-ajoitus — agenttien ajastaminen taustatyönä säännöllisin väliajoin
LangSmith-integraatio — täysi havainnoitavuus jokaisen solmun suorituksesta, tokenien käytöstä ja virheilmoituksista

CrewAI: Syväsukellus

CrewAI tarjoaa korkeamman abstraktiotason moniagenttijärjestelmien rakentamiseen — ja se tekee sen tavalla, joka tuntuu yllättävän intuitiiviselta. Sen filosofia perustuu roolipohjaisten agenttien yhteistyöhön, jossa agentit määritellään inhimillisten roolien ja vastuualueiden kautta. Vuonna 2026 CrewAI tarjoaa sekä Crews-pohjaisen agenttien yhteistyömallin että Flows-pohjaisen työnkulkujen orkestroinnin.

Crews- ja Flows-arkkitehtuuri

CrewAI:n arkkitehtuuri koostuu kahdesta pääkonseptista, jotka toimivat eri abstraktiotasoilla:

Crews — ryhmä agentteja, jotka työskentelevät yhdessä suorittaen sarjan tehtäviä; Crew hallinnoi agenttien välistä kommunikaatiota, kontekstin jakamista ja tehtävien delegointia
Flows — rakenteellinen tapa yhdistää useita Crew-ryhmiä ja yksittäisiä tehtäviä monimutkaisemmiksi työnkuluiksi; Flows mahdollistaa ehdollisen haarautumisen, rinnakkaisen suorituksen ja jaetun tilan hallinnan

CrewAI:n agentit määritellään neljän pääkomponentin kautta. Rooli (Role) kertoo agentin pääasiallisen tehtävän ja identiteetin. Tavoite (Goal) määrittää mitä agentin tulee saavuttaa. Taustatarina (Backstory) antaa kontekstin, joka ohjaa agentin käyttäytymistä ja päätöksentekotyyliä. Ja Työkalut (Tools) ovat ulkoisia resursseja ja toimintoja, joita agentti voi käyttää tehtävänsä suorittamiseen.

YAML-pohjainen agenttien määrittely

CrewAI tukee YAML-pohjaista konfiguraatiota, mikä on rehellisesti sanottuna melko kätevä ominaisuus. Se mahdollistaa agenttien ja tehtävien määrittelyn erillään koodista — eli ei-teknisten tiimin jäsenten on helpompi muokata agenttien rooleja ja ohjeistuksia ilman, että tarvitsee koskea itse koodiin.

# config/agents.yaml — Agenttien määrittely

tutkija:
  role: "Vanhempi tutkija"
  goal: "Löydä ja analysoi viimeisin ja relevantein tieto annetusta aiheesta"
  backstory: >
    Olet kokenut tutkija, jolla on yli 15 vuoden kokemus
    akateemisesta ja kaupallisesta tutkimuksesta. Olet tunnettu
    kyvystäsi löytää luotettavia lähteitä ja syntetisoida
    monimutkaista tietoa selkeään muotoon. Arvioit aina
    lähteiden luotettavuutta ennen niiden käyttöä.
  tools:
    - web_search
    - arxiv_search
  llm: gpt-4o-mini
  max_iterations: 5
  verbose: true

kirjoittaja:
  role: "Tekninen kirjoittaja"
  goal: "Tuota selkeä, kiinnostava ja teknisesti tarkka artikkeli"
  backstory: >
    Olet palkittu tekninen kirjoittaja, joka osaa muuntaa
    monimutkaisen teknisen tiedon ymmärrettäväksi sisällöksi.
    Kirjoitat aina suomeksi ja noudatat journalistisia standardeja.
    Käytät konkreettisia esimerkkejä abstraktien konseptien
    havainnollistamiseen.
  tools:
    - text_editor
  llm: gpt-4o
  verbose: true

tarkistaja:
  role: "Laadunvarmistaja"
  goal: "Varmista artikkelin tekninen tarkkuus ja kielen laatu"
  backstory: >
    Olet tarkka laadunvarmistaja, joka ei päästä läpi
    epätarkkuuksia tai kielioppivirheitä. Arvioit sisältöä
    kriittisesti mutta rakentavasti. Keskityt erityisesti
    faktojen oikeellisuuteen ja argumentaation johdonmukaisuuteen.
  llm: gpt-4o
  verbose: true

# config/tasks.yaml — Tehtävien määrittely

tutkimustehtava:
  description: >
    Tutki aihe "{aihe}" perusteellisesti. Kerää tärkeimmät faktat,
    tilastot, trendit ja asiantuntijoiden näkemykset. Keskity
    vuoden 2026 tilanteeseen ja tuoreimpiin kehityskulkuihin.
    Merkitse jokaisen havainnon lähde.
  expected_output: >
    Kattava tutkimusraportti, joka sisältää vähintään 10 keskeistä
    havaintoa, lähdeviitteet ja yhteenvedon tärkeimmistä trendeistä.
  agent: tutkija

kirjoitustehtava:
  description: >
    Kirjoita tutkimustulosten pohjalta noin 2000 sanan artikkeli
    aiheesta "{aihe}". Artikkelin tulee olla ammattimainen,
    helppolukuinen ja sisältää konkreettisia esimerkkejä.
    Noudata selkeää otsikkorakennetta.
  expected_output: >
    Viimeistelty artikkeli, joka sisältää otsikon, johdannon,
    vähintään neljä pääkappaletta ja yhteenvedon.
  agent: kirjoittaja
  context:
    - tutkimustehtava

tarkistustehtava:
  description: >
    Tarkista artikkelin tekninen tarkkuus, kielioppi ja
    johdonmukaisuus. Korjaa virheet ja paranna tekstin sujuvuutta.
    Varmista, että kaikki väitteet ovat tuettuja lähdeaineistolla.
  expected_output: >
    Tarkistettu ja viimeistelty artikkeli valmiina julkaistavaksi.
  agent: tarkistaja
  context:
    - kirjoitustehtava

Koodiesimerkki: Sisällöntuotanto-Crew

Rakennetaan käytännön esimerkki sisällöntuotantotiimistä CrewAI:n avulla. Tämä demonstroi agenttien luonnin, tehtävien määrittelyn riippuvuuksineen ja Crew-kokoonpanon — eli kaiken sen, mitä tarvitset päästäksesi alkuun.

from crewai import Agent, Task, Crew, Process
from crewai.tools import SerperDevTool, WebsiteSearchTool

# --- Työkalujen alustus ---
web_haku = SerperDevTool()
sivuston_luku = WebsiteSearchTool()

# --- Agenttien luonti ---
tutkija = Agent(
    role="Vanhempi tutkija",
    goal="Löydä kattava ja ajantasainen tieto annetusta aiheesta",
    backstory="""Olet kokenut tutkija, joka hallitsee sekä
    akateemisen tutkimuksen että käytännön tiedonhaun.
    Olet erityisen tarkka lähdekritiikissä ja priorisoit
    aina vertaisarvioituja ja virallisia lähteitä.""",
    tools=[web_haku, sivuston_luku],
    llm="gpt-4o-mini",          # Kustannustehokas malli tutkimukseen
    max_iter=5,                  # Maksimiiteraatiot
    memory=True,                 # Muisti käytössä aiempien tehtävien muistamiseen
    verbose=True
)

kirjoittaja = Agent(
    role="Tekninen sisällöntuottaja",
    goal="Kirjoita laadukas suomenkielinen artikkeli tutkimustulosten pohjalta",
    backstory="""Olet ammattitaitoinen tekninen kirjoittaja,
    joka hallitsee monimutkaisen tiedon esittämisen
    ymmärrettävässä muodossa. Kirjoitat aina sujuvaa suomea
    ja käytät konkreettisia koodiesimerkkejä.""",
    llm="gpt-4o",               # Tehokkaampi malli kirjoittamiseen
    memory=True,
    verbose=True
)

tarkistaja = Agent(
    role="Päätoimittaja ja laadunvarmistaja",
    goal="Varmista sisällön tarkkuus, laatu ja julkaisukelpoisuus",
    backstory="""Olet kokenut päätoimittaja, joka on tunnettu
    tarkkuudestaan. Et päästä julkaistavaksi mitään, mikä ei
    täytä korkeimpia laatustandardeja. Keskityt erityisesti
    faktojen tarkistamiseen ja argumentin johdonmukaisuuteen.""",
    llm="gpt-4o",
    memory=True,
    verbose=True
)

# --- Tehtävien määrittely ---
tutkimustehtava = Task(
    description="""Tutki aihe '{aihe}' perusteellisesti.
    Keskity seuraaviin näkökulmiin:
    1. Nykytilanne ja markkinakoko vuonna 2026
    2. Tärkeimmät teknologiat ja kehykset
    3. Käytännön sovellukset ja tapausesimerkit
    4. Tulevaisuuden trendit ja ennusteet
    Kerää vähintään 10 keskeistä havaintoa lähdeviitteineen.""",
    expected_output="Kattava tutkimusraportti lähdeviitteineen",
    agent=tutkija
)

kirjoitustehtava = Task(
    description="""Kirjoita tutkimustulosten pohjalta
    ammattimainen artikkeli aiheesta '{aihe}'.
    Artikkelin tulee olla noin 2000 sanaa, ja sen tulee
    sisältää johdanto, pääkappaleet ja johtopäätös.
    Käytä konkreettisia esimerkkejä ja koodinäytteitä.""",
    expected_output="Viimeistelty artikkeli julkaisuvalmiina",
    agent=kirjoittaja,
    context=[tutkimustehtava]     # Saa tutkimuksen tulokset syötteeksi
)

tarkistustehtava = Task(
    description="""Tarkista artikkeli kokonaisuudessaan:
    - Tekninen tarkkuus ja faktojen oikeellisuus
    - Kielioppi ja tyyli
    - Rakenne ja johdonmukaisuus
    - SEO-optimointi ja luettavuus
    Tee tarvittavat korjaukset suoraan tekstiin.""",
    expected_output="Tarkistettu ja julkaisuvalmis artikkeli",
    agent=tarkistaja,
    context=[kirjoitustehtava]
)

# --- Crew:n kokoaminen ---
sisalto_crew = Crew(
    agents=[tutkija, kirjoittaja, tarkistaja],
    tasks=[tutkimustehtava, kirjoitustehtava, tarkistustehtava],
    process=Process.sequential,   # Sekvenssimalli: tutkimus -> kirjoitus -> tarkistus
    memory=True,                  # Jaettu muisti agenttien välillä
    cache=True,                   # Välimuisti työkalujen tuloksille
    max_rpm=30,                   # API-kutsujen rajoitus minuutissa
    verbose=True
)

# --- Suoritus ---
tulos = sisalto_crew.kickoff(
    inputs={"aihe": "Moniagenttijärjestelmät yrityssovelluksissa 2026"}
)

# Tulosten tarkastelu
print(tulos.raw)                              # Raaka tuotos
print(f"Tokenien käyttö: {tulos.token_usage}") # Kustannusseuranta

CrewAI Flows: Monimutkaiset työnkulut

CrewAI Flows mahdollistaa useiden Crew-ryhmien yhdistämisen laajemmiksi työnkuluiksi ehdollisella logiikalla ja tilan hallinnalla. Flows on erityisen hyödyllinen silloin, kun prosessi sisältää useita erillisiä vaiheita, joista kukin vaatii oman erikoistuneen tiiminsä.

from crewai.flow.flow import Flow, listen, start, router

class SisaltoFlow(Flow):
    """Monivaiheinen sisällöntuotantotyönkulku,
    joka ohjaa sisällön oikealle tiimille tyypin perusteella."""

    @start()
    def vastaanota_tilaus(self):
        """Vastaanottaa sisältötilauksen ja validoi sen."""
        self.state["aihe"] = self.inputs["aihe"]
        self.state["tyyppi"] = self.inputs.get("tyyppi", "artikkeli")
        self.state["kieli"] = self.inputs.get("kieli", "fi")
        return {"aihe": self.state["aihe"], "validoitu": True}

    @router(vastaanota_tilaus)
    def valitse_tyonkulku(self):
        """Reitittää oikeaan työnkulkuun sisältötyypin perusteella."""
        if self.state["tyyppi"] == "artikkeli":
            return "artikkeli_polku"
        elif self.state["tyyppi"] == "raportti":
            return "raportti_polku"
        elif self.state["tyyppi"] == "sosiaalinen_media":
            return "some_polku"
        return "artikkeli_polku"  # Oletuspolku

    @listen("artikkeli_polku")
    def tuota_artikkeli(self):
        """Suorittaa sisällöntuotanto-Crew:n artikkelille."""
        tulos = sisalto_crew.kickoff(
            inputs={"aihe": self.state["aihe"]}
        )
        self.state["tuotos"] = tulos.raw
        return tulos

    @listen("raportti_polku")
    def tuota_raportti(self):
        """Suorittaa raporttituotanto-Crew:n tekniselle raportille."""
        tulos = raportti_crew.kickoff(
            inputs={"aihe": self.state["aihe"]}
        )
        self.state["tuotos"] = tulos.raw
        return tulos

    @listen(tuota_artikkeli, tuota_raportti)
    def julkaise(self):
        """Julkaisee lopullisen sisällön kohdekanavaan."""
        julkaisu_tulos = julkaise_sisalto(
            sisalto=self.state["tuotos"],
            kanava=self.state.get("kanava", "verkkosivusto")
        )
        return julkaisu_tulos

# Käynnistä työnkulku
flow = SisaltoFlow()
tulos = flow.kickoff(inputs={
    "aihe": "Tekoälyagenttien tulevaisuus",
    "tyyppi": "artikkeli"
})

Vertailu: LangGraph vs. CrewAI — kumpi ja milloin?

Tämä on yksi yleisimmistä kysymyksistä, joita moniagenttijärjestelmien parissa työskentelevät kehittäjät esittävät. Kumpi kehys sopii juuri sinun projektiisi? Vastaus riippuu — kuten niin usein — projektin luonteesta, tiimin osaamisesta ja järjestelmän vaatimuksista.

Arkkitehtuurifilosofiset erot

LangGraph perustuu graafiteoriaan ja tarjoaa matalan tason kontrollia työnkulkuun. Jokainen solmu ja reuna on eksplisiittisesti määritelty, mikä antaa kehittäjälle täyden hallinnan siitä, miten data virtaa, miten päätökset tehdään ja miten virhetilanteet käsitellään. Se on tavallaan "ohjelmointikieli" moniagenttijärjestelmille.

CrewAI tarjoaa korkeamman abstraktiotason roolipohjaisella lähestymistavalla. Agentit määritellään inhimillisten roolien kautta, ja kehys hoitaa suuren osan koordinoinnista, kontekstin jakamisesta ja viestinnästä automaattisesti. Sitä voisi kutsua "deklaratiiviseksi työkaluksi" moniagenttijärjestelmille.

Käytännön vertailu

Abstraktiotaso: LangGraph on matala ja graafipohjainen, CrewAI on korkea ja roolipohjainen
Oppimiskynnys: LangGraph vaatii ymmärrystä graafeista ja tilan hallinnasta; CrewAI on intuitiivinen ja nopea aloittaa
Joustavuus: LangGraph tarjoaa täyden kontrollin jokaiseen yksityiskohtaan; CrewAI on rajoitetumpi mutta riittävä useimpiin käyttötapauksiin
Sykliset työnkulut: LangGraph tukee natiivisti syklejä ja silmukoita; CrewAI tukee niitä Flows-rajapinnan kautta
Muistinhallinta: LangGraph tarjoaa manuaaliset tarkistuspisteet ja eksplisiittisen hallinnan; CrewAI tarjoaa automaattisen jaetun muistin
Tuotantoinfra: LangGraph Platform on kypsä ja laajalti käytetty; CrewAI Enterprise tarjoaa hallitun pilviympäristön
Ekosysteemi: LangGraph hyötyy laajasta LangChain-ekosysteemistä; CrewAI:lla on kasvava oma yhteisö

Milloin valita LangGraph?

LangGraph on oikea valinta silloin, kun rakennat monimutkaisia ja dynaamisia työnkulkuja, joissa tarvitaan ehdollista logiikkaa, useita silmukoita ja dynaamista reititystä. Se sopii erityisesti tilanteisiin, joissa haluat matalan tason kontrollia jokaisen agentin vuorovaikutukseen ja tilan siirtymiseen. Kriittisissä tuotantojärjestelmissä, joissa luotettava tilan persistointi, palautuminen ja tarkka virheenkäsittely ovat ehdottomia, LangGraph on vahva valinta. Se on myös luonnollinen jatke projekteille, jotka käyttävät jo LangChain-komponentteja.

Milloin valita CrewAI?

CrewAI sopii erityisen hyvin nopeaan prototyyppiin — kun haluat rakentaa toimivan moniagenttijärjestelmän nopeasti ja demonstroida konseptia sidosryhmille. Se on erinomainen valinta tilanteissa, joissa tehtävä luontaisesti jakautuu selkeisiin inhimillisiin rooleihin. YAML-konfiguraatio tekee siitä houkuttelevan, kun haluat erottaa agenttien määrittelyn koodista ja mahdollistaa ei-teknisten tiimin jäsenten osallistumisen.

Monet organisaatiot käyttävät kumpaakin kehystä rinnakkain: CrewAI nopeaan prototyyppiin ja yksinkertaisempiin työnkulkuihin, LangGraph monimutkaisiin tuotantojärjestelmiin. Ne eivät todellakaan ole toisiaan poissulkevia.

Avoimet standardit: MCP ja A2A

Moniagenttiekosysteemin kypsyessä avoimien standardien merkitys kasvaa — ja tässä kohtaa asiat alkavat mennä todella mielenkiintoisiksi. Ilman standardeja jokainen kehys rakentaa omia rajapintojaan, mikä johtaa pirstaloitumiseen ja lukittumiseen. Kaksi keskeistä protokollaa on noussut esiin vuosina 2025–2026.

Model Context Protocol (MCP)

Anthropicin kehittämä Model Context Protocol (MCP) on avoin standardi, joka määrittelee miten tekoälyagentit voivat turvallisesti yhdistää ulkoisiin tietolähteisiin ja työkaluihin. Sitä on kuvattu osuvasti "USB-C-liittimeksi tekoälylle" — universaali rajapinta, joka korvaa pirstaloituneet yksittäisintegraatiot yhdellä standardoidulla protokollalla.

MCP:n arkkitehtuuri koostuu kahdesta pääkomponentista. MCP Server tarjoaa työkaluja ja tietolähteitä standardoidun rajapinnan kautta (esimerkiksi tietokantakysely, tiedostonhallinta tai API-integraatio). MCP Client on agentti tai sovellus, joka käyttää MCP-palvelimen tarjoamia resursseja. Protokolla tukee kolmea resurssilajia: työkaluja (tools) eli funktioita joita agentti voi kutsua, resursseja (resources) eli dataa ja kontekstia jota agentti voi lukea, ja kehotteita (prompts) eli valmiita mallipohjia agentin ohjaukseen.

Vuoden 2026 alussa yli 1000 MCP-palvelinta on saatavilla, ja kaikki suuret kehykset — mukaan lukien LangGraph ja CrewAI — tukevat MCP-integraatiota natiivisti.

# MCP-palvelimen käyttö LangGraph-agentissa
from langchain_mcp_adapters import MCPToolkit

# Yhdistetään MCP-palvelimeen
mcp_toolkit = MCPToolkit(
    server_url="http://localhost:3000/mcp",
    transport="streamable-http"  # Tuetut: stdio, streamable-http, sse
)

# Haetaan käytettävissä olevat työkalut automaattisesti
tyokalut = mcp_toolkit.get_tools()
print(f"Löydettiin {len(tyokalut)} MCP-työkalua")

# Käytetään MCP-työkaluja agentissa — ne toimivat kuten
# mitkä tahansa muut LangChain-työkalut
from langgraph.prebuilt import create_react_agent

agentti = create_react_agent(
    model=ChatOpenAI(model="gpt-4o"),
    tools=tyokalut  # MCP-työkalut käytettävissä automaattisesti
)

Agent-to-Agent Protocol (A2A)

Googlen kehittämä Agent-to-Agent (A2A) -protokolla standardoi agenttien välisen kommunikaation eri kehysten ja alustojen välillä. Jos MCP yhdistää agentit työkaluihin, niin A2A yhdistää agentit toisiinsa. Tämä on kriittistä erityisesti silloin, kun eri organisaatiot tai tiimit rakentavat agentteja eri kehyksillä ja niiden tulee kommunikoida keskenään.

A2A:n keskeiset konseptit ovat:

Agenttikortti (Agent Card) — JSON-muotoinen kuvaus agentin kyvykkyyksistä, rajapinnasta ja vaatimuksista; toimii agentin "käyntikorttina"
Tehtävien delegointi — standardoitu tapa lähettää tehtäviä agentilta toiselle riippumatta käytetystä kehyksestä
Tulosten vaihto — yhteensopiva tulosmuoto, joka varmistaa että LangGraph-agentin tuotos on käyttökelpoista CrewAI-agentille ja päinvastoin
Kyky-neuvottelu — agentit voivat kysyä toisiltaan, mitä kyvykkyyksiä niillä on, ennen tehtävän delegointia

Yhdessä MCP ja A2A muodostavat perustan aidosti interoperaabelille agenttiekosysteemille: MCP standardoi pystysuuntaisen integraation (agentit ja työkalut) ja A2A vaakasuuntaisen kommunikaation (agentit ja agentit). Tämä yhdistelmä on merkittävä askel kohti avointa ja joustavaa agenttien maailmaa.

Tuotantoympäristön parhaat käytännöt

Moniagenttijärjestelmän rakentaminen kehitysympäristössä on yksi asia. Sen luotettava käyttö tuotannossa? Aivan toinen juttu. Tuotantoympäristö tuo mukanaan haasteita skaalautuvuudessa, luotettavuudessa, kustannuksissa ja turvallisuudessa, jotka eivät näy prototyypissä. Käydään läpi kriittisimmät käytännöt.

Hallinta ja havainnoitavuus

Moniagenttijärjestelmien hallinta vaatii kattavaa havainnoitavuutta. Jokainen agentin päätös, työkalukutsu ja tilan muutos tulee olla jäljitettävissä. Ilman sitä virhetilanteen diagnosointi muuttuu käytännössä mahdottomaksi — et tiedä mikä agentti teki väärän päätöksen, millä syötteellä ja miksi.

# Havainnoitavuus LangSmithin avulla
import os
import time
import langsmith
from langsmith import traceable

# Konfiguroi jäljitys — kaikki LangGraph-suoritukset tallennetaan
os.environ["LANGCHAIN_TRACING_V2"] = "true"
os.environ["LANGCHAIN_API_KEY"] = "ls_..."
os.environ["LANGCHAIN_PROJECT"] = "tuotanto-moniagentit"

# Mukautettu jäljitettävä funktio metriikoilla
@traceable(name="agentti_suoritus", tags=["tuotanto", "v2"])
def suorita_agentti(tila: dict, agentti_nimi: str, agentti):
    """Jäljitettävä agenttifunktio kustannus- ja suorituskykymetriikoilla."""
    alku = time.time()

    try:
        tulos = agentti.invoke(tila)
        kesto = time.time() - alku

        # Kirjaa mukautetut mittarit LangSmithiin
        langsmith.log_metric("suoritusaika_sekuntia", kesto)
        langsmith.log_metric("onnistui", 1)

        return tulos

    except Exception as virhe:
        kesto = time.time() - alku
        langsmith.log_metric("suoritusaika_sekuntia", kesto)
        langsmith.log_metric("onnistui", 0)
        langsmith.log_metric("virhetyyppi", type(virhe).__name__)
        raise

Keskeisiä seurattavia mittareita tuotantoympäristössä ovat:

Agenttien suoritusaika — kunkin agentin ja koko työnkulun latenssi; aseta hälytykset poikkeamille
Tokenien käyttö — kustannusten seuranta agentti- ja mallikohtaisesti; tärkeää budjetin hallinnassa
Onnistumisprosentti — kuinka usein työnkulku saavuttaa tavoitteensa ilman virheitä
Iteraatiomäärä — kuinka monta reflektiosilmukan kierrosta tarvitaan keskimäärin (kasvava trendi viittaa yleensä mallin tai datan ongelmiin)
Työkalujen käyttötilastot — mitkä työkalut ovat käytetyimpiä, mitkä hitaimpia ja mitkä epäonnistuvat useimmin

Ihminen silmukassa (Human-in-the-Loop)

Kriittisissä sovelluksissa — kuten taloudellisissa päätöksissä, lääketieteellisessä neuvonnassa tai julkisessa viestinnässä — ihmisen valvonta on välttämätöntä. Tätä ei voi liikaa korostaa. LangGraph tarjoaa natiivit mekanismit ihmisen väliintulolle tarkistuspisteiden kautta.

from langgraph.checkpoint.postgres import PostgresSaver

# Tuotantotason tarkistuspiste PostgreSQL:llä
tarkistuspiste = PostgresSaver.from_conn_string(
    "postgresql://kayttaja:salasana@localhost:5432/agentit_db"
)

# Käännetään graafi ihmisen tarkistuspisteillä
sovellus = graafi.compile(
    checkpointer=tarkistuspiste,
    interrupt_before=["julkaise", "laheta_asiakkaalle"]  # Pysäytä kriittisissä kohdissa
)

# Suoritus pysähtyy automaattisesti ennen "julkaise"-solmua
config = {"configurable": {"thread_id": "artikkeli-2026-001"}}
tulos = sovellus.invoke(syote, config=config)

# Ihminen tarkistaa tuloksen
print("Tarkista luonnos ennen julkaisua:")
print(tulos["luonnos"][:500], "...")

# Hyväksyntä tai palautteen antaminen
hyvaksynta = input("Hyväksytkö julkaisun? (k/e): ")

if hyvaksynta == "k":
    # Jatka suoritusta nykyisestä tarkistuspisteestä
    lopullinen = sovellus.invoke(None, config=config)
else:
    # Päivitä tila palautteella ja ohjaa takaisin kirjoittajalle
    palaute = input("Anna parannuspalaute: ")
    sovellus.update_state(config, values={"palaute": palaute})
    lopullinen = sovellus.invoke(None, config=config)

Tilan hallinta ja persistointi

Tuotantoympäristössä tilan hallinta on kriittistä. Agentin tulee pystyä palautumaan virhetilanteista menettämättä työn tuloksia. Erityisesti pitkäkestoisissa työnkuluissa, jotka saattavat kestää minuutteja tai jopa tunteja, luotettava tilan persistointi on ehdoton vaatimus.

Tarkistuspisteet — tallenna tila jokaisen solmun jälkeen; LangGraph tukee PostgreSQL-, Redis- ja SQLite-pohjaisia ratkaisuja
Idempotenttisuus — suunnittele jokainen solmu siten, että se voidaan suorittaa uudelleen turvallisesti tuottamatta duplikaatteja tai virheitä
Tilan versiointi — pidä kirjaa tilan muutoksista ja mahdollista palautuminen aiempaan versioon tarvittaessa
Aikakatkaisut — aseta realistiset aikakatkaisut jokaiselle solmulle ja koko työnkululle; älä anna yksittäisen agentin jumiutumisen estää koko prosessia

Virheenkäsittely ja vikasietoisuus

Moniagenttijärjestelmissä virheitä tapahtuu väistämättä. API-kutsut epäonnistuvat, mallit tuottavat odottamattomia tuloksia, ulkoiset palvelut ovat ajoittain tavoittamattomissa ja tokenirajoitukset ylittyvät. Kestävän järjestelmän rakentaminen vaatii monitasoista virheenkäsittelyä — ja juuri tähän monet alkavat projekteissaan kompastua.

from tenacity import retry, stop_after_attempt, wait_exponential
import logging
import openai

logger = logging.getLogger("moniagentti")

# Uudelleenyrityslogiikka eksponentiaalisella odotuksella
@retry(
    stop=stop_after_attempt(3),              # Maksimi 3 yritystä
    wait=wait_exponential(min=1, max=60),    # 1s, 2s, 4s... max 60s
    reraise=True
)
async def turvallinen_agenttikutsu(agentti, syote: dict, vara_malli=None):
    """Vikasietoinen agenttikutsu uudelleenyrityslogiikalla ja varamallilla."""
    try:
        tulos = await agentti.ainvoke(syote)

        # Validoi tuotos ennen palautusta
        if not validoi_tuotos(tulos):
            raise ValueError(f"Agentin tuotos ei läpäissyt validointia: {tulos}")

        return tulos

    except openai.RateLimitError as virhe:
        # API-rajoitus saavutettu — tenacity hoitaa uudelleenyrityksen
        logger.warning(f"API-rajoitus: {virhe}. Odotetaan ja yritetään uudelleen.")
        raise

    except openai.APIConnectionError as virhe:
        # Yhteysvirhe — vaihda varamalliin jos saatavilla
        logger.error(f"Yhteysvirhe: {virhe}")
        if vara_malli:
            logger.info("Vaihdetaan varamalliin...")
            agentti.llm = vara_malli
        raise

    except openai.BadRequestError as virhe:
        # Pyyntövirhe — älä yritä uudelleen, korjaa syötettä
        logger.error(f"Pyyntövirhe: {virhe}. Lyhennetään syötettä.")
        syote = lyhenna_syote(syote)
        raise

def lyhenna_syote(syote: dict) -> dict:
    """Lyhentää syötettä tokenirajoituksen ylittyessä."""
    if "tutkimustulokset" in syote:
        # Säilytä vain viimeisimmät tulokset
        syote["tutkimustulokset"] = syote["tutkimustulokset"][-3:]
    return syote

Kustannusoptimointi (FinOps)

Tämä on aihe, joka ansaitsee erityistä huomiota. Moniagenttijärjestelmien kustannukset voivat kasvaa yllättävän nopeasti, koska jokainen agentti tekee itsenäisiä LLM-kutsuja — ja jokainen reflektiosilmukan kierros moninkertaistaa kutsumäärän. Tehokas kustannushallinta on kriittistä tuotantoympäristössä.

Keskeisiä kustannusoptimointistrategioita ovat:

Malliportaitus (Model tiering) — käytä edullisempia malleja yksinkertaisiin tehtäviin (reititys, luokittelu, datan poiminta) ja varaa tehokkaammat mallit vain monimutkaisiin päätöksiin ja luovaan kirjoittamiseen
Välimuistitus (Caching) — tallenna toistuvien työkalukutsujen ja semanttisesti samankaltaisten kyselyjen tulokset; CrewAI tukee tätä natiivisti cache=True -asetuksella
Iteraatiorajoitukset — aseta reflektiosilmukoille selkeät maksimirajat estääksesi loputtomia parannuskierroksia
Tokenien budjetointi — seuraa ja rajoita tokenien käyttöä agentti- ja tehtäväkohtaisesti; aseta hälytykset budjetin ylittyessä
Kehotusten optimointi — minimoi järjestelmäkehotusten pituus, käytä rakenteellisia syötteitä ja poista tarpeeton konteksti

class KustannusHallinta:
    """Keskitetty kustannusten seuranta ja budjetointi moniagenttijärjestelmälle."""

    def __init__(self, paiva_budjetti_eur: float = 50.0):
        self.budjetti = paiva_budjetti_eur
        self.kaytto = 0.0
        # Hinnat per 1M tokenia (tarkista ajantasaiset hinnat)
        self.hinnat = {
            "gpt-4o":       {"input": 2.50, "output": 10.00},
            "gpt-4o-mini":  {"input": 0.15, "output": 0.60},
            "claude-sonnet-4-20250514":  {"input": 3.00, "output": 15.00},
            "claude-haiku-35": {"input": 0.80, "output": 4.00},
        }

    def laske_kustannus(self, malli: str, input_tokenit: int, output_tokenit: int) -> float:
        """Laske yksittäisen kutsun kustannus euroissa."""
        hinta = self.hinnat.get(malli, {"input": 5.0, "output": 15.0})
        kustannus = (
            (input_tokenit / 1_000_000) * hinta["input"] +
            (output_tokenit / 1_000_000) * hinta["output"]
        )
        return round(kustannus, 6)

    def tarkista_budjetti(self, arvioitu_kustannus: float) -> bool:
        """Tarkista onko budjettia jäljellä ennen agenttikutsua."""
        if self.kaytto + arvioitu_kustannus > self.budjetti:
            logger.warning(
                f"Budjettiraja lähestyy! Käytetty: {self.kaytto:.4f}EUR "
                f"/ {self.budjetti}EUR. Arvioitu kutsu: {arvioitu_kustannus:.4f}EUR"
            )
            return False
        return True

    def kirjaa(self, malli: str, input_tokenit: int, output_tokenit: int) -> float:
        """Kirjaa toteutunut kustannus."""
        kustannus = self.laske_kustannus(malli, input_tokenit, output_tokenit)
        self.kaytto += kustannus
        return kustannus

    def valitse_malli(self, tehtavan_monimutkaisuus: str) -> str:
        """Valitse kustannustehokkain malli tehtävän vaativuuden mukaan."""
        if self.kaytto > self.budjetti * 0.8:
            # Budjetti loppumassa — käytä aina edullisinta mallia
            return "gpt-4o-mini"

        mallit = {
            "yksinkertainen": "gpt-4o-mini",     # Reititys, luokittelu
            "keskitaso": "claude-haiku-35",        # Yhteenveto, analyysi
            "monimutkainen": "gpt-4o",            # Kirjoitus, päätöksenteko
            "kriittinen": "claude-sonnet-4-20250514",       # Kriittiset päätökset
        }
        return mallit.get(tehtavan_monimutkaisuus, "gpt-4o-mini")

Lisäksi muutamia keskeisiä tuotantokäytäntöjä, jotka on hyvä pitää mielessä:

Kattava testaus — yksikkötestit jokaiselle agentille erikseen, integraatiotestit agenttien vuorovaikutukselle ja päästä-päähän-testit koko työnkululle; käytä deterministisiä mock-malleja yksikkötesteissä
Vaiheittainen käyttöönotto — aloita yksinkertaisilla työnkuluilla ja lisää monimutkaisuutta asteittain; testaa jokainen lisäys tuotantoliikenteellä ennen seuraavaa laajennusta
Varasuunnitelmat — määrittele varamalli, yksinkertaistettu työnkulku tai ihmiselle eskalointi kriittisiä vikatilanteita varten
Suorituskyvyn seuranta — aseta hälytykset latenssin, virheprosenttien ja kustannusten poikkeamille; dashboardista on tässä kohtaa valtavasti hyötyä
Tietoturva — rajaa jokaisen agentin pääsy vain tarvittaviin työkaluihin ja tietolähteisiin vähimmän oikeuden periaatteen mukaisesti
Versionhallinta — versioi agenttien konfiguraatiot, kehotteet ja työnkulkumäärittelyt; mahdollista palautuminen aiempaan versioon tarvittaessa

Yhteenveto ja tulevaisuuden näkymät

Moniagenttijärjestelmät ovat vuonna 2026 siirtyneet kokeellisista konsepteista tuotantokypsiksi arkkitehtuureiksi. Markkinan 8,5 miljardin dollarin koko ja 1445 prosentin kasvu agentteihin liittyvissä kyselyissä eivät ole vain tilastoja — ne heijastavat perustavanlaatuista muutosta tavassa, jolla ohjelmistoja rakennetaan.

LangGraph ja CrewAI tarjoavat kypsän perustan monimutkaisten agenttijärjestelmien rakentamiseen. LangGraph soveltuu erinomaisesti tilanteisiin, joissa tarvitaan tarkkaa kontrollia, monimutkaisia syklisiä työnkulkuja ja luotettavaa tilan hallintaa. CrewAI puolestaan loistaa nopeassa prototyyppauksessa ja roolipohjaisissa tiimiarkkitehtuureissa. Avoimet standardit MCP ja A2A luovat yhteensopivan ekosysteemin, joka murtaa kehysten välisiä rajoja.

Keskeisimmät opit tästä oppaasta:

Valitse yksinkertaisin orkestointimalli, joka ratkaisee ongelmasi — lisää monimutkaisuutta vasta kun sille on todellinen tarve
Havainnoitavuus ei ole valinnaista — ilman kattavaa jäljitettävyyttä tuotantojärjestelmän ylläpito on käytännössä mahdotonta
Kustannushallinta on suunniteltava alusta alkaen — malliportaitus, välimuistitus ja iteraatiorajoitukset ovat ehdottomia
Ihmisen valvonta on kriittistä korkean riskin päätöksissä — täysin autonomiset järjestelmät eivät ole vielä luotettavia kaikissa konteksteissa
Vikasietoisuus on tuotantojärjestelmän perusedellytys — suunnittele jokainen solmu uudelleenyritettäväksi ja pidä varasuunnitelmat valmiina

Mitä seuraavaksi?

Moniagenttijärjestelmien kehitys jatkuu vauhdikkaana. Lähitulevaisuudessa voimme odottaa natiiveja monimodaalisia agentteja, jotka käsittelevät sujuvasti tekstiä, kuvia, ääntä ja videota samanaikaisesti. Pitkäaikaiset autonomiset agentit tulevat työskentelemään itsenäisesti päivien tai viikkojen ajan monimutkaisten projektien parissa. Agenttien erikoistuminen syvenee entisestään, ja yhä kapeammin erikoistuneet agentit yhdistyvät suuremmiksi ekosysteemeiksi A2A-protokollan kautta.

Deklaratiiviset orkestroinnit — joissa työnkulut määritellään luonnollisella kielellä ilman eksplisiittistä ohjelmointia — ovat jo näkyvissä horisontissa. Samoin edistyneemmät turvallisuusmekanismit agenttien toiminnan rajaamiseen ja auditointiin tulevat olemaan välttämättömiä sitä mukaa kun agentit saavat enemmän autonomiaa.

Loppujen lopuksi moniagenttijärjestelmien rakentaminen on yhä enemmän suunnitteluhaaste kuin puhtaasti tekninen haaste. Menestyksekäs toteutus vaatii selkeää ymmärrystä liiketoimintaprosesseista, huolellista agenttien vastuualueiden suunnittelua ja jatkuvaa optimointia tuotantoympäristön palautteen perusteella. Aloita pienestä, mittaa kaikkea ja laajenna hallitusti. Potentiaali on valtava — mutta se realisoituu vasta kun järjestelmä on rakennettu kestävälle pohjalle.

Moniagenttiorkestrointi vuonna 2026: Käytännön opas LangGraph- ja CrewAI-järjestelmien rakentamiseen

Moniagenttiorkestrointi vuonna 2026: Käytännön opas LangGraph- ja CrewAI-järjestelmien rakentamiseen

Mitä moniagenttiorkestrointi tarkoittaa?

Mikropalveluanalogia

Milloin moniagenttijärjestelmä kannattaa?

Keskeiset orkestointimallit

Sekvenssimalli (Pipeline)

Rinnakkaismalli (Fan-out/Fan-in)

Orkestroija-Työntekijä-malli

Hierarkkiset tiimit

Reflektio- ja itsekorjaussilmukat

LangGraph: Syväsukellus

StateGraph-arkkitehtuuri

Solmut ja reunat käytännössä

Koodiesimerkki: Tutkimustiimin rakentaminen

LangGraph Platform ja tuotantokäyttö

CrewAI: Syväsukellus

Crews- ja Flows-arkkitehtuuri

YAML-pohjainen agenttien määrittely

Koodiesimerkki: Sisällöntuotanto-Crew

CrewAI Flows: Monimutkaiset työnkulut

Vertailu: LangGraph vs. CrewAI — kumpi ja milloin?

Arkkitehtuurifilosofiset erot

Käytännön vertailu

Milloin valita LangGraph?

Milloin valita CrewAI?

Avoimet standardit: MCP ja A2A

Model Context Protocol (MCP)

Agent-to-Agent Protocol (A2A)

Tuotantoympäristön parhaat käytännöt

Hallinta ja havainnoitavuus

Ihminen silmukassa (Human-in-the-Loop)

Tilan hallinta ja persistointi

Virheenkäsittely ja vikasietoisuus

Kustannusoptimointi (FinOps)

Yhteenveto ja tulevaisuuden näkymät

Mitä seuraavaksi?

Moniagenttiorkestrointi vuonna 2026: Käytännön opas LangGraph- ja CrewAI-järjestelmien rakentamiseen

Mitä moniagenttiorkestrointi tarkoittaa?

Mikropalveluanalogia

Milloin moniagenttijärjestelmä kannattaa?

Keskeiset orkestointimallit

Sekvenssimalli (Pipeline)

Rinnakkaismalli (Fan-out/Fan-in)

Orkestroija-Työntekijä-malli

Hierarkkiset tiimit

Reflektio- ja itsekorjaussilmukat

LangGraph: Syväsukellus

StateGraph-arkkitehtuuri

Solmut ja reunat käytännössä

Koodiesimerkki: Tutkimustiimin rakentaminen

LangGraph Platform ja tuotantokäyttö

CrewAI: Syväsukellus

Crews- ja Flows-arkkitehtuuri

YAML-pohjainen agenttien määrittely

Koodiesimerkki: Sisällöntuotanto-Crew

CrewAI Flows: Monimutkaiset työnkulut

Vertailu: LangGraph vs. CrewAI — kumpi ja milloin?

Arkkitehtuurifilosofiset erot

Käytännön vertailu

Milloin valita LangGraph?

Milloin valita CrewAI?

Avoimet standardit: MCP ja A2A

Model Context Protocol (MCP)

Agent-to-Agent Protocol (A2A)

Tuotantoympäristön parhaat käytännöt

Hallinta ja havainnoitavuus

Ihminen silmukassa (Human-in-the-Loop)

Tilan hallinta ja persistointi

Virheenkäsittely ja vikasietoisuus

Kustannusoptimointi (FinOps)

Yhteenveto ja tulevaisuuden näkymät

Mitä seuraavaksi?

Aiheeseen Liittyvät Artikkelit

Strukturoidut vasteet 2026: OpenAI strict, Claude tool use ja Gemini responseSchema käytännössä

Tekoälyagentin muisti 2026: Mem0, Zep ja lyhyt-/pitkäkestoiset muistikerrokset käytännössä

Prompt caching vuonna 2026: leikkaa Claude- ja GPT-API:n kustannuksia 90 %