Anthropic on julkaissut uudet Claude 4 -sukupolven mallit ja ne ovat nyt saatavilla Amazon Bedrockissa. Claude Opus 4 ja Claude Sonnet 4 -mallien painopiste on erityisesti ohjelmoinnissa, pitkäjänteisessä päättelyssä ja tekoälyagenttien tukemisessa – ja niiden suorituskyky koodauksen tehtävissä on tällä hetkellä markkinoiden kärkeä.
Anthropic väittää Opus 4:n olevan “maailman paras koodaava kielimalli”. Benchmark-tulokset tukevat tätä: esimerkiksi SWE-benchissä, jossa arvioidaan mallien kykyä ratkaista oikeita ohjelmointiongelmia, Opus 4 saavuttaa 72,5 % onnistumisasteen – selvästi korkeammat lukemat kuin OpenAI:n GPT-4.1:llä tai Googlen Gemini 1.5:llä.
AWS:n kautta saataville tulleet mallit tukevat myös ns. "extended thinking" -tilaa, jossa malli kykenee käyttämään työkaluja, säilyttämään muistia ja toimimaan itsenäisenä agenttina pitkien tehtävien ajan. Opus 4 sopii erityisesti laajoihin ohjelmistoprojekteihin ja pääagenttikäyttöön, kun taas kevyempi Sonnet 4 on suunniteltu nopeisiin, korkean volyymin tehtäviin kuten koodikatselmuksiin ja bugikorjauksiin.
Molemmat mallit ovat nyt käytettävissä Amazon Bedrockin kautta, ilman omaa infrastruktuuria tai mallien isännöintiä. Kehittäjät voivat hyödyntää niitä Bedrockin Converse API -rajapinnan kautta, ja käyttää valmiita esimerkkejä mm. Swift-, Python- ja Typescript-ympäristöissä. Tämä tekee uusista Claude-malleista helposti käyttöönotettavia osaksi olemassa olevia kehitysputkia.
Vaikka Opus 4 tarjoaa vaikuttavaa suorituskykyä erityisesti koodauksessa, ei ole itsestään selvää, että se syrjäyttäisi GPT-4.1:n tai Gemini 1.5:n kaikissa käyttökohteissa. OpenAI:n GPT-mallit tarjoavat edelleen vahvan monipuolisuuden ja laajan plug-in-ekosysteemin. Gemini-mallit puolestaan loistavat erityisesti multimodaalisessa sisääntulossa ja Googlen pilvipalveluintegraatioissa.
Lisäksi agenttipohjainen kehitystyö vaatii edelleen huolellista suunnittelua, valvontaa ja kehittäjäosaamista – pelkkä huippumalli ei vielä takaa parempaa tuottavuutta ilman oikeaa käyttöönottoa ja testausta.
Lue lisää täällä.