ప్రోగ్రామింగ్ కోసం ఖచ్చితంగా ఉత్తమ మోడల్, కానీ ఇప్పటికీ పెద్ద సమస్య ఉంది

ఆంత్రోపిక్ తన అత్యంత అధునాతన మోడల్ను ప్రారంభించింది, ఇది కోడ్ పరంగా ఏ పోటీదారుని మించిపోయింది. అయినప్పటికీ, దాని పరిమిత వినియోగం వినియోగదారుకు తక్కువ ప్రయోజనాన్ని అందిస్తుంది మరియు స్థిరమైన నిరాశను సృష్టిస్తుంది
ఆంత్రోపిక్ క్లాడ్ ఓపస్ 4.5ని ప్రకటించింది, ఇప్పటి వరకు దాని అత్యంత అధునాతన AI మోడల్. ఓపెన్ఏఐ యొక్క GPT-5.1 కోడెక్స్-మాక్స్ మరియు Google యొక్క జెమినీ 3 ప్రోలను అధిగమించి ప్రోగ్రామింగ్, ఇంటెలిజెంట్ ఏజెంట్లు మరియు గణన వినియోగం కోసం కంపెనీ ప్రపంచంలోనే అత్యుత్తమమైనదిగా పేర్కొంది.
Grok 4.1 తర్వాత కొద్ది రోజులకే విడుదల కూడా వచ్చింది.
అవలోకనం
కొత్త మోడల్ SWE-బెంచ్ వెరిఫైడ్లో 80.9% ఖచ్చితత్వాన్ని సాధించింది, ఇది సాఫ్ట్వేర్ ఇంజనీరింగ్ సామర్థ్యాలను మూల్యాంకనం చేయడానికి ప్రమాణం.
ఆంత్రోపిక్ దాని స్వంత ఇంజినీరింగ్ రిక్రూట్మెంట్ పరీక్ష ద్వారా కూడా దీనిని ఉంచింది – ఇది రెండు గంటల సమయ పరిమితితో చాలా కష్టమైనది – మరియు మోడల్ దానిని తీసుకున్న ప్రతి మానవ అభ్యర్థిని మించిపోయింది.
ఈ ప్రయోగం ప్రోగ్రామింగ్ కోసం AI సాధనాల్లో అగ్రగామిగా ఆంత్రోపిక్ను ఏకీకృతం చేస్తుంది. ఇతర ప్రాంతాలలో కంపెనీతో నేరుగా పోటీ పడినప్పటికీ, Meta కూడా దాని అంతర్గత కోడ్ అసిస్టెంట్ దేవ్మేట్ కోసం క్లాడ్ని ఉపయోగిస్తుంది.
మెరుగుదలలు కోడ్కే పరిమితం కావు. ఓపస్ 4.5 ప్రత్యేకంగా నిలుస్తుంది:
- వృత్తిపరమైన పత్రాలు, స్ప్రెడ్షీట్లు మరియు ప్రదర్శనల సృష్టి;
- బహుళ వనరులతో లోతైన పరిశోధన పనులు;
- అధునాతన దృశ్య మరియు గణిత తార్కికం;
- సంక్లిష్ట బహుళ-ఏజెంట్ వ్యవస్థల కోసం ఉప-ఏజెంట్ బృందాల నిర్వహణ.
సంఖ్యలలో
అదనంగా, ఆంత్రోపిక్ దాని API ధరను భారీగా తగ్గించింది: ప్రతి మిలియన్ ఇన్పుట్/అవుట్పుట్ టోకెన్లకు US$15/75 (R$83/415) నుండి US$5/25 (R$27/138).
మోడల్ దాని పూర్వీకుల కంటే మరింత సమర్థవంతమైనది:


