Business

ప్రోగ్రామింగ్ కోసం ఖచ్చితంగా ఉత్తమ మోడల్, కానీ ఇప్పటికీ పెద్ద సమస్య ఉంది


ఆంత్రోపిక్ తన అత్యంత అధునాతన మోడల్‌ను ప్రారంభించింది, ఇది కోడ్ పరంగా ఏ పోటీదారుని మించిపోయింది. అయినప్పటికీ, దాని పరిమిత వినియోగం వినియోగదారుకు తక్కువ ప్రయోజనాన్ని అందిస్తుంది మరియు స్థిరమైన నిరాశను సృష్టిస్తుంది




ఫోటో: Xataka

ఆంత్రోపిక్ క్లాడ్ ఓపస్ 4.5ని ప్రకటించింది, ఇప్పటి వరకు దాని అత్యంత అధునాతన AI మోడల్. ఓపెన్‌ఏఐ యొక్క GPT-5.1 కోడెక్స్-మాక్స్ మరియు Google యొక్క జెమినీ 3 ప్రోలను అధిగమించి ప్రోగ్రామింగ్, ఇంటెలిజెంట్ ఏజెంట్‌లు మరియు గణన వినియోగం కోసం కంపెనీ ప్రపంచంలోనే అత్యుత్తమమైనదిగా పేర్కొంది.

Grok 4.1 తర్వాత కొద్ది రోజులకే విడుదల కూడా వచ్చింది.

అవలోకనం

కొత్త మోడల్ SWE-బెంచ్ వెరిఫైడ్‌లో 80.9% ఖచ్చితత్వాన్ని సాధించింది, ఇది సాఫ్ట్‌వేర్ ఇంజనీరింగ్ సామర్థ్యాలను మూల్యాంకనం చేయడానికి ప్రమాణం.

ఆంత్రోపిక్ దాని స్వంత ఇంజినీరింగ్ రిక్రూట్‌మెంట్ పరీక్ష ద్వారా కూడా దీనిని ఉంచింది – ఇది రెండు గంటల సమయ పరిమితితో చాలా కష్టమైనది – మరియు మోడల్ దానిని తీసుకున్న ప్రతి మానవ అభ్యర్థిని మించిపోయింది.

ఈ ప్రయోగం ప్రోగ్రామింగ్ కోసం AI సాధనాల్లో అగ్రగామిగా ఆంత్రోపిక్‌ను ఏకీకృతం చేస్తుంది. ఇతర ప్రాంతాలలో కంపెనీతో నేరుగా పోటీ పడినప్పటికీ, Meta కూడా దాని అంతర్గత కోడ్ అసిస్టెంట్ దేవ్‌మేట్ కోసం క్లాడ్‌ని ఉపయోగిస్తుంది.

మెరుగుదలలు కోడ్‌కే పరిమితం కావు. ఓపస్ 4.5 ప్రత్యేకంగా నిలుస్తుంది:

  • వృత్తిపరమైన పత్రాలు, స్ప్రెడ్‌షీట్‌లు మరియు ప్రదర్శనల సృష్టి;
  • బహుళ వనరులతో లోతైన పరిశోధన పనులు;
  • అధునాతన దృశ్య మరియు గణిత తార్కికం;
  • సంక్లిష్ట బహుళ-ఏజెంట్ వ్యవస్థల కోసం ఉప-ఏజెంట్ బృందాల నిర్వహణ.

సంఖ్యలలో

అదనంగా, ఆంత్రోపిక్ దాని API ధరను భారీగా తగ్గించింది: ప్రతి మిలియన్ ఇన్‌పుట్/అవుట్‌పుట్ టోకెన్‌లకు US$15/75 (R$83/415) నుండి US$5/25 (R$27/138).

మోడల్ దాని పూర్వీకుల కంటే మరింత సమర్థవంతమైనది:



Source link

Related Articles

స్పందించండి

మీ ఈమెయిలు చిరునామా ప్రచురించబడదు. తప్పనిసరి ఖాళీలు *‌తో గుర్తించబడ్డాయి

Back to top button