ใน AI

Anthropic เปิดตัว Claude Opus 4.8 ซื่อตรงขึ้น รองรับ AI Agent

โดย Nattida Suriyodara 29 พ.ค. 2026, 09:37 น. 2k ดู

Anthropic เปิดตัว Claude Opus 4.8 โมเดล AI รุ่นล่าสุด เขียนโค้ดเก่งขึ้น มีความซื่อตรงเพิ่มขึ้น 4 เท่า และราคาถูกลงถึง 3 เท่า ทำคะแนน SWE-Bench Pro 69.2% เหนือกว่า GPT-5.5 และ Gemini 3.1 Pro

Claude Opus 4.8 แรงขึ้น ซื่อตรงขึ้น ราคาถูกลง

Anthropic ประกาศเปิดตัว Claude Opus 4.8 เมื่อวันที่ 28 พ.ค. 2026 โดยระบุว่าโมเดลนี้เป็น “ผู้ช่วยที่มีประสิทธิภาพมากขึ้น” ด้วยการปรับปรุงด้านการเขียนโค้ดแบบ Agentic, การใช้เหตุผลข้ามสาขาวิชา, การใช้งานคอมพิวเตอร์แบบ Agentic, งานด้านองค์ความรู้ และการวิเคราะห์ทางการเงินแบบ Agentic

ซื่อตรงมากขึ้นถึง 4 เท่า

ผู้ทดสอบพบว่า Opus 4.8 มีความน่าเชื่อถือ และการตัดสินใจที่เฉียบคมมากขึ้นเมื่อทำงานแบบ Agentic ที่สำคัญคือโมเดลนี้มีแนวโน้มจะแจ้งเตือนเมื่อไม่แน่ใจในผลลัพธ์ของตัวเอง และมีโอกาสกล่าวอ้างโดยไม่มีหลักฐานสนับสนุนน้อยลง ทาง Anthropic ระบุว่า Opus 4.8 มีโอกาสปล่อยให้ข้อผิดพลาดในโค้ดที่ตัวเองเขียนผ่านไปโดยไม่ทักท้วงน้อยกว่ารุ่นก่อนหน้าประมาณ 4 เท่า

คะแนน Alignment สูงสุดเป็นประวัติการณ์

การประเมินด้าน Alignment แสดงให้เห็นว่าโมเดลนี้ทำคะแนนสูงสุดเป็นประวัติการณ์ในด้านพฤติกรรมเชิงบวกต่อสังคม เช่น การสนับสนุนความเป็นอิสระของผู้ใช้ และการกระทำเพื่อผลประโยชน์สูงสุดของผู้ใช้ ส่วนอัตราพฤติกรรมที่ไม่พึงประสงค์ เช่น การหลอกลวง นั้นต่ำกว่า Opus 4.7 และใกล้เคียงกับ Claude Mythos Preview

ประสิทธิภาพเหนือ GPT-5.5 และ Gemini 3.1 Pro

ผลทดสอบจาก Anthropic ระบุว่า Opus 4.8 ทำคะแนน 69.2% บน SWE-Bench Pro เหนือกว่า GPT-5.5 และ Gemini 3.1 Pro ในการทดสอบนี้ และอีกหลายรายการ แม้ว่า GPT-5.5 จะยังนำอยู่ในการทดสอบ Terminal-Coding

เร็วขึ้น 2.5 เท่า ราคาถูกลง 3 เท่า

โหมดความเร็วสูงของ Opus 4.8 ทำงานได้เร็วขึ้น x2.5 เท่าของรุ่นก่อนหน้า และราคาถูกกว่าโมเดลรุ่นก่อนหน้าถึง 3 เท่า โดยราคาสำหรับการใช้งานปกติยังคงเท่าเดิมกับ Opus 4.7

ฟีเจอร์ใหม่ 3 รายการ

พร้อมกับการเปิดตัว Opus 4.8 ทาง Anthropic ยังได้เพิ่มฟีเจอร์ใหม่ ได้แก่

Dynamic workflows (รุ่นทดลองในงานวิจัย)

Claude สามารถทำงานที่ใหญ่ขึ้นใน Claude Code ได้แล้ว โดยสามารถวางแผนงานและรัน subagent แบบขนานได้หลายร้อยตัวใน session เดียว รวมถึงทำ migration ระดับโค้ดเบสขนาดใหญ่ที่ครอบคลุมโค้ดหลายแสนบรรทัด ฟีเจอร์นี้มีให้ใช้งานสำหรับ Claude Code ในแพ็กเกจ Enterprise, Team และ Max

Effort control

ใน Claude.ai และ Cowork ผู้ใช้สามารถเลือกระดับความพยายามที่ Claude ใช้ในการตอบได้ ถ้าตั้งค่าต่ำ Claude จะตอบเร็วขึ้นและใช้ Rate limit ช้าลง Opus 4.8 ตั้งค่าค่าเริ่มต้นเป็น High effort ซึ่ง Anthropic บอกว่าเป็นสมดุลที่ดีที่สุดระหว่างคุณภาพกับประสบการณ์ผู้ใช้

Messages API

รองรับการใส่ System entry ภายใน Messages array แล้ว ทำให้นักพัฒนาสามารถอัปเดตคำสั่งของ Claude ระหว่างทำงานได้

Claude Mythos กำลังจะมา

Anthropic กำลังพัฒนาโมเดลที่มีความสามารถเทียบเท่า Opus 4.8 แต่มีต้นทุนต่ำกว่า รวมถึงโมเดลระดับใหม่ที่ชาญฉลาดยิ่งกว่า Opus บริษัทระบุว่ากำลังพัฒนาระบบความปลอดภัยสำหรับโมเดล Claude Mythos ซึ่งขณะนี้กำลังทดสอบกับองค์กรจำนวนหนึ่ง และคาดว่าจะเปิดให้ลูกค้าทั้งหมดใช้งานได้ในอีกไม่กี่สัปดาห์ข้างหน้า

Claude Opus 4.8 พร้อมใช้งานแล้ววันนี้

ที่มา: MacRumors

ความคิดเห็น - Like เพจ iPhoneMod.net