ใน

OpenAI เปิดตัว GPT-5.4 รุ่น Pro และ Thinking ประสิทธิภาพดีขึ้น ลดข้อผิดพลาด

OpenAI เปิดตัว GPT-5.4 ซึ่งเป็นโมเดลพื้นฐานใหม่ที่มีประสิทธิภาพสูงสำหรับงานมืออาชีพ โดยมีรุ่น Pro และ Thinking ประสิทธิภาพดีขึ้น ลดข้อผิดพลาด เสริมความปลอดภัยในการใช้งานให้กับผู้ใช้

OpenAI เปิดตัว GPT-5.4 รุ่น Pro และ Thinking ประสิทธิภาพดีขึ้น ลดข้อผิดพลาด

เมื่อวันที่ 5 มี.ค. ที่ผ่านมา OpenAI ได้เปิดตัว GPT-5.4 โดยให้คำนิยามว่าเปน “โมเดลแถวหน้าที่มีความสามารถ และประสิทธิภาพสูงสุดสำหรับงานมืออาชีพ” นอกจากเวอร์ชันมาตรฐานแล้ว GPT-5.4 ยังมีให้เลือกใช้งานในรูปแบบโมเดลการใช้เหตุผล (GPT-5.4 Thinking) หรือแบบมีประสิทธิภาพสูงสุด (GPT-5.4 Pro) อีกด้วย

GPT-5.4 เวอร์ชัน API จะมาพร้อมกับ Context window ที่มีขนาดใหญ่ถึง 1 ล้านโทเค็น ซึ่งใหญ่ที่สุดเท่าที่เคยมีมาของ OpenAI

OpenAI ยังเน้นย้ำถึงประสิทธิภาพการใช้โทเค็นที่ดีขึ้น โดยระบุว่า GPT-5.4 สามารถแก้ปัญหาเดียวกันได้ด้วยจำนวนโทเค็นที่น้อยกว่ารุ่นก่อนหน้าอย่างเห็นได้ชัด

โมเดลใหม่นี้มาพร้อมกับผลการทดสอบเกณฑ์มาตรฐานที่ปรับปรุงดีขึ้นอย่างมาก รวมถึงการทำคะแนนสูงสุดเป็นประวัติการณ์ในการทดสอบเกณฑ์มาตรฐานการใช้งานคอมพิวเตอร์ OSWorld-Verified และ WebArena Verified นอกจากนี้ โมเดลใหม่ยังทำคะแนนได้สูงเป็นประวัติการณ์ถึง 83% ในการทดสอบ GDPval ของ OpenAI สำหรับงานที่ต้องใช้ความรู้

ที่มา: openai

Brendan Foody, CEO ของ Mercor และ GPT-5.4 ยังก้าวขึ้นเป็นผู้นำในการทดสอบ APEX-Agents ของ Mercor ซึ่งออกแบบมาเพื่อทดสอบทักษะทางวิชาชีพในด้านกฎหมายและการเงิน

Foody กล่าวในแถลงการณ์ว่า GPT-5.4 มีความเป็นเลิศในการสร้างผลงานที่ซับซ้อนและต้องใช้เวลา เช่น สไลด์นำเสนอ, โมเดลทางการเงิน และการวิเคราะห์ทางกฎหมาย, ให้ประสิทธิภาพสูงสุดพร้อมทำงานได้เร็วขึ้น และด้วยต้นทุนที่ต่ำกว่าเมื่อเทียบกับโมเดลแถวหน้าของคู่แข่ง

GPT-5.4 ยังคงสานต่อความพยายามของบริษัทในการลดข้อผิดพลาดที่เกิดจากการสร้างข้อมูลที่ไม่จริง (hallucinations) และข้อผิดพลาดด้านข้อเท็จจริง OpenAI กล่าวว่าโมเดลใหม่นี้มีโอกาสเกิดข้อผิดพลาดในการกล่าวอ้างแต่ละรายการลดลง 33% เมื่อเทียบกับ GPT 5.2 และโดยรวมแล้วการตอบกลับมีโอกาสผิดพลาดลดลง 18%

ที่มา: openai

OpenAI ได้ปรับปรุงวิธีการจัดการการเรียกใช้เครื่องมือของ GPT-5.4 เวอร์ชัน API โดยแนะนำระบบใหม่ที่เรียกว่า Tool Search ก่อนหน้านี้ การเรียกใช้โมเดลจำเป็นต้องระบุคำจำกัดความของเครื่องมือทั้งหมดที่มีอยู่ในพรอมต์ระบบ ซึ่งกระบวนการนี้อาจใช้โทเค็นจำนวนมากเมื่อจำนวนเครื่องมือเพิ่มขึ้น ระบบใหม่นี้ช่วยให้โมเดลสามารถค้นหาคำจำกัดความของเครื่องมือได้ตามความจำเป็น ส่งผลให้การเรียกใช้งานในระบบที่มีเครื่องมือจำนวนมากทำได้เร็วขึ้น และประหยัดค่าใช้จ่ายมากขึ้น

OpenAI ยังได้เพิ่มการประเมินความปลอดภัยใหม่เพื่อทดสอบ chain-of-thought ของโมเดล ซึ่งคือการให้ข้อคิดเห็นที่ต่อเนื่องกันเพื่อแสดงกระบวนการคิดในการทำงานหลายขั้นตอน นักวิจัยด้านความปลอดภัย AI กังวลมานานแล้วว่าโมเดลการใช้เหตุผลอาจบิดเบือน chain-of-thought ของตนเองได้ และการทดสอบแสดงให้เห็นว่ามันสามารถเกิดขึ้นได้ภายใต้สถานการณ์ที่เหมาะสม

ผลการประเมินใหม่ของ OpenAI แสดงให้เห็นว่า การหลอกลวงมีแนวโน้มเกิดขึ้นน้อยกว่าใน GPT-5.4 เวอร์ชัน Thinking ซึ่งบ่งชี้ว่าโมเดลอาจยังไม่มีความสามารถในการปกปิดกระบวนการให้เหตุผลของตัวเอง และการติดตามตรวจสอบ chain of thought (CoT) ก็ยังคงเป็นเครื่องมือด้านความปลอดภัยที่มีประสิทธิภาพ

เพิ่มเติม

Chain-of-thought (CoT) กระบวนการคิดทีละขั้นตอนก่อนให้คำตอบ

 

ที่มา: TechCrunch

ความคิดเห็น - Like เพจ iPhoneMod.net

เขียนโดย Nattida Suriyodara

Writer and Creator from IMod