AI สำหรับการเขียนโค้ดกำลังพัฒนาอย่างรวดเร็ว เนื่องจากได้รับประโยชน์จากการเรียนรู้แบบเสริมแรงและการทดสอบที่วัดผลได้ง่าย ทำให้เกิดช่องว่างกับการพัฒนา AI ด้านอื่นที่ก้าวหน้าช้ากว่า ซึ่งมีนัยยะสำคัญต่อตลาดแรงงาน และเศรษฐกิจโดยรวม
ทำไม AI สำหรับเขียนโค้ด ถึงก้าวหน้าเร็วกว่า AI ด้านอื่น ๆ
ครื่องมือ AI สำหรับช่วยเขียนโค้ดกำลังเก่งขึ้นเร็วมาก สำหรับคนนอกสายงานอย่างเรา อาจตามไม่ทันว่าโลกเปลี่ยนไปแค่ไหน แต่ AI อย่าง GPT-5 และ Gemini 2.5 ได้ทำให้เคล็ดลับใหม่ๆ ของนักพัฒนาทำงานได้เองโดยอัตโนมัติ และเมื่อสัปดาห์ที่แล้ว Sonnet 4.5 ก็ทำได้อีกครั้ง
ในทางกลับกัน ความสามารถของ AI ด้านอื่นๆ กลับพัฒนาไปช้ากว่า ถ้าเราใช้ AI ช่วยเขียนอีเมล ประโยชน์ที่ได้ก็คงไม่ต่างจากปีที่แล้วเท่าไหร่ ถึงแม้โมเดล AI จะเก่งขึ้น แต่แอปที่เราใช้ก็อาจไม่ได้ดีขึ้นตามเสมอไป โดยเฉพาะพวก Chatbot ที่ต้องทำหลายอย่างพร้อมกัน ซึ่งตอนนี้ AI ยังคงก้าวหน้าอยู่ แต่ความเก่งของมันไม่ได้กระจายไปทุกด้านเท่าๆ กันเหมือนเมื่อก่อนแล้ว
เหตุผลที่ AI เก่งไม่เท่ากันในแต่ละด้านนั้น
แอปฯ ช่วยเขียนโค้ดจะเก่งขึ้นได้ก็เพราะมันผ่านการทดสอบที่วัดผลได้ง่ายๆ เป็นพันล้านครั้ง เพื่อฝึกให้มันสร้างโค้ดที่ใช้ได้จริง วิธีนี้เรียกว่า “การเรียนรู้แบบเสริมแรง” (Reinforcement Learning – RL) ซึ่งเป็นเบื้องหลังการเทรน AI ในช่วงครึ่งปีที่ผ่านมา และมันก็ซับซ้อนขึ้นเรื่อยๆ
เราจะให้คนมาคอยประเมินผลก็ได้ แต่จะดีที่สุดถ้ามีเกณฑ์ “ผ่าน-ไม่ผ่าน” ที่ชัดเจนไปเลย เพราะ AI จะได้เรียนรู้ซ้ำๆ เป็นพันล้านครั้งได้โดยไม่ต้องรอคนมาบอก พอวงการ AI หันมาใช้วิธีนี้มากขึ้น เลยเริ่มเห็นความแตกต่างชัดเจนระหว่าง “ทักษะที่ให้คะแนนวัดผลได้ง่าย ๆ ” กับ “ทักษะที่วัดผลยาก”
ทักษะที่เหมาะกับวิธีนี้ เช่น การแก้ Bug โค้ด หรือการทำโจทย์เลขยาก ๆ เลยต้องพัฒนาไปเร็วมาก ส่วนทักษะอย่างการเขียนทั่วไทกลับพัฒนาช้ากว่า
สรุปง่ายๆ ก็คือ มันมี ‘ช่องโหว่’ ของการเรียนรู้ (Reinforcement Gap) อยู่ ซึ่งกำลังจะกลายเป็นตัวชี้วัดสำคัญว่า AI จะทำอะไรได้หรือไม่ได้บ้างในอนาคต
การพัฒนาซอฟต์แวร์
ในบางแง่การพัฒนาซอฟต์แวร์เป็นเรื่องที่สมบูรณ์แบบสำหรับการเรียนรู้แบบ RL แม้กระทั่งก่อน AI ก็มีสาขาวิชาย่อยทั้งหมดที่ทุ่มให้กับการทดสอบว่าซอฟต์แวร์จะทำงานได้ดีภายใต้แรงกดดัน
ส่วนใหญ่เป็นเพราะนักพัฒนาจำเป็นต้องแน่ใจว่าโค้ดของพวกเขาจะไม่พังก่อนที่จะนำไปใช้งาน ดังนั้นแม้แต่โค้ดที่ซับซ้อนที่สุดก็ยังต้องผ่านการทดสอบ unit Testing, การทดสอบแบบบูรณาการ (integration testing), การทดสอบความปลอดภัย (security testing) และอื่น ๆ อีกมากมาย
นักพัฒนาใช้การทดสอบเหล่านี้เป็นประจำเพื่อตรวจสอบโค้ด และตามที่ผู้อำนวยการอาวุโสฝ่ายเครื่องมือสำหรับนักพัฒนาของ Google ได้กล่าวไว้ว่า การทดสอบเหล่านี้มีประโยชน์ไม่แพ้กันสำหรับการตรวจสอบโค้ดที่สร้างโดย AI ยิ่งไปกว่านั้นยังมีประโยชน์สำหรับการเรียนรู้แบบ RL เนื่องจากระบบเหล่านี้เป็นระบบที่จัดเป็นระบบ และสามารถทำซ้ำได้แม้จะสเกลใหญ่
การสร้างวิดีโอด้วย AI
วิดีโอที่สร้างโดย AI อยู่ในหมวดหมู่ที่ “ทดสอบได้ยาก” แต่ความก้าวหน้าอย่างรวดเร็วของโมเดล Sora 2 ตัวใหม่จาก OpenAI ก็แสดงให้เห็นว่ามันอาจจะไม่ได้ยากอย่างที่คิด
ผลกระทบ
นี่ไม่ใช่กฎตายตัวของปัญญาประดิษฐ์ แต่มันเป็นผลมาจากบทบาทสำคัญที่การเรียนรู้เสริมกำลังมีต่อการพัฒนา AI ในปัจจุบัน ซึ่งบทบาทนี้ก็อาจเปลี่ยนแปลงไปได้ง่ายๆ เมื่อโมเดลมีการพัฒนาขึ้น แต่ตราบใดที่การเรียนรู้เสริมกำลัง (RL) ยังคงเป็นเครื่องมือหลักในการนำผลิตภัณฑ์ AI ออกสู่ตลาด “ช่องว่างด้านการเรียนรู้เสริมกำลัง” นี้ก็จะยิ่งขยายใหญ่ขึ้นเรื่อย ๆ
ซึ่งจะส่งผลกระทบต่อบริษัทสตาร์ทอัพ และต่อเศรษฐกิจในภาพรวม หากกระบวนการใดตกอยู่ในฝั่งที่สามารถใช้การเรียนรู้เสริมกำลังได้ บริษัทสตาร์ทอัพก็น่าจะประสบความสำเร็จในการนำระบบอัตโนมัติเข้ามาใช้แทนที่
ที่มา: techcrunch.