AI ของ Google สะกดชื่อ Google ไม่ได้ สะกดชื่อบริษัทตัวเองไม่ถูก ตอบว่า Google มี P 2 ตัว และยังสะกดชื่อประธานาธิบดีสหรัฐฯ เป็น t-r-p-u-m สะท้อนจุดอ่อนพื้นฐานของ LLM ในการนับ และสะกดตัวอักษร
AI ของ Google สะกดชื่อ Google ไม่ได้ เผยจุดอ่อน LLM ที่ค้านสายตา
TechCrunch เผยข้อมูลที่น่าตกใจ ในการใช้งาน Google AI กับคำถามง่าย ๆ อย่าง “Google มีตัว P กี่ตัว?” (How many Ps are in Google?) กลับกลายเป็นโจทย์หินสำหรับ AI ของ Google เอง เมื่อ AI Overviews ตอบว่ามี 2 ตัว ซึ่งผิดอย่างชัดเจน
*ถ้าถามด้วยคำถามภาษาไทยจะตอบถูก แต่ถ้าถามด้วยภาษาอังกฤษ จะตอบผิด

นอกจากนี้ AI ยังระบุว่า คำว่า poop มีตัว r 1 ตัว และคำว่า journalism มีตัว d 2 ตัว แต่กลับสะกดว่า j-o-u-r-n-a-d-i-s-m ส่วนนามสกุลประธานาธิบดีสหรัฐฯ ที่ AI ตอบว่ามีตัว P 1 ตัว ก็สะกดออกมาเป็น t-r-p-u-m
ไม่ใช่ครั้งแรกที่ AI Overviews พลาด
นี่ไม่ใช่ครั้งแรกที่ฟีเจอร์ AI Overviews ของ Google สร้างความผิดพลาด ครั้งแรกที่ Google เพิ่ม AI Overviews ใน Search ระบบเคยอ้างอิงโพสต์เสียดสีจาก The Onion และ Reddit แนะนำให้คนกินหิน และทากาวบนพิซซ่า
รอบนี้ Google ทุ่มเทให้ generative AI เป็นศูนย์กลางของผลิตภัณฑ์หลักที่มีอายุ 29 ปี จึงไม่น่าแปลกใจที่ยังสะดุดอีก
ทำไม AI ถึงสะกดคำไม่เป็น
“การนับตัวอักษรในคำเป็นปัญหาที่ทราบกันดีสำหรับ LLM และเรากำลังดำเนินการแก้ไขปัญหานี้” Google ระบุในแถลงการณ์ทางอีเมลถึง TechCrunch
LLM ซึ่งเป็น AI ประเภทที่ขับเคลื่อนแชทบอต และเครื่องมือสร้างข้อความ ไม่ได้ถูกสร้างมาให้เข้าใจการสะกดคำ มันกลายเป็นมุกตลกมาหลายปีว่า ทุกครั้งที่มีบริษัทเปิดตัวโมเดล AI ใหม่ ควรถามมันว่า “คำว่า strawberry มีตัว r กี่ตัว” โมเดลเหล่านี้เขียนแอปได้ในไม่กี่วินาที หรือ แก้ปัญหาที่นักคณิตศาสตร์ติดมานานหลายทศวรรษ แต่สะกดคำได้พอ ๆ กับเด็กอนุบาล
สาเหตุจากระบบ Token
นักวิจัยอธิบายว่า AI ไม่ได้รับรู้ประโยคเป็นหน่วยของภาษาที่ประกอบด้วยคำ และตัวอักษร LLM จำนวนมากสร้างขึ้นบนโมเดล Transformer ซึ่งแบ่งข้อความเป็น Token ที่อาจเป็นทั้งคำ พยางค์ หรือ ตัวอักษร ขึ้นอยู่กับโมเดล แทนที่จะ “อ่าน” แบบมนุษย์ AI จะแปลงข้อความเป็นตัวเลข แล้วนำมาเชื่อมโยงบริบทเพื่อสร้างคำตอบที่สมเหตุสมผล
Matthew Guzdial นักวิจัย และผู้ช่วยศาสตราจารย์แห่ง University of Alberta อธิบายว่า “LLM ใช้สถาปัตยกรรม Transformer ซึ่งไม่ได้อ่านข้อความจริง ๆ เมื่อคุณป้อนคำสั่งเข้าไป มันจะถูกแปลงเป็นการเข้ารหัส”
ความผิดพลาดของ AI Overviews ยังไม่หมดแค่สะกดคำ Google เพิ่งแก้ไขปัญหาจากสัปดาห์ก่อน ที่การค้นหาคำว่า “disregard” จะแสดงผลลัพธ์ที่ดูเหมือนคำนิยาม แต่เนื้อหากลับเป็น “เข้าใจแล้ว แจ้งฉันเมื่อคุณมีคำถามใหม่” ซึ่งเป็นรูปแบบการตอบของแชทบอต
ที่มา: TechCrunch
