ใน ,

ผู้อำนวยการ AI Safety ของ Meta เจอ OpenClaw ลบอีเมลไม่หยุด

ผู้อำนวยการฝ่าย AI Alignment ของ Meta Superintelligence Labs ทดลองใช้ OpenClaw กับเมลจริง พบว่าระบบ OpenClaw ลบอีเมลไม่หยุด จนต้องรีบไปแก้ที่ Mac mini เหมือนกับกู้ระเบิด

ผู้อำนวยการ AI Safety ของ Meta เจอ OpenClaw ลบอีเมลไม่หยุด

Summer Yue ได้ทดลองใช้ OpenClaw ซึ่งเป็น AI Agent แบบ Open Source ที่กำลังได้รับความนิยม สามารถทำงานแทนได้ตลอด 24 ชั่วโมง หลังจากที่เธอทดสอบกับ inbox ของเมลทดลองแล้ว และได้ผลดี เธอจึงตัดสินใจใช้กับอีเมลจริง

แต่แล้วสิ่งที่เกิดขึ้นก็กลายเป็นฝันร้าย, บอทของ OpenClaw บอกว่าจะ “ลบทุกอย่างใน inbox ที่เก่ากว่า 15 ก.พ. ยกเว้นของที่อยู่ในลิสต์เก็บไว้” Yue พยายามหยุดหลายครั้งโดยส่งข้อความว่า “อย่าทำอย่างนั้น” และ “หยุด OPENCLAW” แต่บอทก็ยังคงวางแผนลบอีเมลต่อไป

เธอเขียนบน X ว่า “ฉันหยุดมันจากโทรศัพท์ไม่ได้ ต้องวิ่งไปหยุดที่ Mac mini เหมือนกำลังเก็บระเบิด”

ปัญหาเกิดจากการ Compact Memory

Yue อธิบายว่าเธอเคยทดสอบ OpenClaw กับ inbox ทดลองมาก่อน และได้ผลดี จึงไว้วางใจ แต่เมื่อใช้กับอีเมลจริงที่มีจำนวนมากกว่ามาก บอทต้อง Compact Memory ในระหว่างนั้นก็ทำให้สูญเสีย Prompt ที่บอกให้ไม่ทำอะไรโดยไม่ขออนุมัติก่อน

ตำแหน่งของ Yue ที่ Meta นั้นเป็นผู้อำนวยการฝ่าย Alignment ของแผนก Superintelligence Labs ซึ่งหมายความว่าเธอมีหน้าที่ดูแลให้ AI ทำงานอย่างปลอดภัย และตรงตามที่มนุษย์ต้องการ

การที่คนที่ทำงานด้าน AI Safety กลับเจอปัญหากับ AI Agent ที่ไม่ปลอดภัยจึงเป็นเรื่องที่ทำให้หลายคนตั้งคำถาม

OpenClaw มีข้อกังวลด้านความปลอดภัย

OpenClaw ไม่เหมือน AI Agent ตัวอื่น ๆ เพราะไม่ต้องการการอนุมัติจากมนุษย์ก่อนทำอะไร นอกจากนี้ยังถูกเขียนด้วยวิธี vibe-coding และเมื่อรวมกับระดับการเข้าถึงระบบที่ OpenClaw มี ทำให้นักวิจัย AI หลายคนตั้งคำถามเกี่ยวกับความปลอดภัย

Gary Marcus นักวิจัย AI บอกกับ Business Insider ว่ามันเหมือน “ให้คนแปลกหน้าที่คุณเจอในบาร์เข้าถึงคอมพิวเตอร์ และรหัสผ่านทั้งหมดของคุณ”

Peter Steinberger ผู้สร้าง OpenClaw (ซึ่งตอนนี้ถูกจ้างโดย OpenAI แล้ว) เคยกล่าวในพอดแคสต์ว่าเขากำลังให้ความสำคัญกับการสร้างระบบป้องกันความปลอดภัยเพิ่มเติมมากกว่าฟีเจอร์ที่ใช้งานง่าย

วิพากษ์วิจารณ์จากผู้ใช้โซเชียล

ผู้ใช้ X หลายคนวิจารณ์ Yue ที่เอา OpenClaw มาเชื่อมกับอีเมลจริง, โดย Ben Hylak ผู้ร่วมก่อตั้ง Raindrop AI และอดีตพนักงาน Apple โพสต์ภาพหน้าจอ LinkedIn ของเธอและเขียนว่า “นี่ควรทำให้คุณหวาดกลัว Meta กำลังทำอะไรอยู่”

ผู้ใช้ X อีกคนเขียนว่า “น่ากังวลนิดหน่อยที่คนที่ทำงานเรื่อง AI Alignment กลับแปลกใจเมื่อ AI ไม่ทำตามคำสั่งอย่างแม่นยำ”

น่าสนใจว่า Yue ไม่ใช่พนักงาน Meta คนเดียวที่ลอง OpenClaw, Steinberger เคยบอกว่า Mark Zuckerberg เล่นกับเครื่องมือนี้เป็นเวลาหนึ่งสัปดาห์ และส่ง Feedback มาด้วย แม้ว่า Meta จะพยายามดึงตัวเขา แต่ Steinberger สุดท้ายก็ตัดสินใจรับข้อเสนอจาก OpenAI

ในคอมเมนต์ใต้โพสต์ของ Yue มีคนถามว่าเธอตั้งใจทดสอบระบบป้องกันหรือเป็นแค่ความผิดพลาดของมือใหม่ Yue ตอบว่า “เป็นความผิดพลาดของมือใหม่จริง ๆ ปรากฏว่านักวิจัย Alignment ก็ไม่รอดพ้นจากปัญหา Misalignment เหมือนกัน”

ที่มา: Business Insider

ความคิดเห็น - Like เพจ iPhoneMod.net

เขียนโดย Thitirath Kinaret

เต้นท์ iMoD : ป.ตรี วิศวกรรมซอฟต์แวร์ ป.โท บริหารธุรกิจ ม.พายัพ ชอบความสวยงามแบบเรียบง่าย ตามแบบฉบับของ Apple @Contact : facebook.com/tentzy