ใน

Google เปิดตัว Gemini 3.5 Live Translate แปลเสียงแบบเรียลไทม์กว่า 70 ภาษา รักษาน้ำเสียง และอารมณ์ผู้พูดได้

Google เปิดตัว Gemini 3.5 Live Translate โมเดลแปลภาษาเสียงแบบเรียลไทม์รุ่นใหม่ รองรับมากกว่า 70 ภาษา สามารถแปลเสียงเป็นเสียงได้อย่างต่อเนื่อง พร้อมรักษาน้ำเสียง จังหวะการพูด และอารมณ์ของผู้พูด โดยเริ่มเปิดใช้งานใน Google Translate, Google Meet และ Gemini Live API แล้ว

Google เปิดตัว Gemini 3.5 Live Translate แปลเสียงแบบเรียลไทม์กว่า 70 ภาษา รักษาน้ำเสียง และอารมณ์ผู้พูดได้

Google เปิดตัว Gemini 3.5 Live Translate โมเดล AI ด้านเสียงรุ่นใหม่สำหรับการแปลภาษาแบบ Speech-to-Speech ซึ่งสามารถแปลคำพูดจากภาษาหนึ่งไปเป็นอีกภาษาหนึ่งได้แบบเกือบเรียลไทม์ พร้อมรักษาน้ำเสียง จังหวะ และลักษณะการพูดของเจ้าของเสียงต้นฉบับ

Google ระบุว่านี่คือก้าวสำคัญของเทคโนโลยีแปลภาษาที่บริษัทพัฒนามาต่อเนื่องกว่า 20 ปี โดยปัจจุบัน Google แปลคำมากกว่าหนึ่งล้านล้านคำต่อเดือนให้กับผู้ใช้งานหลายพันล้านคนทั่วโลก

แปลเสียงแบบต่อเนื่อง ไม่ต้องรอพูดจบประโยค

จุดเด่นสำคัญของ Gemini 3.5 Live Translate คือความสามารถในการแปลแบบต่อเนื่องระหว่างที่ผู้พูดยังคงพูดอยู่ โดยแตกต่างจากระบบแปลภาษาแบบเดิมที่ต้องรอให้ผู้พูดพูดจบก่อนจึงเริ่มแปล

ระบบใหม่สามารถสร้างเสียงแปลออกมาได้อย่างต่อเนื่อง โดย AI จะคอยปรับสมดุลระหว่างการรอข้อมูลเพิ่มเติมเพื่อความแม่นยำ และการตอบสนองที่รวดเร็วเพื่อให้การสนทนายังคงเป็นธรรมชาติ

ผลลัพธ์คือเสียงแปลที่ลื่นไหล ลดช่วงเงียบที่น่าอึดอัด และมีความหน่วงเพียงไม่กี่วินาทีจากเสียงต้นฉบับ

รองรับมากกว่า 70 ภาษา

Gemini 3.5 Live Translate สามารถตรวจจับภาษาได้อัตโนมัติ โดยไม่ต้องกำหนดค่าล่วงหน้า

ระบบรองรับมากกว่า 70 ภาษา และสามารถจัดการกับการสนทนาหลายภาษาในเซสชันเดียวได้ พร้อมรองรับสภาพแวดล้อมที่มีเสียงรบกวนสูง เช่น

  • การประชุม
  • ห้องเรียน
  • การถ่ายทอดสด
  • การสนทนาระหว่างประเทศ
  • การแปลสดในงานอีเวนต์

Google ระบุว่าโมเดลได้รับการออกแบบให้สามารถทำงานได้ดีแม้อยู่ในสภาพแวดล้อมที่มีเสียงรบกวนหรือเสียงพูดหลายคนพร้อมกัน

เปิดใช้งานใน Google Translate แล้ว

Google เริ่มทยอยเปิดใช้งาน Gemini 3.5 Live Translate ผ่านแอป Google Translate ทั้งบน Android และ iPhone แล้วทั่วโลก

ผู้ใช้สามารถเชื่อมต่อหูฟัง และใช้ฟีเจอร์ Live Translate เพื่อรับฟังคำแปลที่สะท้อนน้ำเสียง และลักษณะการพูดของผู้สนทนาได้อย่างเป็นธรรมชาติมากขึ้น

Android เพิ่มโหมด Listening Mode ใหม่

สำหรับผู้ใช้งาน Android, Google เริ่มปล่อยฟีเจอร์ใหม่ชื่อ Listening Mode ฟีเจอร์นี้ช่วยให้ผู้ใช้สามารถยกโทรศัพท์แนบหูเหมือนการคุยโทรศัพท์ปกติ และฟังเสียงแปลที่ส่งออกผ่านลำโพงสนทนา (Earpiece) ได้โดยตรง

ซึ่งเหมาะสำหรับสถานการณ์ที่ต้องการฟังคำแปลแบบส่วนตัว หรือไม่มีหูฟังอยู่ใกล้ตัว

Google ยกตัวอย่างการใช้งาน เช่น การฟังไกด์นำเที่ยวภาษาสเปน พร้อมรับคำแปลภาษาอังกฤษแบบเกือบเรียลไทม์ผ่านโทรศัพท์โดยตรง

เตรียมใช้งานใน Google Meet

Google ยังเตรียมนำ Gemini 3.5 Live Translate มาใช้ใน Google Meet ด้วย

การอัปเดตครั้งนี้จะช่วยให้ Google Meet สามารถ

  • รองรับมากกว่า 70 ภาษา
  • รองรับการแปลมากกว่า 2,000 คู่ภาษา
  • แปลภาษาได้โดยไม่จำกัดเฉพาะภาษาอังกฤษ
  • เข้าถึงฟีเจอร์แปลเสียงได้ง่ายขึ้นจากอินเทอร์เฟซใหม่

Google เริ่มเปิด Private Preview ให้ลูกค้า Google Workspace บางรายแล้วในเดือนนี้ และจะทยอยขยายการใช้งานเพิ่มเติมภายในปี 2026

เปิดให้ใช้งานผ่าน Gemini Live API

สำหรับนักพัฒนา Google เปิด Gemini 3.5 Live Translate ในรูปแบบ Public Preview ผ่าน Gemini Live API และ Google AI Studio

นักพัฒนาสามารถนำโมเดลไปสร้างแอปพลิเคชันด้านการแปลภาษา การประชุมหลายภาษา การสื่อสารระหว่างประเทศ หรือระบบพากย์เสียงแบบเรียลไทม์ได้

Google ระบุว่าพาร์ตเนอร์หลายราย เช่น Agora, Fishjam, LiveKit, Pipecat และ Vision Agents ได้เริ่มผสานระบบเข้ากับแพลตฟอร์มของตนแล้ว

Grab เริ่มทดสอบใช้งานจริง

หนึ่งในบริษัทที่กำลังทดสอบ Gemini 3.5 Live Translate คือ Grab

Google ระบุว่า Grab กำลังนำโมเดลดังกล่าวมาทดลองใช้เพื่อช่วยให้คนขับ และผู้โดยสารที่พูดคนละภาษาสามารถสื่อสารกันได้แบบเกือบเรียลไทม์

ปัจจุบัน Grab มีการโทรศัพท์ระหว่างผู้โดยสารและคนขับมากกว่า 10 ล้านครั้งต่อเดือน ทำให้เป็นหนึ่งในกรณีใช้งานที่มีศักยภาพสูงสำหรับเทคโนโลยีนี้

ฝังลายน้ำดิจิทัลด้วย SynthID

Google ยืนยันว่าเสียงทั้งหมดที่สร้างขึ้นโดย Gemini 3.5 Live Translate จะถูกฝังลายน้ำดิจิทัลผ่านเทคโนโลยี SynthID

ลายน้ำดังกล่าวไม่สามารถสังเกตได้ด้วยการฟังปกติ แต่สามารถใช้ตรวจสอบได้ว่าเนื้อหาเสียงถูกสร้างโดย AI หรือไม่

Google ระบุว่ามาตรการนี้เป็นส่วนหนึ่งของแนวทางด้านความปลอดภัยและการลดความเสี่ยงจากข้อมูลปลอมที่สร้างด้วย AI

เริ่มใช้งานแล้ววันนี้

Gemini 3.5 Live Translate เริ่มเปิดใช้งานแล้วใน

  • Google Translate บน Android และ iOS
  • Gemini Live API
  • Google AI Studio

ส่วน Google Meet จะเริ่มเปิดใช้งานแบบ Private Preview สำหรับลูกค้าองค์กรบางส่วนในเดือนนี้ ก่อนขยายการให้บริการเพิ่มเติมภายในปี 2026 นี้

ที่มา: Google

ความคิดเห็น - Like เพจ iPhoneMod.net

เขียนโดย Thitirath Kinaret

เต้นท์ iMoD : ป.ตรี วิศวกรรมซอฟต์แวร์ ป.โท บริหารธุรกิจ ม.พายัพ ชอบความสวยงามแบบเรียบง่าย ตามแบบฉบับของ Apple @Contact : facebook.com/tentzy