ใน

Google เปิดตัว Gemini Omni Flash, AI สร้าง และแก้ไขวิดีโอจากทุก Input

Google เปิดตัว Gemini Omni Flash โมเดล AI ใหม่ สร้างและแก้ไขวิดีโอได้จากข้อความ ภาพ เสียง หรือวิดีโอ ผ่านการสั่งงานด้วยภาษาปกติ

Google เปิดตัว Gemini Omni Flash

Google เปิดตัว Gemini Omni อย่างเป็นทางการ โมเดล AI ใหม่ที่ผสาน “การคิดวิเคราะห์” และ “การสร้างคอนเทนต์” เข้าด้วยกัน โดยเริ่มต้นจากการสร้างวิดีโอเป็นหลัก

Google ระบุว่า Gemini Omni สามารถสร้างวิดีโอจากข้อความ ภาพ เสียง วิดีโอ รวมถึงสามารถแก้ไขวิดีโอผ่านการสนทนาด้วยภาษาปกติได้โดยตรง

เปิดตัว Gemini Omni Flash รุ่นแรก

โมเดลแรกของตระกูลนี้คือ Gemini Omni Flash ซึ่งเริ่มเปิดใช้งานแล้วบนแอป Gemini, Google Flow และ YouTube Shorts โดย Google ระบุว่าในอนาคตจะรองรับ Output เพิ่มเติมทั้งภาพ และเสียง

แก้ไขวิดีโอผ่านการสนทนา

หนึ่งในจุดเด่นสำคัญคือระบบแก้ไขวิดีโอแบบ Conversational Editing

ผู้ใช้สามารถสั่ง AI ด้วยภาษาปกติ เช่น

  • เปลี่ยนฉาก
  • เปลี่ยนมุมกล้อง
  • เพิ่มตัวละคร
  • เพิ่มวัตถุ
  • เปลี่ยนสไตล์วิดีโอ
  • ปรับรายละเอียดบางส่วนของฉาก

โดยทุกคำสั่งจะต่อเนื่องจากบริบทเดิม ทำให้ตัวละครยังคงหน้าตาเดิม ฟิสิกส์ของฉากยังสมจริง และเนื้อหาวิดีโอยังคงต่อเนื่อง

ใช้ความรู้ของ Gemini มาช่วยสร้างวิดีโอ

Google ระบุว่า Gemini Omni ไม่ได้แค่สร้างภาพสมจริง แต่ยังใช้ “World Knowledge” ของ Gemini มาช่วยสร้างเนื้อหาด้วย

ระบบสามารถเข้าใจแรงโน้มถ่วง วิเคราะห์การเคลื่อนไหว จำลองฟิสิกส์ ใช้ข้อมูลด้านประวัติศาสตร์ วิทยาศาสตร์ และวัฒนธรรม ช่วยให้วิดีโอมีความสมจริงและเล่าเรื่องได้ดีขึ้น

รองรับการสร้างวิดีโอจากหลาย Input พร้อมกัน

Gemini Omni สามารถรวมหลาย Input เข้าด้วยกันในคลิปเดียว เช่น ภาพอ้างอิง เสียงพูด วิดีโอต้นฉบับ ข้อความ Prompt

Google ระบุว่า Omni จะผสานทุกองค์ประกอบให้กลายเป็นวิดีโอที่มีสไตล์และโทนภาพสอดคล้องกัน

สร้างวิดีโอด้วย Avatar ของตัวเอง

Google ยังเปิดตัวฟีเจอร์ Avatars ที่ช่วยสร้าง Digital Avatar ของผู้ใช้ เพื่อใช้สร้างวิดีโอที่มีทั้งหน้าตาและเสียงคล้ายเจ้าของบัญชี

อย่างไรก็ตาม Google ระบุว่ายังอยู่ระหว่างทดสอบความปลอดภัยในการแก้ไขเสียงและคำพูด เพื่อป้องกันการนำไปใช้ผิดวัตถุประสงค์

วิดีโอทั้งหมดที่สร้างจาก Omni จะมีลายน้ำดิจิทัล SynthID ฝังอยู่ เพื่อให้สามารถตรวจสอบได้ว่าเป็นคอนเทนต์ที่สร้างจาก AI

เปิดใช้งานแล้วบางแพลตฟอร์ม

Gemini Omni Flash เริ่มเปิดให้ใช้งานแล้วสำหรับสมาชิก Google AI Plus, Google AI Pro, Google AI Ultra

ทั่วโลกผ่าน Gemini App และ Google Flow

ขณะเดียวกัน YouTube Shorts และ YouTube Create จะเริ่มรองรับฟรีตั้งแต่สัปดาห์นี้ และ Google เตรียมเปิด API สำหรับนักพัฒนาและองค์กรในอีกไม่กี่สัปดาห์ข้างหน้า

ที่มา: Google

ความคิดเห็น - Like เพจ iPhoneMod.net

เขียนโดย Thitirath Kinaret

เต้นท์ iMoD : ป.ตรี วิศวกรรมซอฟต์แวร์ ป.โท บริหารธุรกิจ ม.พายัพ ชอบความสวยงามแบบเรียบง่าย ตามแบบฉบับของ Apple @Contact : facebook.com/tentzy