ฟีเจอร์ถอดข้อความจากเสียง (Speech to Text) ช่วยแปลงเสียงให้เป็นข้อความ สามารถประยุกต์ใช้ได้กับงานหลายอย่าง เช่น งานประชุม การเรียน เป็นต้น
สายจดประชุมต้องลองใช้ Google AI Studio ถอดข้อความจากเสียง อัดโดยตรงหรือรองรับไฟล์เสียงได้!
การประชุมงานแบบเดิมอาจต้องมีการบันทึกเสียงในที่ประชุมเพื่อเป็นหลักฐาน และเผื่อนำไปเขียนสรุปหลังจบประชุม ซึ่งวิธีเดิมอาจต้องใช้เวลาเพราะกว่าเราจะจดต้องใช้เวลา และเปลืองแรงพอสมควร ถ้าใครเจอปัญหานี้อยู่ลองใช้ 2 เครื่องมือนี้ดูนะคะ
ใช้งานที่ไหน
เว็บไซต์ Google AI Studio ไม่มีแอปพลิเคชั่น
ผ่านมือถือ แท็บเล็ต และคอมพิวเตอร์ (อย่างสุดท้ายดีสุด)
https://aistudio.google.com/prompts/new_chat
วิธีถอดข้อความจากเสียงโดยตรง – Record Audio
- เข้ามาที่หน้า Google AI Studio (หมวดหมู่ Chat) > กดสัญลักษณ์ +
2. เลือกเมนู Record Audio (บันทึกเสียง)
3. กด Start recording เพื่อเริ่มบันทึกเสียงทันที เมื่อต้องการหยุดให้กด Stop recording
4. เสียงจะถูกส่งไปในห้อง Chat จากนั้นพิมพ์ว่า “ให้ถอดข้อความพร้อมแยกเสียงผู้พูด”
วิธีถอดข้อความจากไฟล์แนบ – Upload File
- เข้ามาที่หน้า Google AI Studio (หมวดหมู่ Chat) > กดสัญลักษณ์ +
2. เลือกเมนู Upload File (อัปโหลดไฟล์)
3. เลือกไฟล์เสียง หรือ ไฟล์ VDO แล้วกดอัปโหลด
4. เสียงจะถูกส่งไปในห้อง Chat จากนั้นพิมพ์ว่า “ช่วยถอดข้อความจากเสียงในคลิปทั้งหมด”
ข้อสังเกตหลังจากที่ใช้ (ส่วนตัว)
กิ๊ฟลองใช้ฟีเจอร์นี้หลายรอบแล้วค่ะ ถ้าให้ถอดข้อความเสียงเสียงที่เป็นไฟล์แนบจะครบ 100% แต่เมื่อใช้เป็นฟีเจอร์ Record Audio ที่เป็นการอัดเสียง Realtime จะถอดเสียงออกมาไม่ครบแม้ว่าเราจะอัดเสียงไว้นานแค่ไหน หรือว่าพิมพ์ Prompt เข้าไปว่าให้ถอดเสียงทั้งหมด
และหากผู้พูดพูดภาษาอื่น ๆ ก็จะแกะเป็นทีละคำออกมาคล้ายภาษาคาราโอเกะ เช่น หนี ห่าว ว่อ เจี้ยว ผิงผิง