Google เปิดฟีเจอร์ Avatar ของ Gemini ให้สมาชิกพรีเมียมสร้…

Google เปิดให้ฟีเจอร์ Avatar ของ Gemini‑Omni ขยายการให้บริการแก่สมาชิกแบบชำระเงินในแอป Gemini อย่างเป็นทางการ — ผู้ใช้สามารถสร้าง “โคลน” ดิจิทัลที่พูดและเคลื่อนไหวตามเสียงและใบหน้าตัวเองได้โดยอัตโนมัติ

Overview

Gemini เป็นชุดโมเดล AI ของ Google ที่พัฒนาโดยใช้ Omni model ซึ่งเป็นการรวมความสามารถหลายด้านเข้าด้วยกัน ทั้งการประมวลผลภาพและเสียงในเวลาเดียวกัน ฟีเจอร์ Avatar ที่เพิ่งเปิดตัวในเดือนที่ผ่านมา ให้ผู้ใช้สร้างตัวแทนดิจิทัลที่ดูเหมือนตนเองโดยอิงจากภาพถ่ายและการบันทึกเสียงของผู้ใช้เอง การทำงานของระบบเป็นแบบ “generative” ทำให้วิดีโอที่ได้มีลักษณะเป็นการพูดคุยแบบเรียลไทม์และเคลื่อนไหวตามอารมณ์ของเสียงที่ป้อนเข้าไป

แม้ว่า Gemini จะถูกออกแบบให้เป็นเครื่องมือสนับสนุนการสร้างคอนเทนต์และการสื่อสารในหลายรูปแบบ ฟีเจอร์ Avatar กลายเป็นจุดสนใจหลักเพราะความสามารถในการทำให้ผู้ใช้ “เป็นตัวเอง” บนแพลตฟอร์มดิจิทัลโดยไม่มีการถ่ายทำวิดีโอจริง ซึ่งอาจเปลี่ยนแปลงวิธีการผลิตสื่อส่วนบุคคลในอนาคต

How It Works

กระบวนการสร้าง Avatar เริ่มจากผู้ใช้ต้องอัปโหลดภาพใบหน้าที่ชัดเจนและบันทึกเสียงพูดตามคำแนะนำของแอป ระบบจะใช้ Omni model วิเคราะห์ข้อมูลเหล่านั้นเพื่อสร้างโมเดล 3 มิติของใบหน้าและเชื่อมต่อกับลักษณะเสียงของผู้ใช้ เมื่อเสร็จแล้วผู้ใช้สามารถพิมพ์ข้อความหรือพูดเพื่อให้ Avatar ทำการพูดออกมาในวิดีโอที่สร้างโดยอัตโนมัติ

การสร้างวิดีโอแต่ละครั้งจะมีการฝัง SynthID watermark ที่มองไม่เห็นด้วยตาเปล่า ซึ่งเป็นมาตรการของ Google เพื่อระบุว่าเนื้อหานั้นเป็นการสร้างโดย AI การฝังรหัสนี้ช่วยให้ผู้ตรวจสอบหรือแพลตฟอร์มอื่นสามารถตรวจจับและจัดการกับคอนเทนต์ที่อาจก่อให้เกิดการเข้าใจผิดหรือการใช้ในทางที่ไม่เหมาะสมได้

Availability & Requirements

การเปิดให้บริการ Avatar ในปัจจุบันจำกัดอยู่ที่สมาชิกที่สมัครใช้บริการแบบชำระเงินของแอป Gemini เท่านั้น โดยมีเงื่อนไขพื้นฐานดังต่อไปนี้

ต้องเป็นผู้ใช้ที่อายุ อย่างน้อย 18 ปี ตามนโยบายของ Google
ต้องสมัครใช้บริการ Gemini Premium หรือระดับสมาชิกที่ให้สิทธิ์การเข้าถึงฟีเจอร์ขั้นสูง
ต้องใช้แอป Gemini เวอร์ชันล่าสุดบนอุปกรณ์ที่รองรับการประมวลผลภาพและเสียง

Google ยังระบุว่าจะค่อยขยายการให้บริการให้ครอบคลุมผู้ใช้ระดับพื้นฐานในช่วงหลายเดือนข้างหน้า หากมีการตอบรับที่ดีและไม่มีปัญหาด้านความเป็นส่วนตัวหรือการใช้งานที่ผิดพลาด

Privacy & Ethical Concerns

แม้ว่าเทคโนโลยี Avatar จะเปิดโอกาสใหม่ในการสร้างคอนเทนต์ส่วนบุคคล แต่ก็ทำให้เกิดคำถามด้านความเป็นส่วนตัวและจริยธรรมอย่างชัดเจน การใช้ใบหน้าและเสียงของผู้ใช้เพื่อสร้างคลอนดิจิทัลอาจทำให้ข้อมูลชีวภาพถูกเก็บไว้ในระบบคลาวด์ของ Google ซึ่งอาจเป็นเป้าหมายของการโจมตีหรือการใช้งานโดยไม่ได้รับอนุญาต

Google พยายามบรรเทาความกังวลนี้ด้วยการฝัง SynthID watermark ที่ช่วยให้วิดีโอที่สร้างโดย AI สามารถแยกแยะได้จากวิดีโอที่ถ่ายทำจริง นอกจากนี้ยังมีการแจ้งเตือนผู้ใช้ให้ตรวจสอบและยืนยันการใช้ข้อมูลส่วนบุคคลก่อนทำการสร้าง Avatar อย่างไรก็ตาม ผู้สังเกตการณ์ด้านความปลอดภัยดิจิทัลยังคงเตือนว่าการเผยแพร่ Avatar ไปยังสื่อสาธารณะอาจทำให้เกิดการหลอกลวงหรือการปลอมแปลงตัวตนได้ง่ายขึ้น

Market Impact

การเปิดตัว Avatar อย่างกว้างขวางอาจเป็นสัญญาณบ่งชี้ถึงการเปลี่ยนแปลงในอุตสาหกรรมคอนเทนต์ดิจิทัล การใช้ AI สร้างตัวแทนเสมือนจริงอาจทำให้ครีเอเตอร์, นักการตลาด และผู้ผลิตสื่อสามารถลดต้นทุนการผลิตวิดีโอและเพิ่มความเร็วในการสร้างสรรค์คอนเทนต์ได้อย่างมีประสิทธิภาพ

ในมุมของการแข่งขัน ฟีเจอร์นี้ทำให้ Google แข่งกับแพลตฟอร์ม AI อื่น ๆ เช่น Meta’s LLaVA หรือ OpenAI’s Sora ที่กำลังพัฒนาเทคโนโลยีคล้ายคลึงกัน การที่ Google นำ Omni model มาใช้เป็นจุดเด่นในการประมวลผลหลายรูปแบบพร้อมกันอาจช่วยให้ Gemini ยังคงความได้เปรียบด้านความแม่นยำและความเป็นธรรมชาติของ Avatar

อย่างไรก็ตาม ความสำเร็จของฟีเจอร์นี้จะขึ้นกับการยอมรับของผู้ใช้และการจัดการความเสี่ยงด้านความเป็นส่วนตัว หากผู้ใช้รู้สึกว่าการใช้ Avatar มีความปลอดภัยและเป็นประโยชน์จริง ๆ การรับสมัครสมาชิกแบบชำระเงินอาจเพิ่มขึ้นอย่างต่อเนื่อง

Summary

Google ได้ขยายการให้บริการฟีเจอร์ Avatar ของ Gemini‑Omni ให้กับสมาชิกชำระเงินในแอป Gemini อย่างเป็นทางการ ผู้ใช้สามารถสร้างคลอนดิจิทัลที่พูดและเคลื่อนไหวตามเสียงและใบหน้าตัวเองได้โดยมี SynthID watermark ปกป้องความโปร่งใส การเปิดตัวนี้อาจส่งผลต่อรูปแบบการสร้างคอนเทนต์และการแข่งขันในตลาด AI อย่างต่อเนื่อง.