Google เปิดฟีเจอร์ Avatar ของ Gemini ให้สมาชิกพรีเมียมสร้…

ที่มาภาพ: Android Authority

AI5 มิถุนายน 2569 เวลา 12:00อ่าน 6 นาทีAndroid Authority

Google เปิดฟีเจอร์ Avatar ของ Gemini ให้สมาชิกพรีเมียมสร้…

⚡ สรุป 30 วิ

Google เปิดให้บริการฟีเจอร์ Avatar ของ Gemini‑Omni แก่สมาชิกพรีเมียม ซึ่งผู้ใช้สามารถอัปโหลดภาพและเสียงเพื่อสร้างโคลนดิจิทัลที่พูดและเคลื่อนไหวได้ ระบบใส่…

Google เปิดให้ฟีเจอร์ Avatar ของ Gemini‑Omni ขยายการให้บริการแก่สมาชิกแบบชำระเงินในแอป Gemini อย่างเป็นทางการ — ผู้ใช้สามารถสร้าง “โคลน” ดิจิทัลที่พูดและเคลื่อนไหวตามเสียงและใบหน้าตัวเองได้โดยอัตโนมัติ

Overview

Gemini เป็นชุดโมเดล AI ของ Google ที่พัฒนาโดยใช้ Omni model ซึ่งเป็นการรวมความสามารถหลายด้านเข้าด้วยกัน ทั้งการประมวลผลภาพและเสียงในเวลาเดียวกัน ฟีเจอร์ Avatar ที่เพิ่งเปิดตัวในเดือนที่ผ่านมา ให้ผู้ใช้สร้างตัวแทนดิจิทัลที่ดูเหมือนตนเองโดยอิงจากภาพถ่ายและการบันทึกเสียงของผู้ใช้เอง การทำงานของระบบเป็นแบบ “generative” ทำให้วิดีโอที่ได้มีลักษณะเป็นการพูดคุยแบบเรียลไทม์และเคลื่อนไหวตามอารมณ์ของเสียงที่ป้อนเข้าไป

แม้ว่า Gemini จะถูกออกแบบให้เป็นเครื่องมือสนับสนุนการสร้างคอนเทนต์และการสื่อสารในหลายรูปแบบ ฟีเจอร์ Avatar กลายเป็นจุดสนใจหลักเพราะความสามารถในการทำให้ผู้ใช้ “เป็นตัวเอง” บนแพลตฟอร์มดิจิทัลโดยไม่มีการถ่ายทำวิดีโอจริง ซึ่งอาจเปลี่ยนแปลงวิธีการผลิตสื่อส่วนบุคคลในอนาคต

How It Works

กระบวนการสร้าง Avatar เริ่มจากผู้ใช้ต้องอัปโหลดภาพใบหน้าที่ชัดเจนและบันทึกเสียงพูดตามคำแนะนำของแอป ระบบจะใช้ Omni model วิเคราะห์ข้อมูลเหล่านั้นเพื่อสร้างโมเดล 3 มิติของใบหน้าและเชื่อมต่อกับลักษณะเสียงของผู้ใช้ เมื่อเสร็จแล้วผู้ใช้สามารถพิมพ์ข้อความหรือพูดเพื่อให้ Avatar ทำการพูดออกมาในวิดีโอที่สร้างโดยอัตโนมัติ

การสร้างวิดีโอแต่ละครั้งจะมีการฝัง SynthID watermark ที่มองไม่เห็นด้วยตาเปล่า ซึ่งเป็นมาตรการของ Google เพื่อระบุว่าเนื้อหานั้นเป็นการสร้างโดย AI การฝังรหัสนี้ช่วยให้ผู้ตรวจสอบหรือแพลตฟอร์มอื่นสามารถตรวจจับและจัดการกับคอนเทนต์ที่อาจก่อให้เกิดการเข้าใจผิดหรือการใช้ในทางที่ไม่เหมาะสมได้

Availability & Requirements

การเปิดให้บริการ Avatar ในปัจจุบันจำกัดอยู่ที่สมาชิกที่สมัครใช้บริการแบบชำระเงินของแอป Gemini เท่านั้น โดยมีเงื่อนไขพื้นฐานดังต่อไปนี้

  • ต้องเป็นผู้ใช้ที่อายุ อย่างน้อย 18 ปี ตามนโยบายของ Google
  • ต้องสมัครใช้บริการ Gemini Premium หรือระดับสมาชิกที่ให้สิทธิ์การเข้าถึงฟีเจอร์ขั้นสูง
  • ต้องใช้แอป Gemini เวอร์ชันล่าสุดบนอุปกรณ์ที่รองรับการประมวลผลภาพและเสียง

Google ยังระบุว่าจะค่อยขยายการให้บริการให้ครอบคลุมผู้ใช้ระดับพื้นฐานในช่วงหลายเดือนข้างหน้า หากมีการตอบรับที่ดีและไม่มีปัญหาด้านความเป็นส่วนตัวหรือการใช้งานที่ผิดพลาด

Privacy & Ethical Concerns

แม้ว่าเทคโนโลยี Avatar จะเปิดโอกาสใหม่ในการสร้างคอนเทนต์ส่วนบุคคล แต่ก็ทำให้เกิดคำถามด้านความเป็นส่วนตัวและจริยธรรมอย่างชัดเจน การใช้ใบหน้าและเสียงของผู้ใช้เพื่อสร้างคลอนดิจิทัลอาจทำให้ข้อมูลชีวภาพถูกเก็บไว้ในระบบคลาวด์ของ Google ซึ่งอาจเป็นเป้าหมายของการโจมตีหรือการใช้งานโดยไม่ได้รับอนุญาต

Google พยายามบรรเทาความกังวลนี้ด้วยการฝัง SynthID watermark ที่ช่วยให้วิดีโอที่สร้างโดย AI สามารถแยกแยะได้จากวิดีโอที่ถ่ายทำจริง นอกจากนี้ยังมีการแจ้งเตือนผู้ใช้ให้ตรวจสอบและยืนยันการใช้ข้อมูลส่วนบุคคลก่อนทำการสร้าง Avatar อย่างไรก็ตาม ผู้สังเกตการณ์ด้านความปลอดภัยดิจิทัลยังคงเตือนว่าการเผยแพร่ Avatar ไปยังสื่อสาธารณะอาจทำให้เกิดการหลอกลวงหรือการปลอมแปลงตัวตนได้ง่ายขึ้น

Market Impact

การเปิดตัว Avatar อย่างกว้างขวางอาจเป็นสัญญาณบ่งชี้ถึงการเปลี่ยนแปลงในอุตสาหกรรมคอนเทนต์ดิจิทัล การใช้ AI สร้างตัวแทนเสมือนจริงอาจทำให้ครีเอเตอร์, นักการตลาด และผู้ผลิตสื่อสามารถลดต้นทุนการผลิตวิดีโอและเพิ่มความเร็วในการสร้างสรรค์คอนเทนต์ได้อย่างมีประสิทธิภาพ

ในมุมของการแข่งขัน ฟีเจอร์นี้ทำให้ Google แข่งกับแพลตฟอร์ม AI อื่น ๆ เช่น Meta’s LLaVA หรือ OpenAI’s Sora ที่กำลังพัฒนาเทคโนโลยีคล้ายคลึงกัน การที่ Google นำ Omni model มาใช้เป็นจุดเด่นในการประมวลผลหลายรูปแบบพร้อมกันอาจช่วยให้ Gemini ยังคงความได้เปรียบด้านความแม่นยำและความเป็นธรรมชาติของ Avatar

อย่างไรก็ตาม ความสำเร็จของฟีเจอร์นี้จะขึ้นกับการยอมรับของผู้ใช้และการจัดการความเสี่ยงด้านความเป็นส่วนตัว หากผู้ใช้รู้สึกว่าการใช้ Avatar มีความปลอดภัยและเป็นประโยชน์จริง ๆ การรับสมัครสมาชิกแบบชำระเงินอาจเพิ่มขึ้นอย่างต่อเนื่อง

Summary

Google ได้ขยายการให้บริการฟีเจอร์ Avatar ของ Gemini‑Omni ให้กับสมาชิกชำระเงินในแอป Gemini อย่างเป็นทางการ ผู้ใช้สามารถสร้างคลอนดิจิทัลที่พูดและเคลื่อนไหวตามเสียงและใบหน้าตัวเองได้โดยมี SynthID watermark ปกป้องความโปร่งใส การเปิดตัวนี้อาจส่งผลต่อรูปแบบการสร้างคอนเทนต์และการแข่งขันในตลาด AI อย่างต่อเนื่อง.

แชร์บทความนี้:

ชอบบทความแบบนี้?

สมัคร AI Automate Weekly Newsletter — รับเคล็ดลับ AI + how-to ใหม่
ทุกสัปดาห์ตรงถึง inbox ฟรี ไม่มีสแปม

แหล่งข่าวต้นฉบับ

ชื่อต้นฉบับ
Google’s wild Gemini tool that creates a talking, moving AI clone of you is now rolling out widely
ผู้เขียน
Adamya Sharma
แหล่ง
Android Authority
วันที่เผยแพร่
3 มิถุนายน 2569 เวลา 12:25

Related

บทความที่เกี่ยวข้อง

Gemini แทน Google Assistant ช่วยให้ระบบ Google Home และอุปกรณ์ Nest ทำงานได้เต็มที่AI
22 มิถุนายน 2569 เวลา 16:30

Gemini แทน Google Assistant ช่วยให้ระบบ Google Home และอุปกรณ์ Nest ทำงานได้เต็มที่

การนำ Gemini มาแทน Google Assistant ใน Google Home ทำให้ระบบสมาร์ทโฮมเสถียรขึ้นและอุปกรณ์ Nest รุ่นเก่ากลับทำงานได้เต็มที่ตามมาตรฐาน Matter…

Android Authority5 นาที
ให้ LLM ภายในเครื่องเข้าถึง Docker แล้วสคริปต์มอนิเตอร์ถู…AI
15 มิถุนายน 2569 เวลา 05:00

ให้ LLM ภายในเครื่องเข้าถึง Docker แล้วสคริปต์มอนิเตอร์ถู…

ผู้ใช้ให้ Local LLM เข้าถึง Docker เพื่อสร้างสคริปต์มอนิเตอร์อัตโนมัติ แต่ค่าใช้จ่ายสูง, ความเป็นส่วนตัวเสี่ยง, และผลลัพธ์ไม่แม่นยำ…

XDA Developers8 นาที
Meta เผชิญการต่อต้านของพนักงานต่อเครื่องมือติดตาม MCIAI
2 มิถุนายน 2569 เวลา 21:00

Meta เผชิญการต่อต้านของพนักงานต่อเครื่องมือติดตาม MCI

Meta เปิดใช้เครื่องมือ MCI เพื่อติดตามการคลิกเมาส์และการพิมพ์ของพนักงานสหรัฐเพื่อฝึก AI แต่พนักงานกังวลว่าอาจละเมิด GDPR และเพิ่มภาระอินเทอร์เน็ต.

Mashable Tech6 นาที
Immich บน NAS พร้อม GPU ทำให้ลบ Google Photos อย่างถาวรAI
2 มิถุนายน 2569 เวลา 18:00

Immich บน NAS พร้อม GPU ทำให้ลบ Google Photos อย่างถาวร

ผู้เขียนติดตั้ง Immich บน NAS พร้อม GPU ทำให้การค้นหาและจำแนกใบหน้าเร็วเทียบเท่า Google Photos จึงลบ Google Photos อย่างถาวร.…

XDA Developers6 นาที
คัดลอกลิงก์แล้ว!