1. Gemini 2.5 Pro และฟีเจอร์ Deep Think
Gemini 2.5 Pro เป็นโมเดล AI ขั้นสูงของ Google ที่ได้รับการอัปเกรดครั้งใหญ่ โดยมีฟีเจอร์ใหม่ชื่อ Deep Think ซึ่งเป็นโหมดการให้เหตุผลขั้นสูงที่ช่วยให้โมเดลสามารถพิจารณาสมมติฐานหลาย ๆ แบบก่อนตอบคำถาม ทำให้มีความแม่นยำและลึกซึ้งมากขึ้น โดยเฉพาะในงานคณิตศาสตร์และการเขียนโปรแกรมที่ซับซ้อน
- Deep Think ทำคะแนนได้สูงถึง 84% ในการทดสอบ reasoning แบบ multimodal (MMMU) และยังทำคะแนนดีในการแข่งขันคณิตศาสตร์ระดับสูง USAMO 2025
- Gemini 2.5 Pro ยังเพิ่มความสามารถในการเขียนโค้ด โดยเฉพาะการสร้างเว็บแอปที่มีความโต้ตอบสูงและสวยงาม ทำให้ได้คะแนนสูงสุดใน WebDev Arena และ LM Arena ด้านการเขียนโค้ด แซงคู่แข่งอย่าง GPT-4 และ Claude 3.7 Sonnet
- โมเดลนี้ยังรองรับการแปลงข้อความเป็นเสียงหลายภาษา และสามารถตรวจจับอารมณ์ในเสียงได้ รวมถึงมีการปรับปรุงด้านความปลอดภัย
2. AI Mode และการปฏิวัติการค้นหา
Google เปิดตัว AI Mode สำหรับ Google Search ซึ่งเป็นประสบการณ์การค้นหาที่ผสาน AI อย่างเต็มรูปแบบ ทำให้ผู้ใช้สามารถพิมพ์คำค้นหาที่ยาวและซับซ้อนขึ้นได้ถึง 3 เท่า จากเดิม และได้รับคำตอบที่ละเอียดและมีบริบทมากขึ้น
- AI Mode สามารถแยกคำถามใหญ่เป็นคำถามย่อย ๆ ค้นหาข้อมูลหลายแหล่ง และสังเคราะห์คำตอบที่ครบถ้วนและมีการอ้างอิง
- ฟีเจอร์นี้จะเปิดให้ใช้ในสหรัฐอเมริกาก่อน และเป็นการเปลี่ยนแปลงครั้งใหญ่ของ Google Search จากการแสดงผลลิงก์ธรรมดาเป็นการให้คำตอบแบบโต้ตอบและลึกซึ้ง
- นอกจากนี้ Google ยังมีฟีเจอร์ AI Overviews ที่สรุปคำตอบด้วย AI ซึ่งมีผู้ใช้กว่า 1.5 พันล้านรายต่อเดือน
- AI Mode ยังเชื่อมโยงกับ Gmail และสามารถแสดงข้อมูลเป็นภาพได้ รวมถึงรองรับการค้นหาผ่านกล้องแบบเรียลไทม์ (Search Live)
3. Android XR และแว่นตาอัจฉริยะ
Google เปิดตัวแว่นตาอัจฉริยะ Android XR ที่ใช้ระบบปฏิบัติการ Android XR และขับเคลื่อนด้วย AI Gemini โดยมีพันธมิตรสำคัญอย่าง Samsung, Gentle Monster และ Warby Parker
- แว่นตานี้มีดีไซน์ที่เน้นความสวยงามและความบางเบา แตกต่างจากแว่น VR/AR แบบเดิม
- ระบบนี้รองรับการซ้อนทับภาพแบบเรียลไทม์ (real-time overlays) และการโต้ตอบด้วยเสียงและท่าทาง
- Google วางแผนจะปล่อยเครื่องมือสำหรับนักพัฒนา Android XR ในปี 2025 เพื่อขยายระบบนิเวศแว่นตาอัจฉริยะ
- Samsung มีแผนเปิดตัว Project Moohan ซึ่งเป็น headset ที่ใช้ Android XR ภายในปีนี้ ซึ่งเป็นส่วนหนึ่งของความร่วมมือในระบบนี้
4. Google Beam
Google Beam เป็นเทคโนโลยีสำหรับการประชุมและการสื่อสารแบบ 3 มิติที่พัฒนาต่อจาก Project Starline โดยใช้กล้อง 6 ตัวและ AI เพื่อรวมวิดีโอ 2 มิติหลายมุมมองให้เป็นภาพ 3 มิติแบบเรียลไทม์
- มีระบบติดตามการเคลื่อนไหวของศีรษะ (head tracking) ที่แม่นยำระดับมิลลิเมตร
- แสดงผลด้วยจอ lightfield 3D ที่เฟรมเรต 60 fps ทำให้ภาพดูสมจริงและลื่นไหล
- ช่วยให้การสนทนาออนไลน์มีความเป็นธรรมชาติมากขึ้นเหมือนนั่งคุยกันตัวต่อตัว
5. สถิติการใช้งาน AI ที่เติบโตอย่างรวดเร็ว
- จำนวนโทเคนที่ประมวลผลโดยระบบ AI ของ Google เพิ่มขึ้นจาก 9.7 ล้านล้านโทเคนต่อเดือนเป็น 480 ล้านล้านโทเคนต่อเดือน เพิ่มขึ้นกว่า 50 เท่า
- นักพัฒนาที่ใช้ Gemini เพิ่มขึ้น 5 เท่าเป็นกว่า 7 ล้านคน และการใช้งานบน Vertex AI เพิ่มขึ้น 40 เท่า
- แอป Gemini มีผู้ใช้งานมากกว่า 400 ล้านคนต่อเดือน โดยเฉพาะ Gemini 2.5 Pro ที่มีอัตราการใช้งานเพิ่มขึ้น 45%
6. อัปเดตอื่น ๆ
- Google Meet เพิ่มฟีเจอร์แปลภาษาแบบเรียลไทม์ ช่วยให้การประชุมหลายภาษาราบรื่นขึ้น
- เครื่องมือเขียนโค้ดอัตโนมัติชื่อ Jules เปิดให้ทดลองใช้ในเบต้าสาธารณะ
- Gemini 2.5 Flash รองรับการแปลงข้อความเป็นวิดีโอ
- SynthID Detector เป็นระบบตรวจจับเนื้อหาที่สร้างโดย AI ด้วยการตรวจจับลายน้ำในไฟล์ที่อัปโหลด ช่วยเพิ่มความน่าเชื่อถือและความปลอดภัยของเนื้อหา
สรุปแล้ว Google I/O 2025 แสดงให้เห็นถึงการก้าวกระโดดของ Google ในการนำ AI มาใช้ในผลิตภัณฑ์และบริการต่าง ๆ ตั้งแต่การค้นหา การสื่อสาร การพัฒนาแอป ไปจนถึงอุปกรณ์สวมใส่ที่ผสาน AI อย่างลึกซึ้ง เพื่อสร้างประสบการณ์ใหม่ ๆ ที่ฉลาดและตอบโจทย์ผู้ใช้ได้มากขึ้น