TeknoAIBerita Teknologi

Agentic Vision, Fitur Baru Gemini 3 Flash yang Bisa Deteksi Objek Mikro

Fitur baru Gemini 3 Flash 2026, Agentic Vision mampu investigasi gambar secara aktif untuk peningkatan performa visi AI hingga 10%!

Google baru saja menggebrak dunia kecerdasan buatan dengan memperkenalkan teknologi Agentic Vision Google, sebuah kemampuan agen AI revolusioner yang disematkan pada model Gemini 3 Flash. Fitur ini memungkinkan kecerdasan buatan untuk tidak sekadar “melihat” gambar, tetapi menyelidikinya secara aktif layaknya seorang detektif.

Berbeda dengan model AI tradisional yang sering kali hanya menebak detail pada area gambar yang buram, fitur baru Gemini 3 Flash 2026 ini memperlakukan penglihatan sebagai sebuah proses investigasi sistematis.


Cara Kerja Agentic Vision Gemini

Fitur baru Gemini 3 Flash 2026, Agentic Vision dengan Peningkatan performa visi AI
adwaitx

Kemampuan AI Gemini 3 Flash dalam menganalisis visual kini jauh lebih cerdas dengan fitur Agentic Vision. Model ini akan merumuskan rencana langkah demi langkah untuk memperbesar (zoom), memotong (crop), hingga memanipulasi gambar guna menemukan bukti visual yang akurat.

Agen AI ini mengadopsi metode “Berpikir, Bertindak, dan Mengamati” yang berbasis pada sistem agen cerdas:

  1. AI menganalisis permintaan pengguna terhadap sebuah gambar.
  2. Menjalankan kode Python untuk memanipulasi atau memperjelas bagian gambar tertentu.
  3. Mengamati hasil baru hasil manipulasi tersebut sebelum memberikan jawaban final kepada pengguna.

Penggunaan eksekusi kode ini memberikan peningkatan performa visi AI secara konsisten sebesar 5 hingga 10 persen pada berbagai tolok ukur industri.


Aplikasi Nyata Fitur baru Gemini 3 Flash 2026

Kemampuan AI Gemini 3 Flash, Agen AI investigasi gambar
Shutterstock

Salah satu keunggulan utama dari agen AI investigasi gambar ini adalah kemampuannya mendeteksi detail mikro. Misalnya seperti nomor seri pada microchip atau membaca rambu jalan dari jarak yang sangat jauh.

Implementasi nyata sudah terlihat pada platform PlanCheckSolver.com. Dengan dukungan Gemini 3 Flash, sistem dapat secara otomatis memotong detail konstruksi bangunan yang rumit dan memasukkannya ke dalam jendela konteks untuk divalidasi.

Teknik “papan tulis visual” juga memungkinkan AI memberikan anotasi atau menggambar kotak pembatas pada gambar guna memastikan perhitungan objek yang presisi.

Selain itu, Gemini 3 Flash kini sangat andal dalam menangani matematika visual. AI mampu mengidentifikasi data mentah dari tabel yang padat, lalu menulis kode Python untuk menghasilkan grafik batang profesional tanpa perlu menebak angka secara probabilitas.

Baca Juga: