Computer Vision


Konsep dasar yang melandasi kajian tentang Computer Vision

Computer Vision à computer becomes seeing machines

Computer Vision hari ini cendrung mendekati kemampuan manusia dalam menangkap informasi visual (human sight)

Untuk kebutuhan tersebut computer vision harus terdiri dari banyak fungsi pendukung yang berfungsi secara penuh

Computer Vision dilakukan dalam empat tahapan dasar

1. Image Acqusition

Image Acqusition pada manusia dimulai dengan mata, kemudian informasi visual diterjemahkan ke dalam suatu format yang kemudian dapat dimanipulasi oleh otak.

Senada dengan proses di atas, computer  vision membutuhkan sebuah mata untuk menangkap sebuah sinyal visual.

Umumnya mata pada computer vision adalah sebuah kamera video.

Kamera menerjemahkan sebuah scene atau image

Kemudian sinyal listrik ini diubah menjadi bilangan biner yang akan digunakan oleh komputer untuk pemrosesan.

Keluaran dari kamera adalah berupa sinyal analog, dimana frekuensi dan amplitudonya (frekuensi berhubungan dengan jumlah sinyal dalam satu detik, sedangkan amplitudo berkaitan dengan tingginya sinyal listrik yang dihasilkan) merepresentasikan detail ketajaman (brightness) pada scene.

Kamera mengamati sebuah kejadian pada satu jalur dalam satu waktu, memindainya dan membaginya menjadi ratusan garis horizontal yang sama.

Tiap-tiap garis membuat sebuah sinyal analog yang amplitudonya menjelaskan perubahan brightness sepanjang garis sinyal tersebut.

Keluaran dari kamera adalah berupa sinyal analog, dimana frekuensi dan amplitudonya (frekuensi berhubungan dengan jumlah sinyal dalam satu detik, sedangkan amplitudo berkaitan dengan tingginya sinyal listrik yang dihasilkan) merepresentasikan detail ketajaman (brightness) pada scene.

Kamera mengamati sebuah kejadian pada satu jalur dalam satu waktu, memindainya dan membaginya menjadi ratusan garis horizontal yang sama.

Tiap-tiap garis membuat sebuah sinyal analog yang amplitudonya menjelaskan perubahan brightness sepanjang garis sinyal tersebut.

2. Image Processing

Tahapn berikutnya computer vision akan melibatkan sejumlah manipulasi utama (initial manipulation) dari data binary tersebut.

Image processing membantu peningkatan dan perbaikan kualitas image, sehingga dapat dianalisa dan di olah lebih jauh secara lebih efisien.

Image processing akan meningkatkan perbandingan sinyal terhadap noise (signal-to-noise ratio = s/n).

Sinyal-sinyal tersebut adalah informasi yang akan merepresentasikan objek yang ada dalam image.

Sedangkan noise adalah segala bentuk interferensi, kekurang pengaburan, yang terjadi pada sebuah objek.

3. Image Analysis

Image analysis akan mengeksplorasi scene ke dalam bentuk karateristik utama dari objek melalui suatu proses investigasi.

Sebuah program komputer akan mulai melihat melalui bilangan biner yang merepresentasikan informasi visual untuk mengidentifikasi fitur-fitur spesifik dan karekteristiknya.

Lebih khusus lagi program image analysis digunakan untuk mencari tepi dan batas-batasan objek dalam image.

Sebuah tepian (edge) terbentuk antara objek dan latar belakangnya atau antara dua objek yang spesifik.

Tepi ini akan terdeteksi sebagai akibat dari perbedaan level brightness pada sisi yang berbeda dengan salah satu batasnya.

4. Image Understanding

Ini adalah langkah terakhir dalam proses computer vision, yang mana sprsifik objek dan  hubungannya di identifikasi.

Pada bagian ini akan melibatkan kajian tentang teknik-teknik artificial intelligent.

Understanding berkaitan dengn template matching yang ada dalam sebuah scene.

Metoda ini menggunakan program pencarian (search program)dan teknik penyesuaian pola (pattern matching techniques).

Dalam proses image acqusition dibutuhkan suatu teknik konversi yang disebut dengan ADC, Karena komputer tidak bekerja dengan sinyal analog, maka sebuah analog-to-digital converter (ADC), dibutuhkan untuk memproses semua sinyal tersebut oleh komputer. ADC ini akan mengubah sinyal analog yang direpresentasikan dalam bentuk informasi sinyal tunggal ke dalam sebuah aliran (stream) sejumlah bilangan biner . Bilangan biner ini kemudian disimpan di dalam memori dan akan menjadi data raw yang akan diproses.

Perbedaan dasar antara tabung vidicon dengan CCD

Vidicon Tubes

Photoconductive  target adalah komponen utama dalam tabung vidicon.

Fungsi photoconductive target dibantu oleh sebuah lensa fokus (lenses focuses on target), yang digunakan untuk melihat image target

Kemudian photoconductive target menyimpan scene dalam bentuk sinyal listrik (electrical charge).

Electrical conductivity yang dihasilkan akan bervariasi, tergantung pada besarnya serapan cahaya.

Ketika cahaya rendah maka perangkat ini akan mempunyai nilai resistansi yang tinggi.

Photoconductive target akan berfungsi dengan baik pada saat pencahayaan bagus, agar resistansinya rendah.

Standar yang berlaku untuk scanning adalah standar NTSC dan PAL

Charge Couple Devices

CCD adalah sebuah rangkaian terintegrasi yang sensitif terhadap  cahaya

Dirancang untuk mengubah sebuah image visual persegi (rectangular visual image) menjadi sebuah sinyal listrik.

Sebuah sistem lensa digunakan untuk menfokuskan scene ke photoconductive substrate seperti silicon.

Perangkat ini menyerap cahaya dan menyimpannya sebagai sebuah electrical charge dalam bentuk ribuan kapasitor  mini berbentuk persegi

Prinsip kerja rangkaian berikut ini dan disebut apa rangkaiannya

Proses sampling biasanya dilakukan dengan menggunakan sebuah rangkaian penguat yang disebut dengan track/store atau sample/hold (S/H) amplifier

Pada saat sinyal analog masuk ke input S/H, sebuah sinyal clock digital terjadi dengan kecepatan rata yang akan menggerakkan sebuah switch elektronis dari FET (Field Effect Transistor) pada S/H    Amplifier.

Selama proses sampling FET terhubung dan keluaran penguat S/H sama dengan sinyal input analog.

Kemudian kapasitor akan terisi sesuai dengan tegangan sinyal input.

Ketika sinyal kontrol logic dalam bentuk biner berubah, maka FET akan cut-off dan amplifier akan menyimpan nilai tegangan analog secara instan pada FET cut-off.

Sinyal analog kemudian disimpan sebagai sinyal muatan elektrik pada kapasitor.

Keluaran penguat S/H kemudian dijadikan sebagai tegangan DC.

Sinyal ini kemudian di kirim ke ADC

ADC melakukan operasi konversi dan keluarannya berupa bilangan biner yang nilainya proporsional dengan amplitudo sinyal analog.

Untuk setiap sinyal yang disampling oleh ADC disebut dengan Pixel.

Sebuah pixel menyatakan nilai sensitifitas cahaya.

Tiap-tiap jalur scan yang dihasilkan oleh sampling diterjemahkan menjadi titik cahaya dengan level gray yang bervariasi.

Konsep pengubahan informasi 3 D menjadi 2 D dalam computer vision

Kamera video tidak melihat dalam format 3 dimensi.

Yang diperlihatkan oleh kamera adalah sebuah representasi 2 dimensi dari segala sesuatu yang ditangkapnya.

Kita dapat melihat secara akurat tinggi dan lebar dari sebuah objek, tetapi tidak dapat melihat dari dimensi dalam (depth) atau perspektif lainnya.

Tanpa informasi depth, maka kita sulit untuk menentukan berapa jarak antara kamera dan objek yang lihatnya.

Lebih jauh lagi akan sulit untuk menentukan jarak antar objek dalam sebuah scene.

Pendekatan langsung yang dapat dilakukan untuk mengatasi masalah ini adalah  dengan melakukan emulasi mendekati sistem penglihatan manusia.

Mengapa manusia mempunyai kemampuan dalam menangkap informasi depth?, karena manusia memiliki 2 bola mata.

Otak menerima informasi yang sama dari mata, tetapi  terjadi perbedaan sebagai akibat dari jarak antara dua mata.

Pola pengolah informasi oleh otak manusia ini disebut dengan “triangularization”. Yang memberikan kita kemampuan merasakan lebih dalam dan secara mental mengukur jarak dari diri kita dengan objek atau jarak antar objek

Maka untuk mengimplementasikan kemampuan ini pada computer vision, prosedur yang biasa digunakan adalah dengan 2 buah kamera input.

Hal ini akan menghasilkan “binocular” atau “stereo” vision dengan kemampuan mengukur kedalaman  informasi yang diperoleh dari kamera.

Dalam model sistem 3-D vision, sistem yang sama menggunakan dua buah kamera untuk melihat.

Kamera biasanya ditempatkan pada jarak yang tetap satu sama lainnya.

Scene dari kedua kamera didigitilasasi dan disimpan ke dalam memori dengan dua sistem terpisah.

Satu objek dalam scene yang telah diidentifikasi, maka kemudian komputer dapat melakukan berbagai operasi komputasi  matematis untuk menghitung jarak sebuah objek dan jarak antar objek.

Dalam image processing dilakukan dalam empat tahapan proses yang disebut dengan Pre Processing, Noise Reduction, Gray Scale Modification dan Histogram Flattering

Pre Processing

Sebelum proses enhancement image dilakukan untuk meningkatkan kualitas scene, maka terdapat beberapa hal yang perlu dipersiapkan :

Pertama, pasang sebuah filter pada lensa kamera untuk mengontrol jumlah cahaya, warna dan kontras berbagai objek di dalam scene

Kedua, kebanyakan sistem computer vision beroperasi di dalam lingkungan terkontrol, maka perlu diperhatikan kontrol terhadap intensitas iluminasi, posisi sumber cahaya atau objek, sehingga Diperoleh tingkat kelihatan  yang maksimum dan informasi yang lengkap.

Noise Reduction

Noise reducation disebut juga dengan image averaging, yang digunakan untuk mengeliminasi noise dan distorsi.

Pada proses ini sistem vision meng-capture sejumlah view yang berurutan dari sebuah scene, kemudian meratakannya.

Misalnya sebagai akibat dari perubahan cahaya, posisi oebjek berubah, maka akan berakibat bagi perubahan image yang ditangkap oleh kamera, maka reduksi noise  dilakukan secara random.

Gray Scale Modification

Teknik pemrosesan berikutnya adalah dengan mengatur tingkat terang (lighten) dan gelap (darken) dari sebuah scene.

Hal ini disebut dengan grayscale modification.

Sejalan dengan itu, maka untuk pemrosesan 8 bit biner array, angka 0 (00000000) merepresentasikan hitam dan angka 255 (11111111) merepresentasikan warna putih.

Nilai – nilai yang berada diantara nilai tersebut, disebut dengan grayscale.

Histogram Flattering

Histogram Flattering adalah salah satu metoda lain yang digunakan untuk meningkatkan kualitas images.

Histogram adalah sebuah grafik bar digital yang digunakan untuk mengatur informasi secara statistik.

Histogram bisa dibangun dari image biner dengan menghitung jumlah beda level cahaya gray.

Hasilnya akan diperoleh seperti chart pada gambar berikut  (a) :

Proses flattering ini dilakukan dengan mengatur level threshold, dengan membagi pixel brightness range ke dalam blok brightness values.

Nilai pixel yang ada dalam range yang bervariasi kemudian diidentifikasi dan pixel yang berada dalam range itu di tandai sebagai nilai intensitas yang sama (common intensity value)

Hasilnya adalah range nilai intensitas (jumlah pixel) yang ada di scene di reduksi dengan baik (gambar b)

Surface Smoothing (Penghalusan Permukaan Objek)

Permukaan suatu objek pada dasarnya sangat mudah untuk diidentifikasi, karena pada umumnya permukaan tersebut relatif seragam dalam intensitas cahaya.

Persoalan muncul pada bagian permukaan yang memperoleh intensiatas cahaya rendah, sehingga permukaan tersebut sedikit membayang (shading).

Kondisi shading ini menjadi persoalan ketika proses deteksi sudut (edge detection) dilakukan.

Untuk mengatasinya, maka pada permukaan yang mengalami shading, dilakukan  proses surface smothing, Sehingga sisi shading menjadi tampak lebih jelas pada saat edge detection dilakukan.

Edge Detection (Deteksi Sudut Objek)

Setelah permukaan objek dihaluskan, maka selanjutnya komputer melakukan pendeteksian terhadap sudut-sudut objek, sehingga bisa dibedakan batas antara dua objek.

Pada edge detection ini, program komputer melakukan pembandingan terhadap intensitas pixel.

Jika dari hasil pembandingan diperoleh perbedaan yang kecil, maka dianggap objek mempunyai area permukaan yang luas.

Namun jika dari hasil perbandingan diperoleh peredaan yang cukup besar, maka itu mengindikasikan adanya edge pada objek.

Template matching

Template matching melakukan pembandingan suatu model objek yang telah tersimpan dalam objek binari dalam komputer dengan objek binari yang dilihat oleh sistem computer vision.

Proses pembandingan dilakukan dalam bentuk basis pixel-by-pixel.

Perbandingan pixel dalam dua image akan menghasilkan suatu nilai yang berbeda.

Perbedaan inilah yang kemudian di hitung. Jika perbedaannya sama dengan nol, maka kedua pola adalah sesuai, jika perbedaannya kecil, maka imagenya saling mendekati dan jika besar maka image tidaklah sama.

Feature matching

Metoda lain selain pattern-matching adalah feature matching.

Feature matching tidak membandingkan actual image dengan stored image seperti pada template matching, tetapi pencocokan dilakukan pada fitur-fitur yang dimiliki oleh objek dengan fitur tentang suatu objek yang telah disimpan dalam komputer.

Fitur-fitur tersebut disimpab dalam suatu blok yang disebut dengan block world yang berisi informasi tentang objek yang mempunyai fitur-fitur yang sama

Reblog this post [with Zemanta]

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: