Selasa, 27 Agustus 2013

Bagaimana cara kerja program OCR (Optical Character Recognition)?

Teknologi OCR (Optical Character Recognition) sudah lama kita dengan, tetapi apakah kita sudah mengetahui fungsi dan cara kerja dari software tersebut?

Seperti yang sudah kita ketahui bahwa software OCR berfungsi untuk merubah file Image/Gambar menjadi file Teks dengan format TXT.

Hal ini berguna apabila kita ingin mendapatkan file teks dari sebuah surat tanpa harus mengetik ulang seluruh tulisan yg terdapat didalam surat tersebut.

Pada dasarnya setiap scanner hanya menghasilkan file gambar/image dalam format TIFF saja, setelah file gambar/image tersebut dihasilkan, file tersebut di kirim ke dalam komputer dan langsung di sambut dan diproses oleh program OCR untuk diproses menjadi file teks, berikut ini saya jelaskan susunan cara kerja software OCR tersebut:


1. Meratakan gambar (Auto Deskewing).
file image (gambar) akan diatur kemiringannya, apabila hasil scan ada kemiringan, maka gambar akan dibuat sejajar atau lurus.


2. Menganalisa (Analysis).
software (program) OCR akan menganalisa dan memisahkan bagian teks dan bagian gambar.

3. Otomatis mengatur arah gambar (Auto Orientation).
software (program) OCR akan mengambil sebagian area pada file image (gambar) dan mengidentifikasi arah teks yang benar.
file image (gambar) akan diputar ke arah yang benar, pilihannya adalah 90⁰, 180⁰ atau 270⁰.

4. Memisahkan setiap karakter huruf dan angka (Separating single character).
software (program) OCR akan memisahkan setiap karakter yang terdapat pada image (gambar) menjadi sebuah huruf atau angka.


5. Mengidentifikasi gambar (Capturing the features of the characters and comparing).
software (program) OCR akan mengidentifikasi satu persatu setiap gambar yang sudah dipisahkan, dan melakukan pengecekan terhadap database yang dimiliki oleh software (program) OCR, dan menetapkan huruf atau angka yang akan digunakan.


6. Menghasilkan file akhir (Recognition result output).
Setelah setiap image (gambar) sudah dirubah menjadi huruf atau angka (format teks) maka software (program) OCR akan menghasilkan sebuah file dengan format teks, seperti Microsoft Word, Microsoft Excel, TXT, Rich Text dan Searchable PDF, tergantung dari pengaturan awal.


Catatan:
Untuk menghasilkan sebuah proses OCR yang sempurna, gunakan resolusi scan 300dpi, dengan format warna Grayscale.

Ada juga kebutuhkan untuk mengkonfersi buku menjadi "buku digital" sehingga kita tidak perlu repot-repot membawa buku lagi, semua buku kita sudah terdapat didalam komputer kita.

Kesimpulannya adalah: Software OCR berfungsi untuk merubah data gambar/image menjadi teks, hal ini membantu kita untuk mendapatkan data teks secara cepat dari sebuah surat/dokumen.

Mudah-mudahan bermanfaat! :)

2 komentar:

  1. untuk output berupa audio, kira2 bsa ngk gan

    BalasHapus
  2. secara teknologi sudah bisa dilakukan, Microsoft juga sudah mengembangkan program yang merubah data teks menjadi audio.

    BalasHapus