API & Library

Google Cloud Vision API ile Android’de Resimden Yazı Okutma

Yazılı resimlerdeki metinler üzerinde çalışacağınız zaman, bu metinleri elle yazıya dökmenin ne kadar zor bir işlem olacağını tahmin edebiliyorsunuzdur. Örneğin, çevrenizde gördüğünüz tabelalar ya da özellikle akademik çalışmalar yürüten insanların gazeteden, dergiden, kitaptan bilgisayara yazı aktarma yaparken el ile yazmak ve saatlerce uğraşmak zorunda kalıyorlar.

İşte bu sıkıntıları Android cihazlarda artık çok basit bir şekilde çözüm üretebilirsiniz.Peki nasıl?

Android Mobile Vision API OCR teknolojini kullanarak, yazılı resimlerdeki metinleri uygulama içinde açtığı kamerayla kullanıcı ilgili resmi göstererek, resimdeki tüm yazıyı basit bir şekilde Android uygulama içine alabiliyorsunuz.

OCR Nedir ve Ne İşe Yarar?

Optik Karakter Tanıma (OCR), elektronik görüntüler üzerindeki karakterlerin ya da metin bilgilerinin okunarak ASCII koda dönüştürülmesi işlemidir.Böylelikle ASCII kodunu kullanarak harfleri algılayabiliyoruz.
OCR yani Optik Karakter Tanıma gazete, kitap, dergi, broşür gibi basılı materyaldeki metinleri tanıyıp bunları bilgisayar, tablet, cep telefonu gibi dijital ortamlarda düzenlenebilir yazılara çevirmenize olanak sağlayan bir sistem/yazılımdır.

Bu makalemde Android Mobile Vision API içinde barınan Resimden Yazı Okutma (Text Recognition) özelliği ile ilgili örnek bir Android uygulama paylaşacağım.

Uygulama içindeki kamerayı içinde yazı barınan bir alana tuttuğumuzda aşağıdaki sonucu elde ederiz.

ocr

Örnek resmi biraz açıklamak gerekirse, ben developer.android.com sitesini bilgisayarımda açtım.Telefonumda yüklü Text Recognition uygulamasını açıp kamerayı bu site görüntüsüne tuttuğumda gördüğünüz üzere alandaki yazıları bana okudu ve kamera üstünde gösterdi.

Şimdi ise böyle bir uygulamayı kullanabilmek için neler yapmalıyıza bakalım.

Android Uygulamada Yapılacak İlgili Ayarlar ve Kod Yazımı

1- Android Projede Olması Gereken Ayarlar

  • Android Sdk Manager’da Google Play Services 7.8 veya üst versiyonu yüklü olmalı
  • Android projenizin versiyonu, Android 4.2.2+ olmalı

2-Oluşturduğumuz Android Projeye İlgili Kütüphaneleri Yükleme

Android Studio Ide ile oluşturduğum projemin app dizinin altındaki build.gradle dosyasını açıyoruz. Dependencies kod bloklarının arasına aşağıdaki kodları yerleştirerek Google Mobile Vision kütüphanesini yüklüyoruz.

3-AndroidManifest Dosyasına İlgili Ayarları Ekleme

Uygulama içinde kamerayı kullanabilmek için, AndroidManifest dosyasına kamera izinlerimizi eklemeliyiz.

Birde application tag’leri arasına aşağıdaki meta’yı eklemeliyiz

4-Örnek Proje Kaynak Kodları

Projenin sınıfları sitede yer kaplıcağını düşündüğüm için direk örneğin bulunduğu projeyi Github‘a yükledim.Kodlar arasındaki yazdığım türkçe açıklamalar sizlerin kodları anlamanızda yardımcı olcaktır.

Projemin kodlarını indirmek isterseniz; yapmanız gereken tek şey github linkine tıklamak.

Kaynaklar
1- https://developers.google.com/vision/text-overview

Bülten
Bültene abone ol

Bültene abone olarak yeni makalelerimden haberdar olun.

1 Comment

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir