Tesseract-ocr

OCR motoru
Şimdi İndirin

Tesseract-ocr Sıralama ve Özet

Reklamcılık

  • Rating:
  • Yayıncı adı:
  • theraysmith
  • yayıncı web sitesi:
  • İşletim sistemleri:
  • Windows XP / Vista / 7
  • Dosya boyutu:
  • 0 KB

Tesseract-ocr Etiketler


Tesseract-ocr Açıklama

Tesseract tarafından düzenle Muhtemelen mevcut en doğru açık kaynaklı OCR motorudur. Leptonica Image İşleme Kütüphanesi ile birlikte, çok çeşitli görüntü formatlarını okuyabilir ve bunları 60'tan fazla dilde metne dönüştürebilir. 1995 UNLV doğruluk testinde ilk 3 motordan biriydi. 1995 ve 2006 yılları arasında çok az çalışması vardı, ancak o zamandan beri Google tarafından kapsamlı bir şekilde iyileştirildi. Tesseract Yayın Notları 23 Ekim 2012 - V3.02.02 - Ccmain'e Hikaye / Pageiterator'a taşındı. - İbranice / Arapça için çıkış yinelemelerinde sağdan sola / BIDI özelliği eklendi. - Düzen analizi / OCR sonrası paragraf tespiti eklendi. - Eğitim ve aşırı doğrama sırasında tutarsız xheight düzeltildi. - Eşzamanlı çoklu dil yeteneği eklendi. - Readored üst düzey kelime tanıma modülü. - Deneysel denklem dedektörü eklendi. - Giriş görüntülerinden çözünürlüğün iyileştirilmesi. - Hata analizi için BLAMER modülü eklendi. - Kaldırılarak harici olarak kullanılan ad alanını temizledi. - Ölü Bellek Yönetimi Kodunu kaldırdı. - Kontrol parametrelerinde kısıtlamalar kurdu. - Sınıflandırıcı ve eğitimde şekillendirilebilir destek eklendi. - Readored sınıf budayıcı. - Sabit eğitim sızıntıları ve rastgele. - Daha iyi görüntü tespiti, diafritik algılama, daha iyi TextLine bulma, daha iyi tabaş bulma için mizanpaj analizi için büyük gelişmeler. - Geliştirilmiş çizgi tespiti ve çıkarılması. - CJK için sabit adımlı kıyıcı eklendi. - Çok dilli işleme kolaylaştırmak için Werd_Choice'e UnicharSet'e eklendi. - Dahili olarak ölçeklendirilmiş görüntülerle ilgili sorunlar. - Eğitim verilerinin kaynağını daha iyi tanımlamak için TR dosyalarında Sayfa ve Box eklendi. - Hintçe Shiroreka Splitter'a gider. - BigRAM düzeltme kelimesi eklendi. - Yığın bellek tüketimini azalttı ve bazı çirkin tiptefleri ortadan kaldırdı. - Yeni üniforma sınıflandırıcı API eklendi. - Yeni eğitim hatası sayacı eklendi. - Dawg Reader'da Sabit Endian Hata. - C API (Tobias Müller sayesinde) - VS 2008 için yeni bir çözüm (Tom Powers sayesinde) - Ve dahası...


Tesseract-ocr İlgili Yazılım