Cleartk

Java'da İstatistiksel Doğal Dil İşleme Bileşenlerinin Geliştirilmesi İçin Bir Araç Takımı
Şimdi İndirin

Cleartk Sıralama ve Özet

Reklamcılık

  • Rating:
  • Lisans:
  • BSD
  • Fiyat:
  • FREE
  • Yayıncı adı:
  • ClearTK Team
  • yayıncı web sitesi:
  • http://code.google.com/p/cleartk/
  • İşletim sistemleri:
  • Mac OS X
  • Dosya boyutu:
  • 435 KB

Cleartk Etiketler


Cleartk Açıklama

Java'da istatistiksel doğal dil işleme bileşenlerini geliştirmek için bir araç seti Cleartk Toolkit, metin analizi için Apache UIMA çerçevesine dayanmaktadır. Cleartk, Boulder'daki Colorado Üniversitesi'ndeki Hesaplamalı Dil ve Eğitim Araştırması (Clear) merkezinde geliştirilen bir projedir. Nuttk, Cleartk, Java'daki istatistiksel doğal dil işleme (NLP) bileşenlerini geliştirmek için bir çerçeve sunar ve iki kütüphane sağlar: kısaca aşağıdaki özetlenen Cleartk-Framework ve Cleartk-Toolkit. Cleartk Framework UIMA geliştirmek için altyapı sağlar İstatistiksel öğrenmeyi karar verme ve ek açıklama yaratma temeli olarak kullanan analiz motorları. Cleartk Framework aşağıdakileri sağlar: · Zengin bir özellik çıkarma kütüphanesi · Maksimum entropi, destek vektör makineleri ve koşullu rastgele alanlar gibi modellere dayanan popüler makine öğrenme kütüphaneleri için ortak bir arayüz ve sarmalayıcılar. Şu anda Libsvm, OpenNLP Maxent, Mallet Sınıflandırıcıları, Mallet Koşullu Rastgele Alanlar, SVMLight'ı destekler. Geliştiriciler yaklaşımı, birinin bir makine öğrenme kütüphanesini, bir başkası için bir makine öğrenme kütüphanesini, analiz motorunun çekirdek mantığını uygulayan kodun değiştirilmesi gerekmediği şekilde kullanmasına izin verir. · Uygulama, bir tür sistem agnostik yaklaşımı sağlar. ClearTK Framework, belirli bir tür sisteme bağlı değildir veya sağlanmaz. Çerçeve tarafından sağlanan kod, ortamınızda yeni bir analiz motorları oluşturmak için bir temel olarak kullanılması amaçlanmıştır, böylece ihtiyaçlarınıza özgü bileşenler ve tür sisteminize olan bileşenler oluşturabilirsiniz. · Çerçeve, indirmeler sayfasından indirilebilir, bir Eclipse Projesi olarak Subversion Deposu'ndan kontrol edilebilir ya da Maven bağımlılığı olarak eklenebilir (aşağıya bakınız) .CleArtk Toolkit: ClearTk Toolkit, UIMA Bileşenleri sağlar ve / veya belirli görevleri ele almak için altyapı. Toolkit aşağıdakileri sağlar: · Yaygın olarak kullanılan corpora (örneğin Conll, ACE, Penntreebank, Genia, Timeml) için toplama okuyucular · Konuşma parçası etiketleme, biyo tarzında belirli görevler için NLP bileşenleri oluşturma altyapısı, Tanıma, sözdizimsel ayrıştırıcı, anlamsal rol etiketleme, zamansal çözünürlük vb. · Kartopu stemmer ve OpenNLP bileşenleri gibi ortak NLP bileşenleri için sarmalayıcılar. · ClearTK Toolkit, bir tür sistemi ve birçoğu (ve birim testlerinin) bu tür sisteme bağlıdır. Bununla birlikte, bileşenleri türlere göre veya genel yazma yoluyla bileşenleri genişletilebilir hale getirerek, Toolkit Tipi-System-System agnostiğindeki kodun çoğunu yapmak için çok çalıştık. · Araçkit şu anda yalnızca Subversion depo gereksinimlerinden kontrol edilebilecek bir ECLISPE projesi olarak mevcuttur: · Java


Cleartk İlgili Yazılım

Yarım kimse

Java değişkenlerini varsayılan olarak değişken hale getiren bir Javac ek açıklama işlemcisi ...

169 4 KB

İndirmek

Coşku

Java'daki programların geliştirilmesi için bir web çerçevesi ...

150 18 MB

İndirmek

Classmock

Yansımayı veya ek açıklamaları kullanan bileşenler için test ünitesinin oluşturulmasına yardımcı olan bir çerçeve ...

156 961 KB

İndirmek