| Cleartk Java'da İstatistiksel Doğal Dil İşleme Bileşenlerinin Geliştirilmesi İçin Bir Araç Takımı |
Şimdi İndirin |
Cleartk Sıralama ve Özet
- Yayıncı adı:
- ClearTK Team
- yayıncı web sitesi:
- http://code.google.com/p/cleartk/
- İşletim sistemleri:
- Mac OS X
Cleartk Etiketler
Cleartk Açıklama
Java'da istatistiksel doğal dil işleme bileşenlerini geliştirmek için bir araç seti Cleartk Toolkit, metin analizi için Apache UIMA çerçevesine dayanmaktadır. Cleartk, Boulder'daki Colorado Üniversitesi'ndeki Hesaplamalı Dil ve Eğitim Araştırması (Clear) merkezinde geliştirilen bir projedir. Nuttk, Cleartk, Java'daki istatistiksel doğal dil işleme (NLP) bileşenlerini geliştirmek için bir çerçeve sunar ve iki kütüphane sağlar: kısaca aşağıdaki özetlenen Cleartk-Framework ve Cleartk-Toolkit. Cleartk Framework UIMA geliştirmek için altyapı sağlar İstatistiksel öğrenmeyi karar verme ve ek açıklama yaratma temeli olarak kullanan analiz motorları. Cleartk Framework aşağıdakileri sağlar: · Zengin bir özellik çıkarma kütüphanesi · Maksimum entropi, destek vektör makineleri ve koşullu rastgele alanlar gibi modellere dayanan popüler makine öğrenme kütüphaneleri için ortak bir arayüz ve sarmalayıcılar. Şu anda Libsvm, OpenNLP Maxent, Mallet Sınıflandırıcıları, Mallet Koşullu Rastgele Alanlar, SVMLight'ı destekler. Geliştiriciler yaklaşımı, birinin bir makine öğrenme kütüphanesini, bir başkası için bir makine öğrenme kütüphanesini, analiz motorunun çekirdek mantığını uygulayan kodun değiştirilmesi gerekmediği şekilde kullanmasına izin verir. · Uygulama, bir tür sistem agnostik yaklaşımı sağlar. ClearTK Framework, belirli bir tür sisteme bağlı değildir veya sağlanmaz. Çerçeve tarafından sağlanan kod, ortamınızda yeni bir analiz motorları oluşturmak için bir temel olarak kullanılması amaçlanmıştır, böylece ihtiyaçlarınıza özgü bileşenler ve tür sisteminize olan bileşenler oluşturabilirsiniz. · Çerçeve, indirmeler sayfasından indirilebilir, bir Eclipse Projesi olarak Subversion Deposu'ndan kontrol edilebilir ya da Maven bağımlılığı olarak eklenebilir (aşağıya bakınız) .CleArtk Toolkit: ClearTk Toolkit, UIMA Bileşenleri sağlar ve / veya belirli görevleri ele almak için altyapı. Toolkit aşağıdakileri sağlar: · Yaygın olarak kullanılan corpora (örneğin Conll, ACE, Penntreebank, Genia, Timeml) için toplama okuyucular · Konuşma parçası etiketleme, biyo tarzında belirli görevler için NLP bileşenleri oluşturma altyapısı, Tanıma, sözdizimsel ayrıştırıcı, anlamsal rol etiketleme, zamansal çözünürlük vb. · Kartopu stemmer ve OpenNLP bileşenleri gibi ortak NLP bileşenleri için sarmalayıcılar. · ClearTK Toolkit, bir tür sistemi ve birçoğu (ve birim testlerinin) bu tür sisteme bağlıdır. Bununla birlikte, bileşenleri türlere göre veya genel yazma yoluyla bileşenleri genişletilebilir hale getirerek, Toolkit Tipi-System-System agnostiğindeki kodun çoğunu yapmak için çok çalıştık. · Araçkit şu anda yalnızca Subversion depo gereksinimlerinden kontrol edilebilecek bir ECLISPE projesi olarak mevcuttur: · Java
Cleartk İlgili Yazılım