Lemur Projesi

Dil Modellemesi ve Bilgi Alma Uygulaması
Şimdi İndirin

Lemur Projesi Sıralama ve Özet

Reklamcılık

  • Rating:
  • Lisans:
  • Freeware
  • Fiyat:
  • FREE
  • Yayıncı adı:
  • The Lemur Team
  • yayıncı web sitesi:
  • http://www.lemurproject.org/
  • İşletim sistemleri:
  • Mac OS X
  • Dosya boyutu:
  • 63.6 MB

Lemur Projesi Etiketler


Lemur Projesi Açıklama

Dil modelleme ve bilgi alma uygulaması Lemur Toolkit dil modelleme ve bilgi alma araştırma kolaylaştırmak için tasarlanmış ücretsiz ve açık kaynak uygulamasıdır. Lemur seti, geçici ve dağıtılmış alma, diller arası IR, özetleme filtre edilmesi ve sınıflandırma gibi teknolojileri içerir. İşte "Lemur Projesi" bazı temel özellikleri şunlardır: (InQuery ve Indri kullanarak) · Sofistike yapılandırılmış sorgu dilleri · XML desteği ve yapılandırılmış belge alma · Araştırma testi koleksiyonları geniş bir yelpazede yaygın kullanılır (örneğin TREC CD'leri 1-5, wt10g, RCV1, gov, YÖN2) Bir "out-of-the-box" site arama özelliğiyle · Endeksi web sayfaları Windows, Linux ve Web için · İnteraktif arayüzleri · Dağıtık bilgi alma ve belge kümeleme uygulamaları · Çapraz platform, hızlı ve C ile yazılmış modüler kod ++ · C ++, Java ve C # API'leri · Ücretsiz ve açık kaynak yazılım geniş ve büyüyen kullanıcı topluluğu tarafından 6 yıldır · In kullanımı indeksleme: ·, Küçük, orta ve büyük ölçekli (terabayt) koleksiyonları için çoklu erişim yöntemleri · Dahili destek İngilizce, Çince ve Arapça metin için · Porter ve Krovetz kelime kaynaklanan · Artan indeksleme · TREC Metin Out-of-the-box indeksleme desteği, TREC Web, düz metin, HTML, XML, PDF, MBox, Microsoft Word ve Microsoft PowerPoint · İnline endeksler ve ofset metin ek açıklamaları (örneğin, part-of-konuşma ve sayılan öğelerin) · Endeksleri belge nitelikleri alma: · Büyük dil modelleme böyle Indri ve KL-sapma, hem de vektör alanı, tf.idf, Okapi ve InQuery olarak yaklaşımları destekler · İle işe ve yalancı alaka geribildirim · Joker terimi genişletme (Indri kullanılarak) · Pasajı ve XML elemanı alımı · Çapraz dilli alımı · Dirichlet priors Markov zincirlerinin yoluyla Pürüzsüzleştirici · Destekler keyfi belge Sabıkası (örneğin Page Rank URL derinlik) Bu sürümde yenilikler: · 2799440 terminfo'ya IndriTermInfoList tarafından döndürülen hiçbir pozisyonlara sahip · 2794361 harvestlinks hasat dizinleri oluşturmak için başarısız · 2788507 KrovetzStemmerTransformation bir tampon taşabilir · 2788504 AnchorTextAnnotator bir tampon taşabilir linkler yol kötüyse · 2787935 pagerank çekirdek döker · 2784994 Yanlış makale · 2783665 TextTokenizer zamanından önce alıntılanan etiket niteliklerini sonlandırır · 2782954 indri :: ayrıştırma :: HTMLParser :: handleTag taşabilir bir tampon · 2772914 irevalGUI.jar deli sonuçlar verir · 2772846 bin / ireval.jar geçersiz .JAR dosyası (Lemur V48) 'dir · Birden fazla konu olan 2770916 documentLength tampon bozulması · 2747981 WARCDocumentIterator WARC dosyasındaki belgeleri özlüyor · 2747707 TextTokenizer bazı alıntı etiket niteliklerini tanımıyor


Lemur Projesi İlgili Yazılım

Rakun

Açık kaynaklı bir veritabanı uygulama geliştirme çerçevesi ...

292 227 KB

İndirmek

Tidydoc

Ücretsiz, Açık Kaynak ve Kullanımı Kolay Dokümantasyon Organizatörü ...

153 204 KB

İndirmek

Yami

MySQL veritabanlarını yönetmek için kullanıcı dostu arayüz ...

1,418 692 KB

İndirmek