Lemur ToolkitMac OS X için ücretsiz dil modelleyici | |
Şimdi İndirin |
Lemur Toolkit Sıralama ve Özet
Reklamcılık
- Lisans:
- Freeware
- Fiyat:
- FREE
- Yayıncı adı:
- The Lemur Team
- yayıncı web sitesi:
- http://www.lemurproject.org/
- İşletim sistemleri:
- Mac OS X
- Dosya boyutu:
- 63.2 MB
Lemur Toolkit Etiketler
Lemur Toolkit Açıklama
Mac OS X için ücretsiz dil modelleyici Lemur Toolkit, reklam hoc ve dağıtılmış alım, özetleme, çapraz dil, filtreleme ve sınıflandırma gibi teknolojiler de dahil olmak üzere dil modelleme ve bilgi alma alanındaki araştırmaları kolaylaştırmak için tasarlanmıştır. Bu sürümde yenilikler: · 4.9, 4.8 dağıtım paketindeki çeşitli sorunları düzeltir, yeni · FileClassenvironment Warc dosya girişi, çeşitli indeksleme hızı için · Indri için optimizasyonlar; ve dahası. · Lemur Toolkit ile derlenen uygulamalar aşağıdakileri gerektirir · Kütüphaneler: Z, Iberty, Pthread ve Linux'ta M ve ayrıca soket · Ve Solaris'teki NSL. Visual Studio'da yerleşik uygulamalar gerektirir · Ek kütüphane wsock32.lib. Java Jar dosyaları ile inşa edildi · Java 5 (JDK 1.5.0). Java UIS java gerektirir 5. GCC'yi kullanarak test ettik · 3.2 (Solaris), 3.2.2 (Linux), 3.4 (Linux), 3.4.3 (Linux X86_64), 4.0.2 (Linux), · 4.3.1 (OS / X), VC ++ .NET 7.1 (Windows XP) ve Visual Studio 2005 (Windows · XP). Geliştirmeler: · YazıManager kısıtlamaları yeniden boyutlandırmayı iyileştirmek için değiştirildi · Bileşenlerin davranışları. · Sorgu Günlüğü Araç Çubuğu ve Sunucu, otomatik olarak günlük yüklemeyi destekler. · Zamanlanmış bazda dosyalar. Bu tercih kullanıcısı tarafından ayarlanabilir. · Araç çubuğu Tamamen otomatik, otomatik olarak gerekli olan otomatik · Yüklemeden önce veya yalnızca manuel yükleme. · Yeni bir FileClassenvironment, Warc, Indri'ye eklendi. Bu çevre · CLUEWEB09 CORPUS'un indekslenmesini sağlar. · Http: //boston.lti.cs.cmu.edudata/clueweb09/ · GOV2 için% 5-15 hız sağlayan Indexing Hız optimizasyonları (25) Milyon Belgeler) Boyut Koleksiyonları: · 1) Bellek tahsislerinin / dağıtımlarının sayısını azaltın · Endeks yazarı :: _ lookuptermid. · 2) Flex'in tam tabloları seçeneğini kullanın. · 3) ASCII vaka normalleştirme yapmayın · UTF8CasenormalizationTransformation, yedek olduğu için. · 4) String_set yerine Stril yerine STL'den HASH_SET kullanın. · 5) Silinen sayısı DeletedDocumentlist'te 0 ise, okunmayı edinin. · Yanlış dönmeden önce kilitleyin. · 6) RepoSittermaintenAncethRead'de birleştirmek yerine Trim, · Sayı sürelerini azaltın Geçici dizinler kopyalanır. TRIM'i toplama kes · Önceki endeksin büyüklüğünün iki katı bir indeks olduğunda adaylar · Karşılaştı. · 7) Bellek tahmin ederken diskincexlerin boyutunu dikkate alın. · Kullanım. · 8) Belge uzunluklarını 20 MB'a önbelleğe almak için kullanılan toplam bellek miktarını sınırlayın. · (5.000.000 belge).
Lemur Toolkit İlgili Yazılım
Bakker
Yedekleme için dosyaları yeniden adlandırmak ve kopyalamak için Ruby tabanlı araç kullanımı kolay ...
164 25 KB