NCBIX :: BigFetch

NCBI EUTIL'leri kullanarak anahtar kelime aramalarına dayanarak çok büyük NCBI dizisi sonuç kümelerini sağlam bir şekilde alın.
Şimdi İndirin

NCBIX :: BigFetch Sıralama ve Özet

Reklamcılık

  • Rating:
  • Lisans:
  • Perl Artistic License
  • Fiyat:
  • FREE
  • Yayıncı adı:
  • Roger A Hall
  • yayıncı web sitesi:
  • http://search.cpan.org/~rogerhall/

NCBIX :: BigFetch Etiketler


NCBIX :: BigFetch Açıklama

NCBI Eutils kullanarak anahtar kelime aramalarına dayanarak çok büyük NCBI sekans sonucu setlerini sağlam bir şekilde al. NCBIX :: BigFetch, bir metin sorgusu verilen NCBI'den gelen sekansların çok büyük sonuçlarını indirmek için yararlı bir Perl modülüdür. İlk kullanımı, tek bir anahtar kelime aramasının sonucu olarak 11.000.000'den fazla diziye sahipti. Proje durumunu sürdürmek için bir yapılandırma dosyası oluşturmak için YAML kullanır. Metin dosyalarında. Her dosya, proje kimliğini adına dahildir. Project_ID ve Base_Dir tuşları, "query" tuşunu da ayarlamadığınız sürece, her zaman "apoptoz" için aynı aramayı alacaksınız. Herhangi bir durumda, bir proje başlatıldığında, yalnızca yeniden yüklenecek iki parametreye ihtiyaç duyar. Veri dosyalarını, diğer iki dosyayı kaydedilir: 1) WebEnv tuşunu içeren ilk arama sonucu, ve 2) bir yapılandırma dosyası , ayrıştırılmış verileri kaydeder ve indirmeyi ve eksik partileri veya sekansları kurtarmak için kullanılır. "Return_max" tuşuna bağlı olarak serigraflarda toplanır. Varsayılan olarak, "dizin" 1'de başlar ve indeks "sayımı" aşılıncaya kadar indirin devam eder. Bu durumda, "indeks", "eksik" listesine eklenir. Bu liste yapılandırma dosyasına kaydedilir. Kayıp partiler her gün indirilmeli ve tamamının sonuna kadar kaydedilmemelidir. Çalışma komut dosyaları komut dosyasına dahil edilmiştir. Komut dosyalarını kopyalayın ve belirli bir proje için düzenleyin. Proje kimliği olarak yeni bir numara kullanın. 2. Önce bir sorgu sunacak ve sonuçta ortaya çıkan WebENV tuşunu bir proje özel yapılandırma dosyasında (YAML kullanarak) kaydetmek için Fetch-ALL.PP çalıştırarak indirmeye başlayın. 3. Ertesi sabah, All.PP işlemini öldür ve tamamlanıncaya kadar getirin. 4. Fetch-all.pp'yi yeniden başlatın. "Mevcut Değil" dizileri tekrar indirmek istiyorsanız, getirilemiyorsunuz. Bununla birlikte, normal olarak tamamlıysa, All.PP'nin sonunda indirilecekler. Oradan ayarlanan sonucu (yeni bir WebEnv ile) alacak. (Planlanan yükseltme otomatik olarak başka bir arama başlatır.) Uyarı: İndirmeniz birden fazla projede uzanırsa, bir (çok) az sayıda diziyi kaybedebilirsiniz. Bununla birlikte, testlerimiz birbirlerinin birkaç gün içinde aynı sorgula üretilen partilerin büyük ölçüde aynı olduğunu göstermektedir. # Parametrelerim $ params = {project_id => "1", Base_Dir => "/ home / user / veri", db => "protein", sorgu => "apoptoz", return_max => "500"}; # Başlat Projesi $ Projemim = NCBIX :: BigFetch-> Yeni ($ params); # Yazdırdığınız kişiyi seviyorum "Yazarlar:". $ Project-> Yazarlar (). "\n"; # Tüm dizilerin gruplarını girerken ($ Project-> Icondion_waiting ()) {$ Project-> GET_NEXT_BATCH (); } # Kayıp partileri olsun ($ Project-> Missing_Batches ()) {$ Project-> get_missing_batch (); } # Kullanılamayan Kimlikleri Bul $ IDS = $ Project-> Unavailable_IDS (); # Kullanılamayan kimlikleri almak, $ kimliğimi (@ $ IDS) {$ Project-> Get_Seuce ($ ID); } Gereksinimler: · Perl


NCBIX :: BigFetch İlgili Yazılım