Jericho html ayrıştırıcı

Bir HTML belgesinin parçalarının analizi ve manipülasyonuna izin veren basit ama güçlü bir Java kütüphanesi.
Şimdi İndirin

Jericho html ayrıştırıcı Sıralama ve Özet

Reklamcılık

  • Rating:
  • Lisans:
  • LGPL
  • Fiyat:
  • FREE
  • Yayıncı adı:
  • Martin Jericho
  • yayıncı web sitesi:

Jericho html ayrıştırıcı Etiketler


Jericho html ayrıştırıcı Açıklama

Bir HTML belgesinin parçalarının analizi ve manipülasyonuna izin veren basit fakat güçlü bir Java kütüphanesi. JERICH HTML ayrıştırıcı, bazı ortak sunucu tarafı etiketleri de dahil olmak üzere bir HTML belgesinin parçalarının bir kısmının analiz edilmesini ve manipülasyonuna izin veren basit fakat güçlü bir Java kütüphanesidir. Aynı zamanda, yüksek düzeyde HTML formu manipülasyon fonksiyonları sağlar. Bu nedenle, bu nedenle, lisans belgesinde detaylandırılmış terimlere tabi olan ticari uygulamalarda kullanmakta özgürsünüz. İşte "Jericho HTML ayrıştırıcısının" bazı önemli özellikleri: · Tüm belgenin ayrıştırma ağacı hiç üretilemez. Belge kaynağı metni yalnızca geçerli işlemle ilgili işaretleme için aranır. Bu, kütüphanenin yanlış veya kötü biçimlendirilmiş HTML veya başka bir sunucu veya istemci tarafı kodu, komut dosyası, makro veya işaretleme içeren belgeleri analiz etmesini ve değiştirmesini sağlar. Diğer birçok ayrıştırıcı, açıkça kabul etmek için programlanmadıkları içeriği kaldıramaz. · Tüm ayrık segmentlerin kaynak metnindeki başlangıç ve bitiş pozisyonları erişilebilir, belgenin tüm belgesini ayrıştırma bir ağaçtan yeniden inşa etmek zorunda kalmadan yalnızca seçilen bölümlerin yalnızca seçilen bölümlerinin değiştirilmesine izin verir. Bu özellik, yukarıdakilerle birlikte, araç setini basitliğinde çok güçlü hale getirir. · İlk değerlerin ekstraksiyonu ve nüfusu ve salt okunur veya veri ekranı modlarına dönüştürme dahil, HTML form kontrollerinin analizi ve manipülasyonu için basit fakat kapsamlı bir arayüz sağlar. Form kontrollerinin analizi aynı zamanda formdan alınan verilerin saklanmasına ve uygun bir şekilde sunulmasına izin verir. · ASP, JSP, PSP, PHP ve Mason Sunucu Etiketleri, ayrıştırıcı tarafından tanınması için kaydedilebilir ve bu diller için bu diller için gerçek ayrıkçıları kütüphaneye dahil edilmeden mümkün olduğu kadar doğru tanınır. Kütüphane daha sonra, belgenin geri kalanını, HTML sözdizimini engellemeyecek şekilde ayrıştırırken bu bölümlerden herhangi birinin göz ardı edilmesini sağlar. (Bkz. Segment.ignoreWhenparsing ())) · Özel etiket türleri, ayrıştırıcı tarafından tanınması için kolayca tanımlanabilir ve kaydedilebilir. Bu sürümde yenilikler: Hata düzeltmeleri: · Segment'te Sonsuz Döngü. · Segment.getalelelements () üzerinde sonsuz döngü · Segment.getFirst * Yöntemler Sınırlama segmentinin dışındaki bölümleri iade etti. · Segment.getallelements yöntemleri, bazı kapalı elemanları bazı durumlarda iade etmedi. · Segment.Getalelements yöntemlerinde sabit belgeler hataları. · StreamedSource sınıfı eklendi. Mevcut programların davranışını etkileyebilecek değişiklikler: · Sınıftan arabirime göre Parsetext değiştirildi. · Segment.GetNodeiterator () Şimdi karakter referanslarını ayrı düğüm olarak döndürür. · Nitelik değeri düzenli ifadelere göre etiket arama yöntemleri eklendi. · HTML sınıfı özniteliğine göre etiket arama yöntemleri eklendi. · Static Source.legacyNodeiteratorTompatableAlfle.legacyNodeiteratorTompatableAlfingMode özelliğini geçici olarak geri yüklemek için Geçici olarak önceki sürümler için geçici olarak. · Kaldırılan Char [] Tabanlı Arama Yöntemleri Partext'te. · Eklenen karaktersizlik.appendcharto (eklenebilir) yöntem. · Eklenen çıkışDocument (segment) yapıcısı. · StreamedSourceCopy örnek programı eklendi.


Jericho html ayrıştırıcı İlgili Yazılım

metaf2xml

MetaF2XML, METAR ve TAF mesajlarını ayrıştırır ve çözer ve bunları XML olarak saklar. ...

122

İndirmek

pdftex

doğrudan Tex kaynak dosyalarından PDF oluşturabilen bir TEX'in genişletilmiş bir sürümü ...

184

İndirmek