PHPCrawl

Software screenshot:
PHPCrawl
Software detaljer:
Version: 0.83
Upload dato: 1 Mar 15
Udvikler: Uwe Hunfeld
Licens: Gratis
Popularitet: 26

Rating: nan/5 (Total Votes: 0)

Kan anvendes skriftligt søgning crawlere (edderkopper), at mine websider for forskellige oplysninger.
PHPCrawl erhverver oplysninger, den var konfigureret til at hente og sender det til mere kraftfulde apps til yderligere behandling

Funktioner :.

  • Filtre til URL og Content-Type data
  • Angiv måder at håndtere cookies
  • Angiv måder at håndtere robots.txt-filer
  • Begræns sine aktiviteter på forskellige måder
  • multi-processing tilstande

Hvad er nyt i denne udgivelse:

  • Faste bugs:
  • Links, der er delvist urlencoded og delvist ikke gå genopbygge / kodet korrekt nu.
  • fjernet en unødvendig debug var_dump () fra PHPCrawlerRobotsTxtParser.class.php
  • Server-navn-indikation i TLS / SSL fungerer korrekt nu.
  • & quot; basis-href & quot;. -tags I hjemmesider bliver fortolket korrekt nu igen

Hvad er nyt i version 0.80 beta:

  • Code blev fuldstændig refactored, porteret til PHP5-OO- kode og en masse kode blev omskrevet.
  • Tilføjet muligheden for at bruge eller betjene flere processer at spider en hjemmeside. Metode & quot; goMultiProcessed () & quot; tilføjet.
  • Ny overridable metode & quot; initChildProcess () & quot; tilføjet for at indlede barn-processer ved brug af crawler i multi-proces-tilstand.
  • Implementet et alternativ, intern SQLite caching-mekanisme for webadresser gør det muligt at edderkoppen meget store websites.
  • Metode & quot; setUrlCacheType () & quot; tilføjet.
  • Ny metode setWorkingDirectory () tilsat for at definere placeringen af ​​crawlere midlertidig erhvervsaktive mappe manuelt. Hertil metode & quot; setTmpFile () & quot; er markeret som forældet (har ingen funktion længere).
  • Ny metode & quot; addContentTypeReceiveRule () & quot; erstatter den gamle metode & quot; addReceiveContentType () & quot;.
  • Funktionen & quot; addReceiveContentType () & quot; stadig er til stede, men blev markeret som forældet.

Krav :

  • PHP 5 eller højere
  • PHP med OpenSSL support

Lignende software

ack
ack

10 Feb 16

jui_filter_rules
jui_filter_rules

12 May 15

Searchjoy
Searchjoy

13 Apr 15

Elastica
Elastica

6 Mar 16

Kommentarer til PHPCrawl

Kommentarer ikke fundet
Tilføj kommentar
Tænd billeder!