Find Jobs
Hire Freelancers

273163 Project for loker

N/A

Probíhající
Zveřejněno před více než 15 roky

N/A

Zaplaceno při doručení
C++ Crawler able to index/reindex pages and download content making xml file for each page. Here are main requirements: * Can be scheduled * The Agent can accept multiple crawl start locations per web site * Support for [login to view URL] * Forbiden string in url (for example do not follow ?, %, or keyword) * Can leave domain / do not leave domain * Max pages per domain (user input) * The agent can support exclusions of files beyond that of the servers standard [login to view URL] * Specify how many levels deep to follow links for starting location crawl * Multi-Threaded for Concurrent Scans * Reindexing New Files or Modified Files Only * Complete Cache Management * Download to specific storage (web, news) * Download Title, Description, Keywords, Page content, Add the following fields: date indexed, Page size, url * Make XML file for each downloaded page with the info above ------------------------------------------------------------------- * Web based administration * List of url's to crawl * Start/Stop/Hold/Continue * Scheduled time index/reindex for specific storage and list of sites * File type: html based (html, htm, php, asp, js, do ...)
IČ projektu: 2019447

O projektu

Vzdálený projekt
Aktivní před 12 roky

Chcete si vydělat nějaké peníze?

Výhody podávání nabídek na Freelancer

Stanovte si rozpočet a časový rámec
Získejte za svou práci zaplaceno
Načrtněte svůj návrh
Registrace a podávání nabídek je zdarma

O klientovi

Pochází z CYPRUS
Nicosia, Cyprus
5,0
2
Členem od led 17, 2009

Ověření klienta

Díky! Poslali jsme vám e-mailem odkaz pro získání kreditu zdarma.
Při odesílání e-mailu se něco pokazilo. Zkuste to prosím znovu.
Registrovaných uživatelů Zveřejněných projektů
Freelancer ® is a registered Trademark of Freelancer Technology Pty Limited (ACN 142 189 759)
Copyright © 2024 Freelancer Technology Pty Limited (ACN 142 189 759)
Načítání náhledu
Bylo uděleno povolení ke geolokaci.
Vaše doba přihlášení vypršela a byli jste odhlášeni. Přihlaste se znovu.