Acerca de este buscador

De Trovator Wiki
Saltar a: navegación, buscar

Trovator es un buscador de contenidos web basado en spiders (arañas) que indexa principalmente páginas escritas en español y lenguas españolas, así como todas aquellas páginas que aún escritas en otros idiomas pudieran interesar a cualquier persona hispano-hablante.

Así, las respuestas a las búsquedas provienen de una base de datos que es auto-generada, siguiendo un proceso que a grandes rasgos consiste en lo siguiente:


1.- Lectura mediante robots de páginas web.

2.- Análisis del contenido, codificación, detección de lenguaje, páginas duplicadas, feeds, links, keywords, etc

3.- Extracción de nuevas url,s (o páginas a visitar) a partir del análisis del punto anterior.

4.- Inserción en las bases de datos de la información recopilada.

5.- Indexación de los contenidos en indices invertidos para acelerar los tiempos de respuesta en las búsquedas.


Tras esto, comienza un nuevo ciclo con la lectura de las nuevas páginas incorporadas. Este sistema permite que los spiders puedan llegar a leer cualquier sitio que tenga por lo menos un enlace desde una pagina exterior a su website, siempre y cuando dicho sitio sea público y su acceso no esté restringido mediante el archivo robots.txt (vease Trovator y Robots.txt).

De forma adicional, los spiders o robots periódicamente actualizan la información ya existente. La frecuencia de esas actualizaciones depende en gran medida de las peticiones generadas a partir de las búsquedas, es decir, los temas más demandados se intentan mantener mas actualizados.

Puede consultar las actualizaciones mas recientes efectuadas en nuestro buscador visitando la página Actualidad

Herramientas personales
Espacios de nombres

Variantes
Acciones
Navegación
Herramientas