Rastrear y extraer contenido de sitios web

Power-Chat se basa en el conocimiento almacenado en artículos wiki. Cuando ese conocimiento ya existe en sitios web externos, puedes incorporarlo a Unusual Suite extrayendo páginas individuales o rastreando un sitio completo.

Extraer una sola página web

La extracción importa el contenido de una página externa a un artículo wiki. Para extraer una página:

  1. Crea un nuevo artículo wiki.
  2. Rellena el campo Enlace externo con la URL de la página web.
  3. Haz clic en el icono 'Robot' a la derecha del campo Enlace externo.

Unusual Suite extrae el contenido de la página, elimina cualquier encabezado, pie de página, menú o elementos de navegación, y compila un resumen que aparece cuando el artículo se encuentra en los resultados de búsqueda del wiki.

Puedes extraer una página de nuevo en cualquier momento para importar una versión actualizada del contenido. La extracción se puede aplicar a cualquier nodo del árbol wiki. También existe la opción de extraer todos los subnodos del nodo del árbol actualmente seleccionado al mismo tiempo.

Advertencia: revisa el contenido extraído tras la importación. En casos excepcionales, el contenido extraído puede no coincidir exactamente con la página web de origen.

Rastrear un sitio web completo

El icono 'Robot' en la interfaz del wiki también te permite rastrear un sitio web completo. Cuando inicias un rastreo:

  • Se rastrean y extraen todas las páginas enlazadas desde la URL de inicio que pertenecen al mismo dominio.
  • Se crea un artículo wiki independiente para cada página encontrada, ubicado bajo el nodo actualmente seleccionado en el árbol de navegación del wiki.
  • Puedes configurar el tipo de artículo wiki asignado a los artículos recién creados, y si esos artículos deben publicarse inmediatamente tras su creación.
  • Unusual Suite intenta extraer el asunto correcto para cada nuevo artículo wiki a partir del contenido de la página.
  • Cuando se crea un gran número de artículos, Unusual Suite los agrupa en subnodos por la primera letra del asunto.

Advertencia: supervisa el proceso de rastreo mientras se ejecuta. Los resultados del rastreo no siempre son deterministas. Revisar la estructura y el contenido del subárbol resultante es obligatorio.