IBM WebSphere Portal 8.5: Asistencia al usuario para administradores

Gestionar búsqueda

Utilice el portlet Búsqueda de portal para administrar la búsqueda de portal.

Para gestionar una búsqueda del portal, haga clic en el icono menú Administración de la barra de herramientas. A continuación, haga clic en Interfaz de usuario del portal > Gestionar búsqueda en el menú del portal. El portal muestra Gestionar búsqueda del portlet de administración,

Nota: Esta ayuda del portlet proporciona instrucciones para utilizar el portlet Gestionar búsqueda. Para obtener más información sobre los servicios, las recopilaciones y los ámbitos de búsqueda, las consideraciones de planificación y la configuración de búsqueda, consulte la búsqueda del portal en la documentación del producto.

Servicios de búsqueda

En Servicios de búsqueda, puede visualizar y gestionar los servicios de búsqueda de IBM® WebSphere Portal. Los servicios de búsqueda representan instancias separadas del motor de búsqueda proporcionado y que se pueden utilizar para buscar contenido mediante el centro de búsqueda. Al crear una recopilación de búsqueda, debe seleccionar un servicio de búsqueda para que los usuarios puedan solicitar búsquedas en dicha recopilación. Un servicio de búsqueda se puede utilizar para buscar varias recopilaciones de búsqueda. Puede establecer parámetros para configurar un servicio de búsqueda que permita establecer instancias independientes de servicios de búsqueda con distintas configuraciones. También puede establecer varios servicios de búsqueda del portal y distribuir la carga de búsqueda en varios nodos. De forma predeterminada, se proporciona el servicio de búsqueda siguiente:
Servicio de búsqueda del portal
Seleccione el servicio de búsqueda del portal para gestionar las recopilaciones de búsqueda que contengan páginas de portal, contenido gestionado por IBM Web Content Manager o páginas web indexadas. En un entorno en clúster, debe configurar un servicio de búsqueda remoto.
Nota: El rastreador de HTTP del servicio de búsqueda del portal no da soporte a JavaScript. Es posible que el texto que genera JavaScript no esté disponible para la búsqueda.

También puede crear más servicios de búsqueda personalizados y añadirlos al portal.

Creación de un servicio de búsqueda
Para crear un nuevo servicio de búsqueda, pulse Nuevo servicio de búsqueda. Gestionar búsqueda muestra la página Nuevo servicio de búsqueda. Especifique un Nombre de servicio que sea exclusivo dentro del portal actual o el portal virtual.

Recopilaciones de búsqueda

En Recopilaciones de búsqueda, puede visualizar y gestionar las recopilaciones de búsqueda y sus orígenes de contenido en el portal. Puede crear y mantener recopilaciones de búsqueda de contenido web, contenido de Web Content Manager, contenido del portal y las recopilaciones de búsqueda relacionadas. Los usuarios pueden realizar búsquedas en estas recopilaciones utilizando el Centro de búsqueda del portal.

Una recopilación de búsqueda puede tener uno o más orígenes de contenido, como páginas web, contenido de Web Content Manager o portlets y páginas del portal. La recopilación de búsqueda predeterminada del portal combina dos orígenes de contenido y sus rastreadores relacionados:

Origen de contenido del portal
El origen de contenido del portal contiene el sitio del portal local, donde los usuarios pueden buscar portlets y páginas del portal.
Origen de contenido de Web Content Manager
El origen de contenido de Web Content Manager permite que los usuarios puedan buscar contenido web.

Durante el proceso de creación de recopilaciones de búsqueda, se recupera el contenido para indexar a través de un rastreador (robot) de los orígenes de contenido. La recopilación de búsqueda almacena palabras clave y metadatos, y los correlaciona con su origen original. Se permite un procesamiento más rápido de las solicitudes desde el portlet Centro de búsqueda.

Los recursos se pueden almacenar en el servidor local del portal o en orígenes de contenido remotos para la búsqueda. Los rastreadores pueden procesar el contenido, si se puede acceder a este a través del protocolo HTTP. Por ejemplo, este contenido puede ser de páginas del portal, Web Content Manager y documentos alojados en servidores web. Los documentos pueden ser de distinto tipo, por ejemplo, archivos de texto editables, documentos del conjunto de aplicaciones de oficina, tales como Microsoft y OpenOffice, o bien, archivos PDF.

Gestión de recopilaciones de búsqueda

En el panel Recopilaciones de búsqueda, seleccione los iconos u opciones siguientes para ejecutar las siguientes tareas en las recopilaciones de búsqueda:
  • Seleccione Renovar para actualizar la información y los iconos de opciones disponibles para las recopilaciones. Ejemplos:
    • Si se ha completado o ejecutando un rastreo, se actualiza el número de documentos.
    • Si se ha completado el rastreo de una recopilación desde la última renovación, pueden aparecer iconos de opciones, por ejemplo Buscar y examinar la recopilación.
    • Si otro administrador ha actualizado las recopilaciones de búsqueda, se renueva la información.
  • En la página Recopilaciones de búsqueda, puede importar y exportar recopilaciones de búsqueda. También puede ver el estado de la recopilación de búsqueda y gestionar los orígenes de contenido pulsando el nombre de la recopilación de búsqueda.
    Nota: Los iconos de algunas tareas sólo están disponibles si el usuario actual puede realizar la tarea específica en la recopilación de búsqueda.

Creación de una recopilación de búsqueda

Algunos de los siguientes campos de entrada y opciones están disponibles al crear una recopilación de búsqueda:

Nota: Los parámetros seleccionados al crear la recopilación de búsqueda no se podrán cambiar posteriormente. Por lo tanto, planifique con antelación y preste especial atención al crear una nueva recopilación de búsqueda. Si desea cambiar los parámetros, debe empezar de nuevo creando una nueva recopilación de búsqueda con nuevos parámetros. A continuación, podrá exportar los datos de la recopilación anterior e importarlos a la nueva recopilación. Para obtener información, consulte Exportación de una recopilación de búsqueda e Importación de una recopilación de búsqueda.
Ubicación de la recopilación
Utilice este campo de entrada para escribirla vía de acceso del directorio en el que desea crear la nueva recopilación de búsqueda y los datos relacionados que desea guardar. Puede insertar una vía de acceso completa o una vía de acceso relativa al parámetro de servicio de búsqueda Collections Locations (Ubicaciones de las recopilaciones). La recopilación de búsqueda se crea en la ubicación siguiente:
  • Si escribe un nombre cualquiera, la ubicación de la nueva recopilación de búsqueda se combinará entre el directorio y el nombre predeterminados. Ejemplo: Si escribe ubicación_de_mi_recopilación, la nueva recopilación de búsqueda se creará en el directorio wp_raíz/collections/my_collection_location. Para obtener detalles sobre el directorio predeterminado para las recopilaciones de búsqueda y cómo configurarlo, consulte Configuración de la ubicación predeterminada para recopilaciones de búsqueda en la documentación del producto en la búsqueda del portal.
  • Si escribe la vía de acceso completa del directorio, la ubicación de la nueva recopilación de búsqueda será diferente a la ubicación de recopilación de búsqueda predeterminada. La nueva recopilación de búsqueda se creará en la ubicación de directorio que haya especificado.
Nombre de la recopilación
Utilice este campo de entrada para establecer el nombre de la nueva recopilación de búsqueda. Si no especifica ningún nombre, se utilizará la ubicación que haya especificado en el campo anterior para la recopilación de búsqueda.
Especificar el idioma de la recopilación
Utilice este menú para seleccionar un idioma para la recopilación de búsqueda. La recopilación de búsqueda y su índice están optimizados para el idioma. Esta característica mejora la calidad de los resultados de la búsqueda de los usuarios, ya que les permite utilizar variantes ortográficas, incluyendo plurales e inflexiones, para la palabra clave de la búsqueda. La búsqueda utiliza este idioma para indexar si no hay ningún idioma definido para el documento. Seleccione una de las opciones No especificado para indexar documentos sin derivación de las palabras.
Nota: Este valor no se sobrescribe cuando se importa una recopilación de búsqueda, por ejemplo durante la migración de una recopilación de búsqueda. Si crea la recopilación de búsqueda para migrar una recopilación existente, elija la selección para que coincida con la recopilación de origen.
Seleccionar resumidor
Utilice este menú para seleccionar un resumidor para la recopilación de búsqueda. Elija una de las siguientes opciones:
  • Elija Ninguno si no se genera ningún resumen. Si selecciona esta opción, el centro de búsqueda utiliza los metadatos de la descripción del documento, si están disponibles.
  • Elija Automático si se genera un resumidor automático.

Visualización del estado de una recopilación de búsqueda

Para ver el estado de una recopilación de búsqueda, pulse el nombre de la recopilación en la lista de recopilaciones de búsqueda. Gestionar búsqueda muestra el Nombre de origen de contenido y la Información de estado de la recopilación de búsqueda de la recopilación de búsqueda seleccionada. Los campos de estado muestran datos que cambian durante el ciclo de vida de la recopilación de búsqueda. Algunos datos se muestran como se indica a continuación:
Ultima actualización completada:
Muestra la fecha en la que se actualizó por última vez un origen de contenido mediante un rastreo planificado y en la que se indexó.
Nota: El tiempo de espera que puede establecer en Detener recopilación después de (minutos): es una aproximación. Puede superarse en algo de porcentaje, puesto que el indexado de documentos después del rastreo requiere más tiempo.

Si tiene una recopilación de búsqueda defectuosa en el portal, el portlet mostrará un enlace a la recopilación defectuosa.

Migración de recopilaciones de búsqueda

Cuando actualiza a una versión superior de WebSphere Portal, el formato de almacenamiento de los datos no es necesariamente compatible con la versión anterior. Para evitar la pérdida de datos, exporte todos los datos de las recopilaciones de búsqueda a archivos XML antes de actualizar. Después de actualizar, cree una recopilación de búsqueda y utilice los datos que ha exportado anteriormente para importar los datos de recopilación de búsqueda de nuevo al portal actualizado.

  1. Si no realiza estos pasos, las recopilaciones de búsqueda se perderán tras la actualización.
  2. Cuando cree la recopilación de búsqueda en el portal actualizado, introduzca datos y realice selecciones como se indica a continuación:
    • Introduzca la ubicación, el nombre y la descripción de la nueva recopilación. Puede utilizar los valores antiguos o bien escribir valores nuevos.
    • No es necesario seleccionar un resumidor. Estos valores se sobrescriben al importar los datos desde la recopilación de búsqueda de origen.
  3. No puede migrar una recopilación del sitio del portal entre versiones distintas de WebSphere Portal. Si actualiza a otra versión, deberá volver a crear la recopilación del sitio del portal. Haga lo siguiente:
    1. Documente los datos de configuración del origen de contenido del sitio del portal.
    2. Suprima el origen de contenido existente.
    3. Actualice el portal.
    4. En el portal actualizado, cree un nuevo origen de contenido del sitio del portal. Utilice los datos de configuración documentados.
    5. Ejecute el nuevo origen de contenido del portal.

La búsqueda no devuelve los portlets que se rastrearon antes de la actualización, pero que no existen en el portal actualizado.

Para obtener más información sobre estas tareas, consulte los temas acerca de la migración, importación y exportación de recopilaciones de búsqueda en la documentación del producto.

Para obtener detalles sobre cómo exportar e importar recopilaciones de búsqueda, consulte Exportación de una recopilación de búsqueda e Importación de una recopilación de búsqueda.

Exportación de una recopilación de búsqueda

Para exportar una recopilación de búsqueda y sus datos, haga lo siguiente:
  1. Antes de exportar una recopilación, asegúrese de que el usuario que está ejecutando el proceso de aplicación del portal tiene acceso de escritura a la ubicación de directorio de destino. En caso contrario, debería obtener un mensaje de error como Archivo no encontrado.
  2. Asegúrese de que el directorio de destino está vacío o que no contiene archivos que todavía necesite, ya que la exportación puede sobrescribir los archivos de este directorio.
  3. Localice la recopilación de búsqueda que desee exportar.
  4. Pulse el icono Importar o exportar recopilación, situado junto a la recopilación de búsqueda en la lista. Gestionar búsqueda muestra el panel Importar y exportar recopilación de búsqueda.
  5. En el campo de entrada Especificar ubicación (vía de acceso completa con extensión XML), escriba la vía de acceso completa del directorio y el nombre de archivo XML al que desea exportar la recopilación de búsqueda y sus datos. Documente los nombres de las recopilaciones, las ubicaciones de los directorios y los nombres de los archivos de destino a los que desea exportar las recopilaciones para la importación que se va a llevar a cabo.
    Nota: Cuando especifique la ubicación del directorio de destino para la exportación, tenga en cuenta que la exportación puede sobrescribir los archivos de este directorio.
  6. Pulse Exportar para exportar los datos de la recopilación de búsqueda. Gestionar búsqueda graba los datos de la recopilación de búsqueda completos en un archivo XML y lo almacena en la ubicación de directorio especificada. Puede utilizar esta archivo posteriormente como origen de la operación de importación para importar la recopilación de búsqueda a otro portal.
  7. Para volver al panel anterior sin exportar la recopilación de búsqueda, pulse el enlace adecuado en la indicación de ruta.

Importación de una recopilación de búsqueda

Para importar los datos de una recopilación de búsqueda, haga lo siguiente:
  1. Antes de importar los datos de la recopilación, debe crear el shell vacío para la recopilación de búsqueda. Puede crear el shell vacío creando una recopilación de búsqueda. Tiene que especificar sólo el campo de entrada de datos obligatorio Ubicación de la recopilación. No añada documentos ni orígenes de contenido, puesto que esto lo hace la importación.
  2. En la lista de recopilaciones de búsqueda, localice la recopilación de búsqueda a la que desee importar los datos de la recopilación de búsqueda.
  3. Pulse el icono Importar o exportar, situado junto a la recopilación de búsqueda en la lista. Gestionar búsqueda muestra el panel Importar y exportar recopilación de búsqueda.
  4. En el campo de entrada Especificar ubicación (vía de acceso completa con extensión XML):, escriba la vía de acceso completa del directorio y el nombre del archivo XML de los datos de la recopilación de búsqueda, que desee importar a la recopilación de búsqueda seleccionada.
  5. Pulse Importar para importar los datos completos de la recopilación de búsqueda del archivo XML especificado a la recopilación de búsqueda seleccionada.
  6. Para volver al panel anterior sin importar una recopilación de búsqueda, pulse el enlace adecuado en la indicación de ruta.
  7. Si lo desea, ahora puede añadir documentos y orígenes de contenido a la recopilación de búsqueda.
Nota: Al importar una recopilación, tenga en cuenta la información siguiente:
  1. Importe los datos de la recopilación sólo en una recopilación vacía. No importe datos de recopilación en una recopilación de destino que contenga orígenes de contenido o documentos.
  2. Cuando importa datos de la recopilación a una recopilación, todos los valores se sobrescriben por los valores que probablemente haya importado. Por ejemplo, se sobrescribe el valor de idioma o se añade un resumidor, si se ha especificado para la recopilación de búsqueda importada.
  3. Cuando importe una recopilación, un proceso en segundo plano recupera, rastrea e indexa todos los documentos listados por URL en el archivo anteriormente exportado. Este proceso es asíncrono y es posible que pase un tiempo considerable hasta que los documentos estén disponibles.
  4. Al importar una recopilación que contiene un origen de contenido del sitio del portal creado en una versión anterior, debe realizar las acciones siguientes:
    • Volver a recopilar el contenido suprimiendo el origen de contenido existente
    • Crear un origen de contenido del sitio
    • Iniciar un rastreo

Renovación de los datos de la recopilación

La renovación de los datos de una recopilación de búsqueda actualiza dicha recopilación mediante un rastreo renovado en todos los orígenes de contenido asociados a ella. Para renovar una recopilación de búsqueda, pulse Volver a recopilar documentos del origen de contenido. Gestionar búsqueda realiza nuevos rastreos completos en todos los orígenes de contenido. Para verificar el progreso y la finalización de la nueva recopilación, pulse la recopilación y vea la información de Estado de la recopilación.
Nota: Esta acción puede requerir una cantidad considerable de recursos del sistema, puesto que todos los orígenes de contenido de la recopilación de búsqueda se rastrean al mismo tiempo.

Supresión de una recopilación de búsqueda

Nota: Si suprime la recopilación de búsqueda antes de actualizar a una versión posterior de WebSphere Portal, asegúrese de exportar la recopilación de búsqueda para importarla posteriormente antes de suprimirla. Para obtener más detalles, consulte Migración de recopilaciones de búsqueda.

Gestión de los orígenes de contenido de una recopilación de búsqueda

Para trabajar con los orígenes de contenido de una recopilación de búsqueda, pulse el nombre de la recopilación en la lista de recopilaciones de búsqueda. Gestionar búsqueda lista los Orígenes de contenido y la Información de estado de la recopilación de búsqueda de la recopilación de búsqueda seleccionada. Una recopilación de búsqueda se puede configurar para cubrir más de un origen de contenido.

Desde el panel Orígenes de contenido, puede realizar las tareas siguientes:
  • Pulse Renovar para renovar la información de estado. Mientras está en ejecución un rastreo en el origen de contenido, esta opción actualiza la información sobre el tiempo de ejecución y los documentos recopilados hasta el momento.
  • Ver la información de estado del origen de contenido:
    Documentos
    Número de documentos del origen de contenido. Si pulsa Renovar durante un rastreo, esta acción mostrará cuántos documentos ha recuperado el rastreador hasta ese momento.
    Tiempo de ejecución
    El tiempo de ejecución de la última ejecución del rastreador en los orígenes de contenido. Si pulsa Renovar durante un rastreo, esta acción mostrará la cantidad de tiempo que ha utilizado el rastreador hasta ese momento.
    Última ejecución
    Fecha y hora en la que se ha iniciado la última ejecución que ha rastreado el origen de contenido.
    Próxima ejecución
    La fecha y hora de la próxima ejecución en la que se rastrea el origen de contenido, si se ha planificado.
    Estado
    El Estado del origen de contenido, es decir, si el origen de contenido está Inactivo o si un rastreo está En ejecución.
  • Seleccione uno de los iconos para un origen de contenido específico y realice una de las tareas siguientes:
    • Ver planificadores de origen de contenido. Este icono sólo se muestra si ha definido rastreos planificados para este origen de contenido. Si pulsa este icono, el portlet enumera los rastreos planificados, así como la información siguiente:
      • Fecha de inicio
      • Hora de inicio
      • Intervalo de periodicidad
      • Próxima fecha de ejecución
      • Próxima hora de ejecución
      • Estado es una opción que se puede habilitar o inhabilitar.
    • Iniciar rastreador. Pulse este icono para iniciar un rastreo en el origen de contenido. Esta acción actualiza el contenido del origen de contenido con una nueva ejecución del rastreador. Durante la ejecución, el icono cambia a Detener rastreador, que puede pulsar para finalizar la ejecución. Para obtener más detalles, consulte Empezar a recopilar documentos de un origen de contenido. . Búsqueda de portal renueva distintos orígenes de contenido de la forma siguiente:
      • Para orígenes de contenido del sitio web, los documentos que se han indexado anteriormente y que aún existen en el origen de contenido se actualizan. Los documentos que se han indexado anteriormente, pero ya no existen, se mantienen en la recopilación de búsqueda. Los documentos que son nuevos en el origen de contenido se indexan y añaden a la recopilación.
      • Para los sitios de WebSphere Portal, el rastreo añade todas las páginas y portlets al origen de contenido. Suprime los portlets y las páginas estáticas del origen de contenido que se han eliminado del portal. El rastreo funciona de forma similar a la opción Volver a recopilar documentos del origen de contenido.
      • Para los sitios de IBM Web Content Manager, la búsqueda del portal utiliza un método de rastreo incremental. Además del contenido añadido y actualizado, la lista de partida especifica explícitamente contenido suprimido. Por contra, al pulsar Volver a recopilar documentos del Origen de contenido, comienza un rastreo completo; no continúa desde la última sesión y, por lo tanto, no es incremental.
      • Para orígenes de contenido creados con la opción del proveedor de la lista de partida, un rastreo en un sistema remoto que da soporte al rastreo incremental, como por ejemplo IBM Connections, se comporta como un rastreo en un sitio de Web Content Manager.
    • Volver a recopilar documentos del origen de contenido. Esta opción suprime los documentos existentes del origen de contenido de los rastreos anteriores. A continuación, inicia un rastreo completo en el origen de contenido. Los documentos indexados anteriormente y que aún existen en el origen de contenido se actualizan. Los documentos indexados anteriormente, pero que ya no existen en el origen de contenido, se eliminan de la recopilación. Los documentos que son nuevos en el origen de contenido se indexan y añaden a la recopilación.
    • Notas:
      • Se recomienda definir un ID de usuario de rastreador dedicado. La búsqueda del sitio de portal predeterminada preconfigurada utiliza el ID de usuario de administrador predeterminado wpsadmin con la contraseña predeterminada de ese ID de usuario para el rastreador. Si ha cambiado el ID de usuario de administrador predeterminado durante la instalación de portal, el rastreador utiliza el ID de usuario predeterminado. Si ha modificado el ID de usuario o la contraseña para el ID de usuario de administración y aún desea utilizarlo para el rastreador de la búsqueda de portal, debe adaptar los valores.

        Para definir un ID de usuario de rastreador, seleccione el separador Seguridad y actualice el ID de usuario y la contraseña. Pulse Guardar.

      • Si modifica un origen de contenido que pertenece al ámbito de búsqueda, actualice manualmente el ámbito para asegurarse de que este aún cubre ese origen de contenido. Especialmente, si ha cambiado el nombre del origen de contenido, edite el ámbito y asegúrese de que todavía aparece en él. Si no es así, vuélvalo a añadir.
      • Si suprime un origen de contenido, los documentos recopilados seguirán estando disponibles para que los usuarios realicen búsquedas en todos los ámbitos. Todos los ámbitos incluían el origen del contenido antes de suprimirlo. Estos documentos estarán disponibles hasta que llegue la caducidad. En Parámetros generales, puede especificar esta caducidad desde el menú Los enlaces caducan después de (días):.

Nuevo origen de contenido

Cuando cree un origen de contenido nuevo para una recopilación de búsqueda, se rastreará el origen de contenido y se rellenará la recopilación de búsqueda se rellenará con documentos de dicho origen de contenido. Puede determinar dónde se realiza el rastreo del índice y qué información recupera. Seleccione opciones del menú Tipo de origen de contenido. Los campos de entrada y parámetros que puede especificar son los siguientes:

Sitio web
Seleccione esta opción para todos los sitios remotos, que incluye sitios web y los sitios de portal remotos. Sólo se pueden indexar las páginas anónimas y se pueden buscar en los sitios de portal remotos.
Proveedor de lista de partida
Seleccione esta opción si el rastreador utiliza una lista de semillas como origen de contenido para la recopilación.
Sitio del portal
Seleccione esta opción si el origen de contenido es el sitio del portal local.
Sitio de WCM (contenido web gestionado)
Para que un origen de contenido de este tipo esté disponible en la Búsqueda del portal, lo debe crear en el portlet Creación de Web Content Manager. Debe seleccionar la opción adecuada para que esté disponible para realizar búsquedas y especificar la recopilación de búsqueda a la que pertenece. Al terminar de crear el sitio de contenido web gestionado, éste se lista entre los orígenes de contenido para la recopilación de búsqueda que ha especificado.
La selección determina algunos de los campos de entrada y las opciones que están disponibles para crear el origen de contenido. Por ejemplo, la opción Obedecer al archivo robots.txt del separador Parámetros avanzados sólo está disponible si selecciona Sitio web como tipo de origen de contenido.

Establecimiento de los parámetros generales de un origen de contenido

Para definir los parámetros generales del origen de contenido, continúe rellenando los campos de entrada y realizando selecciones en el recuadro Crear un origen de contenido nuevo. Las opciones y los campos disponibles dependen del tipo de origen de contenido que haya seleccionado y se muestran de la siguiente manera:
  • Escriba el URL de web o URL de portal necesarios en el campo obligatorio Recopilar documentos enlazados desde este URL. Esta acción determina el URL raíz desde el que se iniciará el rastreador. Para orígenes de contenido del portal, el valor de este campo lo rellena Gestionar búsqueda.
    Notas:
    • Para sitios web, debe especificar el nombre completo, incluido http://. Por ejemplo: http://www.cnn.com. Si se escribe sólo www.cnn.com, se producirá un error.
    • Un error de rastreo puede ser debido a problemas de redirección de URL. Si se produce este problema, intente editar este campo, por ejemplo, cambiando el URL por el URL de redirección.
  • Realice la selección entre las opciones siguientes de las listas. Las opciones y los campos disponibles difieren, en función del tipo de origen de contenido seleccionado.
    Niveles de enlaces que deben seguirse:
    Para rastrear sitios web: esta opción determina la profundidad del rastreo, que es el número máximo de niveles de enlaces anidados que el rastreador sigue desde el URL raíz.
    Número de documentos enlazados que se recopilarán:
    Para rastrear sitios web: esta opción determina el número máximo de documentos que indexará el rastreador durante cada sesión. El número de documentos indexados incluye los documentos que se vuelven a indexar ya que su contenido se ha modificado.
    Detener recopilación después de (min):
    Esta opción establece el número máximo de minutos que el rastreador puede ejecutarse en una sola sesión para sitios web.
    Nota: El tiempo de espera funciona como un límite de tiempo aproximado. Puede superarse en algo de porcentaje.
    Detener la recuperación de un documento después de (s):
    Esta opción indica el tiempo que el rastreador pasa intentando captar un documento. Esta opción establece el límite de tiempo máximo en segundos para completar la fase inicial de la conexión HTTP, es decir, para recibir las cabeceras HTTP. Este límite de tiempo debe ser finito ya que se utiliza para evitar que el rastreador se atasque infinitamente en una conexión errónea. Sin embargo, permite que el rastreador recupere grandes archivos, como archivos comprimidos, que necesitan más tiempo para ser recuperados.

Establecimiento de los parámetros avanzados para un origen de contenido

Al crear un nuevo origen de contenido, pulse el separador Parámetros avanzados y seleccione entre las siguientes opciones, marque los recuadros o introduzca datos de la siguiente manera:
Número de procesos paralelos:
Este parámetro determina el número de hebras que utiliza el rastreador en una sesión.
Codificación de caracteres predeterminada:
Este parámetro establece el conjunto de caracteres predeterminado que el rastreador utiliza si no puede determinar el conjunto de caracteres de un documento.
Nota: El campo de entrada para la codificación de caracteres predeterminada contiene el valor predeterminado inicial windows-1252, independientemente del valor para el Idioma predeterminado del portal en Menú de administración > Valores del portal > Valores globales. Especifique la codificación de caracteres predeterminada, en función del idioma del portal. De lo contrario, es posible que los documentos se visualicen incorrectamente en Examinar documentos.
Utilizar siempre la codificación de caracteres predeterminada:
Si activa esta opción, el rastreador siempre utilizará el juego de caracteres predeterminados, sin tener en cuenta el juego de caracteres del documento. Si no activa esta opción, el rastreador intentará determinar los juegos de caracteres de los documentos.
Obedecer al archivo Robots.txt
Si selecciona esta opción, el rastreador observa las restricciones especificadas en el archivo robots.txt cuando accede a los URL de los documentos. Esta opción solo está disponible para el tipo de origen de contenido de sitio web, y no el sitio del portal o el proveedor de lista de partida.
Servidor proxy:
Si deja este valor de servidor proxy HTTP vacío, el rastreador no utilizará un servidor proxy.
Puerto:
Si deja este valor de puerto vacío, el rastreador no utilizará un servidor proxy.

Configuración del planificador

Para configurar la planificación, pulse el separador Planificador para ver las opciones siguientes:
Definir planificación
Añada una nueva planificación desde este recuadro.
Actualizaciones planificadas
Este recuadro muestra cuándo se realizarán los rastreos planificados.
Nota: El intervalo de tiempo en el que se ejecuta el rastreador debe ser superior al tiempo de ejecución máximo del rastreador. Un rastreador no se puede iniciar si ya está en ejecución. Si un trabajo de rastreador se inicia mientras el rastreador se está ejecutando, esta ejecución se ignora y el rastreador solo se iniciará en el siguiente tiempo planificado.

Configuración de los filtros

Los filtros del rastreador controlan el progreso del rastreador y el tipo de documentos que se indexan y catalogan. Para configurar filtros, pulse el separador Filtros. Puede definir nuevos filtros en el recuadro Definir reglas de filtro. Los filtros definidos se listan en el recuadro Filtrado de reglas.

Los filtros del rastreador se dividen en dos tipos:
Filtros de URL
Estos filtros controlan los documentos que se rastrean e indexan basándose en el URL en que se han encontrado los documentos.
Filtros de tipos
Estos filtros controlan los documentos que se rastrean e indexan basándose en el tipo de documento.

Si no define ningún filtro, se recuperarán y se rastrearán todos los documentos del origen de contenido. Si pulsa filtros de inclusión, solo se rastrearán e indexarán aquellos documentos que pasen los filtros. Si pulsa filtros de exclusión, estos sustituirán los filtros incluidos. Si no define filtros incluidos, limitarán el número de documentos que se rastrean e indexan. Más específicamente, si un documento pasa uno de los filtros incluidos, pero también pasa uno de los filtros excluidos, no se rastreará, indexará ni catalogará.

Puede realizar las siguientes tareas con el recuadro Filtros:
Creación de un filtro
Al utilizar la opción Aplicar regla al: recopilar documentos con Tipo de regla: Incluir, asegúrese de que el URL del campo Recopilar documentos enlazados desde este URL: se ajusta a la regla especificada; de lo contrario, no se recopilarán documentos. Por ejemplo, el rastreo del URL http://www.ibm.com/products con el filtro de URL */products/* no proporciona ningún resultado, ya que la regla tiene una barra inclinada final, pero el URL no. Sin embargo, funcionan tanto el rastreo http://www.ibm.com/products/ con el filtro de URL */products/* (ambos con barra invertida final) como el rastreo http://www.ibm.com/products con el filtro de URL */products* (sin barra invertida final) funciona.

Configuración de la seguridad de un origen de contenido

Puede configurar la seguridad para indexar los orígenes de contenido protegidos y los repositorios que requieran autenticación. Pulse el separador Seguridad para ver los dos recuadros siguientes:
Definir dominio de seguridad
Este recuadro se utiliza para añadir nuevos orígenes de contenido protegidos.
Dominios de seguridad
Este recuadro muestra una lista de los dominios de seguridad existentes.
En el recuadro Definir dominio de seguridad, especifique los siguientes campos de entrada de datos:
Nombre de usuario
Especifique el ID de usuario con el que el rastreador puede acceder al origen de contenido o repositorio protegido.
Contraseña
Especifique la contraseña para el ID de usuario que haya indicado en Nombre de usuario.
Nombre de host
Especifique el nombre del servidor. Para los sitios del portal y los proveedores de la lista de partida, esta entrada no es necesaria. Si lo deja en blanco, el nombre de host se infiere a partir del URL raíz proporcionado.
Dominio
Especifique el dominio del repositorio u origen de contenido protegido.

Empezar a recopilar documentos de un origen de contenido

Para iniciar una actualización de un origen de contenido manualmente, lleve a cabo los pasos siguientes:
  1. Pulse Iniciar rastreador para el origen de contenido para el que desea iniciar la ejecución del rastreador. El rastreador recupera los documentos del origen de contenido seleccionado. Si son nuevos o están modificados, se actualizarán en la recopilación de búsqueda. Durante la ejecución de un rastreador, el icono cambia a Detener rastreador, que puede pulsar para detener el rastreador. Búsqueda de portal renueva distintos orígenes de contenido de la forma siguiente:
    • Para orígenes de contenido del sitio web, los documentos que se han indexado anteriormente y que aún existen en el origen de contenido se actualizan. Los documentos que se han indexado anteriormente, pero ya no existen, se mantienen en la recopilación de búsqueda. Los documentos que son nuevos en el origen de contenido se indexan y añaden a la recopilación.
    • Para los sitios de WebSphere Portal, el rastreo añade todas las páginas y portlets al origen de contenido. Suprime los portlets y las páginas estáticas del origen de contenido que se han eliminado del portal. El rastreo funciona de forma similar a la opción Volver a recopilar documentos del origen de contenido.
    • Para los sitios de IBM Web Content Manager, la búsqueda del portal utiliza un método de rastreo incremental. Además del contenido añadido y actualizado, la lista de partida especifica explícitamente contenido suprimido. Por contra, al pulsar Volver a recopilar documentos del Origen de contenido, comienza un rastreo completo; no continúa desde la última sesión y, por lo tanto, no es incremental.
    • Para orígenes de contenido creados con la opción del proveedor de la lista de partida, un rastreo en un sistema remoto que da soporte al rastreo incremental, como por ejemplo IBM Connections, se comporta como un rastreo en un sitio de Web Content Manager.
  2. Para ver la información de estado actualizada sobre el progreso del proceso de rastreo, pulse Renovar. Se actualiza la información de estado siguiente:
    Documentos
    Muestra el número de documentos que el rastreador ha recuperado hasta el momento desde el origen de contenido seleccionado.
    Tiempo de ejecución
    Muestra la cantidad de tiempo que el rastreador ha utilizado hasta el momento para rastrear el origen de contenido.
    Estado
    Muestra si el rastreador del origen de contenido está en ejecución o desocupado.

Verificación de la dirección de un origen de contenido

Para verificar la dirección URL de un origen de contenido, localice el origen de contenido y pulse el icono Verificar dirección.

Si el origen de contenido web está disponible y no bloqueado por un archivo robots.txt, Gestionar búsqueda devuelve el mensaje El origen de contenido es correcto. Si el origen de contenido no es válido, no se puede acceder a él o está bloqueado, Gestionar búsqueda devuelve un mensaje de error.

Al crear un nuevo origen de contenido, Gestionar búsqueda comienza la característica Verificar dirección.

Ámbitos de búsqueda y enlaces personalizados

Desde Ámbitos de búsqueda, puede ver y gestionar ámbitos de búsqueda y enlaces personalizados. Los ámbitos de búsqueda se muestran a los usuarios como opciones de búsqueda en la lista desplegable del recuadro de búsqueda en el banner y en el portlet Centro de búsqueda. Los usuarios pueden seleccionar el ámbito adecuado para sus consultas de búsqueda. Puede configurar los ámbitos de uno de los modos siguientes:
  • Una o varias ubicaciones de búsqueda, u orígenes de contenido.
  • Funciones o características del documento, como el tipo de documento.
WebSphere Portal incluye estos ámbitos:
Todos los orígenes
Este ámbito incluye documentos con todas las funciones de todos los orígenes de contenido de la búsqueda.
Contenido web gestionado
Este ámbito restringe la búsqueda a sitios que ha creado Web Content Manager.

Puede añadir sus propios ámbitos de búsqueda personalizados y un icono para cada ámbito. Los iconos se sitúan en la lista de ámbitos.

También puede añadir enlaces personalizados nuevos a las ubicaciones de búsqueda. Este enlace personalizado incluye enlaces a ubicaciones web externas, como por ejemplo Google o Yahoo. La búsqueda global del Centro de búsqueda lista los enlaces personalizados del menú de selección de opciones de búsqueda.

Gestión de ámbitos de búsqueda y enlaces personalizados

En el panel Ámbitos de búsqueda y enlaces personalizados, seleccione los iconos o las opciones siguientes para completar tareas en los ámbitos de búsqueda o enlaces personalizados:
Nuevo ámbito
Pulse esta opción para creare un nuevo ámbito de búsqueda. Para obtener detalles, consulte Creación de un nuevo ámbito de búsqueda.
Renovar
Pulse esta opción para renovar la información para los ámbitos, por ejemplo, el estado de los ámbitos o las actualizaciones que otro administrador haya realizado en los ámbitos.
Flechas Mover abajo y Mover arriba
Pulse estas flechas para desplazar los ámbitos de búsqueda hacia arriba y hacia abajo en la lista. Esta acción determina la secuencia en la que se listan los ámbitos en el menú desde el que los usuarios seleccionan opciones de búsqueda para búsquedas con el portlet Centro de búsqueda.
Editar ámbito de búsqueda
Pulse este icono para trabajar con un ámbito de búsqueda o modificarlo. Para obtener detalles, consulte Edición de un ámbito de búsqueda.
Suprimir ámbito de búsqueda
Pulse este icono para suprimir un ámbito de búsqueda.
Nuevo enlace personalizado
Pulse esta opción para añadir un nuevo enlace personalizado. Para obtener detalles, consulte Adición de un enlace personalizado nuevo.
Editar enlace personalizado
Pulse este icono para trabajar con un enlace personalizado o modificarlo.
Suprimir enlace personalizado
Pulse este icono para suprimir un enlace personalizado.
Nota: Debe borrar la memoria caché de navegador para ver los cambios, por ejemplo, un nuevo ámbito predeterminado que se muestra en la posición correcta.

Creación de un ámbito de búsqueda

Para crear un ámbito de búsqueda nuevo, pulse Nuevo ámbito para ver la página Nuevo ámbito de búsqueda. Entre los datos necesarios en los campos y seleccione entre las opciones disponibles:
Nombre de ámbito
Un campo obligatorio en el que se especifica un nombre para el nuevo ámbito de búsqueda. Este nombre debe ser exclusivo en el portal actual o el portal virtual.
Descripción
Un campo opcional en el que se describe el ámbito.
URL de icono personalizado:
Especifique la ubicación del URL donde el portal puede localizar el icono de ámbito que desea que se visualice con las opciones de búsqueda. Si el archivo de icono existe en el directorio de iconos predeterminado wps/images/icons, sólo es necesario que escriba el nombre de archivo del icono. Si el archivo del icono está en otra vía de acceso de directorio, escriba la vía de acceso absoluta del archivo con el nombre de archivo. Pulse Comprobar vía de acceso del icono para asegurarse de que el icono está disponible en el URL que especificó.
Estado:
Establezca el estado del ámbito de búsqueda según proceda. Para que el ámbito esté disponible para los usuarios, establezca el estado en Activo.
Visible para usuarios anónimos:
Seleccione para que el ámbito de búsqueda esté disponible para los usuarios que utilizan el portal sin iniciar una sesión. Seleccione No para que el ámbito esté disponible únicamente para los usuarios autenticados.
Texto de consulta (opcional):
Especifique un texto de consulta que se añade de modo invisible a todas las búsquedas de este ámbito. Las búsquedas devuelven resultados que coinciden con la búsqueda del usuario y el texto de consulta que ha indicado en este campo. Ambos conjuntos de resultados están sopesados con la misma relevancia en la lista de resultados. El texto de consulta que especifique debe cumplir las reglas sintácticas para entrar una consulta en el centro de búsqueda. Para obtener más información sobre estas reglas sintácticas de consulta, consulte la ayuda del portlet de Centro de búsqueda.
Seleccionar ubicaciones
Seleccione la ubicación según sea necesario. Si los usuarios seleccionan este ámbito para la búsqueda, sólo se buscan los documentos de estas ubicaciones de búsqueda u orígenes de contenido.
Nota: El árbol de ubicaciones también muestra orígenes de contenido que se han suprimido, si aún contienen documentos en la recopilación. Una vez que un origen de contenido suprimido no contenga documentos, el daemon de limpieza lo elimina del árbol de ubicaciones.

Si desea establecer nombres y descripciones para el ámbito de búsqueda, debe crear y guardar el ámbito en primer lugar. A continuación, ubique el ámbito en la lista de ámbitos y edítelo pulsando el icono Editar. La opción de establecer nombres y descripciones en otros entornos locales sólo está disponible en la página Editar ámbito de búsqueda.

Nota: Si modifica un origen de contenido que pertenece al ámbito de búsqueda, actualice manualmente el ámbito para asegurarse de que el ámbito aún cubre ese origen de contenido. Especialmente, si ha cambiado el nombre del origen de contenido, edite el ámbito y asegúrese de que todavía aparece en él. Si no es así, vuélvalo a añadir.