IBM WebSphere Portal 8.5: Asistencia al usuario para administradores |
---|
Gestionar búsqueda
Utilice el portlet Búsqueda de portal para administrar la búsqueda de portal.
Para gestionar una búsqueda del portal, haga clic en el icono menú Administración de la barra de herramientas. A continuación, haga clic en en el menú del portal. El portal muestra Gestionar búsqueda del portlet de administración,
- Servicios de búsqueda
- Los servicios de búsqueda representan instancias independientes del motor de búsqueda. Para gestionar los servicios de búsqueda, pulse Servicios de búsqueda para acceder a la página Servicios de búsqueda. Pulse sobre el nombre de un servicio de búsqueda para ver las recopilaciones de búsqueda y los orígenes de contenido que utilizan dicho servicio de búsqueda.
- Recopilaciones de búsqueda
- Una recopilación de búsqueda contiene uno o varios orígenes de contenido de contenido web o contenido del portal, así como índices de texto completo relacionados que permiten a los usuarios buscar contenido. Para gestionar las recopilaciones de búsqueda y sus orígenes de contenido, pulse Recopilaciones de búsqueda para ver la página Recopilaciones de búsqueda.
- Ámbitos de búsqueda y enlaces personalizados.
- Los ámbitos de búsqueda limitan los resultados de la búsqueda a ubicaciones de contenido y tipos de documentos específicos. Los administradores definen ámbitos de búsqueda para las búsquedas los los usuarios. Los enlaces personalizados son accesos directos de enlaces web que permiten a los usuarios realizar búsquedas directamente en los motores de búsqueda web, como por ejemplo Google o Yahoo. Para gestionar los ámbitos de búsqueda y los enlaces personalizados, pulse Ámbitos de búsqueda. Se visualiza la página Ámbitos de búsqueda y enlaces personalizados.
Servicios de búsqueda
- Servicio de búsqueda del portal
- Seleccione el servicio de búsqueda del portal para gestionar las recopilaciones de búsqueda
que contengan páginas de portal, contenido gestionado por IBM Web Content Manager o páginas web indexadas. En un entorno en clúster, debe configurar un servicio de búsqueda remoto. Nota: El rastreador de HTTP del servicio de búsqueda del portal no da soporte a JavaScript. Es posible que el texto que genera JavaScript no esté disponible para la búsqueda.
También puede crear más servicios de búsqueda personalizados y añadirlos al portal.
- Creación de un servicio de búsqueda
- Para crear un nuevo servicio de búsqueda, pulse Nuevo servicio de búsqueda. Gestionar búsqueda muestra la página Nuevo servicio de búsqueda. Especifique un Nombre de servicio que sea exclusivo dentro del portal actual o el portal virtual.
Recopilaciones de búsqueda
En Recopilaciones de búsqueda, puede visualizar y gestionar las recopilaciones de búsqueda y sus orígenes de contenido en el portal. Puede crear y mantener recopilaciones de búsqueda de contenido web, contenido de Web Content Manager, contenido del portal y las recopilaciones de búsqueda relacionadas. Los usuarios pueden realizar búsquedas en estas recopilaciones utilizando el Centro de búsqueda del portal.
Una recopilación de búsqueda puede tener uno o más orígenes de contenido, como páginas web, contenido de Web Content Manager o portlets y páginas del portal. La recopilación de búsqueda predeterminada del portal combina dos orígenes de contenido y sus rastreadores relacionados:
- Origen de contenido del portal
- El origen de contenido del portal contiene el sitio del portal local, donde los usuarios pueden buscar portlets y páginas del portal.
- Origen de contenido de Web Content Manager
- El origen de contenido de Web Content Manager permite que los usuarios puedan buscar contenido web.
Durante el proceso de creación de recopilaciones de búsqueda, se recupera el contenido para indexar a través de un rastreador (robot) de los orígenes de contenido. La recopilación de búsqueda almacena palabras clave y metadatos, y los correlaciona con su origen original. Se permite un procesamiento más rápido de las solicitudes desde el portlet Centro de búsqueda.
Los recursos se pueden almacenar en el servidor local del portal o en orígenes de contenido remotos para la búsqueda. Los rastreadores pueden procesar el contenido, si se puede acceder a este a través del protocolo HTTP. Por ejemplo, este contenido puede ser de páginas del portal, Web Content Manager y documentos alojados en servidores web. Los documentos pueden ser de distinto tipo, por ejemplo, archivos de texto editables, documentos del conjunto de aplicaciones de oficina, tales como Microsoft y OpenOffice, o bien, archivos PDF.
Gestión de recopilaciones de búsqueda
- Seleccione Renovar para actualizar la información y los iconos de opciones disponibles para las recopilaciones. Ejemplos:
- Si se ha completado o ejecutando un rastreo, se actualiza el número de documentos.
- Si se ha completado el rastreo de una recopilación desde la última renovación, pueden aparecer iconos de opciones, por ejemplo Buscar y examinar la recopilación.
- Si otro administrador ha actualizado las recopilaciones de búsqueda, se renueva la información.
- En la página Recopilaciones de búsqueda, puede importar y exportar recopilaciones de búsqueda. También puede ver el estado de la recopilación de búsqueda y gestionar los orígenes de contenido pulsando el nombre de la recopilación de búsqueda. Nota: Los iconos de algunas tareas sólo están disponibles si el usuario actual puede realizar la tarea específica en la recopilación de búsqueda.
Creación de una recopilación de búsqueda
Algunos de los siguientes campos de entrada y opciones están disponibles al crear una recopilación de búsqueda:
- Ubicación de la recopilación
- Utilice este campo de entrada para escribirla vía de acceso del directorio en el que desea crear la nueva recopilación de búsqueda y los datos
relacionados que desea guardar. Puede insertar una vía de acceso completa o una vía de acceso relativa al parámetro de servicio de búsqueda Collections Locations (Ubicaciones de las recopilaciones). La recopilación de búsqueda se crea en la ubicación siguiente:
- Si escribe un nombre cualquiera, la ubicación de la nueva recopilación de búsqueda se combinará entre el directorio y el nombre predeterminados. Ejemplo: Si escribe ubicación_de_mi_recopilación, la nueva recopilación de búsqueda se creará en el directorio wp_raíz/collections/my_collection_location. Para obtener detalles sobre el directorio predeterminado para las recopilaciones de búsqueda y cómo configurarlo, consulte Configuración de la ubicación predeterminada para recopilaciones de búsqueda en la documentación del producto en la búsqueda del portal.
- Si escribe la vía de acceso completa del directorio, la ubicación de la nueva recopilación de búsqueda será diferente a la ubicación de recopilación de búsqueda predeterminada. La nueva recopilación de búsqueda se creará en la ubicación de directorio que haya especificado.
- Nombre de la recopilación
- Utilice este campo de entrada para establecer el nombre de la nueva recopilación de búsqueda. Si no especifica ningún nombre, se utilizará la ubicación que haya especificado en el campo anterior para la recopilación de búsqueda.
- Especificar el idioma de la recopilación
- Utilice este menú para seleccionar un idioma para la recopilación de búsqueda. La recopilación de búsqueda y su índice están optimizados para el
idioma. Esta característica mejora la calidad de los resultados de la búsqueda de los usuarios, ya que les permite utilizar variantes ortográficas, incluyendo plurales e inflexiones, para la palabra clave de la búsqueda. La búsqueda utiliza este idioma para indexar
si no hay ningún idioma definido para el documento. Seleccione
una de las opciones No especificado para indexar documentos
sin derivación de las palabras.Nota: Este valor no se sobrescribe cuando se importa una recopilación de búsqueda, por ejemplo durante la migración de una recopilación de búsqueda. Si crea la recopilación de búsqueda para migrar una recopilación existente, elija la selección para que coincida con la recopilación de origen.
- Seleccionar resumidor
- Utilice este menú para seleccionar un resumidor para la recopilación de búsqueda. Elija una de las siguientes opciones:
- Elija Ninguno si no se genera ningún resumen. Si selecciona esta opción, el centro de búsqueda utiliza los metadatos de la descripción del documento, si están disponibles.
- Elija Automático si se genera un resumidor automático.
Visualización del estado de una recopilación de búsqueda
- Ultima actualización completada:
- Muestra la fecha en la que se actualizó por última vez un origen de contenido mediante un rastreo planificado y en la que se indexó.Nota: El tiempo de espera que puede establecer en Detener recopilación después de (minutos): es una aproximación. Puede superarse en algo de porcentaje, puesto que el indexado de documentos después del rastreo requiere más tiempo.
Si tiene una recopilación de búsqueda defectuosa en el portal, el portlet mostrará un enlace a la recopilación defectuosa.
Migración de recopilaciones de búsqueda
Cuando actualiza a una versión superior de WebSphere Portal, el formato de almacenamiento de los datos no es necesariamente compatible con la versión anterior. Para evitar la pérdida de datos, exporte todos los datos de las recopilaciones de búsqueda a archivos XML antes de actualizar. Después de actualizar, cree una recopilación de búsqueda y utilice los datos que ha exportado anteriormente para importar los datos de recopilación de búsqueda de nuevo al portal actualizado.
- Si no realiza estos pasos, las recopilaciones de búsqueda se perderán tras la actualización.
- Cuando cree la recopilación de búsqueda en el portal actualizado, introduzca datos y realice selecciones como se indica a continuación:
- Introduzca la ubicación, el nombre y la descripción de la nueva recopilación. Puede utilizar los valores antiguos o bien escribir valores nuevos.
- No es necesario seleccionar un resumidor. Estos valores se sobrescriben al importar los datos desde la recopilación de búsqueda de origen.
- No puede migrar una recopilación del sitio del portal entre versiones distintas de WebSphere Portal. Si actualiza a otra versión, deberá volver a crear la recopilación del sitio del portal. Haga lo siguiente:
- Documente los datos de configuración del origen de contenido del sitio del portal.
- Suprima el origen de contenido existente.
- Actualice el portal.
- En el portal actualizado, cree un nuevo origen de contenido del sitio del portal. Utilice los datos de configuración documentados.
- Ejecute el nuevo origen de contenido del portal.
La búsqueda no devuelve los portlets que se rastrearon antes de la actualización, pero que no existen en el portal actualizado.
Para obtener más información sobre estas tareas, consulte los temas acerca de la migración, importación y exportación de recopilaciones de búsqueda en la documentación del producto.
Para obtener detalles sobre cómo exportar e importar recopilaciones de búsqueda, consulte Exportación de una recopilación de búsqueda e Importación de una recopilación de búsqueda.
Exportación de una recopilación de búsqueda
- Antes de exportar una recopilación, asegúrese de que el usuario que está ejecutando el proceso de aplicación del portal tiene acceso de escritura a la ubicación de directorio de destino. En caso contrario, debería obtener un mensaje de error como Archivo no encontrado.
- Asegúrese de que el directorio de destino está vacío o que no contiene archivos que todavía necesite, ya que la exportación puede sobrescribir los archivos de este directorio.
- Localice la recopilación de búsqueda que desee exportar.
- Pulse el icono Importar o exportar recopilación, situado junto a la recopilación de búsqueda en la lista. Gestionar búsqueda muestra el panel Importar y exportar recopilación de búsqueda.
- En el campo de entrada Especificar ubicación (vía de acceso completa con extensión XML), escriba la vía de acceso completa del directorio y el nombre de archivo XML al que desea exportar la recopilación de búsqueda y sus datos. Documente los nombres de las recopilaciones, las ubicaciones de los directorios y los nombres de los archivos de destino a los que desea exportar las recopilaciones para la importación que se va a llevar a cabo. Nota: Cuando especifique la ubicación del directorio de destino para la exportación, tenga en cuenta que la exportación puede sobrescribir los archivos de este directorio.
- Pulse Exportar para exportar los datos de la recopilación de búsqueda. Gestionar búsqueda graba los datos de la recopilación de búsqueda completos en un archivo XML y lo almacena en la ubicación de directorio especificada. Puede utilizar esta archivo posteriormente como origen de la operación de importación para importar la recopilación de búsqueda a otro portal.
- Para volver al panel anterior sin exportar la recopilación de búsqueda, pulse el enlace adecuado en la indicación de ruta.
Importación de una recopilación de búsqueda
- Antes de importar los datos de la recopilación, debe crear el shell vacío para la recopilación de búsqueda. Puede crear el shell vacío creando una recopilación de búsqueda. Tiene que especificar sólo el campo de entrada de datos obligatorio Ubicación de la recopilación. No añada documentos ni orígenes de contenido, puesto que esto lo hace la importación.
- En la lista de recopilaciones de búsqueda, localice la recopilación de búsqueda a la que desee importar los datos de la recopilación de búsqueda.
- Pulse el icono Importar o exportar, situado junto a la recopilación de búsqueda en la lista. Gestionar búsqueda muestra el panel Importar y exportar recopilación de búsqueda.
- En el campo de entrada Especificar ubicación (vía de acceso completa con extensión XML):, escriba la vía de acceso completa del directorio y el nombre del archivo XML de los datos de la recopilación de búsqueda, que desee importar a la recopilación de búsqueda seleccionada.
- Pulse Importar para importar los datos completos de la recopilación de búsqueda del archivo XML especificado a la recopilación de búsqueda seleccionada.
- Para volver al panel anterior sin importar una recopilación de búsqueda, pulse el enlace adecuado en la indicación de ruta.
- Si lo desea, ahora puede añadir documentos y orígenes de contenido a la recopilación de búsqueda.
- Importe los datos de la recopilación sólo en una recopilación vacía. No importe datos de recopilación en una recopilación de destino que contenga orígenes de contenido o documentos.
- Cuando importa datos de la recopilación a una recopilación, todos los valores se sobrescriben por los valores que probablemente haya importado. Por ejemplo, se sobrescribe el valor de idioma o se añade un resumidor, si se ha especificado para la recopilación de búsqueda importada.
- Cuando importe una recopilación, un proceso en segundo plano recupera, rastrea e indexa todos los documentos listados por URL en el archivo anteriormente exportado. Este proceso es asíncrono y es posible que pase un tiempo considerable hasta que los documentos estén disponibles.
- Al importar una recopilación que contiene un origen de contenido del sitio del portal
creado en una versión anterior, debe realizar las acciones siguientes:
- Volver a recopilar el contenido suprimiendo el origen de contenido existente
- Crear un origen de contenido del sitio
- Iniciar un rastreo
Renovación de los datos de la recopilación
Supresión de una recopilación de búsqueda
Gestión de los orígenes de contenido de una recopilación de búsqueda
Para trabajar con los orígenes de contenido de una recopilación de búsqueda, pulse el nombre de la recopilación en la lista de recopilaciones de búsqueda. Gestionar búsqueda lista los Orígenes de contenido y la Información de estado de la recopilación de búsqueda de la recopilación de búsqueda seleccionada. Una recopilación de búsqueda se puede configurar para cubrir más de un origen de contenido.
- Pulse Renovar para renovar la información de estado. Mientras está en ejecución un rastreo en el origen de contenido, esta opción actualiza la información sobre el tiempo de ejecución y los documentos recopilados hasta el momento.
- Ver la información de estado del origen de contenido:
- Documentos
- Número de documentos del origen de contenido. Si pulsa Renovar durante un rastreo, esta acción mostrará cuántos documentos ha recuperado el rastreador hasta ese momento.
- Tiempo de ejecución
- El tiempo de ejecución de la última ejecución del rastreador en los orígenes de contenido. Si pulsa Renovar durante un rastreo, esta acción mostrará la cantidad de tiempo que ha utilizado el rastreador hasta ese momento.
- Última ejecución
- Fecha y hora en la que se ha iniciado la última ejecución que ha rastreado el origen de contenido.
- Próxima ejecución
- La fecha y hora de la próxima ejecución en la que se rastrea el origen de contenido, si se ha planificado.
- Estado
- El Estado del origen de contenido, es decir, si el origen de contenido está Inactivo o si un rastreo está En ejecución.
- Seleccione uno de los iconos para un origen de contenido específico y realice una
de las tareas siguientes:
- Ver planificadores de origen de contenido. Este icono sólo se muestra si ha definido rastreos planificados para este origen de contenido. Si pulsa este icono, el portlet enumera los rastreos planificados, así como la información siguiente:
- Fecha de inicio
- Hora de inicio
- Intervalo de periodicidad
- Próxima fecha de ejecución
- Próxima hora de ejecución
- Estado es una opción que se puede habilitar o inhabilitar.
- Iniciar rastreador. Pulse este icono para iniciar un rastreo en el origen de contenido. Esta acción actualiza el contenido
del origen de contenido con una nueva ejecución del rastreador.
Durante la ejecución, el icono cambia a Detener rastreador, que
puede pulsar para finalizar la ejecución. Para obtener más detalles, consulte Empezar a recopilar documentos de un origen de
contenido.
. Búsqueda de portal renueva distintos orígenes de contenido de la forma siguiente:
- Para orígenes de contenido del sitio web, los documentos que se han indexado anteriormente y que aún existen en el origen de contenido se actualizan. Los documentos que se han indexado anteriormente, pero ya no existen, se mantienen en la recopilación de búsqueda. Los documentos que son nuevos en el origen de contenido se indexan y añaden a la recopilación.
- Para los sitios de WebSphere Portal, el rastreo añade todas las páginas y portlets al origen de contenido. Suprime los portlets y las páginas estáticas del origen de contenido que se han eliminado del portal. El rastreo funciona de forma similar a la opción Volver a recopilar documentos del origen de contenido.
- Para los sitios de IBM Web Content Manager, la búsqueda del portal utiliza un método de rastreo incremental. Además del contenido añadido y actualizado, la lista de partida especifica explícitamente contenido suprimido. Por contra, al pulsar Volver a recopilar documentos del Origen de contenido, comienza un rastreo completo; no continúa desde la última sesión y, por lo tanto, no es incremental.
- Para orígenes de contenido creados con la opción del proveedor de la lista de partida, un rastreo en un sistema remoto que da soporte al rastreo incremental, como por ejemplo IBM Connections, se comporta como un rastreo en un sitio de Web Content Manager.
- Volver a recopilar documentos del origen de contenido. Esta opción suprime los documentos existentes del origen de contenido de los rastreos anteriores. A continuación, inicia un rastreo completo en el origen de contenido. Los documentos indexados anteriormente y que aún existen en el origen de contenido se actualizan. Los documentos indexados anteriormente, pero que ya no existen en el origen de contenido, se eliminan de la recopilación. Los documentos que son nuevos en el origen de contenido se indexan y añaden a la recopilación.
- Notas:
- Se recomienda definir un ID de usuario de rastreador dedicado. La búsqueda del sitio de portal predeterminada preconfigurada utiliza el ID de usuario de administrador predeterminado wpsadmin con la contraseña predeterminada de ese ID de usuario para el rastreador. Si ha cambiado el ID de usuario de administrador predeterminado durante la instalación de portal, el rastreador utiliza el ID de usuario predeterminado. Si ha modificado el ID de usuario o la contraseña para el ID de usuario de administración y aún desea utilizarlo para el rastreador de la búsqueda de
portal, debe adaptar los valores.
Para definir un ID de usuario de rastreador, seleccione el separador Seguridad y actualice el ID de usuario y la contraseña. Pulse Guardar.
- Si modifica un origen de contenido que pertenece al ámbito de búsqueda, actualice manualmente el ámbito para asegurarse de que este aún cubre ese origen de contenido. Especialmente, si ha cambiado el nombre del origen de contenido, edite el ámbito y asegúrese de que todavía aparece en él. Si no es así, vuélvalo a añadir.
- Si suprime un origen de contenido, los documentos recopilados seguirán estando disponibles para que los usuarios realicen búsquedas en todos los ámbitos. Todos los ámbitos incluían el origen del contenido antes de suprimirlo. Estos documentos estarán disponibles hasta que llegue la caducidad. En Parámetros generales, puede especificar esta caducidad desde el menú Los enlaces caducan después de (días):.
- Se recomienda definir un ID de usuario de rastreador dedicado. La búsqueda del sitio de portal predeterminada preconfigurada utiliza el ID de usuario de administrador predeterminado wpsadmin con la contraseña predeterminada de ese ID de usuario para el rastreador. Si ha cambiado el ID de usuario de administrador predeterminado durante la instalación de portal, el rastreador utiliza el ID de usuario predeterminado. Si ha modificado el ID de usuario o la contraseña para el ID de usuario de administración y aún desea utilizarlo para el rastreador de la búsqueda de
portal, debe adaptar los valores.
- Ver planificadores de origen de contenido. Este icono sólo se muestra si ha definido rastreos planificados para este origen de contenido. Si pulsa este icono, el portlet enumera los rastreos planificados, así como la información siguiente:
Nuevo origen de contenido
Cuando cree un origen de contenido nuevo para una recopilación de búsqueda, se rastreará el origen de contenido y se rellenará la recopilación de búsqueda se rellenará con documentos de dicho origen de contenido. Puede determinar dónde se realiza el rastreo del índice y qué información recupera. Seleccione opciones del menú Tipo de origen de contenido. Los campos de entrada y parámetros que puede especificar son los siguientes:
- Sitio web
- Seleccione esta opción para todos los sitios remotos, que incluye sitios web y los sitios de portal remotos. Sólo se pueden indexar las páginas anónimas y se pueden buscar en los sitios de portal remotos.
- Proveedor de lista de partida
- Seleccione esta opción si el rastreador utiliza una lista de semillas como origen de contenido para la recopilación.
- Sitio del portal
- Seleccione esta opción si el origen de contenido es el sitio del portal local.
- Sitio de WCM (contenido web gestionado)
- Para que un origen de contenido de este tipo esté disponible en la Búsqueda del portal, lo debe crear en el portlet Creación de Web Content Manager. Debe seleccionar la opción adecuada para que esté disponible para realizar búsquedas y especificar la recopilación de búsqueda a la que pertenece. Al terminar de crear el sitio de contenido web gestionado, éste se lista entre los orígenes de contenido para la recopilación de búsqueda que ha especificado.
- Seleccione los separadores para configurar diversos tipos de parámetros del origen de contenido:
Establecimiento de los parámetros generales de un origen de contenido
- Escriba el URL de web o URL de portal necesarios en el campo obligatorio Recopilar documentos enlazados desde este URL. Esta acción determina el URL raíz desde el que se iniciará el rastreador.
Para orígenes de contenido del portal, el valor de este
campo lo rellena Gestionar búsqueda.Notas:
- Para sitios web, debe especificar el nombre completo, incluido http://. Por ejemplo: http://www.cnn.com. Si se escribe sólo www.cnn.com, se producirá un error.
- Un error de rastreo puede ser debido a problemas de redirección de URL. Si se produce este problema, intente editar este campo, por ejemplo, cambiando el URL por el URL de redirección.
- Realice la selección entre las opciones siguientes de las listas. Las opciones y los campos disponibles difieren, en función del tipo de origen de contenido seleccionado.
- Niveles de enlaces que deben seguirse:
- Para rastrear sitios web: esta opción determina la profundidad del rastreo, que es el número máximo de niveles de enlaces anidados que el rastreador sigue desde el URL raíz.
- Número de documentos enlazados que se recopilarán:
- Para rastrear sitios web: esta opción determina el número máximo de documentos que indexará el rastreador durante cada sesión. El número de documentos indexados incluye los documentos que se vuelven a indexar ya que su contenido se ha modificado.
- Detener recopilación después de (min):
- Esta opción establece el número máximo de minutos que el rastreador puede ejecutarse en una sola sesión para sitios web.Nota: El tiempo de espera funciona como un límite de tiempo aproximado. Puede superarse en algo de porcentaje.
- Detener la recuperación de un documento después de (s):
- Esta opción indica el tiempo que el rastreador pasa intentando captar un documento. Esta opción establece el límite de tiempo máximo en segundos para completar la fase inicial de la conexión HTTP, es decir, para recibir las cabeceras HTTP. Este límite de tiempo debe ser finito ya que se utiliza para evitar que el rastreador se atasque infinitamente en una conexión errónea. Sin embargo, permite que el rastreador recupere grandes archivos, como archivos comprimidos, que necesitan más tiempo para ser recuperados.
Establecimiento de los parámetros avanzados para un origen de contenido
- Número de procesos paralelos:
- Este parámetro determina el número de hebras que utiliza el rastreador en una sesión.
- Codificación de caracteres predeterminada:
- Este parámetro establece el conjunto de caracteres predeterminado que el rastreador utiliza si no puede determinar el conjunto de caracteres de un documento. Nota: El campo de entrada para la codificación de caracteres predeterminada contiene el valor predeterminado inicial windows-1252, independientemente del valor para el Idioma predeterminado del portal en . Especifique la codificación de caracteres predeterminada, en función del idioma del portal. De lo contrario, es posible que los documentos se visualicen incorrectamente en Examinar documentos.
- Utilizar siempre la codificación de caracteres predeterminada:
- Si activa esta opción, el rastreador siempre utilizará el juego de caracteres predeterminados, sin tener en cuenta el juego de caracteres del documento. Si no activa esta opción, el rastreador intentará determinar los juegos de caracteres de los documentos.
- Obedecer al archivo Robots.txt
- Si selecciona esta opción, el rastreador observa las restricciones especificadas en el archivo robots.txt cuando accede a los URL de los documentos. Esta opción solo está disponible para el tipo de origen de contenido de sitio web, y no el sitio del portal o el proveedor de lista de partida.
- Servidor proxy:
- Si deja este valor de servidor proxy HTTP vacío, el rastreador no utilizará un servidor proxy.
- Puerto:
- Si deja este valor de puerto vacío, el rastreador no utilizará un servidor proxy.
Configuración del planificador
- Definir planificación
- Añada una nueva planificación desde este recuadro.
- Actualizaciones planificadas
- Este recuadro muestra cuándo se realizarán los rastreos planificados.
Configuración de los filtros
Los filtros del rastreador controlan el progreso del rastreador y el tipo de documentos que se indexan y catalogan. Para configurar filtros, pulse el separador Filtros. Puede definir nuevos filtros en el recuadro Definir reglas de filtro. Los filtros definidos se listan en el recuadro Filtrado de reglas.
- Filtros de URL
- Estos filtros controlan los documentos que se rastrean e indexan basándose en el URL en que se han encontrado los documentos.
- Filtros de tipos
- Estos filtros controlan los documentos que se rastrean e indexan basándose en el tipo de documento.
Si no define ningún filtro, se recuperarán y se rastrearán todos los documentos del origen de contenido. Si pulsa filtros de inclusión, solo se rastrearán e indexarán aquellos documentos que pasen los filtros. Si pulsa filtros de exclusión, estos sustituirán los filtros incluidos. Si no define filtros incluidos, limitarán el número de documentos que se rastrean e indexan. Más específicamente, si un documento pasa uno de los filtros incluidos, pero también pasa uno de los filtros excluidos, no se rastreará, indexará ni catalogará.
- Creación de un filtro
- Al utilizar la opción Aplicar regla al: recopilar documentos con Tipo de regla: Incluir, asegúrese de que el URL del campo Recopilar documentos enlazados desde este URL: se ajusta a la regla especificada; de lo contrario, no se recopilarán documentos. Por ejemplo, el rastreo del URL http://www.ibm.com/products con el filtro de URL */products/* no proporciona ningún resultado, ya que la regla tiene una barra inclinada final, pero el URL no. Sin embargo, funcionan tanto el rastreo http://www.ibm.com/products/ con el filtro de URL */products/* (ambos con barra invertida final) como el rastreo http://www.ibm.com/products con el filtro de URL */products* (sin barra invertida final) funciona.
Configuración de la seguridad de un origen de contenido
- Definir dominio de seguridad
- Este recuadro se utiliza para añadir nuevos orígenes de contenido protegidos.
- Dominios de seguridad
- Este recuadro muestra una lista de los dominios de seguridad existentes.
- Nombre de usuario
- Especifique el ID de usuario con el que el rastreador puede acceder al origen de contenido o repositorio protegido.
- Contraseña
- Especifique la contraseña para el ID de usuario que haya indicado en Nombre de usuario.
- Nombre de host
- Especifique el nombre del servidor. Para los sitios del portal y los proveedores de la lista de partida, esta entrada no es necesaria. Si lo deja en blanco, el nombre de host se infiere a partir del URL raíz proporcionado.
- Dominio
- Especifique el dominio del repositorio u origen de contenido protegido.
Empezar a recopilar documentos de un origen de contenido
- Pulse Iniciar rastreador para el origen de contenido para el que desea iniciar la ejecución del rastreador. El rastreador
recupera los documentos del origen de contenido seleccionado. Si son nuevos o están
modificados, se actualizarán en la recopilación de búsqueda. Durante la ejecución de un rastreador, el icono cambia a Detener
rastreador, que puede pulsar para detener el rastreador. Búsqueda de portal renueva distintos orígenes de contenido de la forma siguiente:
- Para orígenes de contenido del sitio web, los documentos que se han indexado anteriormente y que aún existen en el origen de contenido se actualizan. Los documentos que se han indexado anteriormente, pero ya no existen, se mantienen en la recopilación de búsqueda. Los documentos que son nuevos en el origen de contenido se indexan y añaden a la recopilación.
- Para los sitios de WebSphere Portal, el rastreo añade todas las páginas y portlets al origen de contenido. Suprime los portlets y las páginas estáticas del origen de contenido que se han eliminado del portal. El rastreo funciona de forma similar a la opción Volver a recopilar documentos del origen de contenido.
- Para los sitios de IBM Web Content Manager, la búsqueda del portal utiliza un método de rastreo incremental. Además del contenido añadido y actualizado, la lista de partida especifica explícitamente contenido suprimido. Por contra, al pulsar Volver a recopilar documentos del Origen de contenido, comienza un rastreo completo; no continúa desde la última sesión y, por lo tanto, no es incremental.
- Para orígenes de contenido creados con la opción del proveedor de la lista de partida, un rastreo en un sistema remoto que da soporte al rastreo incremental, como por ejemplo IBM Connections, se comporta como un rastreo en un sitio de Web Content Manager.
- Para ver la información de estado actualizada sobre el progreso del proceso de rastreo, pulse
Renovar. Se actualiza la información de estado siguiente:
- Documentos
- Muestra el número de documentos que el rastreador ha recuperado hasta el momento desde el origen de contenido seleccionado.
- Tiempo de ejecución
- Muestra la cantidad de tiempo que el rastreador ha utilizado hasta el momento para rastrear el origen de contenido.
- Estado
- Muestra si el rastreador del origen de contenido está en ejecución o desocupado.
Verificación de la dirección de un origen de contenido
Para verificar la dirección URL de un origen de contenido, localice el origen de contenido y pulse el icono Verificar dirección.
Si el origen de contenido web está disponible y no bloqueado por un archivo robots.txt, Gestionar búsqueda devuelve el mensaje El origen de contenido es correcto. Si el origen de contenido no es válido, no se puede acceder a él o está bloqueado, Gestionar búsqueda devuelve un mensaje de error.
Al crear un nuevo origen de contenido, Gestionar búsqueda comienza la característica Verificar dirección.
Ámbitos de búsqueda y enlaces personalizados
- Una o varias ubicaciones de búsqueda, u orígenes de contenido.
- Funciones o características del documento, como el tipo de documento.
- Todos los orígenes
- Este ámbito incluye documentos con todas las funciones de todos los orígenes de contenido de la búsqueda.
- Contenido web gestionado
- Este ámbito restringe la búsqueda a sitios que ha creado Web Content Manager.
Puede añadir sus propios ámbitos de búsqueda personalizados y un icono para cada ámbito. Los iconos se sitúan en la lista de ámbitos.
También puede añadir enlaces personalizados nuevos a las ubicaciones de búsqueda. Este enlace personalizado incluye enlaces a ubicaciones web externas, como por ejemplo Google o Yahoo. La búsqueda global del Centro de búsqueda lista los enlaces personalizados del menú de selección de opciones de búsqueda.
Gestión de ámbitos de búsqueda y enlaces personalizados
- Nuevo ámbito
- Pulse esta opción para creare un nuevo ámbito de búsqueda. Para obtener detalles, consulte Creación de un nuevo ámbito de búsqueda.
- Renovar
- Pulse esta opción para renovar la información para los ámbitos, por ejemplo, el estado de los ámbitos o las actualizaciones que otro administrador haya realizado en los ámbitos.
- Flechas Mover abajo y Mover arriba
- Pulse estas flechas para desplazar los ámbitos de búsqueda hacia arriba y hacia abajo en la lista. Esta acción determina la secuencia en la que se listan los ámbitos en el menú desde el que los usuarios seleccionan opciones de búsqueda para búsquedas con el portlet Centro de búsqueda.
- Editar ámbito de búsqueda
- Pulse este icono para trabajar con un ámbito de búsqueda o modificarlo. Para obtener detalles, consulte Edición de un ámbito de búsqueda.
- Suprimir ámbito de búsqueda
- Pulse este icono para suprimir un ámbito de búsqueda.
- Nuevo enlace personalizado
- Pulse esta opción para añadir un nuevo enlace personalizado. Para obtener detalles, consulte Adición de un enlace personalizado nuevo.
- Editar enlace personalizado
- Pulse este icono para trabajar con un enlace personalizado o modificarlo.
- Suprimir enlace personalizado
- Pulse este icono para suprimir un enlace personalizado.
Creación de un ámbito de búsqueda
- Nombre de ámbito
- Un campo obligatorio en el que se especifica un nombre para el nuevo ámbito de búsqueda. Este nombre debe ser exclusivo en el portal actual o el portal virtual.
- Descripción
- Un campo opcional en el que se describe el ámbito.
- URL de icono personalizado:
- Especifique la ubicación del URL donde el portal puede localizar el icono de ámbito que desea que se visualice con las opciones de búsqueda. Si el archivo de icono existe en el directorio de iconos predeterminado wps/images/icons, sólo es necesario que escriba el nombre de archivo del icono. Si el archivo del icono está en otra vía de acceso de directorio, escriba la vía de acceso absoluta del archivo con el nombre de archivo. Pulse Comprobar vía de acceso del icono para asegurarse de que el icono está disponible en el URL que especificó.
- Estado:
- Establezca el estado del ámbito de búsqueda según proceda. Para que el ámbito esté disponible para los usuarios, establezca el estado en Activo.
- Visible para usuarios anónimos:
- Seleccione Sí para que el ámbito de búsqueda esté disponible para los usuarios que utilizan el portal sin iniciar una sesión. Seleccione No para que el ámbito esté disponible únicamente para los usuarios autenticados.
- Texto de consulta (opcional):
- Especifique un texto de consulta que se añade de modo invisible a todas las búsquedas de este ámbito. Las búsquedas devuelven resultados que coinciden con la búsqueda del usuario y el texto de consulta que ha indicado en este campo. Ambos conjuntos de resultados están sopesados con la misma relevancia en la lista de resultados. El texto de consulta que especifique debe cumplir las reglas sintácticas para entrar una consulta en el centro de búsqueda. Para obtener más información sobre estas reglas sintácticas de consulta, consulte la ayuda del portlet de Centro de búsqueda.
- Seleccionar ubicaciones
- Seleccione la ubicación según sea necesario. Si los usuarios seleccionan este ámbito para la búsqueda, sólo se buscan los documentos de estas ubicaciones de búsqueda u orígenes de contenido. Nota: El árbol de ubicaciones también muestra orígenes de contenido que se han suprimido, si aún contienen documentos en la recopilación. Una vez que un origen de contenido suprimido no contenga documentos, el daemon de limpieza lo elimina del árbol de ubicaciones.
Si desea establecer nombres y descripciones para el ámbito de búsqueda, debe crear y guardar el ámbito en primer lugar. A continuación, ubique el ámbito en la lista de ámbitos y edítelo pulsando el icono Editar. La opción de establecer nombres y descripciones en otros entornos locales sólo está disponible en la página Editar ámbito de búsqueda.
Adición de un enlace personalizado
- Estado:
- Establezca el estado del enlace personalizado según sea necesario. Para que el enlace esté disponible para los usuarios, establezca el estado en activo.
- Nombre de enlace personalizado:
- Un campo obligatorio en el que se especifica un nombre para el nuevo enlace personalizado. Este nombre debe ser exclusivo en el portal actual o el portal virtual.
- URL de enlace:
- Entre el URL del motor de búsqueda web de destino para el nuevo enlace personalizado. Este campo es obligatorio.
Utilice el formato correcto para el URL, puesto que las consultas de usuario se añaden al URL. Para la
sintaxis de interfaz web correcta, consulte la documentación de ayuda del motor de búsqueda
de destino. En algunos casos, la sintaxis de la interfaz web se puede determinar del modo siguiente:
- Realice una búsqueda con algo de texto de búsqueda característico en el motor de búsqueda de destino, por ejemplo, un nombre poco común.
- Revise el campo URL del navegador y localice la serie de búsqueda. Es posible que la parte del URL que precede a la serie de búsqueda sea el URL de enlace para el motor de búsqueda de destino.
- Si la serie de búsqueda no se encuentra al final del URL, puede resultarle útil editar el URL y probar diferentes versiones con una serie de búsqueda añadida.
Los ejemplos siguientes muestran la sintaxis de la interfaz web:- Para Google: http://www.google.com/search?&q=
- Para Yahoo!: http://search.yahoo.com/search?p=
- URL de icono personalizado:
- Entre la ubicación del URL donde el portal puede localizar el icono que desea que se muestre con el nuevo enlace personalizado. Pulse Comprobar vía de acceso del icono para asegurarse de que el icono está disponible en el URL que especificó.
Para establecer nombres y descripciones para el enlace personalizado, debe crear y guardar el enlace en primer lugar. A continuación, busque el enlace personalizado en la lista y edítelo pulsando el icono Editar. La opción de establecer nombres y descripciones en otros entornos locales sólo está disponible en la página Editar enlace personalizado.