domingo, 21 de septiembre de 2014

Buscadores

Buscadores


¿Que son?

Cuando necesitamos de Internet, normalmente buscamos información sobre un tema concreto, y es difícil acceder a una página que la contenga, simplemente pinchando vínculos. Como solución a este problema surgieron los buscadores. Un buscador es una página web en la que se ofrece consultar una base de datos en la cual se relacionan direcciones de páginas web con su contenido. No es un programa 


¿Como se utilizan?

Su forma de utilización es muy sencilla, basta con introducir una o más palabras clave en una casilla y el buscador generará una lista de páginas web que se supone guardan relación con el tema solicitado.
Aunque el modo de utilización es muy fácil a nivel básico, los buscadores permiten opciones avanzadas para refinar la búsqueda, cuyo resultado puede ser en muchas ocasiones de miles de páginas. Mediante estas opciones avanzadas se puede acotar la búsqueda y obtener un número de páginas más manejable. 


   Debido al gran tamaño de Internet y a su naturaleza cambiante, ningún buscador posee registro de todas las páginas que se encuentran en la red. Por ello es aconsejable visitar más de un buscador para contrastar los resultados y en ningún caso pensar que si una página no aparece en un buscador, es que no existe. 


Funcionamiento básico de los buscadores:

   Los buscadores poseen enormes bases de datos que contienen información referente a páginas web. Estas bases de datos se generan por las altas de usuarios que han creado sus páginas web (esto equivaldría a poner tus datos en un listín telefónico). En muchos buscadores, si el creador de la página no se da de alta en el buscador, la página no aparecerá. Para las empresas es muy importante promocionar sus páginas en los buscadores para que la gente las encuentra fácilmente.

Otros buscadores, no contentos con ello, poseen programas específicos que rastrean la red 24 horas al día, todos los días. Estos programas procesan una gran cantidad de información y extraen palabras clave que puedan servir para identificar la temática de la página web. Debido a que esta acción se realiza por programas y no por personas, la temática de una página web puede confundirse y aparecer por ejemplo un enlace a la marca de Jeans "Pepe Pardo" cuando estemos realizando una búsqueda sobre el Oso pardo. 

Origen


El origen de los buscadores se remonta a abril de 1994, año en el que David Filo y Jerry Yang decidieron crear una página web en la que se ofreciera un directorio de páginas interesantes clasificadas por temas, pensando siempre en las necesidades de información que podrían tener sus compañeros de estudios. Había nacido Yahoo!. El éxito de esta página fue tan grande que una empresa decidió comprarla y convertirla en el portal que hoy conocemos. Además del buscador, hoy Yahoo! ofrece muchos más servicios.



 Tipos de buscadores

Existen varios tipos de buscadores, en función del modo de construcción y acceso a la base de datos, pero todos ellos tienen en común que permiten una consulta en la que el buscador nos devuelve una lista de direcciones de páginas web relacionadas con el tema consultado.
    Los buscadores se pueden clasificar en tres tipos, según la forma de obtener las direcciones que almacenan en su base de datos. Cada tipo de buscador tiene sus propias características. Conocerlas puede ayudarnos a decidir cuál utilizar en función de las necesidades de nuestra búsqueda. No obstante, hoy en día todos los buscadores tienden a ofrecer el mayor número de servicios posible, con lo que sus ofertas de búsqueda se asemejan cada vez más, siendo difícil adivinar de qué tipo de buscador estamos hablando.

 Índices de búsqueda


        Es el primer tipo de buscador que surgió. En los índices de búsqueda, la base de datos con direcciones la construye un equipo humano. Es decir, un grupo de personas va rastreando la red en busca de páginas. Vistas éstas son clasificadas por categorías ó temas y subcategorías en función de su contenido. De este modo, la base de datos de un índice de búsqueda contiene una lista de categorías y subcategorías relacionadas con un conjunto de direcciones de páginas web que tratan esos temas.
   La consulta de un índice se realiza, pues, a través de categorías. Por ejemplo, si buscamos información sobre el Museo del Prado deberemos seleccionar sobre una secuencia de categorías y subcategorías como la siguiente: Arte / museos / pinacotecas y seguro que dentro de ésa última subcategoría hay algún enlace que hace referencia al museo del Prado.
        El primer índice de búsqueda que apareció fue Yahoo!

Motores de búsqueda



        Temporalmente, los motores de búsqueda son posteriores a los índices. El concepto es diferente: en este caso, el rastreo de la web lo hace un programa, llamado araña ó motor (de ahí viene el nombre del tipo de buscador). Este programa va visitando las páginas y, a la vez, creando una base de datos en la que relaciona la dirección de la página con las 100 primeras palabras que aparecen en ella. Como era de esperar, el acceso a esta base de datos se hace por palabras clave: la página del buscador me ofrece un espacio para que yo escriba la ó las palabras relacionadas con el tema que me interesa, y como resultado me devuelve directamente un listado de páginas que contienen esas palabras clave. Por ejemplo, si utilizo un motor de búsqueda para localizar información sobre el Museo del Prado, simplemente tendré que escribir "Museo del Prado" en el espacio de búsqueda y pinchar en el botón Buscar. A continuación se me devolverá otra página con los resultados de la búsqueda: un listado con enlaces a las páginas solicitadas.
La base de datos de un motor siempre es más amplia que la de un índice, ya que su método de rastreo (automatizado por una araña) le permite más incorporaciones a la base que unmétodo manual.La mayor ventaja de utilizar un motor de búsqueda es la rapidez e inmediatez, pero una gran desventaja radica en que puede resultar difícil encontrar lo que se busca si no se domina el lenguaje de interrogación a su base de datos. Si no se sabe buscar, el internauta puede encontrarse con una gran cantidad de enlaces que no le interesen (lo que se denomina “ruido”) o, por el contrario, con que no le devuelvan ningún enlace (“silencio”). Pero si se conoce mínimamente el sistema de búsqueda  los buscadores suelen contar con alguna página de información o ayuda sobre cómo se deben realizar las búsquedas- los buscadores suelen ser una solución muy potente. Para las búsquedas precisas, los motores tienen su propio lenguaje de interrogación y suelen permitir acotar las búsquedas utilizando interfaces sencillas de búsqueda que permiten la introducción de texto en alguna de estas variantes: 
Todas las palabras:   esto permite recuperar los resultados que contengan todas las palabras que se introducen en la caja de interrogación. Por ejemplo, buscando "hipertexto documento historia" mediante Todas las Palabras, se localizarán los resultados que incluyan todos los términos, aunque estén separados: hipertexto y documento e historia. 
Alguna de las palabras: permite recuperar los resultados que contienen una de las palabras. Por ejemplo, la interrogación: "documento digital virtual" devolvería los resultados que contuvieran alguna  estas tres palabras:documento o digital o virtual. 
La frase exacta: es la más adecuada para búsqueda por nombres propios y expresiones que deben ser buscadas en el especificado. Para introducirla se suelen utilizar comillas. Por ejemplo, la consulta: "historia del hipertexto" localizaría los documentos que contuvieran dicha frase. 
La búsqueda booleana: se trata de un tipo de interrogación que incluye alguno de los operadores lógicos. aunque existen otros muchos como AltaVista, Go.com (Infoseek), Gigablast, Exalead, etc.
 Muchos motores cuentan con versiones en español, además de en inglés.
Por su parte, la ventaja de utilizar un índice está en que resulta muy fácil encontrar la información deseada si ésta se encuentra en su base de datos. Se puede hacer descendiendo a través de sus árboles temáticos, introduciéndose en las diferentes subcategorías hasta dar con lo que se necesita, o introduciendo las palabras clave  adecuadas en el espacio que ofrecen para ello, tanto en la página principal como en las diferentes categorías. El inconveniente radica en que no siempre están todo lo actualizados que sería de desear y en que no contienen toda la información que sí pueden ofrecer los motores de búsqueda. Los ejemplos más clásicos de índices temáticos son nuevamente los de Yahoo, Altavista o Google, ya que estos tres buscadores cuentan con índices temáticos, además de sus muy usados motores de búsqueda.

Metabuscadores


    Los metabuscadores son páginas web en las que se nos ofrece una búsqueda sin que 
haya una base de datos propia detrás: utilizan las bases de varios buscadores ajenos para 
ofrecernos los resultados. Un ejemplo de metabuscador es Metacrawler.

Depende del tipo de datos que se le pide, cual de los buscadores nos conviene utilizar Si estamos buscando información sobre un tema genérico, por ejemplo, sobre antropología en Aragón, sería mejor usar un índice de búsqueda, ya que el contenido de las páginas que me ofrezca va a estar muy relacionado con la categoría, es decir, con el tema de la búsqueda. Si el motivo de la búsqueda es más concreto, por ejemplo, un autor ó un título de una obra, el motor de búsqueda va a resultar más eficaz, ya que su base de datos es más amplia.    


No todas las páginas que se me indiquen tratarán el tema buscado En un índice sí. En un motor no, ya que al realizar la búsqueda por palabras clave podemos encontrar páginas que, aunque contengan las palabras indicadas, traten de temas muy diferentes al trabajado. Por ejemplo, si en un motor introducimos la palabra Zeus tratando de obtener información sobre el dios griego, es posible que nos salga también la página de un local de fiestas con ese nombre. No obstante, los motores ofrecen técnicas para afinar las búsquedas y eliminar, en lo posible, este tipo de resultados. Es lo que se conoce como búsquedas avanzadas.

Buscadores especializados

Hay que tener en cuenta que además de los buscadores generalistas, existen una serie de buscadores que se han especializado en un campo o área concreta de conocimiento y así, encontramos buscadores que se refieren al mundo del cine, los libros, las bibliotecas, la música, los medios de comunicación o las noticias, buscadores de personas y empresas que imitan las tradicionales páginas blancas o amarillas impresas, etc; como también podemos encontrar numerosos buscadores temáticos referidos a cualquier campo del conocimiento: documentación, universidad, arte y literatura, ciencias puras o ciencias aplicadas, informática, ecología, tecnología, educación y formación, legislación, política, administración, trabajo, cultura, etc.
Por otro lado, también existen buscadores que se centran bien en una morfología concreta (imagen, audio, vídeo y otros recursos audiovisuales como radio y televisión), bien en determinados formatos como blogs, noticias o listas de distribución, etc. o  focalizan las búsquedas a determinados ámbitos como pueden ser las revistas científicas, como hace el buscador Scopus que permite navegar por toda la Web científica. Una lista exhaustiva de este tipo de buscadores especializados se muestra en esta tesis en el apartado: Principales buscadores/especializados, aunque los buscadores generalistas también permiten acotar las búsquedas limitándose a una morfología o formato concretos. Por ejemplo, Google cuenta con búsquedas especializadas para Imágenes, Grupos (listas de distribución), Noticias, Blogs, Google Scholar (que muestra artículos, revistas especializadas, tesis, tesinas, etc.), Libros, etc. y Yahoo hace lo propio con búsquedas acotadas por Imágenes, Vídeos, Noticias, Páginas Amarillas, Compras, Podcats, etc.

Diferencia

La diferencia entre los distintos tipos de buscadores En la forma de construir la base de datos y en su estructura. No olvidemos que, en el caso de un índice, la base de datos relaciona temas con direcciones, mientras que un motor relaciona palabras clave  aunque  con cualquier buscador puedo realizar una búsqueda indistintamente por palabras clave 


Descubrimiento de recursosRepresentación del contenidoRepresentación de la consultaPresentación de los resultados
Directorios o indices de búsqueda Lo realizan las personasClasificación manual Implícita (navegación por categorías)Páginas creadas antes de la consulta.Poco exhaustivos, muy precisos.
Motores de búsquedaPrincipalmente de forma automática por medio de robots Indización automáticaExplícita (palabras clave, operadores, etc.)Páginas creadas dinámicamente en cada consulta.Muy exhaustivos, poco precisos


Multibuscadores

Los multibuscadores se limitan a colocar en una página web una lista con los buscadores más comunes y  con una ventana de texto para poder enviar la cadena de búsqueda introducida por el usuario a cada uno de ellos. También pueden enviar la cadena de búsqueda a una serie de motores de búsqueda e índices temáticos previamente definidos. Una vez realizada la consulta a los buscadores prefijados, el multibuscador devolverá la información de todos los enlaces encontrados. Con la utilización de multibuscadores, el usuario se evita tener que ir de buscador en buscador hasta encontrar la información deseada. El usuario elige los buscadores que quiere utilizar y desde allí realiza su consulta que ofrecerá las respuestas buscador por buscador. La única ventaja es la posibilidad de consultar un gran número de buscadores partiendo de una única página. La exhaustividad primará sobre la precisión, ya que el usuario encontrará un gran número de enlaces y muchas páginas repetidas. Un buen ejemplo de multibuscador es el ofrecido por CyberJournalist.

Metabuscadores

Los metabuscadores también permiten buscar en varios buscadores al mismo tiempo. Los metabuscadores no almacenan las descripciones de páginas en sus bases de datos, sino que contienen los registros de los motores de búsqueda y la información sobre ellos, adecuando su expresión a los diferentes motores para remitir la consulta a los motores. Una vez que reciben la respuesta, la remiten al usuario no directamente, sino tras realizar un filtrado de los resultados. Este filtrado consiste en eliminar y depurar los enlaces repetidos y en ordenar los enlaces. Además, sólo aparecerá un número limitado de enlaces, los que se consideren más importantes. Los más repetidos ocuparán los primeros puestos ya que el metabuscador considerará que son los más relevantes por estar dados de alta en mayor número de buscadores. Se trata de herramientas muy útiles, el único problema es que, por lo general, no permiten realizar búsquedas tan avanzadas como en un motor de búsqueda, con lo que las consultas tienen que ser generales y no se puede buscar en profundidad
Biwe Biwe: Busca simultáneamente en los principales buscadores. 
BuscaMultiple Buscamultiple
Dogpile Dogpile: Busca simultánea o separadamente en Google, Yahoo, MSN y Ask Jeeves. 
ixquick ixquick:  Busca simultáneamente en los motores de búsqueda más comunes: Google, AltaVista, Yahoo, Ask Jeeves, OpenDirectory,MSN, etc.
Info.com Info.com: Busca separada o simultáneamente en Google, Yahoo, MSN Ask Jeeves.  
Mamma Mamma: Busca simultáneamente en varios buscadores. 
Metacrawler Metacrawler: Busca simultáneamente en Google, AltaVista, WebCrawler, Lycos, Yahoo, Looksmart, MSN, etc. 
Monster Crawler Monster Crawler: Busca simultáneamente en Yahoo, MSN, AltaVista, FastSearch y OpenDirectory. 
StartingPoint
 StartingPoint: Busca simultáneamente en Ask Jeeves, Excite, Google,  Looksmart, Lycos, MSN, Yahoo y Northern Light.

No hay comentarios.:

Publicar un comentario