Inteligencia Computacional (Ene-May 2009): Web Crawler + Applicacion Web

Un web crawler es un programa que navega de manera automática y sistemática por las páginas web, con el fin mostrar una relación entre palabras y URLs.

Descripción detallada del medio ambiente.

El Internet es un sistema global de redes interconectadas que intercambian datos.

El ambiente en particular son lás páginas web escritas en (x)HTML y que utilizan el protocolo HTTP para transferir datos de una computadora llamada Servidor a otra llamada cliente.

Plataforma en la que se programara el medio ambiente y lenguaje de programación a ser utilizado.

Utilizaremos Python para hacer los prototipos del Web Crawler debido a que es un lenguaje que permite representar de manera sencilla los algoritmos además de contar con un gran numero de librerías y herramientas que facilitan la programación, como lo son avanzados profilers y debuggers.

Para la aplicación tenemos pensado utilizar LAMP (Linux, Apache, MySQL y P*) para hacer la aplicación que presentara los resultados y hará las búsquedas en las bases de datos.
¿Cuáles problemas de optimización se encuentran en dicho medio?

Maximizar la rapidez de la búsqueda de resultados de acuerdo a los criterios establecidos por el usuario. Así como minimizar el número de resultados no útiles presentados.
¿Qué conocimiento con incertidumbre necesita ser representado?

No sabe realmente a dónde se dirigen los links ni sabe si los links funcionan o seguirán funcionando en el futuro. Además de que no se puede saber si el Web Crawler se quedará ciclado en una cierta zona de la web.

Inteligencia Computacional (Ene-May 2009)

Friday, January 30, 2009

Web Crawler + Applicacion Web

No comments:

Post a Comment

Labels

Followers

Blog Archive

Contributors