Join us!
Forgot your password?
aarkerio 1459
vedrisha 268
asarch 249
vendaval 232
saidjose 118
pakal 85
Almsx 74
dmesg 70
tonathiu 63
blacksoul 60

Ubuntu: Linux fácil
Ubuntu: Linux fácil
No se pierde nada cuando uno se deshace de sus defectos.
Sophia Bedford
Blogger: thot


GNU/Linux
GNU/Linux
Instalar Ht://Dig
Warning (512): Method GagsHelper::googleAds does not exist [CORE/Cake/View/Helper.php, line 165]

Este artículo ha sido consultado en 1,083 ocasiones.

Reproducido con la autorización de: www.softwarelibremorelos.gob.mx

ht://Dig

Manual básico de Instalación y Configuración


Este sencillo manual nos ayuda a hacer una instalación configuración básica y personalizada de ht://dig, cabe mencionar que todo lo aquí explicado es con referencia a nuestro sistema, nosotros tenemos instalado Debian Woody, pero debe de funcionar igual para otros sistemas, para una mejor referencia visita la página de ht://dig, cualquier duda, aclaración, contribución, o comentario es bien recibido a cualquiera de estas direcciones: fgonzalez@correo.insp.mx, fjcarlos@correo.insp.mx, oalvirde@correo.insp.mx, esperamos les sea de utlidad.

    Se baja el archivo de la versión que vayamos a utilizar de www.htdig.org en este caso, la versión que se utilizó fue la: 3.1.6.

    Se descomprimen los archivos utilizando tar -zxvf htdig-3.1.6.tar.gz, en nuestro caso: /usr/src/tar -zxvf htdig-3.1.6.tar.gz

    En el directorio donde se descomprimieron los archivos se corre el script: ./configure, en nuestro caso: /usr/src/htdig-3.1.6/./configure

    Una vez corrido el script, se edita el archivo /usr/src/htdig-3.1.6/CONFIG, en el cual básicamente esta la ruta de donde va a estar el buscador: los archivos principales, las bases de datos, los archivos de configuración, el CGI, las imágenes que se van o se quieran utilizar, etcétera.

    EDITANDO EL ARCHIVO CONFIG

      La primer variable con la que nos vamos a encontrar es: prefix= , que es básicamente el directorio raíz donde queremos la instalación del htdig (nosotros utilizamos por ejemplo: prefix=/usr/local/htdig )

      exec_prefix= ${prefix}, indica el directorio raíz donde vamos a poner los programas instalados por htdig.

      BIND_DIR= ${exec_prefix}/bin, aquí le decimos en que directorio dejar los binarios ejecutables.

      CONFIG_DIR= ${prefix}/conf, en este directorio estarán los archivos de configuración de htdig.

      COMMON_DIR= ${prefix}/common, en este directorio quedan los archivos que van a utilizar las diferentes bases de datos, por ejemplo los archivos: header.html, footer.html, nomatch.html, que son los archivos que va a leer el cgi, para el encabezado, el pie y cuando no hay matchs, dichos archivos los podemos modificar a nuestras necesidades.

      DATABASE_DIR= /var/htdig/db, directorio donde queremos que queden las bases de datos, las bases de datos son de las palabras que se pueden encontrar en la búsqueda y los links a donde están.

      DEFAULT_CONFIG_FILE= ${CONFIG_DIR}/htdig.conf, aquí definimos como queremos que se llame el archivo de configuración para el htdig.

      CGIBIN_DIR= /var/www/cgi-bin, directorio donde tenemos nuestros cgis, o donde queremos que quede el cgi del htdig, tenemos que tener en cuenta que debemos modificar el archivo de configuración del apache en caso de que no lo tengamos configurado para correr cgis o el directorio que le indicamos aquí no tenga permiso para correr cgis.

      IMAGE_DIR= /var/www/html/images/htdig, directorio donde queremos que queden las imagenes que trae y utiliza por default htdig.

      IMAGE_URL_PREFIX= /images/htdig, prefijo de URL que queremos que escriba en los archivos header.html y footer.hml de donde buscar las imágenes.

      SEARCH_DIR= /var/www/html, directorio donde básicamente tenemos nuestro sitio en el que queremos buscar, este directorio determina en donde va a buscar htdig.

      SEARCH_FORM= search.html, aquí le indicamos como queremos que se llame la forma con la que queremos buscar, por default se llama search.html, que es la forma que manda llamar al cgi, nosotros por ejemplo metimos nuestra forma de buscado en un frame, pero se puede utilizar como se guste, solo es buena idea darle una checada a dicha forma para ver los parámetros con los que podemos buscar.

    Una vez terminado de editar el archivo CONFIG, estamos listos para ejecutar: make, seguido por make install, para terminar la instalación.

    Editamos el archivo de configuración de htdig, que en nuestro caso quedó en: usr/local/htdig/conf/htdig.conf

    EDITANDO EL ARCHIVO htdig.conf

    Este archivo puede ser muy extenso, con muchas variables configurables, la lista total de variables la podemos encontrar en http://www.htdig.org/confindex.html, sin embargo, aquí mostramos básicamente las más importantes para un buen funcionamiento y solo a las que se les modificó algo.

    Empezamos con la primer variable que trae el archivo por defautl:

    database_dir: /var/htdig/db, aquí le indicamos el directorio donde están las bases de datos.

    start_url: http://evaloportunidades.insp.mx/bus.php, en esta parte indicamos la dirección donde se desea que empiece a indexar, casi siempre será el index principal de nuestro sitio.

    limit_urls_to: http://evaloportunidades.insp.mx, con esta variable podemos limitar el alcance del indexador, por ejemplo nosotros lo pusimos solamente para nuestro sitio, esto quiere decir que si encuentra una liga a un sitio fuera del nuestro, no intenta indexarlo.

    search_algorithm: exact:1 synonyms:0.5 endings:0.1 accents:1, este es el tipo de algoritmo que va a utilizar el indexador, por default no trae el de accents, que es para acentos, nosotros se lo agregamos puesto nuestro sitio es en español de México.

    next_page_text: (código html), cuando la búsqueda arroje muchos resultados, se tendrá más de una página de resultados, en esta variable podemos poner código html de que queremos que muestre para pasar a la siguiente página, ya sean imágenes o texto.

    prev_page_text: (código html), es la misma situación que la variable anterior, solo que para la página anterior.

    page_number_text: (números o código html), en esta variable ponemos las imágenes, números o lo que deseemos que aparezca como links a las diferentes páginas de resultados, en nuestro caso pusimos solamente números.

    no_page_number_text: (números o código html), en esta variable ponemos las imágenes, números o lo que deseemos que aparezca en la página en la que estemos posicionados, en nuestro caso pusimos solamente números con un color un poco más fuerte.

    locale: es_MX, aquí configuramos el lenguaje que va a utilizar htdig, es importante que ese lenguaje lo tengamos instalado en nuestro sistema operativo.

    page_list_header: (texto o código html), texto para el encabezado de la lista de páginas de resultado, por default esta en ingles diciendo pages, nosotros lo cambiamos a español poniendo Páginas.

    Para una mejor referencia, anexamos nuestro archivo de configuración para que lo puedas revisar, dando click aquí

    Con todo configurado, estamos listos para correr rundig, el cual esta ubicado en nuestro caso en: /usr/local/htdig/bin/, este comando nos indexa, nos une las palabras con sus links y llena las bases de datos, podemos correrlo con la opción -v para verlo en modo verboso.

    Después de corremos htfuzzy, ubicado en nuestro caso en: /usr/local/htdig/bin/, el cual nos sirve para lógica difusa, nosotros lo utilizamos con la opción para acentos, htfuzzy -accents.

    Una vez creado las bases de datos, estamos listos para utilizar nuestro buscador, para más personalización podemos editar los archivos: header.html, footer.html y nomatch.html, ubicados en nuestro caso en el directorio: /usr/local/htdig/common/.

    Puedes revisar como quedó nuestro buscador, integrado al sitio: evaloportunidades.insp.mx, te podras dar cuenta que esta muy bien integrado a nuestro sitio, lo logramos modificando los archivos: header.html, footer.html y nomatch.html, con nuestros propios estilos, claro, sin dejar de darle el crédito al htdig, en la parte de tecnología utilizada


Última actualización: 2009-08-20 00:32:14-05

Printable version

blog comments powered by Disqus
Que estas haciendo?
humusanitohumusanito está:
Como Vimmer que soy ya olvidé lo (muy) poco que sabía de emacs
6 days, 1 hour ago

chilicuilchilicuil está:
administrador de sistemas junior libre xD
1 week, 4 days ago

chilicuilchilicuil está:
yup!, actualización del editor de la MN =)
2 weeks, 5 days ago

saidjosesaidjose está:
Escuchando la segunda sura del Islan
4 weeks ago

mandrakemandrake está:
Que pex banda
4 weeks, 1 day ago

asarchasarch está:
Eso lo tiene que hacer el admin (o usar un servidor externo)
4 weeks, 1 day ago

Que estuvimos haciendo >>

Quickvote

Esta año quiero:

IdUna nueva laptop
Una nueva tablet
Un nuevo cell
Una nueva vieja

Problemas de Lenguaje en niños
25913 lecturas
Anticoncepción de Emergencia
22206 lecturas
Sinapsis y exocitosis
15400 lecturas
Rompiendo cualquier clave WEP en unos pocos minutos
15253 lecturas
Sexualidad infantil y juvenil
14703 lecturas
Interrupción de Embarazo
12133 lecturas
Evolución filética en las hepáticas
10301 lecturas
Mi primer CakePHP, mmmmm cakeee
9878 lecturas
CakePHP II Active Record
7651 lecturas
Cómo hacer un Bonsai?
7493 lecturas
Go topEste trabajo está licenciado bajo la MonoNeurona Commons License. 2002-2012 © :: Colectivo de Programacion MonoNeurona.org ::
The Queen is here Mozilla Firefox The Best DataBase CakePHP Framework XHTML GNU Hacker Chipotle Software