<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	>
<channel>
	<title>Comentarios en: Buscador para la wikipedia (jugando con sphinx)</title>
	<atom:link href="http://www.compuglobalhipermega.net/motores-busqueda/buscador-wikipedia/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.compuglobalhipermega.net/motores-busqueda/buscador-wikipedia/</link>
	<description>descarga internet en un CD</description>
	<pubDate>Thu, 24 Jul 2008 00:01:18 +0000</pubDate>
	<generator>http://wordpress.org/?v=2.5.1</generator>
		<item>
		<title>Por: jmrrva</title>
		<link>http://www.compuglobalhipermega.net/motores-busqueda/buscador-wikipedia/#comment-22</link>
		<dc:creator>jmrrva</dc:creator>
		<pubDate>Sun, 13 May 2007 08:09:03 +0000</pubDate>
		<guid isPermaLink="false">http://www.compuglobalhipermega.net/motores-busqueda/buscador-wikipedia/#comment-22</guid>
		<description>Hola, las bases de datos del BOE estan con ese indexador (http://www.boe.es/g/es/iberlex/). El stemmer o lematizador que usa swish-e es snowball (http://snowball.tartarus.org/). Si quieres mas detalles enviame un email al webmaster del boe y te cuento. 

Un saludo
Jose</description>
		<content:encoded><![CDATA[<p>Hola, las bases de datos del BOE estan con ese indexador (http://www.boe.es/g/es/iberlex/). El stemmer o lematizador que usa swish-e es snowball (http://snowball.tartarus.org/). Si quieres mas detalles enviame un email al webmaster del boe y te cuento. </p>
<p>Un saludo<br />
Jose</p>
]]></content:encoded>
	</item>
	<item>
		<title>Por: CompuGlobalHiperMegaNet</title>
		<link>http://www.compuglobalhipermega.net/motores-busqueda/buscador-wikipedia/#comment-18</link>
		<dc:creator>CompuGlobalHiperMegaNet</dc:creator>
		<pubDate>Sat, 12 May 2007 21:38:57 +0000</pubDate>
		<guid isPermaLink="false">http://www.compuglobalhipermega.net/motores-busqueda/buscador-wikipedia/#comment-18</guid>
		<description>jmrrva: aunque de momento me concentro en el tema base de datos (mysql y posgre), prometo echarle un ojo y si es posible compararlo con xmlpipe de sphinx. ¿Existe algun ejemplo del uso a gran nivel de ese indexer? ¿Permite stemming?  


Muchas gracias por vuestros comentarios</description>
		<content:encoded><![CDATA[<p>jmrrva: aunque de momento me concentro en el tema base de datos (mysql y posgre), prometo echarle un ojo y si es posible compararlo con xmlpipe de sphinx. ¿Existe algun ejemplo del uso a gran nivel de ese indexer? ¿Permite stemming?  </p>
<p>Muchas gracias por vuestros comentarios</p>
]]></content:encoded>
	</item>
	<item>
		<title>Por: Moises</title>
		<link>http://www.compuglobalhipermega.net/motores-busqueda/buscador-wikipedia/#comment-17</link>
		<dc:creator>Moises</dc:creator>
		<pubDate>Sat, 12 May 2007 21:12:16 +0000</pubDate>
		<guid isPermaLink="false">http://www.compuglobalhipermega.net/motores-busqueda/buscador-wikipedia/#comment-17</guid>
		<description>Excelente trabajo!</description>
		<content:encoded><![CDATA[<p>Excelente trabajo!</p>
]]></content:encoded>
	</item>
	<item>
		<title>Por: jmrrva</title>
		<link>http://www.compuglobalhipermega.net/motores-busqueda/buscador-wikipedia/#comment-15</link>
		<dc:creator>jmrrva</dc:creator>
		<pubDate>Sat, 12 May 2007 21:05:42 +0000</pubDate>
		<guid isPermaLink="false">http://www.compuglobalhipermega.net/motores-busqueda/buscador-wikipedia/#comment-15</guid>
		<description>Has probado swish-e? Esta en http://www.swish-e.org. Yo lo uso para indexar cientos de miles de documentos XML no precisamente pequeños. Los documetos XML se generan "on the fly" al indexar</description>
		<content:encoded><![CDATA[<p>Has probado swish-e? Esta en <a href="http://www.swish-e.org" rel="nofollow">http://www.swish-e.org</a>. Yo lo uso para indexar cientos de miles de documentos XML no precisamente pequeños. Los documetos XML se generan &#8220;on the fly&#8221; al indexar</p>
]]></content:encoded>
	</item>
	<item>
		<title>Por: CompuGlobalHiperMegaNet</title>
		<link>http://www.compuglobalhipermega.net/motores-busqueda/buscador-wikipedia/#comment-14</link>
		<dc:creator>CompuGlobalHiperMegaNet</dc:creator>
		<pubDate>Sat, 12 May 2007 18:55:36 +0000</pubDate>
		<guid isPermaLink="false">http://www.compuglobalhipermega.net/motores-busqueda/buscador-wikipedia/#comment-14</guid>
		<description>Hola Ceska, como bien supones la manera de trabajar con sphinx (e imagino que con otros indexers funcionará parecido) es que se mantiene un índice que lleva una correspondencia entre la clave primaria a devolver en la consulta y el texto indizado (aparte de datos de agrupacion y fecha pero creo que incluso eso lo guarda en ficheros separados ).

Asi que, una consulta de un buscador (hecho con sphinx) siempre acaba consistiendo en: una query a sphinx y otra a base de datos (si una puedes usar una cache pues mejor y te ahorras la segunda, sino pues no hay más narices). 

Aparte de los ids, devuelve más información como: número de resultados encontrados y matches de cada uno.

No cambia mucho el script php de query a sphinx del que puse en el ejemplo del RFC pero lo añado de todas formas por si a alguien le es útil.

Un saludo</description>
		<content:encoded><![CDATA[<p>Hola Ceska, como bien supones la manera de trabajar con sphinx (e imagino que con otros indexers funcionará parecido) es que se mantiene un índice que lleva una correspondencia entre la clave primaria a devolver en la consulta y el texto indizado (aparte de datos de agrupacion y fecha pero creo que incluso eso lo guarda en ficheros separados ).</p>
<p>Asi que, una consulta de un buscador (hecho con sphinx) siempre acaba consistiendo en: una query a sphinx y otra a base de datos (si una puedes usar una cache pues mejor y te ahorras la segunda, sino pues no hay más narices). </p>
<p>Aparte de los ids, devuelve más información como: número de resultados encontrados y matches de cada uno.</p>
<p>No cambia mucho el script php de query a sphinx del que puse en el ejemplo del RFC pero lo añado de todas formas por si a alguien le es útil.</p>
<p>Un saludo</p>
]]></content:encoded>
	</item>
	<item>
		<title>Por: Ceska</title>
		<link>http://www.compuglobalhipermega.net/motores-busqueda/buscador-wikipedia/#comment-13</link>
		<dc:creator>Ceska</dc:creator>
		<pubDate>Sat, 12 May 2007 10:07:13 +0000</pubDate>
		<guid isPermaLink="false">http://www.compuglobalhipermega.net/motores-busqueda/buscador-wikipedia/#comment-13</guid>
		<description>Muy interesante!
Sólo me queda una duda. Con Sphinx recuperas los page_id que hacen maching, y luego, ¿Como recuperas los datos de esos id\'s? Realizas una consulta Mysql normal para extraer el contenido (título, contenido, etc) a partir de los id\'s que te devuelve Sphinx?  

Por las pruebas que he realizado, creo que el propio Sphinx no retorna esos datos...

Estaría muy bueno que añadieras el script php que interactua con la API de Sphinx (el de la búsqueda)

Un trabajo excelente!</description>
		<content:encoded><![CDATA[<p>Muy interesante!<br />
Sólo me queda una duda. Con Sphinx recuperas los page_id que hacen maching, y luego, ¿Como recuperas los datos de esos id\&#8217;s? Realizas una consulta Mysql normal para extraer el contenido (título, contenido, etc) a partir de los id\&#8217;s que te devuelve Sphinx?  </p>
<p>Por las pruebas que he realizado, creo que el propio Sphinx no retorna esos datos&#8230;</p>
<p>Estaría muy bueno que añadieras el script php que interactua con la API de Sphinx (el de la búsqueda)</p>
<p>Un trabajo excelente!</p>
]]></content:encoded>
	</item>
</channel>
</rss>

<!-- Dynamic Page Served (once) in 1.032 seconds -->
