viernes, enero 12, 2007
qué dice google de ti?
Hoy pase por Sushiknights, y me encontré un post que hablaba sobre el Personal Google Hits (Peghi), que es el número de Hits que google entrega cuando pones tu nombre, y que la gente lo usa tanto para 'mirarse el ombligo' como dice Tama (no en vano, también le llaman EGO-ogle), como también para hacerse una opinión de otras personas, saber en qué estan, en qué estuvieron, y cuál es su vision sobre la vida.
Mirando eso, se me ocurrió hacer una query que fuera lo más exacta posible en referenciar páginas asociadas a mi (y no a otros Rodrigo Meza que anden por el mundo!), asi es que empezé a descartar documentos poniendo exclusion de términos que evidentemente no estuvieran asociados a mí. Lamentablemente Google solo permite 32 términos en su búsqueda, asi es que la mía finalmente mostró 122 resultados. La query que usé fue la siguiente:
"rodrigo meza" -biphome -rediex -padresok -formosadeportiva -colima -chavez -greengates -diputado -golf -afa -umayor -duoc -korn -i8 -echevarria -sxd -agronomia -"dr rodrigo" -"radiogrupo" -"eteamz" -"médico rodrigo" -"luis rodrigo" -"portaldearte" -"guerrero" -"morote" -"ureña" -polanco
Mirando esto, es directa la idea de armar armar una query mínima que muestre exactamente el conjunto de páginas que retorna google sobre tí. Dejo la idea lanzada para que quien tenga más tiempo o ganas que yo, la implemente (antes :-) ). Para armar la query mínima, se me imagina lo siguiente:
Finalmente, es posible que la 'impresion que das al mundo' pueda estar más clara en la query mínima, en vez de las páginas mismas. En mi caso, está claro que el golf no me gusta, que no soy médico ni padre, etc.
Mirando eso, se me ocurrió hacer una query que fuera lo más exacta posible en referenciar páginas asociadas a mi (y no a otros Rodrigo Meza que anden por el mundo!), asi es que empezé a descartar documentos poniendo exclusion de términos que evidentemente no estuvieran asociados a mí. Lamentablemente Google solo permite 32 términos en su búsqueda, asi es que la mía finalmente mostró 122 resultados. La query que usé fue la siguiente:
"rodrigo meza" -biphome -rediex -padresok -formosadeportiva -colima -chavez -greengates -diputado -golf -afa -umayor -duoc -korn -i8 -echevarria -sxd -agronomia -"dr rodrigo" -"radiogrupo" -"eteamz" -"médico rodrigo" -"luis rodrigo" -"portaldearte" -"guerrero" -"morote" -"ureña" -polanco
Mirando esto, es directa la idea de armar armar una query mínima que muestre exactamente el conjunto de páginas que retorna google sobre tí. Dejo la idea lanzada para que quien tenga más tiempo o ganas que yo, la implemente (antes :-) ). Para armar la query mínima, se me imagina lo siguiente:
- definir todos los términos por los cuales podrías estar indexado en google (en mi caso "rodrigo meza", "rho" "rmeza")
- hacer una interfaz que muestre secuencialmente todos los resultados de google, y agregar una barra que permita al usuario indicar si la página habla efectivamente de él o no.
- cuando una página sea marcada como no relevante, se guarda una lista asociada al documento, de todas las palabras que aparecen en dicho documento y que no aparecen en otros documentos que sí son relevantes.
- cuando se encuentra un nuevo documento, se modifican las listas de palabras asociadas, de forma que las palabras que aparecen en varios documentos no relevantes también se asocian con los nuevos documentos.
- a medida que se muestran documentos, mostrar aquellos documentos más probables de ser relevantes, es decir, cuyo índice de palabras relevantes sea mayor que el indice de palabras que tambien aparecen en documentos no relevantes.
Finalmente, es posible que la 'impresion que das al mundo' pueda estar más clara en la query mínima, en vez de las páginas mismas. En mi caso, está claro que el golf no me gusta, que no soy médico ni padre, etc.
Etiquetas: algoritmos, google, search engines