Bueno, en esos dias en los que no tienes nada que hacer y encuentras un tool interesante, navegando y leyendo por ahi me encontre con un componente desarrollado por Microsoft Research en donde llevan toda la funcionalidad del Fuzzy Lookup de SQL Server Integration Services directamente a Excel.
Para descargarlo pueden ir a:
http://www.microsoft.com/download/en/details.aspx?id=15011
Ahora bien, la instalacion es supremamente simple, lo descomprimen y lanzan el archivo setup.exe, no es necesario tener Excel cerrado, ya que despues de la instalacion y al abrir excel, este lanza una ventana en donde pregunta si queremos instalar el Fuzzy lookup en nuestro excel, al final tendremos un nuevo menu en nuestro excel.
La utilizacion del componente es igualmente sencilla, simplemente damos clic en la pestaña y abrimos las opciones del mismo, estas se reducen a 1 opcion.
Damos clic en esta opcion y ya podremos trabajar con el componente, al dar clic alli se abre un menu al mejor estilo Smart Documents.
El componente esta en su primer version, aun no podemos hacer cosas como hacer lookup entre 2 libros distintos o contra una base de datos de forma nativa, sin embargo hay trucos para esto como una conexion de datos y demas.
Tampoco podemos hacerlo contra un segmento de datos, debe hacerse contra tablas directamente, para crear una tabla en excel y no complicarnos tanto la vida, simplemente llenen los datos en una hoja de datos normal y luego le aplican un formato de tabla, de esa manera lo pueden hacer de forma rapida y simple.
Yo cree rapidamente una tabla con 4 ciudades de Colombia
Ahora cree una tabla con las mismas ciudades pero con errores tipograficos y ortograficos.
Ahora simplemente lo que debemos hacer es seleccionar nuestras tablas, el orden si importa, normalmente vemos que a la izquierda va la tabla fuente o la tabla maestra, a la derecha normalmente va la tabla que se analizara, sin embargo este componente funciona al contrario, a la izquierda (Left) debemos seleccionar la tabla que contiene los datos que se analizaran, a la derecha debe ir la tabla maestra.
Ahora simplemente damos clic en Go.
Al dar clic el componente genera nuevas columnas en donde se devuelve la similitud con el dato de la siguiente manera
Esta similitud esta dada en porcentaje, asi que el numero mas cercano a 1 es el mas exacto.
Con esto pueden hacer luego un Vlookup y reemplazar los datos “Sucios” por los datos buenos.
Si tienen alguna duda dejenmelo saber a traves de los comentarios.
John