Search This Blog

Monday, March 12, 2012

SSIS Fuzzy Lookup Add-in for Excel (From Microsoft Research)

 

Bueno, en esos dias en los que no tienes nada que hacer y encuentras un tool interesante, navegando y leyendo por ahi me encontre con un componente desarrollado por Microsoft Research en donde llevan toda la funcionalidad del Fuzzy Lookup de SQL Server Integration Services directamente a Excel.

Para descargarlo pueden ir a:

http://www.microsoft.com/download/en/details.aspx?id=15011

Ahora bien, la instalacion es supremamente simple, lo descomprimen y lanzan el archivo setup.exe, no es necesario tener Excel cerrado, ya que despues de la instalacion y al abrir excel, este lanza una ventana en donde pregunta si queremos instalar el Fuzzy lookup en nuestro excel, al final tendremos un nuevo menu en nuestro excel.

image

La utilizacion del componente es igualmente sencilla, simplemente damos clic en la pestaƱa y abrimos las opciones del mismo, estas se reducen a 1 opcion.

image

Damos clic en esta opcion y ya podremos trabajar con el componente, al dar clic alli se abre un menu al mejor estilo Smart Documents.

image

El componente esta en su primer version, aun no podemos hacer cosas como hacer lookup entre 2 libros distintos o contra una base de datos de forma nativa, sin embargo hay trucos para esto como una conexion de datos y demas.

Tampoco podemos hacerlo contra un segmento de datos, debe hacerse contra tablas directamente, para crear una tabla en excel y no complicarnos tanto la vida, simplemente llenen los datos en una hoja de datos normal y luego le aplican un formato de tabla, de esa manera lo pueden hacer de forma rapida y simple.

Yo cree rapidamente una tabla con 4 ciudades de Colombia

 

image

Ahora cree una tabla con las mismas ciudades pero con errores tipograficos y ortograficos.

image

Ahora simplemente lo que debemos hacer es seleccionar nuestras tablas, el orden si importa, normalmente vemos que a la izquierda va la tabla fuente o la tabla maestra, a la derecha normalmente va la tabla que se analizara, sin embargo este componente funciona al contrario, a la izquierda (Left) debemos seleccionar la tabla que contiene los datos que se analizaran, a la derecha debe ir la tabla maestra.

image

Ahora simplemente damos clic en Go.

Al dar clic el componente genera nuevas columnas en donde se devuelve la similitud con el dato de la siguiente manera

image

Esta similitud esta dada en porcentaje, asi que el numero mas cercano a 1 es el mas exacto.

Con esto pueden hacer luego un Vlookup y reemplazar los datos “Sucios” por los datos buenos.

Si tienen alguna duda dejenmelo saber a traves de los comentarios.

John

LinkWithin

Related Posts Plugin for WordPress, Blogger...