¿Encuentras muchos datos en Real Estate, pero dudas de su calidad?
Porque más no siempre es igual a mejor, sobre todo cuando hablamos de datos.
Nos encontramos en una era donde una de sus principales características, a nivel tecnológico, es la cantidad de datos que se disponen a lo largo y ancho de las diferentes industrias. Gracias a la multiplicidad de dispositivos interconectados, las facilidades para crear y difundir contenido, las cada vez más bajas barreras de entrada para insertarse en determinados sectores o industrias, entre otros muchos otros factores, impulsan una colosal cantidad de datos a las que hoy tenemos acceso.
El sector de bienes raíces no es la excepción a la regla, cada día vemos más y más portales dedicados a difundir información, no solo de las viviendas, terrenos, oficinas u otros tipos de inmuebles, sino también información relevante sobre el área o entorno en donde se encuentra dicha propiedad.
Podríamos estar hablando de un momento ideal para la industria en cuanto a la disponibilidad de datos que ayudan a mejorar la toma de decisiones, pero la realidad se aleja un poco de este ideal. Muchos de los Marketplaces u otras fuentes de información no poseen sistema de verificación y validación de los datos que allí se cargan.
La consecuencia
“Confusión” es posiblemente la palabra que mejor resume el estado actual entre los diferentes actores del sector. Dicho estado, generado a partir de la duplicidad de datos (mismos inmuebles, publicado varias veces en el mismo sitio y entre diferentes sitios, con características diferentes) puede generar:
- La conducción a inversiones poco rentables o perdidas financieras significativas.
- Un aumento de la complejidad en los procesos de due diligence, aumentando el tiempo y los costos asociados con las transacciones
- Generación de una representación distorsionada del mercado, llevando a políticas y decisiones de desarrollo ineficaces
A continuación, se presentan 3 factores que contribuyen al avance de los problemáticas descriptas con anterioridad:
Distorsión de métricas: Indiciadores claves, que se utilizan para dar soporte una acción determinada, resultan poco confiables, ya que los datos que se utilizaron para confeccionarlos se alejan de una media estadística por una mala carga por parte del usuario, proceden de fuentes duplicadas o existe la omisión de ciertas características.
Dificultad para conocer las características reales del inmueble: Sea que estés en la búsqueda de un terreno o inmueble para vivir o realizar una inversión, es conocida la dificultad para determinar, a través de los diferentes portales, cuáles son las características reales del mismo, como ser su superficie, amenidades, ubicación o incluso si aún sigue disponible.
Incremento en el uso de “fuentes tradicionales” o contacto directo para capturar información: Al verse envueltos en este situación de incertidumbre sobre los datos que se exhiben en algunos de los sitios web específicos de la industria, muchos actores están retomando su captura de información hacía fuentes más tradicionales. Se han aumentado los esfuerzos para establecer un contacto directo con el propietario o representante del inmueble, en búsqueda de contar con las herramientas e información necesaria para sus procesos de negocios.
¿Cómo abordamos esta problemática en Algorym?
Siendo una plataforma donde buscamos proveer de información y herramientas útiles para la toma de decisiones a los agentes del sector inmobiliario, como así a aquellos de sectores vinculados a este, encontramos de suma importancia que cada dato que conforma las herramientas, métricas y análisis, que ponemos a disposición de los usuarios, pase por un muy exigente proceso de limpieza y validación.
A continuación, te contamos el paso a paso que llevamos a cabo:
- Eliminación de registros sin latitud y longitud Es un factor clave la latitud y longitud de un inmueble, nos permite realizar asignaciones de variables y características del entorno vinculadas a su ubicación, considerar factores que influyen directamente en su potencialidad y valuación y establecer un primer punto de control sobre sus características propias. Este tipo de registro es descartado luego de que su latitud y longitud no pueda ser determinada a través de diferentes mecanismos que empleamos.
- Validación de registros por strings: Luego de una amplia tarea de investigación y análisis se estableció un procedimiento que nos permite detectar palabras en los registros que, en la mayoría de los casos, nos permite identificar que el inmueble analizado se trata realmente de otro tipo de inmueble que el declarado en la operación en cuestión.
- Eliminación de registros con valores atípicos en sus características Todos aquellos registros que muestren un número inusual, como por ejemplo un departamento con miles y miles de m2 construidos, casas con números de habitación exorbitantes o incluso sin habitaciones detallada, son rápidamente identificados y descartados de la muestra.
- Validación de coordenadas con respecto a la zona declarada. En muchas ocasiones encontramos inmuebles con determinadas coordenadas que no coinciden con la zona donde se declara el inmueble y viceversa. Luego de realizar el cruzamiento de datos geoespaciales y determinar que no hay coincidencia, estos registros son descartados.
- Eliminación de registros duplicados entre diferentes fuentes de datos Como es de común conocimiento, podemos encontrar los mismos inmuebles en diferentes sitios, lo cual no sería un problema per se, pero en más de un 90% de los casos se declaran características, desde su precio, m2 construidos, n° de habitaciones, etc. diferentes.
- Eliminación de registros con valores atípicos en métricas calculadas Luego de un meticuloso proceso de limpieza y validación de datos llegamos al ultimo punto de control, el cual se realiza a través de la detección outliers sobre métricas que desarrollamos a partir de la información previa.
¿Te ha afectado alguna vez en la toma de decisiones la poca calidad de los datos que te brindan los diferentes Marketplace? ¿Qué otros inconvenientes encuentras en tu proceso de toma de decisiones?
Algorym se encuentra desarrollando constantemente nuevas funcionalidades y servicios para facilitar tu trabajo. Si te gustaría conocer más, suscribirte a nuestro newsletter y entérate de las novedades del sector Real Estate en México.