Este post desarrollo un sistema de predicción de precios para vehículos, comenzando con motos y continuando en una segunda fase con coches. El proyecto se apoya en Azure Machine Learning para la construcción y entrenamiento de los modelos, y en SQL Server como fuente principal de datos.
El objetivo es entrenar modelos capaces de estimar el valor de un vehículo en base a sus características (marca, modelo, año, kilometraje, tipo de combustible, entre otras). Este tipo de predicción es útil para plataformas de compraventa, concesionarios y herramientas internas de evaluación.
Inicio
Primero se crea el servicio de Machine Learning con su grupo de recursos y las características básicas del servicio, una vez creada, abrimos el Machine Learning Studio para empezar a desarrollar nuestros modelos.
Carga de Datos
Dentro de Machine Learning Studio, podemos cargar nuestros propios datos para entrenar modelos, se pude desde archivos o enlaces directos, también existe la posibilidad de cargar datos desde una Base de Datos con Azure SQL DataBase.
En este proyecto haremos dos datastore para motos y coches, dentro del apartado Data, seleccionas Datastores y aquí realizas la conexión a tu base de datos.
Una vez creado, damos clic en Create data assets. en el apartado de consulta SQL, colocas la consulta correspondiente.
Motos:
Coches:
Una vez cargada la información en la sección Data de Machine Learning Studio, debe verse así:
Predicción de Precios: MOTOS.
Creamos la tarea para entrenar el modelo, seleccionando el datastore de motos que creamos antes.
Configuramos las tareas según nos muestra este laboratorio de Microsoft Learn: Explore Automated Machine Learning in azure Machine Learning
Métricas:
Ejemplos:
Predicción de Precios: COCHES.
Creamos la tarea para entrenar el modelo, seleccionando el datastore de coches que creamos antes.
Configuramos las tareas según nos muestra este laboratorio de Microsoft Learn: Explore Automated Machine Learning in azure Machine Learning
Métricas:
Ejemplos:
Implementación:
Ahora que tenemos un endpoint donde enviar información y que nos prediga los precios podemos hacer una implementación con un pequeño formulario para ver el rendimiento.
En este enlace podemos probar la calculadora de precios.
Modelo multietiqueta: COCHES.
Para este modelo usando el mismo datastore de coches vamos a intentar predecir otros parámetros, en este caso será la Marca, aunque se podría hacer con cualquier otra etiqueta que se quiera analizar.
Creamos un modelo de Classification para detectar la Marca de los coches.