|
--- |
|
language: |
|
- pt |
|
library_name: sklearn |
|
model_format: pickle |
|
model_file: model.pkl |
|
datasets: |
|
- fetch_california_housing |
|
pipeline_tag: tabular-regression |
|
tags: |
|
- Regressão |
|
- Califórnia |
|
- sklearn |
|
--- |
|
|
|
## Descrição do modelo: |
|
|
|
Este é um modelo de regressão linear treinado no conjunto de dados de habitação da Califórnia. O modelo foi treinado para prever o valor mediano das casas em um determinado bairro na Califórnia com base em várias características do bairro, como a renda média, a idade média da casa, o número médio de quartos, o número médio de ocupantes por casa, a latitude e a longitude. |
|
|
|
O modelo foi avaliado usando várias métricas de erro, incluindo o Erro Quadrático Médio (MSE), o Erro Absoluto Médio (MAE) e o Coeficiente de Determinação (R^2). Além disso, a validação cruzada foi usada para obter uma estimativa mais robusta do desempenho do modelo. |
|
|
|
Os coeficientes do modelo fornecem uma indicação da importância relativa de cada característica na previsão do valor mediano das casas. Por exemplo, um coeficiente positivo para a renda média sugere que bairros com maior renda média tendem a ter casas mais caras, enquanto um coeficiente negativo para a latitude sugere que bairros mais ao norte tendem a ter casas menos caras. |
|
|
|
Este modelo é um exemplo de um modelo de aprendizado de máquina simples e interpretable que pode ser usado como um ponto de partida para tarefas de previsão mais complexas. |
|
|
|
## Métricas de avaliação: |
|
|
|
Erro Quadrático Médio: 0.5558915986952441 |
|
|
|
Erro Absoluto Médio: 0.5332001304956565 |
|
|
|
Coeficiente de Determinação (R^2): 0.575787706032451 |
|
|
|
Erro Quadrático Médio Médio da Validação Cruzada: 0.5582901717686553 |
|
|
|
MedInc 0.852382 |
|
|
|
HouseAge 0.122382 |
|
|
|
AveRooms -0.305116 |
|
|
|
AveBedrms 0.371132 |
|
|
|
Population -0.002298 |
|
|
|
AveOccup -0.036624 |
|
|
|
Latitude -0.896635 |
|
|
|
Longitude -0.868927 |
|
|
|
# Análise dos resultados: |
|
|
|
Erro Quadrático Médio (MSE): O MSE é uma medida comum de erro de previsão que penaliza grandes erros mais do que pequenos erros. Seu valor é 0.5558915986952441, o que significa que, em média, as previsões do seu modelo estão cerca de 0.56 unidades distantes do valor real. |
|
|
|
Erro Absoluto Médio (MAE): O MAE é outra medida de erro de previsão que é menos sensível a grandes erros do que o MSE. Seu valor é 0.5332001304956565, o que significa que, em média, as previsões do seu modelo estão cerca de 0.53 unidades distantes do valor real. |
|
|
|
Coeficiente de Determinação (R^2): O R^2 é uma medida de quão bem as previsões do seu modelo se ajustam aos dados reais. Seu valor é 0.575787706032451, o que significa que seu modelo explica cerca de 57.6% da variância na variável alvo. |
|
|
|
Erro Quadrático Médio Médio da Validação Cruzada: Este é o MSE médio calculado através da validação cruzada. Seu valor é 0.5582901717686553, o que é ligeiramente maior do que o MSE calculado no conjunto de teste. Isso sugere que seu modelo pode estar um pouco sobreajustado aos dados de treinamento. |
|
|
|
Coeficientes do Modelo: Os coeficientes do modelo de regressão linear representam a relação entre as características (ou variáveis independentes) e a variável alvo. Por exemplo, um coeficiente de 0.852382 para ‘MedInc’ sugere que um aumento de uma unidade em ‘MedInc’ está associado a um aumento de 0.852382 na variável alvo. Isso sugere que a renda média é um forte preditor positivo da variável alvo. Da mesma forma, um coeficiente de -0.305116 para ‘AveRooms’ sugere que um aumento de uma unidade em ‘AveRooms’ está associado a uma diminuição de 0.305116 na variável alvo, indicando uma relação negativa. |
|
|