Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

Algoritmo Random Forest, Resúmenes de Inteligencia Artificial

Analisis dela algoritmo Random Forest

Tipo: Resúmenes

2020/2021

Subido el 26/07/2021

victor-agusto-martin-manayay-chamay
victor-agusto-martin-manayay-chamay 🇵🇪

5

(1)

2 documentos

1 / 6

Toggle sidebar

Documentos relacionados


Vista previa parcial del texto

¡Descarga Algoritmo Random Forest y más Resúmenes en PDF de Inteligencia Artificial solo en Docsity! Chiclayo, abril del 2021 Informe sobre el Algoritmo Random Forest ALUMNO: Manayay Chamaya Victor Agusto Martin DOCENTE: Ing. Juan Villegas Cubas CURSO: Inteligencia Artificial ALGORITMO RANDOM FOREST (BOSQUES ALEATORIOS) 1. Un poco de historia: El primer algoritmo para bosques de decisión aleatoria fue creado en 1995 por Tin Kam Ho utilizando el método subespacial aleatorio. Una extensión del algoritmo fue desarrollada por Leo Breiman y Adele Cutler, quienes registraron "Random Forests" como marca comercial en 2006 para el software Minitab. 2. ¿Cómo funciona? Los bosques aleatorios usan la idea de árboles de decisión para construir sistemas de regresión o clasificación ensamblando arboles de decisión. Un árbol de decisión permite establecer una serie de textos condicionales que nos llevan a una salida a partir de las características de entrada. Sin embargo, los arboles de decisión tienen algunas desventajas fundamentales, por una parte, pueden producir sesgos en los modelos esto quiere decir que tienen dificultad en representar bien la función objetivo que representa los datos, además otra desventaja es que suelen presentar alta varianza, es decir cambios en dataset en el proceso de entrenamiento pueden producir cambios sustanciales en el modelo En la entrada (dataset) tenemos N (número de muestras) y Nx (características) y también varios árboles de decisión en el ensamble. En el bosque aleatorio se busca dividir ese dataset en secciones que se distribuyen en los arboles de decisión es decir cada árbol tendrá un subset de datos con dimensiones menores al dataset original, para cada uno de estos árboles de decisión se establecerá un modelo que se construirá a partir de cada uno de sus subset y cada modelo tendrá también asociado una varianza. Por cada valor de entrada los modelos producirán un resultado de clasificación o de regresión, si es en clasificación da un resultado categórico y si es de regresión un numero continuo. La manera de decidir cuál será el resultado total del ensamble será la regla de mayoría para los sistemas de clasificación y si se trabaja con modelos de regresión se aplicarán promedio de los valores. y = data.Survived + División 75% de datos para entrenamiento, 25% de daeatos para test X_train, X_test, y_ train, y test = train_test_split(X, y,random_state=9) SS De oiEtO es Bosques ALSO (y OoPIgaraRs el número de estimadores (árboles de decisión)) BA_model = RandomForestClassifier(n_estimators = 19, random_state = 2016, min_samples_leaf = 8,) Entrenamiento Accuracy promedio (Usando datos de Test) BA_model RandomFor]| + Accuracy promedio BA _model.score(X_test, y test) 0.3248314696741573 me amp 7 AMP min_weight_fraction_leaf=8.0, n_estimators=19, Matriz de Confusión from mlxtend.plotting import plot_confusion matrix from sklearn.metrics import confusion_matrix * Predicción del modelo usando Los datos de prueba y_pred = BA_model .predict(X_test) matriz = confusion matrix(y test,y_pred) plot_confusion_matrix(conf mat=matriz, figsize=(5,6), show_normed=False) plt.tight_layout() true label predicted label Referencias: + Ho, Tin Kam (1995). Random Decision Forests (PDF). Proceedings of the 3rd International Conference on Document Analysis and Recognition, Montreal, QC, 14-16 August 1995. pp. 278-282. Archived from the original (PDF) on 17 April 2016. Retrieved 5 June 2016. » https: //github.com/DavidReveloLuna/MachineLearning/blob /master/ 3_4 BosquesAleatorios.ipynb
Docsity logo



Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved