Clasificación automática de plantas monocotiledóneas y dicotiledóneas usando minería de datos
No Thumbnail Available
Files
Date
2022-03
Authors
Advisors
Journal Title
Journal ISSN
Volume Title
Publisher
Ecuador: Latacunga: Universidad Técnica de Cotopaxi (UTC)
Abstract
En el presente proyecto de investigación, describe el desarrollo de una aplicación web basada en la comparación de dos técnicas de minería de datos tales como: regresión logística y SVM (máquina de vector de soporte). Para este caso de estudio se realizó la investigación de campo, donde se obtuvieron las imágenes para la creación de la base de datos con 353 registros. En el desarrollo de la aplicación web se recopila los datos como: área, perímetro, centroide y el tipo (monocotiledónea y dicotiledónea), estos datos son utilizados en el proceso de entrenamiento y aprendizaje de los dos algoritmos anteriormente mencionados; ya que es de utilidad para la clasificación automática. Para el desarrollo del prototipo se utilizó la segmentación de imágenes, operaciones morfológicas para el reconocimiento de la hoja y posteriormente se extrae los atributos de las mismas, dichos atributos son guardados en un cvs, el cual se utilizó dos modelos mediante las funciones model= LogisticRegression() y clf = SVC(kernel="rbf").fit(X_train, y_train), para obtener cómo resultado la clasificación de la planta esta puede ser (monocotiledónea y dicotiledónea) , finalmente nos da una precisión de validación de la clasificación en la planta monocotiledónea y dicotiledóneas con regresión logística un 97.75% y en SVM un 73.03%, lo que muestra que la técnica de minería de datos con menor error es de la regresión logística.
Description
This research project, it describes based on a web application development within the two data mining techniques comparison, such as: logistic regression and SVM (support vector machine). For this case study, it was performed the field research, where was got the images for the database creation with 353 records. Into web application development is collected data, such as: area, perimeter, centroid and type (monocotyledonous and dicotyledonous), these data are used in the two aforementioned algorithms training and learning process; since it is useful for automatic classification. For the prototype development was used the image segmentation, morphological operations for the leaf recognition and subsequently, it is extracted the same attributes, said attributes are saved in a cvs, what used two models, through the functions model = LogisticRegression () and clf = SVC(kernel="rbf").fit(X_train, y_train), to get as a result, the plant classification, this can be (monocotyledonous and dicotyledonous). At the end, it gives a classification validation accuracy in the monocotyledonous and dicotyledonous plant with logistic 97.75% regression and in 73.03%SVM, whose shows that the data mining technique with the least error is logistic regression.
Keywords
REGRESIÓN LOGÍSTICA, SMV, MINERÍA DE DATOS, MONOCOTILEDÓNEA Y DICOTILEDÓNEA
Citation
Fabián Rolando Cayambe Cajo (2022); Clasificación automática de plantas monocotiledóneas y dicotiledóneas usando minería de datos. UTC. Latacunga. 80 p.