Detección e identificación de la enfermedad de la hoja de té basada en YOLOv7 (YOLO

Noticias

HogarHogar / Noticias / Detección e identificación de la enfermedad de la hoja de té basada en YOLOv7 (YOLO

Jun 06, 2023

Detección e identificación de la enfermedad de la hoja de té basada en YOLOv7 (YOLO

Informes científicos volumen 13,

Scientific Reports volumen 13, Número de artículo: 6078 (2023) Citar este artículo

3425 Accesos

1 Altmetric

Detalles de métricas

Se requiere un diagnóstico y un sistema de identificación fiables y precisos para prevenir y gestionar las enfermedades de la hoja de té. Las enfermedades de la hoja de té se detectan manualmente, lo que aumenta el tiempo y afecta la calidad y la productividad del rendimiento. Este estudio tiene como objetivo presentar una solución basada en inteligencia artificial para el problema de la detección de enfermedades de la hoja de té al entrenar el modelo de detección de objetos de una sola etapa más rápido, YOLOv7, en el conjunto de datos de hojas de té enfermas recopiladas de cuatro jardines de té prominentes en Bangladesh. Se recopilan 4000 imágenes digitales de cinco tipos de enfermedades de las hojas de estos jardines de té, lo que genera un conjunto de datos de imágenes de enfermedades de las hojas con anotaciones manuales y datos aumentados. Este estudio incorpora enfoques de aumento de datos para resolver el problema de los tamaños de muestra insuficientes. Los resultados de detección e identificación para el enfoque YOLOv7 están validados por métricas estadísticas destacadas como exactitud de detección, precisión, recuperación, valor mAp y puntuación F1, que dieron como resultado 97,3 %, 96,7 %, 96,4 %, 98,2 % y 0,965, respectivamente. . Los resultados experimentales demuestran que YOLOv7 para las enfermedades de la hoja de té en imágenes de escenas naturales es superior a las redes existentes de detección e identificación de objetivos, incluidas CNN, Deep CNN, DNN, AX-Retina Net, DCNN mejorada, YOLOv5 y segmentación de imágenes multiobjetivo. Por lo tanto, se espera que este estudio minimice la carga de trabajo de los entomólogos y ayude en la identificación y detección rápidas de las enfermedades de la hoja de té, minimizando así las pérdidas económicas.

El té es una de las bebidas funcionales más populares del mundo debido a su agradable sabor, exquisito sabor y beneficios biológicos. Contiene varios fitoconstituyentes activos que tienen importantes beneficios para la salud humana. Lo más curioso es que se ha convertido en la bebida más consumida (después del agua)1. El té juega un papel importante en acercar a familias y amigos en todo el mundo2. Para 2025, se prevé que el consumo mundial de té alcance los 7,4 millones de toneladas métricas, frente a los aproximadamente 7,3 millones de toneladas métricas de 20203.

La demanda de producción de té aumentará en los próximos días. Por el contrario, la producción de té está disminuyendo debido a las condiciones meteorológicas y al cambio climático. Además de estos fenómenos globales, diversas enfermedades y plagas afectan gravemente la producción y la calidad del té. Las enfermedades afligen con frecuencia a las plantas de té durante su desarrollo y crecimiento. Se identifican más de cien enfermedades prevalentes en todo el mundo que dañan las hojas de té4. El té se encuentra entre los cultivos agroindustriales y orientados a la exportación superiores de Bangladesh. Es consumido regularmente por la mayoría de la población del país, y su sabor es muy apreciado dentro y fuera de su país de origen5. Bangladesh tiene 162 jardines de té divididos en dos regiones principales de cultivo de té: Sylhet en el noreste y Chittagong en el sur5. La enorme producción de té de Bangladesh, sin duda, ha ayudado a su PIB al tiempo que lo posicionó como el principal exportador de té del mundo.

El diagnóstico temprano y preciso de las enfermedades y plagas de las plantas previene significativamente las pérdidas de producción agrícola. Si las enfermedades de la hoja de té se identifican con precisión y rapidez, se pueden prevenir y manejar de manera más eficiente6. En los últimos tiempos, el diagnóstico de la enfermedad de la hoja de té se ha realizado manualmente. Debido a que la mayor parte de las plantas de té crecen en terrenos montañosos difíciles, los profesionales requieren mucho tiempo y dinero para visitar los jardines de té para realizar un diagnóstico. Cuando los agricultores confían en sus experiencias personales para diferenciar entre diferentes formas de enfermedades del té, los resultados son muy subjetivos7. La precisión de tales proyecciones es baja y la identificación de hojas enfermas requiere un trabajo considerable. Por lo tanto, un marco debería permitir un diagnóstico de enfermedades más preciso y fiable6.

Con el avance de la tecnología informática, el aprendizaje automático y el procesamiento de imágenes pueden detectar e identificar automáticamente las enfermedades de las plantas, lo que desempeña un papel importante en el diagnóstico automático de las enfermedades de las plantas8,9. Los investigadores han aplicado el procesamiento de imágenes y el aprendizaje automático para identificar y categorizar las enfermedades de las plantas. Castelao Tetila et al. aplicó seis enfoques tradicionales de aprendizaje automático para detectar hojas de soja infectadas capturadas por un vehículo aéreo no tripulado (UAV) desde varias alturas. El impacto de las características de color y textura se validó con base en la tasa de reconocimiento10. Maniyath et al.11, sugirieron una arquitectura de clasificación basada en el aprendizaje automático para detectar enfermedades de las plantas. En otro estudio reciente, Ferentinos12 utilizó imágenes de hojas simples de plantas sanas e infectadas y construyó modelos de redes neuronales convolucionales para la identificación y el diagnóstico de enfermedades de las plantas mediante el aprendizaje profundo. Fuentes et al.13 emplearon "metaarquitecturas de aprendizaje profundo" para identificar enfermedades y plagas en las plantas de tomate utilizando una cámara para capturar imágenes con diferentes resoluciones. Como resultado de fructíferas investigaciones, los enfoques continuaron detectando nueve tipos distintos de enfermedades y plagas de las plantas de tomate. Tiwari et al.14 introdujeron una estrategia de red neuronal convolucional densa para detectar y clasificar enfermedades de plantas a partir de imágenes de hojas adquiridas en diferentes resoluciones. Esta red neuronal profunda abordó muchas variaciones entre clases e intraclases en las imágenes en circunstancias complicadas. Varios estudios adicionales han utilizado técnicas de aprendizaje profundo y procesamiento de imágenes para identificar enfermedades de la hoja de té. Hossain et al.15 descubrieron un método de procesamiento de imágenes capaz de analizar 11 características de las enfermedades de la hoja de té y utilizaron un clasificador de máquinas de vectores de soporte para identificar y clasificar las 2 enfermedades de la hoja de té más comunes, a saber, la enfermedad del tizón pardo y la enfermedad de la hoja de algas. Sun et al.16 mejoraron la extracción de mapas de prominencia de la enfermedad de la hoja de té en entornos complicados al combinar un clúster iterativo lineal simple (SLIC) y una máquina de vectores de soporte (SVM). Hu et al.17 desarrollaron un modelo para analizar la gravedad del tizón de la hoja del té en fotografías de escenas naturales. El índice de gravedad inicial de la enfermedad (IDS) se calculó segmentando las ubicaciones de las manchas de la enfermedad a partir de las imágenes de la hoja del tizón de la hoja de té utilizando el clasificador SVM. Además, varios investigadores han utilizado arquitecturas notables, como AlexNet18, VGGNet19, GoogLeNet20, InceptionV321, ResNet22 ​​y DenseNet23, para la identificación de enfermedades de las plantas.

Si bien las técnicas mencionadas anteriormente han demostrado su eficacia en el tratamiento de enfermedades de cultivos o plantas, se limitan a diagnosticar o clasificar imágenes de enfermedades de cultivos. Como se mencionó anteriormente, las redes neuronales profundas son ineficaces para detectar y reconocer enfermedades de la hoja de té en imágenes de escenas naturales. Esto se debe a que las imágenes de escenas naturales de hojas de té contienen fondos complejos, hojas densas y alteraciones a gran escala. Los algoritmos de una etapa funcionaron bien en comparación con otros modelos de aprendizaje profundo24. Recientemente, las redes de detección de imágenes basadas en aprendizaje profundo se han separado en redes de dos etapas y de una etapa24. La primera es la familia de algoritmos R–CNN (red neuronal convolucional basada en regiones), que está orientada a propuestas regionales y comprende redes representativas como R–CNN, Fast R–CNN, Faster R–CNN, Mask R–CNN, etc. Otra categoría son los algoritmos de una etapa y sus redes representativas, como la serie YOLO (solo miras una vez)25.

YOLO es un algoritmo de detección de objetos que ha ganado popularidad en la visión artificial. YOLO es un algoritmo de detección de objetos en tiempo real que procesa una imagen en un solo paso hacia adelante a través de una red neuronal. A diferencia de los algoritmos de detección de objetos tradicionales que involucran múltiples etapas de procesamiento, YOLO realiza el reconocimiento de objetos y la regresión de cuadro delimitador en un solo paso24. Esto lo hace rápido y eficiente, con la capacidad de procesar hasta 60 cuadros por segundo. YOLO funciona dividiendo una imagen en una cuadrícula de celdas y prediciendo cuadros delimitadores para cada celda. Para cada cuadro delimitador, YOLO predice la probabilidad de clase (es decir, la probabilidad de que el cuadro delimitador contenga un objeto en particular) y la puntuación de confianza (es decir, la probabilidad de que el cuadro delimitador contenga un objeto). YOLO también predice las coordenadas del cuadro delimitador relativas a la celda 26.

Para mejorar la precisión de las predicciones, YOLO utiliza una técnica llamada cuadros ancla, que son cuadros predefinidos de diferentes tamaños y relaciones de aspecto. Cada cuadro de anclaje está asociado con una celda en particular y se usa para predecir el tamaño y la forma del objeto dentro de esa celda. Usando cajas de anclaje, YOLO puede manejar objetos de diferentes tamaños y formas. Una de las principales fortalezas de YOLO es su velocidad. YOLO puede procesar imágenes en tiempo real, lo que lo hace adecuado para aplicaciones como vehículos autónomos, sistemas de vigilancia y robótica26. YOLO también es eficiente, ya que solo necesita procesar una imagen una vez, a diferencia de los algoritmos de detección de objetos tradicionales que requieren varias pasadas a través de la red. Otro punto fuerte de YOLO es su capacidad para detectar múltiples objetos en una imagen. Debido a que YOLO predice cuadros delimitadores para cada celda, puede detectar múltiples objetos en diferentes partes de la imagen. Esto hace que YOLO sea ideal para la detección de peatones y el reconocimiento de señales de tráfico26.

YOLOv7 es el nuevo detector avanzado de la familia YOLO. Esta red utiliza una bolsa de obsequios entrenables, lo que permite que los detectores en tiempo real mejoren drásticamente la precisión sin aumentar los costos de inferencia. Integra el escalado extendido y compuesto, lo que permite que el detector objetivo reduzca de manera efectiva la cantidad de parámetros y cálculos, lo que da como resultado una aceleración sustancial de la tasa de detección27. YOLOv7 supera a los detectores de objetos típicos en precisión y velocidad de 5 FPS (fotogramas por segundo) a 160 FPS. También ofrece un conjunto de obsequios listos para usar y simplifica el ajuste fino de los modelos de detección. El archivo de configuración de YOLOv7 facilita la adición de módulos adicionales y la generación de nuevos modelos28. El estudio ofrece E-ELAN, que emplea la cardinalidad de expansión, barajado y fusión para lograr la capacidad de mejorar constantemente la capacidad de aprendizaje de la red sin romper la ruta de gradiente original29.

La versión anterior de la familia YOLO (YOLOv5) se ha aplicado con eficacia en varios dominios, incluida la identificación de frutas mediante robots recolectores30,31, detección de vehículos y barcos32,33, selección de hongos venenosos y detección de rostros34. Jubayer et al.35 utilizaron YOLOv5 para la detección de moho y demostraron precisión, recuperación, F1 y AP del 98,1 %, 100 %, 99,5 % y 99,6 %, respectivamente.

La variante mejorada de YOLO (YOLOv7) ha atrapado a muchos científicos de aprendizaje automático y modelado de datos. Varios investigadores se han empleado para varios fenómenos de detección de objetos, como el seguimiento de objetos de video29, la detección de objetos para la estimación del conteo de patos de cáñamo36, la detección de objetos de imágenes marítimas de vehículos aéreos no tripulados37, la detección de barcos a partir de imágenes satelitales38, la detección de defectos en diferentes materiales39,40,41, el seguimiento de vehículos42 , así como en la asistencia sanitaria43,44. Gallo et al.45 aplicaron el modelo YOLOv7 en un conjunto de datos de plantas de achicoria para identificar malezas. De manera similar, la arquitectura YOLOv7 se utilizó para detectar frutas en los huertos, lo que facilita que los robots recolectores localicen y recolecten frutas46,47.

La familia YOLO se ha utilizado ampliamente para identificar enfermedades de las hojas y plagas de insectos en los cultivos, lo que nos anima a considerar YOLOv7 como modelo de referencia. El algoritmo YOLOv7 aún no se utiliza para identificar enfermedades de la hoja de té. Para la continuación de esta investigación, se consideran las siguientes lagunas de conocimiento:

Hay datos etiquetados limitados disponibles para detectar la enfermedad de la hoja de té, entrenar y probar cualquier modelo.

Hay una falta de métricas de evaluación establecidas o puntos de referencia específicos para la detección de la enfermedad de la hoja de té, lo que dificulta comparar el rendimiento de los modelos YOLOv7 con otros métodos.

Si bien ha habido pocos estudios sobre la aplicación de la inteligencia artificial para las enfermedades del té, ninguno se ha realizado en Bangladesh. Es crucial analizar los posibles beneficios y la eficacia de utilizar IA para identificar y detectar enfermedades de la hoja de té en Bangladesh.

El presente estudio fue diseñado para identificar y detectar enfermedades de la hoja de té utilizando imágenes capturadas en el entorno natural de numerosas plantaciones de té en la región de Sylhet en Bangladesh. Este documento utiliza hojas de té enfermas como objeto de investigación, recopila cinco tipos de imágenes de fallas frecuentes para producir un conjunto de datos de fallas de hojas de té y aplica la alta velocidad de detección y precisión del algoritmo YOLOv7 al campo de detección de objetos. Esta investigación pretende desarrollar un método automatizado para detectar, identificar y clasificar las enfermedades de la planta del té, aumentando la precisión de la detección de enfermedades, ahorrando tiempo a los agricultores y beneficiando sus medios de vida. Según nuestro conocimiento, esta es la primera vez que se utiliza YOLOv7 con el modelo de atención como arquitectura fundamental para detectar hojas enfermas en plantas de té.

Las principales contribuciones de nuestro trabajo son las siguientes:

Presentamos un modelo mejorado de detección de objetos YOLOv7, YOLO-T, para la detección, identificación y resolución automáticas del problema de la precisión de detección automática de enfermedades de la hoja de té en imágenes de escenas naturales.

El rendimiento del YOLO-T desarrollado se evaluó con respecto a la versión anterior de YOLO (YOLOv5). También se comparan el presente estudio y los algoritmos previos de detección de enfermedades de las plantas.

Creamos y presentamos un conjunto de datos original de imágenes de hojas de té enfermas obtenidas de los destacados jardines de té de Sylhet, Bangladesh. Este nuevo conjunto de datos podría usarse para entrenar y probar el modelo YOLOv7 y por otros investigadores que trabajen en problemas comparables.

La técnica de aumento de datos se utiliza para aumentar la cantidad de imágenes de entrenamiento para abordar el problema de las muestras insuficientes y mejorar el efecto de detección e identificación de la red.

La metodología de este estudio proporciona una base para la prevención y el manejo automáticos de las enfermedades de la hoja de té y facilita la aplicación sensata de pesticidas utilizando tecnología de drones.

Las hojas de té se recolectaron de cuatro jardines de té de renombre en el distrito de Sylhet de Bangladesh, como se muestra en la Fig. 1. La posición geográfica de estos cuatro jardines se representa en la Fig. 2 para que se pueda comprender la distancia entre ellos (ArcGIS 10.8). Las hojas se recolectaron en junio de 2022 de dos jardines de té, a saber, National Tea Company Ltd. (24°55′11,9″ de latitud norte y 91°52′25,7″ de longitud este) en Lackatoorah, Sylhet y Malnicherra Tea Garden (24°56 ′11,2″ de latitud norte y 91°52′01,2″ de longitud este) en la carretera del aeropuerto de Sylhet. Además, esta investigación se extendió a dos jardines de té más, y se recolectaron hojas durante agosto de 2022 de los jardines, a saber, Nur Jahan Tea Garden (24°17′50.5″ latitud norte 91°48′05.6″ longitud este) y Finlay Tea Estate (24°19′12.0″ latitud norte y 91°44′35.4″ longitud este), ambos en Sreemangal, Sylhet.

Investigar lugares de recolección de datos; (A) National Tea Company Ltd., (B) Malnicherra Tea Garden, (C) Nur Jahan Tea Garden, (D) Finlay Tea Estate.

Las ubicaciones geográficas de cuatro jardines de té estudiados en esta investigación en Sylhet, Bangladesh.

Las metodologías de investigación experimental y de campo utilizadas en este estudio se realizaron de acuerdo con las normas y directrices aplicables. Durante el período de estudio, solo se recolectaron imágenes de hojas de té enfermas; no se utilizaron otros métodos de recolección o muestreo. Las fotos fueron tomadas en un entorno natural utilizando una cámara Canon EOS 80D SLR con una resolución de imagen de 6000 × 4000 píxeles. La cámara se colocó a 0,4 m por encima de la copa de los árboles de té. De las imágenes de hojas de té enfermas capturadas en su entorno natural, se eligieron 4000 imágenes de cinco tipos de hojas de té (infectadas con enfermedades) para generar un conjunto de datos para este estudio. Entre estas 4000 imágenes, 800 imágenes (cada una) de hojas infectadas por plagas y enfermedades como arañas rojas, chinches del mosquito del té, podredumbre negra, tizón marrón y roya de la hoja. La Figura 3 muestra imágenes de estas cinco enfermedades de la hoja de té tomadas de hojas de té. Inicialmente, se seleccionaron aleatoriamente 800 imágenes de 4000 imágenes para evaluar la generalización del modelo de detección. Las 3200 imágenes restantes se dividieron aleatoriamente en un conjunto de entrenamiento (2800) y un conjunto de validación (400). Dado que los tamaños de imagen en nuestro conjunto de datos no eran uniformes, se realiza una fase de normalización inicial para estandarizar todas las fotos a una imagen de resolución de 640 × 640. Para completar el etiquetado manual de la enfermedad/infección, se usó el software de anotación de datos de imagen 'Labeling' para crear el rectángulo exterior de las porciones enfermas en todas las imágenes del conjunto de entrenamiento usando el paquete 'labeling' en python. Después de la instalación exitosa, se realiza el etiquetado de imágenes (dibujar el cuadro delimitador y etiquetar la clase) para cada imagen. Después de etiquetar con éxito la imagen, la salida se almacena como un archivo de texto y un archivo de clase. Para garantizar que el rectángulo comprenda la menor cantidad posible de fondo, las imágenes se etiquetaron en función del rectángulo más pequeño que rodea las hojas de té. Las hojas de té enfermas se manipularon con cuidado para evitar que se mezclaran.

Imágenes de enfermedades de la hoja de té: (a) araña roja, (b) chinche del mosquito del té, (c) podredumbre negra, (d) tizón marrón, (e) roya de la hoja.

El paquete YOLO se instala obteniendo el código 'YOLOv7' de GitHub y clonándolo. La versión más reciente de 'YOLO v7' es compatible con Torch y se puede implementar fácilmente con la ayuda de 'Google colab'. Esto generará una nueva carpeta en el sistema llamada 'YOLOv7'. Esta nueva carpeta almacenará los pesos preentrenados del modelo y la estructura de directorio especial de YOLO. Se crea una nueva subcarpeta en YOLOv7 una vez que se completa el entrenamiento. Para agregar la ruta de la ubicación de la subcarpeta, se usa la notación 'YOLOv7/run/training/experiment/weights/last.pt'. El tamaño del peso del documento se cambiará de acuerdo con el documento 'yaml' que se usó aquí. En la Fig. 4 se muestra un diagrama de bloques del marco de pruebas y entrenamiento del modelo propuesto.

Diagrama de bloques de entrenamiento y prueba del modelo YOLOv7 propuesto.

Los siguientes son los detalles del entrenamiento del modelo YOLOv7.

Tamaño de la foto: 640 × 640

Número de imágenes en cada lote: 10

Extracción de características: data.yaml

Yolo desarrollado: YOLOv7s.yaml

Imagen: medida de las dimensiones de una imagen (tanto en alto como en ancho).

Lote: el tamaño del lote es el número de imágenes alimentadas a la vez durante una iteración.

épocas: la cantidad de repeticiones o iteraciones de entrenamiento.

Datos: la estructura de datos, incluida la ubicación de los datos de entrenamiento y validación, el número total de clases y los nombres de cada clase se caracterizó en este archivo YAML.

cfg: para obtener más información sobre un modelo, puede consultar su archivo de configuración YAML en la carpeta 'modelo'. Hay 4 modelos distintos disponibles, cada uno con un rango de tamaño único. Se ha utilizado el archivo de entrenamiento denominado "YOLOv7s.yaml".

Nombre: Hay un nombre de modelo dado.

%cd yolov7/# cambie el nombre del directorio a 'yolov7' usando el comando

!tren pitón. py --img 640 --batch 10 --epochs 205 --data/content/data.yaml --cfg models/yolov7s.yaml --name TeaLeafDisease

A lo largo del proceso de entrenamiento, se recopilaron datos, se analizó la pérdida y se capturó el peso del modelo en cada época con la ayuda de la herramienta de visualización Tensorboard. Las siguientes especificaciones de computadora de escritorio (Tabla 1) se usaron para el entrenamiento y las pruebas con el marco de aprendizaje profundo PyTorch.

YOLOv7 se deriva de las arquitecturas modelo YOLOv4, Scaled YOLOv4 y YOLO-R. La estrategia de preprocesamiento del modelo YOLOv7 se combina con la técnica de preprocesamiento del modelo YOLOv5, y el aumento de datos de mosaico es apropiado para identificar objetos pequeños. En términos de arquitectura, se propone ELAN expandida (E-ELAN) como una extensión de ELAN. El bloque computacional de la columna vertebral de YOLOv7 se conoce como E-ELAN. Se aplican cardinalidad de expansión, mezcla y combinación para mejorar continuamente la capacidad de aprendizaje de la red sin comprometer la ruta de gradiente. La convolución de grupo se utiliza para aumentar el canal y la cardinalidad del bloque informático en la arquitectura del bloque informático. Se instruye a diferentes conjuntos de bloques computacionales para que adquieran diversas características. YOLOv7 también presenta escalado de modelos compuestos para modelos basados ​​en concatenación. El método de escalado compuesto permite conservar los atributos iniciales del modelo y, en consecuencia, la mejor estructura. Luego, el modelo se concentra en varios módulos de optimización entrenables y técnicas conocidas como "bolsa de regalos" (BoF)27,36. BoF son estrategias que mejoran el rendimiento de un modelo sin aumentar su costo de entrenamiento. YOLOv7 ha implementado los siguientes enfoques BoF.

La reparametrización es una técnica para mejorar un modelo después del entrenamiento. Alarga la duración del entrenamiento pero mejora los resultados de la inferencia. Hay dos métodos de reparametrización para completar modelos: conjunto a nivel de modelo y conjunto a nivel de módulo. En consecuencia, la reparametrización a nivel de módulo ha suscitado un gran interés en la comunidad científica. En este método, el proceso de entrenamiento del modelo se divide en varios módulos. Los resultados se agregan para producir el modelo final. YOLOv7 utiliza canales de propagación de flujo de gradiente para identificar los segmentos del modelo (módulos) que requieren reparametrización. El componente de cabeza de la arquitectura se basa en el concepto de múltiples cabezas. En consecuencia, el jefe principal es responsable de la categorización final, mientras que los jefes auxiliares ayudan en el procedimiento de formación21.

Los resultados del modelo proyectado se encuentran en la parte superior de YOLO. YOLOv7 no se limita a una sola cabeza, ya que se inspiró en la supervisión profunda, una estrategia de entrenamiento común para las redes neuronales profundas. Tiene varias cabezas para lograr cualquier cosa que desee. El jefe responsable del resultado final es el jefe principal, mientras que el jefe empleado para apoyar el entrenamiento en las capas intermedias se denomina jefe auxiliar. Para mejorar el entrenamiento de las redes neuronales profundas, se diseñó un mecanismo de asignación de etiquetas que asigna etiquetas blandas en función de los resultados de la predicción de la red y la verdad del terreno. La asignación de etiquetas tradicional utiliza la verdad del terreno directamente para crear etiquetas duras basadas en criterios preestablecidos. Las etiquetas flexibles confiables, por el contrario, usan métodos de cálculo y optimización que consideran tanto la realidad del terreno como la calidad y distribución de la salida de la predicción27,36. La Figura 5 muestra la descripción general del diagrama de arquitectura de red de YOLOv7.

Diagrama de arquitectura de red de YOLOv7. Toda la arquitectura contiene 4 módulos generales, a saber, una terminal de entrada, una red troncal, una cabecera y una predicción, junto con 5 componentes básicos: CBS, MP, ELAN, ELAN-H.

(a) La capa de normalización por lotes está directamente acoplada a la capa de convolución. Esto indica que la media y la varianza normalizadas del lote se suman a la desviación y el peso de la capa de convolución durante el paso de inferencia, (b) Usando la técnica de suma y multiplicación de adquisición de conocimiento en YOLO-R en combinación con el mapa de características de convolución, puede estandarizarse en vectores mediante precálculo en la etapa de inferencia para combinarse con la desviación y el peso de la capa de convolución anterior o posterior, y (c) finalmente, la detección de objetos en tiempo real puede aumentar considerablemente la precisión de detección sin afectar el computacional costo, de modo que la velocidad y la precisión en el rango de 5 a 160 FPS superan a todos los detectores de objetos conocidos, lo que permite una respuesta rápida y una predicción precisa de la detección de objetos27,36.

La herramienta de etiquetado se usó para etiquetar el cuadro de verdad del terreno de las imágenes. Se contó el número y la distribución de las etiquetas del conjunto de datos, y el resultado se muestra en la Fig. 6. Esta figura muestra una visualización de los atributos del conjunto de datos aumentado. Para mejorar la generalización del modelo entrenado, el aumento de datos mejora la información en el conjunto de datos de entrenamiento, mantiene la diversidad de datos y ajusta la dirección de distribución en las imágenes originales. El eje de ordenadas en la Fig. 6a representa la cantidad de etiquetas, mientras que el eje de abscisas representa sus nombres. El conjunto de datos contiene cantidades suficientes de muestras de hojas de té que están infectadas y enfermas. La figura 6b muestra la distribución de etiquetas. La ordenada 'y' es la relación de abscisas del centro de la etiqueta con respecto a la altura de la imagen, y la abscisa 'x' es la relación de abscisas del centro de la etiqueta con el ancho de la imagen. Los datos están uniforme y finamente dispersos y enfocados en el medio de la imagen, como se ve en la figura. El conjunto de datos de la hoja de té contiene etiquetas para cuadros de verdad en el suelo (Fig. 6c). Las estadísticas de tamaño de todos los bordes de la imagen se muestran en esta figura. Un algoritmo de agrupamiento genera cuadros de anclaje de varios tamaños en función de todos los cuadros de verdad en el terreno en el conjunto de datos, lo que garantiza que el tamaño inicial del cuadro de anclaje del algoritmo coincida con el tamaño previsto de las hojas de té enfermas. En este caso, el cuadro de verdad fundamental se refiere a los cuadros anotados alrededor de cada caso de enfermedad de la hoja de té en el conjunto de datos de entrenamiento. Durante el entrenamiento, el algoritmo YOLOv7 usó estas cajas de datos reales para aprender a detectar objetos de clases similares en nuevas imágenes. La mayor parte de los cuadros de límite en la Fig. 6c está centrada. El algoritmo YOLOv7 utiliza cuadros de anclaje para ayudar a ubicar objetos, y colocar estos cuadros de anclaje potencialmente hace que el sistema encuentre cosas hacia el centro de la imagen con mayor frecuencia.

Etiquetas y distribución de etiquetas, (a) número y clase de etiquetas en el conjunto de datos, (b) ubicación de las etiquetas en las imágenes del conjunto de datos y el tamaño de las etiquetas en el conjunto de datos, (c) cuadro de verdad del terreno.

El conjunto de datos original y la red YOLOv7 se usaron para construir el modelo para la detección de enfermedades en las hojas de té. La eficacia del modelo desarrollado se muestra en gráficos, que muestran diferentes métricas del rendimiento de los conjuntos de entrenamiento y validación. En la figura 7 se representan tres tipos distintos de pérdida: pérdida de caja, pérdida de objetualidad y pérdida de categorización. La pérdida de cuadro evalúa la capacidad de un algoritmo para ubicar con precisión el centro de un objeto y estimar su cuadro delimitador. Como métrica, la "objetualidad" cuantifica la probabilidad de que se pueda encontrar un objeto en un área determinada. La alta objetividad sugiere que es probable que un objeto se encuentre dentro de la región visible de una imagen. La pérdida de clasificación indica la precisión con la que un algoritmo puede determinar la clase adecuada de un objeto. En el transcurso de 0 a 100 iteraciones, los parámetros del modelo varían considerablemente. Cuando el número de iteraciones aumentó de 100 a 150, el rendimiento del modelo se optimizó continuamente. La pérdida de objetividad es insignificante, como muestra la figura, YOLO v7 brinda mayor precisión y valores de recuperación que K-Means.

Análisis visual de los indicadores de evaluación del modelo (Precisión, recuperación y [email protected] para el YOLOv7 propuesto) durante el entrenamiento.

La precisión y la recuperación no pueden verse como los únicos determinantes del rendimiento de un modelo porque podrían inducir a error con respecto al rendimiento del modelo41. Por lo tanto, empleamos curvas adicionales para evaluar el rendimiento del modelo que se calcula como se muestra en la Fig. 8. la curva de recuperación de precisión se representa en la Fig. 8a, y b ilustra el gráfico de precisión (P) versus confianza (C), Fig. 8c muestra la puntuación F1 al 97 % con una confianza de 0,368, lo que recomienda equilibrar P y R en función del conjunto de datos de imágenes de la enfermedad de la hoja de té. La Figura 8d representa el gráfico de recuerdo (R) versus confianza (C).

Curva de resultados de operación; (a) curva de recuperación de precisión, (b) curva de confianza de precisión, (c) curva de confianza de F1 y (d) curva de confianza de recuperación.

Se observó que a medida que crece la recuperación, también aumenta la tasa de cambio en la precisión. Si la curva del gráfico está cerca de la esquina superior derecha, muestra que a medida que aumenta la recuperación, la caída en la precisión no es fácilmente visible y el rendimiento general del modelo ha aumentado. Sin embargo, con un umbral de 0,5, el mAp para todas las clases es alto y modela con precisión el 97,3 % de las detecciones. Esto indicaba en la Fig. 8 que se podía confiar en el algoritmo para detectar y clasificar objetos de interés de forma adecuada. Sin embargo, al comienzo de las fases de entrenamiento y prueba, el algoritmo tuvo desafíos debido a la falta de datos representativos, pero convergió constantemente a medida que se completaban más épocas de entrenamiento.

La matriz de confusión en la Fig. 9 contrasta la clasificación real con la clasificación proyectada. Puede ilustrar dónde se confunde el modelo al clasificar o distinguir entre dos clases. Esto está representado por una matriz de dos por dos, con un eje que representa la verdad real o fundamental y el otro que representa la verdad del modelo o la predicción. En un escenario perfecto, 1,00 abarcaría la diagonal desde la parte superior izquierda de la matriz hasta la parte inferior derecha. El porcentaje de clasificación adecuado para cada tipo de hoja de té enferma según el modelo parece ser el siguiente:

Podredumbre negra 97%

Tizón marrón 97%

Roya de la hoja 97%

Araña roja 98%

Mosquito del té 97%

Diagrama de matriz de confusión para el modelo YOLO-T propuesto.

Además de mostrar el porcentaje de salida del algoritmo clasificado correctamente, también es posible ver cuántas veces la clasificación fue incorrecta. La podredumbre negra, el tizón pardo y la roya de la hoja se clasificaron incorrectamente como roya de la hoja, podredumbre negra y mosquito del té, respectivamente, el 2% de las veces, lo que causó la mayor confusión al clasificar las enfermedades.

Los resultados experimentales incluyeron cuatro resultados: verdadero positivo (TP), que se refiere a la detección precisa de hojas enfermas marcadas individualmente; falso positivo (FP), que se refiere a un objeto que se identificó incorrectamente como una hoja de té enferma; verdadero negativo (TN) que se refiere a muestras negativas con una predicción negativa del sistema; y falso negativo (FN) que se refiere a hojas de té enfermas que se pasaron por alto. El modelo YOLOv7 de este presente estudio se compara con YOLOv5 para confirmar su precisión y eficacia. La Tabla 2 compara mAP, precisión, recuperación y tiempo de entrenamiento entre YOLOv7 y YOLOv5. La precisión se refiere a la proporción de enfermedades de la hoja de té reconocidas correctamente en todas las imágenes. La tasa de recuperación es la proporción de hojas enfermas reconocidas con precisión en el conjunto de datos. El único desafío que encontramos con el modelo YOLOv7 fue que requería más tiempo para entrenar, mientras que el modelo YOLOv5 requería menos. Los otros parámetros (Tabla 2) son superiores a YOLOv5. Las métricas estadísticas destacadas se calculan utilizando las siguientes ecuaciones35.

Según el análisis y la comparación de la serie anterior de experimentos, es factible concluir que el algoritmo YOLOv7 actualizado presentado en este estudio ofrece ventajas significativas en términos de precisión de detección. A pesar de una pequeña caída en la velocidad, este método aún puede cumplir con los requisitos en tiempo real de las aplicaciones prácticas de detección de enfermedades de la hoja de té.

Los resultados de la visualización de la identificación de los cinco tipos de enfermedades de la hoja de té se muestran en la Fig. 10. Esta figura demuestra que el algoritmo propuesto detecta e identifica con precisión las hojas enfermas mediante la construcción de un cuadro delimitador perfecto. Deep Learning está ganando popularidad entre los investigadores para aplicaciones de agricultura de precisión, como detección de enfermedades, control de malezas, reconocimiento de frutas, etc.45,46,47. Al identificar la porción enferma, los agricultores pueden emplear medidas más efectivas para el control de enfermedades. La precisión, recuperación y precisión promedio de este modelo YOLOv7 actual son mejores que otros métodos de detección de objetos mencionados en el estudio de Hu et al.48. Empleó una técnica de aprendizaje profundo para identificar y determinar la gravedad de la enfermedad del tizón de la hoja del té48. Sus resultados fueron superiores a los de otros algoritmos de detección de objetos; sin embargo, el rendimiento del trabajo actual es muy superior a los intentos anteriores.

Algunos ejemplos de resultados de detección de enfermedades de la hoja de té usando YOLOv7. Los cuadros delimitadores consisten en imágenes de hojas de té enfermas.

Por el contrario, después de revisar los hallazgos del mismo estudio48, se observó que el YOLOv3, el R-CNN más rápido y el R-CNN + FPN más rápido parecían requerir menos tiempo de entrenamiento48. La comparación de los resultados de diferentes algoritmos de detección de la enfermedad de la hoja de té con los resultados obtenidos en este estudio se muestra en la Tabla 3. Se puede observar que la precisión y la exactitud de la detección son mucho más altas que las de otros estudios similares, donde los investigadores utilizaron diferentes algoritmos.

Las plagas del té se pueden dividir en tres grupos según el lugar donde atacan o infestan, incluidas las plagas de la raíz, como la larva del abejorro, la chinche harinosa de la raíz y el nematodo; plagas del tallo tales como la broca perforadora y la broca roja del café; y plagas de las hojas tales como la chinche del mosquito del té, la lombriz, la oruga looper, el enrollador de hojas, los trips y todos los ácaros. Las enfermedades causadas por la chinche del mosquito del té y la araña roja se encuentran entre las amenazas más importantes de Bangladesh para la producción de té, confirmadas y concluidas por otros estudios54.

Los objetivos de la enfermedad del té suelen ser pequeños, y el complejo entorno del área de cultivo impide fácilmente el procedimiento de su detección inteligente. Además, varias enfermedades del té se concentran en toda la superficie de la hoja, lo que requiere inferencias a partir de datos globales55. En cuanto a la tarea de detección de enfermedades de las hojas, donde la precisión era el factor esencial, el modelo YOLO-T propuesto es superior a otros modelos. Descubrimos que algunos cuadros delimitadores son demasiado grandes para el área de la enfermedad. El nombre etiquetado y la predicción no aparecen juntos en la imagen. Esto se debe a que el nombre está configurado para ser excesivamente largo, haciendo que aparezca incompleto en las imágenes. La anotación correcta, el etiquetado y el uso de un nombre más corto y significativo resolvieron el problema. El cuadro delimitador debe dibujarse cerca de la región de detección requerida del objeto. Esta técnica puede ayudar al algoritmo de entrenamiento a aprender únicamente dentro del cuadro delimitador. Otro beneficio de este enfoque es su resolución de imagen. El tamaño de entrada de imagen de 640 × 640 proporciona el máximo grado de precisión56. Cuanto mayor sea el tamaño de la imagen de entrada, mayor será la cantidad de información que contiene.

La única desventaja que descubrimos al utilizar el modelo YOLOv7 fue su largo período de entrenamiento. Comparamos nuestra versión (YOLO-T) con la versión más reciente (YOLOv5). Un nuevo estudio encontró que YOLOv7 requirió menos tiempo de entrenamiento que YOLOv5, lo que contradice nuestros hallazgos47. Esta variación en la duración del entrenamiento puede deberse a la utilización de unidades de procesamiento de gráficos (GPU). El uso de una GPU normal puede ralentizar el tiempo de entrenamiento de YOLOv7.

Excepto por el tiempo de entrenamiento, el resultado de un estudio reciente55 que también utilizó la versión YOLOv5 para la enfermedad de la hoja de té fue consistente con los de la presente investigación. YOLOv5 emplea una estructura de enfoque que requiere menos memoria de Compute Unified Device Architecture (CUDA), una capa reducida y una mejor propagación hacia adelante y hacia atrás. También utiliza una red troncal oscura con una red parcial de etapas cruzadas. Por otro lado, E-ELAN en YOLOv7 utiliza cardinalidad de expansión, barajado y fusión para obtener la capacidad de mejorar constantemente la capacidad de aprendizaje de la red sin dañar la ruta de gradiente. Según un estudio, YOLOv7 tiene una mayor inferencia en velocidad y precisión en comparación con otros algoritmos como YOLOR, PP-YOLOE, YOLOX, Scaled-YOLOv4 y YOLOv5 (r6.1)57. En varias investigaciones recientes, también se evaluó e informó la exactitud y precisión de detección del algoritmo YOLOv747,56,58,59,60.

Identificar y detectar enfermedades es crucial para mejorar la producción de té durante la siembra y la cosecha. En la era actual de alto uso de la tecnología informática, un sistema mejorado de detección e identificación de enfermedades en las plantaciones de té de un país en desarrollo como Bangladesh podría tener un potencial sustancial para la economía del país, además de mejorar el estilo de vida rico de los agricultores. En este estudio de investigación, se utiliza el modelo YOLOv7 (YOLO-T) para detectar e identificar diferentes tipos de enfermedades de la hoja de té en los jardines de té. El modelo propuesto detectó automáticamente cinco tipos distintos de enfermedades de la hoja de té y diferenció entre hojas sanas y enfermas. La precisión general de la clasificación es del 97,30 %, mientras que la recuperación y la precisión son del 96,4 % y el 96,7 %, respectivamente. El modelo sugerido supera a los modelos más recientes informados en la sección de discusión con respecto a la precisión general, la exactitud y la recuperación. Sin embargo, en este estudio, el rendimiento de YOLOv7 se compara con la versión anterior, YOLOv5, y se observó que YOLOv7 supera. Aunque los resultados son favorables, el enfoque propuesto está limitado por la duración del período de formación. Los futuros investigadores pueden emplear la normalización por lotes para los próximos proyectos para acelerar el proceso de capacitación y mejorar la precisión. La expansión del conjunto de datos es uno de los focos para el desarrollo futuro. Las investigaciones futuras deberían recopilar muestras de hojas de té dañadas de diversas variedades, etapas de fertilidad y ángulos de disparo en el campo para compilar un gran conjunto de datos.

Además, la calidad de la imagen se puede mejorar empleando técnicas de etiquetado más avanzadas. El modelo es compatible con dispositivos de Internet de las cosas (IoT) y se aplica a aplicaciones del mundo real. Este marco puede modificarse ligeramente para tener en cuenta enfermedades adicionales de los cultivos y adaptarse a otras plantas. El algoritmo propuesto se puede implementar en una aplicación móvil para facilitar el acceso de los agricultores a la asistencia para sus cultivos en cualquier momento. Esta investigación facilita la detección temprana de numerosas enfermedades de la hoja de té, lo que puede contribuir a su pronta detección. Los estudios posteriores pueden centrarse en recopilar información de temperatura y humedad, información de esporas patógenas, información del suelo y parámetros ambientales a través de múltiples sensores, fusionar datos de múltiples fuentes y construir un modelo de alerta temprana de enfermedades de la hoja de té basado en la fusión de múltiples datos para realizar Alerta temprana cuando la enfermedad no se presenta.

Los conjuntos de datos utilizados y analizados durante el estudio actual están disponibles del autor correspondiente a pedido.

Sanlier, N., Gokcen, BB & Altuğ, M. Consumo de té y correlaciones de enfermedades. Tendencias Ciencias de la alimentación. Tecnología 78, 95–106. https://doi.org/10.1016/j.tifs.2018.05.026 (2018).

Artículo CAS Google Académico

Verma, HV Café y té: significado sociocultural, contexto y marca. Asia-Pac. Gerente J. Res. innovador 9(2), 157–170. https://doi.org/10.1177/2319510X13504283 (2013).

Artículo Google Académico

Debnath, B., Haldar, D. y Purkait, MK Utilización potencial y sostenible de los desechos de té: una revisión del estado actual y las tendencias futuras. J. Medio Ambiente. química Ing. 9(5), 106179. https://doi.org/10.1016/j.jece.2021.106179 (2021).

Artículo CAS Google Académico

Hu, G., Yang, X., Zhang, Y. y Wan, M. Identificación de enfermedades de la hoja de té mediante el uso de una red neuronal convolucional profunda mejorada. Sostener. computar información sist. 24, 100353. https://doi.org/10.1016/j.suscom.2019.100353 (2019).

Artículo Google Académico

Ahmed, JU et al. Seguridad alimentaria y diversidad dietética de los trabajadores del té de dos jardines de té en el gran distrito de Sylhet de Bangladesh. GeoJournal 86(2), 1015–1027. https://doi.org/10.1007/s10708-019-10108-z (2021).

Artículo Google Académico

Mathew, MP & Mahesh, TY Detección de enfermedades basada en hojas en plantas de pimiento usando YOLOv5. SIViP 16(3), 841–847. https://doi.org/10.1007/s11760-021-02024-y (2022).

Artículo Google Académico

Bao, W., Fan, T., Hu, G., Liang, D. & Li, H. Detección e identificación de enfermedades de la hoja de té basadas en AX-RetinaNet. ciencia Rep. 12(1), 1–16. https://doi.org/10.1038/s41598-022-06181-z (2022).

Artículo CAS Google Académico

Zhao, Y., Gong, L., Huang, Y. y Liu, C. Una revisión de las técnicas clave de control basado en la visión para el robot de recolección. computar Electrón. agricola 127, 311–323. https://doi.org/10.1016/j.compag.2016.06.022 (2016).

Artículo Google Académico

Wang, Q., Nuske, S., Bergerman, M. y Singh, S. Estimación automática del rendimiento de cultivos para huertos de manzanos. En Robótica experimental (págs. 745–758). Springer, (2013). https://doi.org/10.1007/978-3-319-00065-7_50.

Castelao Tetila, E., Brandoli Machado, B., Belete, NAS, Guimaraes, DA & Pistori, H. Identificación de enfermedades foliares de soja mediante imágenes de vehículos aéreos no tripulados. IEEE Geosci. Sensor remoto. Letón. 14, 2190–2194. https://doi.org/10.1109/LGRS.2017.2743715 (2017).

Artículo ANUNCIOS Google Académico

Maniyath, SR, et al. Detección de enfermedades de las plantas mediante el aprendizaje automático. En Actas de la Conferencia internacional de 2018 sobre innovaciones de diseño para 3Cs Compute Communicate Control, ICDI3C 2018, Bangalore, India, 25 y 26 de abril de 2018; págs. 41–45 (2018).

Ferentinos, KP Modelos de aprendizaje profundo para la detección y diagnóstico de enfermedades de las plantas. computar Electrón. agricola 145, 311–318. https://doi.org/10.1016/j.compag.2018.01.009 (2018).

Artículo Google Académico

Fuentes, A., Yoon, S., Kim, SC & Park, DS Un detector robusto basado en aprendizaje profundo para el reconocimiento de plagas y enfermedades de las plantas de tomate en tiempo real. Sensores 17(9), 2022. https://doi.org/10.3390/s17092022 (2017).

Artículo ADS PubMed PubMed Central Google Scholar

Tiwari, V., Joshi, RC & Dutta, MK Redes neuronales convolucionales densas basadas en la detección y clasificación de enfermedades de plantas multiclase utilizando imágenes de hojas. Ecol. información 63, 101289. https://doi.org/10.1016/j.ecoinf.2021.101289 (2021).

Artículo Google Académico

Hossain, MS, Mou, RM, Hasan, MM, Chakraborty, S. & Abdur Razzak, M. Reconocimiento y detección de enfermedades de la hoja de té usando una máquina de vectores de soporte. En Actas: 2018 IEEE 14th International Colloquium on Signal Processing and its Application, CSPA 2018 150–154 (Instituto de Ingenieros Eléctricos y Electrónicos Inc., 2018). https://doi.org/10.1109/CSPA.2018.8368703

Sun, Y., Jiang, Z., Zhang, L., Dong, W. & Rao, Y. SLIC_SVM basado en la extracción de mapas de prominencia de enfermedades de las hojas de la planta del té. computar Electrón. agricola 157, 102–109. https://doi.org/10.1016/j.compag.2018.12.042 (2019).

Artículo Google Académico

Hu, G., Wei, K., Zhang, Y., Bao, W. y Liang, D. Estimación de la gravedad del tizón de la hoja de té en imágenes de escenas naturales. Resumen. agricola 22(4), 1239–1262. https://doi.org/10.1007/s11119-020-09782-8 (2021).

Artículo CAS Google Académico

Krizhevsky, A., Sutskever, I. y Hinton, GE Clasificación Imagenet con redes neuronales convolucionales profundas. En Actas de la 25.ª Conferencia Internacional sobre Sistemas de Procesamiento de Información Neural - Volumen 1, NIPS'12, páginas 1097–1105, EE. UU., 2012. Curran Associates Inc. (2012)

Simonyan, K. y Zisserman, A. Redes convolucionales muy profundas para el reconocimiento de imágenes a gran escala. preimpresión de arXiv arXiv:1409.1556 (2014).

Szegedy, C., et al. Profundizando con las circunvoluciones. En Actas de la conferencia IEEE sobre visión artificial y reconocimiento de patrones (págs. 1 a 9) (2015)

Szegedy, C., Vanhoucke, V., Ioffe, S., Shlens, J. y Wojna, Z. Replanteamiento de la arquitectura inicial para la visión artificial. En Actas de la conferencia IEEE sobre visión artificial y reconocimiento de patrones (págs. 2818–2826) (2016).

He, K., Zhang, X., Ren, S. y Sun, J. Aprendizaje residual profundo para el reconocimiento de imágenes. En Actas de la conferencia IEEE sobre visión artificial y reconocimiento de patrones (págs. 770–778) (2016).

Huang, G., Liu, Z., Van Der Maaten, L. y Weinberger, KQ Redes convolucionales densamente conectadas. En Actas de la conferencia IEEE sobre visión artificial y reconocimiento de patrones (págs. 4700–4708) (2017).

Xue, Z., Xu, R., Bai, D. & Lin, H. YOLO-tea: Un modelo de detección de enfermedades del té mejorado por YOLOv5. Bosques 14(2), 415. https://doi.org/10.3390/f14020415 (2023).

Artículo Google Académico

Wang, L. y Yan, WQ Detección de hojas de árboles basada en aprendizaje profundo. En Simposio Internacional sobre Geometría y Visión (págs. 26–38). Springer, Cham (2021). https://doi.org/10.1007/978-3-030-72073-5_3

Jiang , P. , Ergu , D. , Liu , F. , Cai , Y. & Ma , B. Una revisión de los desarrollos del algoritmo Yolo . proc. Informática. ciencia Rev. 199 , 1066–1073. https://doi.org/10.1016/j.procs.2022.01.135 (2022).

Artículo Google Académico

Wang, CY, Bochkovskiy, A. y Liao, HYM YOLOv7: La bolsa de obsequios entrenables establece un nuevo estado del arte para los detectores de objetos en tiempo real. preimpresión de arXiv arXiv:2207.02696 (2022). https://doi.org/10.48550/arXiv.2207.02696

Pham, V., Nguyen, D. y Donan, C. Detección y clasificación de daños en carreteras con YOLOv7. preimpresión de arXiv arXiv:2211.00091 (2022). https://doi.org/10.48550/arXiv.2211.00091

Yang, F., Zhang, X. y Liu, B. Seguimiento de objetos de video basado en YOLOv7 y DeepSORT. preimpresión de arXiv arXiv:2207.12202 (2022). https://doi.org/10.48550/arXiv.2207.12202

Kuznetsova, A., Maleva, T. y Soloviev, V. Detección de manzanas en huertos utilizando YOLOv3 y YOLOv5 en imágenes generales y de primer plano. En Simposio Internacional sobre Redes Neuronales (págs. 233–243). Springer, Cham (2020). https://doi.org/10.1007/978-3-030-64221-1_20

Yan, B., Fan, P., Lei, X., Liu, Z. y Yang, F. Un método de detección de objetivos de manzana en tiempo real para el robot de recolección basado en YOLOv5 mejorado. Remote Sens. 13(9), 1619. https://doi.org/10.3390/rs13091619 (2021).

Artículo ANUNCIOS Google Académico

Kasper-Eulaers, M. et al. Detección de vehículos pesados ​​en áreas de descanso en condiciones invernales usando YOLOv5. Algoritmos 14(4), 114. https://doi.org/10.3390/a14040114 (2021).

Artículo Google Académico

Chen, Y., Zhang, C., Qiao, T., Xiong, J. y Liu, B. Detección de barcos en imágenes de detección óptica basadas en YOLOv5. En Duodécima Conferencia Internacional sobre Procesamiento de Imágenes y Gráficos (ICGIP 2020) (Vol. 11720, págs. 102–106). SPIE (2021). https://doi.org/10.1117/12.2589395

Yang, G., et al. Sistema de reconocimiento de mascarillas con YOLOV5 basado en reconocimiento de imágenes. En 2020 IEEE 6th International Conference on Computer and Communications (ICCC) (págs. 1398–1404). IEEE (2020). https://doi.org/10.1109/ICCC51575.2020.9345042

Jubayer, F. et al. Detección de moho en la superficie de los alimentos mediante YOLOv5. actual Res. ciencia de la comida 4, 724–728. https://doi.org/10.1016/j.crfs.2021.10.003 (2022).

Artículo Google Académico

Jiang, K. et al. Un algoritmo de detección de objetos YOLOv7 mejorado con mecanismo de atención para la estimación del recuento de patos de cáñamo. Agricultura 12(10), 1659. https://doi.org/10.3390/agriculture12101659 (2022).

Artículo Google Académico

Zhao, H., Zhang, H. y Zhao, Y. Yolov7-sea: Detección de objetos de imágenes de UAV marítimos basadas en yolov7 mejorado. En Actas de la Conferencia de invierno IEEE/CVF sobre aplicaciones de visión artificial (págs. 233–238) (2023).

Patel, K., Bhatt, C. & Mazzeo, PL Detección automática de barcos basada en aprendizaje profundo: un estudio experimental utilizando imágenes de satélite. J. Imágenes. 8(7), 182. https://doi.org/10.3390/jimaging8070182 (2022).

Artículo PubMed PubMed Central Google Académico

Sun, YX, Zhang, YJ, Wei, ZH & Zhou, JT Un método de clasificación y localización de defectos superficiales en tiras de acero laminadas en caliente basado en YOLOV7. Metalurgia 62(2), 240–242 (2023).

Google Académico

Wang, Y., Wang, H. & Xin, Z. Modelo de detección eficiente de defectos superficiales de tiras de acero basado en YOLO-V7. Acceso IEEE https://doi.org/10.1109/ACCESS.2022.3230894 (2022).

Artículo PubMed PubMed Central Google Académico

Zheng, J., Wu, H., Zhang, H., Wang, Z. y Xu, W. Algoritmo de detección de defectos del aislador basado en YOLOv7 mejorado. Sensores 22(22), 8801. https://doi.org/10.3390/s22228801 (2022).

Artículo ADS PubMed PubMed Central Google Scholar

Tran, DNN, Pham, LH, Nguyen, HH y Jeon, JW Seguimiento de vehículos con múltiples cámaras a escala urbana basado en YOLOv7. En 2022 IEEE International Conference on Consumer Electronics-Asia (ICCE-Asia) (págs. 1 a 4). IEEE (2022). https://doi.org/10.1109/ICCE-Asia57006.2022.9954809

Sun, KX y Cong, C. Investigación sobre la detección de anomalías torácicas basada en el algoritmo YOLOv7 mejorado. En 2022 Conferencia internacional IEEE sobre bioinformática y biomedicina (BIBM) (págs. 3884–3886). IEEE (2022). https://doi.org/10.1109/BIBM55620.2022.9995687

Bayram, AF, Gurkan, C., Budak, A. & Karataş, H. Un modelo de detección y predicción basado en aprendizaje profundo asistido por inteligencia artificial explicable para enfermedades renales. EUR. J. Ciencia. Tecnología 40, 67–74 (2022).

Google Académico

Gallo, I. et al. Detección profunda de objetos de malas hierbas: rendimiento de YOLOv7 en un conjunto de datos de casos reales a partir de imágenes de UAV. Remote Sens. 15(2), 539. https://doi.org/10.3390/rs15020539 (2023).

Artículo ANUNCIOS Google Académico

Chen, J. et al. Un modelo multiescala ligero y eficiente basado en YOLOv7: Aplicado al huerto de cítricos. Plantas 11(23), 3260. https://doi.org/10.3390/plants11233260 (2022).

Artículo PubMed PubMed Central Google Académico

Zhou, Y. et al. Posicionamiento activo adaptativo de puntos de recolección de frutos de Camellia oleifera: procesamiento de imágenes clásico y algoritmo de fusión YOLOv7. aplicación ciencia 12(24), 12959. https://doi.org/10.3390/app122412959 (2022).

Artículo CAS Google Académico

Hu, G., Wang, H., Zhang, Y. & Wan, M. Detección y análisis de gravedad del tizón de la hoja de té basado en el aprendizaje profundo. computar eléctrico Ing. 90, 107023. https://doi.org/10.1016/j.compeleceng.2021.107023 (2021).

Artículo Google Académico

Gayathri, S., Wise, DJW, Shamini, PB y Muthukumaran, N. Análisis de imágenes y detección de la enfermedad de la hoja de té mediante el aprendizaje profundo. En la Conferencia Internacional sobre Electrónica y Sistemas de Comunicación Sostenibles (ICESC) de 2020 (págs. 398–403). IEEE (2020). https://doi.org/10.1109/ICESC48915.2020.9155850

Latha, RS, et al. Detección automática de enfermedades de la hoja de té utilizando una red neuronal de convolución profunda. En 2021 Conferencia Internacional sobre Comunicación Informática e Informática (ICCCI) (págs. 1–6). IEEE (2021). https://doi.org/10.1109/ICCCI50826.2021.9402225

Datta, S. & Gupta, N. Un enfoque novedoso para la detección de la enfermedad de la hoja de té utilizando una red neuronal profunda. proc. computar ciencia 218, 2273–2286. https://doi.org/10.1016/j.procs.2023.01.203 (2023).

Artículo Google Académico

Chen, J., Liu, Q. y Gao, L. Reconocimiento visual de enfermedades de la hoja de té mediante un modelo de red neuronal convolucional. Simetría 11(3), 343. https://doi.org/10.3390/sym11030343 (2019).

Artículo ANUNCIOS Google Académico

Mukhopadhyay, S., Paul, M., Pal, R. & De, D. Detección de enfermedades de la hoja de té mediante segmentación de imágenes multiobjetivo. multimed. Aplicación de herramientas 80, 753–771. https://doi.org/10.1007/s11042-020-09567-1 (2021).

Artículo Google Académico

Mamun, MSA Producción de té en Bangladesh: Del arbusto a la taza. Agron. cultivos vol. Pinchar. Tecnología https://doi.org/10.1007/978-981-32-9151-5_21 (2019).

Artículo Google Académico

Lin, J., Bai, D., Xu, R. & Lin, H. TSBA-YOLO: Un modelo mejorado de detección de enfermedades del té basado en mecanismos de atención y fusión de funciones. Bosques 14(3), 619. https://doi.org/10.3390/f14030619 (2023).

Artículo Google Académico

Chen, J., Bai, S., Wan, G. y Li, Y. Investigación sobre el método de detección de defectos basado en YOLOv7 para luces de circulación de automóviles. sist. ciencia Ing. Control. 11(1), 2185916. https://doi.org/10.1080/21642583.2023.2185916 (2023).

Artículo Google Académico

Yung, NDT, Wong, WK, Juwono, FH y Sim, ZA Detección de cascos de seguridad mediante aprendizaje profundo: implementación y estudio comparativo mediante YOLOv5, YOLOv6 y YOLOv7. En 2022 Conferencia Internacional sobre Energía Verde, Computación y Tecnología Sostenible (GECOST) (págs. 164–170). IEEE. (2022). https://doi.org/10.1109/GECOST55694.2022.10010490

Hu, B., Zhu, M., Chen, L., Huang, L., Chen, P. y He, M. Método de identificación de especies de árboles basado en YOLOv7 mejorado. En 2022 IEEE 8th International Conference on Cloud Computing and Intelligent Systems (CCIS) (págs. 622–627). IEEE. (2022). https://doi.org/10.1109/CCIS57298.2022.10016392

Liu, X. y Yan, WQ Estimación de la distancia relacionada con el vehículo utilizando YOLOv7. En Image and Vision Computing: 37th International Conference, IVCNZ 2022, Auckland, Nueva Zelanda, 24 y 25 de noviembre de 2022, Documentos seleccionados revisados ​​(págs. 91 a 103). Cham: Springer Nature Suiza. (2023). https://doi.org/10.1007/978-3-031-25825-1_7

Yuan, W. Comparación de precisión de YOLOv7 y YOLOv4 con respecto a la calidad de anotación de imágenes para la clasificación de capullos de flores de manzana. Agroingeniería. 5(1), 413–424. https://doi.org/10.3390/agriengineering5010027 (2023).

Artículo Google Académico

Descargar referencias

Los autores agradecen al Profesor Dr. Fuad Mondal del Departamento de Entomología de la Universidad Agrícola de Sylhet, por su apoyo en la validación de las identidades de las enfermedades de la hoja de té.

Este trabajo de investigación está parcialmente financiado por la Comisión de Becas Universitarias (UGC) de Bangladesh a través del Sistema de Investigación de la Universidad Agrícola de Sylhet (SAURES) (Proyecto Id. SAURES-UGC-21-22-82). El organismo de financiación está financiado para la ejecución de experimentos, trabajo de campo y laboratorio, recolección de material, etc. No se recibió financiación para la redacción y publicación de este documento. Los autores cubrieron los gastos de redacción, revisión, edición y publicación de este manuscrito.

Estos autores contribuyeron por igual: Md. Janibul Alam Soeb y Md. Fahad Jubayer.

Departamento de Energía y Maquinaria Agrícola, Universidad Agrícola de Sylhet, Sylhet, 3100, Bangladesh

Maryland. Janibul Alam Soeb, Tahmina Akanjee Tarin y Muhammad Rashed Al Mamun

Departamento de Ingeniería y Tecnología de Alimentos, Universidad Agrícola de Sylhet, Sylhet, 3100, Bangladesh

Maryland. Fahad Jubayer

Departamento de Construcción Agrícola e Ingeniería Ambiental, Universidad Agrícola de Sylhet, Sylhet, 3100, Bangladesh

Fahim Mahafuz Ruhad

Centro Global para la Remediación Ambiental (GCER), Facultad de Ingeniería, Ciencias y Medio Ambiente, Universidad de Newcastle, Callaghan, NSW, 2308, Australia

Aney Parven & Islam Md. Meftaul

Departamento de Química Agrícola, Universidad Agrícola Sher-e-Bangla, Dhaka, 1207, Bangladesh

Aney Parven & Islam Md. Meftaul

Ingeniería Química y del Petróleo, Facultad de Ingeniería, Universiti Teknologi Brunei, Bandar Seri Begawan, BE1410, Brunei Darussalam

Nabisab Mujawar Mubarak

Facultad de Tecnologías Integradas, Universidad de Brunei Darussalam, Bandar Seri Begawan, BE1410, Brunei Darussalam

Soni Lanka Karri

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

MJAS y MFJ contribuyeron igualmente en la conceptualización, programación, redacción, revisión y finalización del manuscrito. FMR hizo la codificación y participó en la capacitación y prueba del modelo. TAT y MRAM hicieron una contribución significativa en la recopilación de datos y la redacción de revisiones. AP, NMM y SLK contribuyeron a la redacción, revisión y edición. IMM contribuyó al procesamiento de datos, redacción, revisión y finalización del manuscrito. Todos los autores leyeron y contribuyeron al manuscrito. Todos los autores aceptan ser responsables de los aspectos del trabajo para garantizar que las preguntas relacionadas con la precisión o la integridad de cualquier parte del trabajo se investiguen y resuelvan adecuadamente.

Correspondencia a Md. Janibul Alam Soeb, Maryland. Fahad Jubayer, Nabisab Mujawar Mubarak o Islam Md. Meftaul.

Los autores declaran no tener conflictos de intereses.

Springer Nature se mantiene neutral con respecto a los reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso abierto Este artículo tiene una licencia internacional Creative Commons Attribution 4.0, que permite el uso, el intercambio, la adaptación, la distribución y la reproducción en cualquier medio o formato, siempre que se otorgue el crédito correspondiente al autor o autores originales y a la fuente. proporcionar un enlace a la licencia Creative Commons e indicar si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la regulación legal o excede el uso permitido, deberá obtener el permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Soeb, MJA, Jubayer, MF, Tarin, TA et al. Detección e identificación de enfermedades de la hoja de té basadas en YOLOv7 (YOLO-T). Informe científico 13, 6078 (2023). https://doi.org/10.1038/s41598-023-33270-4

Descargar cita

Recibido: 23 febrero 2023

Aceptado: 11 de abril de 2023

Publicado: 13 abril 2023

DOI: https://doi.org/10.1038/s41598-023-33270-4

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, un enlace para compartir no está disponible actualmente para este artículo.

Proporcionado por la iniciativa de intercambio de contenido Springer Nature SharedIt

Al enviar un comentario, acepta cumplir con nuestros Términos y Pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.