1. Introdução
O transporte rodoviário é um dos mais utilizados no mundo por permitir o deslocamento porta-a-porta com boa flexibilidade. Para garantir segurança, conforto e economia aos usuários, debe-se manter as vias em condições adequadas ao rolamento. Neste aspecto, Sistemas de Gerência de Pavimentos (SGP) são ferramentas de grande utilidade a empresas privadas e órgãos públicos responsáveis pela administração de rodovias. Seu objetivo é formalizar as tomadas de decisão, assegurando consistência às decisões em diferentes níveis e o melhor uso possível dos recursos investidos. O bom funcionamento de um SGP, por sua vez, depende da contínua alimentação de seu banco de dados composto por avaliações. Dentre as avaliações mais importantes de um SGP, está a avaliação de patologias na superfície, sendo um dos principais levantamentos para a definição de estratégias de Manutenção e Reabilitação (M&R) de pavimentos.
Apesar de sua importância, a coleta de dados nem sempre é eficiente e segura. No caso da avaliação de patologias superficiais em pavimentos, o levantamento por caminhamento é o mais conhecido. Apesar de amplamente utilizado, este procedimento demanda tempo (Schnebele et al., 2015), tanto para o treinamento dos técnicos envolvidos quanto para a coleta de dados em campo. Além disso, está sujeito a erros humanos que afetam sua confiabilidade (Shaghlil e Khalafallah, 2018). Por isso, o desenvolvimento de novas tecnologias para o levantamento de patologias é essencial para minimizar a subjetividade dos métodos tradicionais e melhorar a produtividade e repetitividade das avaliações (Ragnoli et al., 2018). Nos últimos anos, tem-se investigado o uso de RPAs (Aeronaves Remotamente Pilotadas) para a avaliação de patologias em pavimentos (Zhu et al., 2021), com vistas à maior segurança dos usuários e avaliadores, sem necessidade de bloqueio de tráfego (Tan e Li, 2019), proporcionando boa repetitividade e agilidade, além da possibilidade de identificação automatizada de patologias (Pinto et al., 2020). Parente et al. (2017) observaram que a identificação manual de patologias a partir de uma RPA apresenta uma diferença em área pouco significativa quando comparado ao levantamento em campo.
Ranyal et al. (2022) realizaram uma revisão sistemática da literatura, publicada entre 2017 e 2022, sobre tecnologias baseadas em sensores com e sem contato voltadas para o monitoramento da condição de rodovias. Os autores destacaram a proeminência de sensores inteligentes e plataformas de coleta de dados, como smartphones, drones e veículos integrados munidos de sensores sem contato, como RGB, câmeras termográficas, lasers e sensores GPR (Ground Penetrating Radar). No caso dos VANTs, destacam que as principais vantagens estão relacionadas ao campo de visão que oferecem, alta resolução, dados profundos e detalhados, facilidade de aplicação e possibilidade de acesso a áreas de risco, além de flexibilidade para rápidos levantamentos. Por outro lado, também citam como desvantagens a carga útil, restrições de memória e limitações legais de uso.
Considerando que a detecção automática de estradas por VANTs é uma etapa essencial para a aplicação desta ferramenta na avaliação da condição de rodovias, Ranjbar et al. (2023) criaram um método para detecção automática dos limites de estradas e as segmentassem por meio de dados temporais e geográficos, através de sua Unidade de Medição Inercial (IMU). Os autores testaram o método desenvolvido em áreas urbanas, concluindo que o sistema foi capaz de realizar essa de forma eficiente, recomendando que trabalhos futuros apliquem redes neurais convolucionais (CNN) para aumentar a eficiência do método.
Hassan et al. (2021) desenvolveram uma CNN para a detecção de faixas amarelas em rodovias com o objetivo de automatizar o levantamento de trincas e buracos a partir de imagens de VANTs. Foram criadas treze camadas convolucionais, sendo uma softmax de saída e duas integralmente conectadas, sendo aplicada a ativação mish nas primeiras doze camadas por meio de uma unidade linear retificada (ReLU), a fim de atingir uma propagação mais profunda e impedir a saturação na fase de treinamento. O modelo alcançou uma precisão de 95%.
Astor et al. (2023) compararam a precisão do levantamento de defeitos em pavimentos realizados por VANTs com aqueles obtidos manualmente, por meio de modelos de regressão obtidos para o SDI (Surface Distress Index) e o PCI (Pavement Condition Index). O modelo de previsão do PCI por imagens de VANTs alcançou um R² de 0.86, contra um R² de 0.653 para o modelo de previsão de SDI.
Branco e Segantine (2015) delimitaram áreas imageadas por meio de polígonos para a identificação de patologias em pavimentos urbanos. Os autores encontraram dificuldades devido à presença de vegetação e edificações de concreto, sendo estas classificadas como pavimento em algumas análises. Pan et al. (2018) utilizaram algoritmos de aprendizado de máquina, como rede neural artificial, máquina de vetorial de suporte e floresta aleatória para classificar trincas e panelas em pavimentos. Entre os três métodos, o modelo de floresta aleatória de dezoito árvores obteve o melhor desempenho de classificação, com acurácia de 98,83%.
Apesar dos benefícios que RPAs podem proporcionar, há limitações a se considerar para o levantamento de patologias, como a altura de voo, resolução e calibração da câmera, e qualidade de orientação da imagem (Tan e Li, 2019), além do software e algoritmo de classificação utilizados (Zhu et al., 2021). Pan et al. (2018) apontam que a resolução espacial não deve exceder a escala mínima dos eventos de interesse ou detalhes são perdidos. Em sua pesquisa, o número de trincas não identificadas aumentou quando o tamanho dos pixels foi superior a 3 cm. Shaghlil e Khalafallah (2018) recomendaram alturas de voo entre 5 e 10 m, sendo a máxima dependente da resolução da câmera. Neste caso, utilizaram uma câmera de 12 megapixels. Com uma câmera de 20 megapixels de resolução, Oliveira et al. (2020) obtiveram erro médio máximo de 1,06%, a uma altura de 30 m, para a identificação de um remendo, enquanto para 60 m, um erro médio máximo de 7,18%. Explicam que imagens sobrepostas das mesmas patologias é determinante para a acurácia do método, pois patologias com maiores dimensões estarão presentes em diversas capturas, gerando, assim, mais informações para a etapa de processamento.
Neste estudo, investigou-se a identificação automatizada de patologias em pavimentos asfálticos por classificação supervisionada de imagens de RPAs, preenchendo uma lacuna importante de pesquisas correlatas, pois aponta a acurácia da classificação não só pelo cálculo de áreas similares dos elementos-alvo, mas também em sua localização. Ademais, contempla não só o método tradicional de levantamento de patologias por caminhamento, mas também a classificação visual de imagens de RPAs, que permite, senão a identificação automatizada de patologias, uma avaliação mais segura, sem interferências no tráfego, atributos altamente relevantes em atividades rotineiras na gerência de pavimentos, especialmente em vias de maior tráfego.
2. Método
O método foi dividido em planejamento e realização do voo, classificação manual,iclassificação supervisionada, comparativo de métodos e análise estatística da classificação supervisionada.
2.1 Planejamento e realização do voo
A aeronave utilizada para a realização do voo foi o modelo Phantom 4 Advanced da fabricante DJI (Dà-Jiāng Innovations) com bateria para 30 minutos de uso. A câmera acoplada à aeronave possui lente com campo de visão de 84º e distância focal de 8,8 mm/24 mm, equipada com um sensor CMOS (Complementary Metal Oxide Semiconductor) de 1” com 20 Megapixels e sistema de cores RGB (Red, Green and Blue) (DJI Brasil, 2017). Para o mapeamento aéreo, consideraram-se os seguintes fatores: tempo ensolarado e incidência luminosa apropriada, sem nuvens; janela ideal de voo, das 11h às 13h; velocidade e direção de vento propícios; locais de pouso e decolagem selecionados conforme obstáculos locais; e não interferência no espaço aéreo, solicitada à Agência Nacional de Aviação Civil (ANAC).
O trecho avaliado possui extensão de 600 m, com dois segmentos perpendiculares entre si, localizado na Rua Irineu Parzianello, município de Pato Branco, estado do Paraná, Brasil, com coordenadas iniciais 26º11’55.14”S e 52º41’19.15’’O, e finais 26º12’4.92”S e 52º41’34.75”O. O trecho apresentava diversas patologias de superfície, permitindo uma análise abrangente da porcentagem de acerto dos métodos de identificação de patologias e de não patologias. A presença de vegetação lindeira à via permitiu a avaliação de elemntos na presença de sombra.
O plano de voo atendeu os seguintes parâmetros: recobrimento lateral de 65%; recobrimento longitudinal de 75%; e velocidade máxima de 15 m/s, com GSD (Ground Sample Distance) de 1,5 cm/px, resultando em uma altitude média de 50 metros. O tempo aproximado de voo foi de 7 minutos. Para otimizar o ajuste do processamento das imagens, fez-se a determinação de dez pontos de controle (Ground Control Points - GCPs) ao longo do trecho escolhido, de forma aleatória e intercalada entre os lados da pista. Foram afixados alvos e suas respectivas coordenadas foram determinadas através do receptor GNSS (Global Navigation Satellite System), modelo Zenith 25, através do método RTK (Real Time Kinematic). O processamento para criação do ortomosaico foi realizado no programa Agisoft PhotoScan, utilizada para referenciar as fotos, corrigir posicionamentos em relação às coordenadas do GNSS e realizar a ortorretificação para a obtenção do ortomosaico final utilizado nas classificações manual e supervisionada.
2.2 Classificação manual de imagens
A partir do ortomosaico, realizou-se a classificação manual das patologias. Para tal, utilizou-se o software AutoCAD® 2018 para a vetorização de cada elemento (Fig. 1).
Para a obtenção de dados de referência para o levantamento realizado com a RPA, realizou-se a avaliação de patologias por caminhamento, identificando-se tipo e extensão das patologias, a fim de verificar se as patologias existentes na via seriam visíveis nas imagens obtidas pela RPA.
2.3 Classificação supervisionada das imagens
A classificação supervisionada de imagens foi realizada com auxílio de um complemento da plataforma QGIS (Quantum Geographic Information System): o SCP (Semi-Automatic Classification Plugin). A partir da ortoimagem final foi criado um conjunto de bandas através do plugin, equivalente à etapa de pré-processamento. Na primeira etapa do processamento definiram-se as categorias de interesse: pavimento asfáltico em boas condições; trincas; panelas; remendos; vegetação (sobreposta à via); e áreas com presença de material argiloso. Em seguida, foram selecionadas amostras de cada elemento de interesse à classificação, que pode ter como instrumento de captura um pixel ou um polígono. Estas amostras alimentam o arquivo de treinamento, obtendo-se, como resultado da classificação, uma imagem raster.
Para estimar o método de classificação supervisionada mais adequado para a máquina utilizada, foram testadas combinações de variáveis associadas ao critério de identificação, por pixel ou por polígono, do algoritmo classificador, Minimum Distance, Maximum Likelihood ou Spectral Angle Mapping; e ao número de amostras para o aprendizado de máquina.
Para a escolha do número de amostras condizente com a capacidade da máquina, coletou-se aleatoriamente quatro amostras de cada um dos elementos para um primeiro ensaio, oito amostras para um segundo e dezesseis para um terceiro, totalizando 24, 48 e 96 amostras, respectivamente. Por meio do SCP, as amostras foram coletadas por pixel, onde se delimita a área com pixels similares ao selecionado, e por polígono, onde a área é delimitada manualmente (Fig. 2).
Quanto aos algoritmos de classificação de imagens, o SCP fornece três opções: (1) Minimum Distance (Mínima Distância), que classifica os pixels através da distância média espectral entre categorias, por distância Euclidiana, conforme Eq. (1) (Richards, 2013):
Onde
(2) Maximum Likelihood (Máxima Verossimilhança), que calcula a distribuição de probabilidade normal da classe, de acordo com a Eq. (2) (Richards, 2013):
Onde
(3) Spectral Angle Mapping (Mapeamento por Ângulo Espectral), que determina o grau de similaridade entre curvas espectrais, conforme a Eq. (3) (Kruse et al., 1993):
Onde
Após diversas combinações entre critério de identificação, algoritmo classificador e número de amostras, encontraram-se as melhores para o estudo. Os resultados com maior porcentagem de acerto, quanto ao tipo e extensão das patologias, foram obtidos com o classificador Maximum LikeliHood, pelo método de polígonos, com 24 e 48 amostras. Combinações com mais amostras foram descartadas devido à capacidade da máquina utilizada e ao modo de funcionamento do programa que, durante o processamento, sobrecarrega continuamente a memória da máquina.
2.4 Análises comparativa e estatística
Após o comparativo entre classificação manual de imagens com os dados do levantamento por caminhamento, considerou-se a classificação manual como referência para as classificações supervisionadas, pela alta conformidade da classificação manual com as patologias de campo.
Para avaliar estatisticamente a acurácia do classificador na identificação das patologias, foi utilizado o índice Kappa, técnica de estatística multivariada. Avaliou-se tanto a comparação da classificação supervisionada com as amostras utilizadas para o treinamento do algoritmo, quanto à classificação supervisionada com a manual. Os índices Kappa obtidos são resultantes da Matriz de Erros (ou de confusão), fornecida no pós-processamento do QGIS, e da Matriz de acertos manual versus supervisionada, respectivamente. Além deste, outro parâmetro utilizado para a análise de classes foi o Coeficiente de Correlação de Matthews (MCC).
2.4.1 Comparativo de acertos da classificação supervisionada em relação a manual
Com o auxílio do QGIS, sobrepuseram-se os polígonos obtidos na classificação manual aos polígonos da classificação supervisionada provenientes da transformação da imagem raster em polígonos. Assim, obteve-se a área em comum de ambas as classificações para cada elemento. A fim de verificar a porcentagem de acerto de identificação de patologias, os resultados da classificação manual foram confrontados com os da classificação supervisionada a partir de 24 e 48 amostras. A título de exemplo, na Figura 3 é exibido um mesmo trecho classificado de forma manual (a) e supervisionada, com 24 amostras (b) e 48 amostras (c).
2.4.2 Matriz de confusão
Na matriz de confusão, os valores de classe previstos para os dados de validação são comparados aos valores conhecidos (Story; Congalton, 1986; Campbell; Hall-Beyer, 1997). Essa matriz mapeia valores reais das classes do conjunto de validação ao longo das colunas em relação às classes previstas pelo classificador nas linhas. Os pixels classificados corretamente são dispostos ao longo da diagonal da matriz, enquanto os classificados incorretos ou confundidos com outra classe são exibidos nas células fora da diagonal (Mcgwire; Fisher, 2001).
Os verdadeiros positivos (TP) e verdadeiros negativos (TN) consistem emsclassificações corretas. Um falso positivo (FP) ocorre quando a predição do resultado é incorreta, como sim (ou positivo) quando, na verdade, não é (negativo). Um falso negativo (FN) ocorre quando o resultado é previsto como negativo quando o resultado verdadeiro é positivo (Witten; Frank; Hall, 2016). A partir destas frequências, obtém-se indicadores de desempenho de classificação que refletem a eficiência do classificador na detecção de uma determinada classe. Uma matriz de confusão multiclasses (k x k), como a do caso em estudo, pode ser representada como um conjunto de k matrizes binárias de confusão, uma para cada classe, possibilitando um tratamento posterior (Ruuska et al., 2018).
2.4.3 Estatística kappa
O índice Kappa (K) foi criado por Jacob Cohen em 1960, com o objetivo de medir a precisão ou grau de concordância entre categorizações previstas e observadas de um conjunto de dados (Cohen, 1960). O coeficiente também serve para indicar o grau de concordância entre a classificação supervisionada e os dados de referência, que podem ser as amostras utilizadas no treinamento do algoritmo de classificação, ou uma imagem da classificação manual definida como correta. Em mapas, o grau de concordância do índice Kappa pode variar entre 0 e 1, sendo que quanto mais próximo da unidade, maior o grau de concordância. Usa-se aqui a interpretação da classificação proposta por Landis e Koch (1977), representada na Tabela 1:
Valor do Kappa | Interpretação |
---|---|
0,00 - 0,20 | Concordância pobre |
0,21 - 0,40 | Concordância fraca |
0,41 - 0,60 | Concordância moderada |
0,61 - 0,80 | Concordância boa |
0,81 - 1,00 | Concordância quase perfeita |
Fonte: Adaptado de Landis e Koch (1977).
O índice Kappa (K) é calculado a partir da seguinte expressão:
Onde
Onde TP é a quantidade de verdadeiros positivos, TN é a quantidade de verdadeiros negativos, e n é o número total de pixel classificado. O termo 𝑃 𝐶 é dado pela seguinte expressão:
Onde PC é o número total de pixels classificados em cada classe, PCR é o número total de pixels classe real, e n² é o quadrado do total de pixels.
2.4.4 Coeficiente de Correlação de Matthews
O coeficiente de correlação de Matthews (MCC) foi usado pela primeira vez por Matthews (1975). Conforme Baldi et al. (2000), é utilizado para mensurar a qualidade de classificações. Seus valores variam de -1 a +1, em que coeficientes mais próximos de +1 representam uma previsão consistente, próximos de 0 representam previsões completamente aleatórias, e próximas de -1 representam uma previsão inconsistente. O MCC é calculado a partir da Eq. (7):
Onde TP é o número de verdadeiros positivos, TN o número de verdadeiros negativos, FP o número de falsos positivos e FN o número de falsos negativos. Pixels de diferentes categorias podem resultar em valores espectrais semelhantes e causar uma classificação falha. Por isso a importância de indicar o desempenho do classificador na detecção de determinada classe, e o MCC, por ser determinado a partir da matriz binária de cada categoria, cumpre este papel.
3. Resultados e discussão
Os resultados são apresentados em quatro tópicos: (i) realização de voo e processamento, (ii) classificação manual das imagens, (iii) classificação supervisionada das imagens e (iv) comparativo de métodos e análise estatística da classificação supervisionada.
3.1 Voo e processamento
Após a realização do voo e o processamento das imagens obtidas no levantamento com a RPA, gerou-se um ortomosaico final (Fig. 4). O GSD foi de 1,39 centímetro por pixel. Com o objetivo de otimizar a classificação foram recortados da imagem as bordas excedentes que continham os arredores além dos limites da faixa de rolamento da via.
3.2 Classificação manual de imagens
A classificação manual das patologias da superfície do pavimento foi relativamente rápida, devido à facilidade de identificação a partir da ortoimagem. Por outro lado, depois de uma posterior conferência com o levantamento por caminhamento, evidenciou-se que as sombras de árvores adjacentes à via dificultaram a visualização de algumas patologias e sua extensão, principalmente de trincas. Além disso, a vegetação ocultou partes do pavimento.
No total, cinco patologias anotadas no levantamento por caminhamento não foram identificadas nas imagens obtidas pela RPA. A área de remendos, panelas e trincas, observada na coleta por caminhamento, foi de 1.759,45 m², enquanto no levantamento manual foi de 1.638,42 m², resultando na identificação de 93,1% das patologias. A porcentagem foi calculada com base em medidas geométricas registradas em croquis, com escala, no levantamento por caminhamento.
3.3 Classificação supervisionada das imagens
A classificação de amostras por polígonos apresentou poucas regiões concordantes com a real condição de superfície do pavimento, como apresentado na Fig. 5. Além disso, resultou em classificações distintas em boa parte dos elementos de imagem selecionados.
Pixels de diferentes categorias, como pavimento bom e remendos, apresentaram tonalidades similares em algumas imagens, resultando em valores espectrais semelhantes e, consequentemente, em erros de classificação. Verificou-se que parte dos erros ocorreram pelo sombreamento e sobreposição de vegetação, impossibilitando a classificação nestes locais.
3.4 Análises comparativa e estatística
Neste tópico, apresenta-se matrizes de confusão e gráficos de dispersão gerados a partir da matriz de confusão advinda da relação entre classificações manual e supervisionadas, sendo utilizadas no cálculo do índice Kappa (K) e Coeficiente de Correlação de Matthews (MCC).
3.4.1 Comparativo entre classificações manual e supervisionada
Para a comparação das classificações manual e supervisionada, na Tab.2 apresentam-se os resultados do método Maximum Likelihood, por meio da identificação por polígono, com 24 e 48 amostras, incluindo áreas identificadas e porcentagens de acerto.
Classes | Manual | Sup. 48 amostras | Superv. 24 amostras | ||
---|---|---|---|---|---|
Áreas (m2) | Áreas (m2) | Acerto (%) | Áreas (m2) | Acerto (%) | |
Pavimento Bom | 4419.39 | 1233.00 | 27.90 | 1346.67 | 30.47 |
Trincas | 1552.50 | 458.76 | 29.55 | 467.19 | 30.09 |
Panela | 2.53 | 1.24 | 49.01 | 0.66 | 26.09 |
Remendo | 83.39 | 25.73 | 30.86 | 42.12 | 50.51 |
Vegetação | 247.40 | 186.14 | 75.24 | 192.52 | 77.82 |
Terra | 29.45 | 22.20 | 75.38 | 20,00 | 67.91 |
Total | 6334.65 | 1927.06 | 30.42 | 2069.16 | 32.66 |
A classificação supervisionada com 24 e 48 amostras resultou em uma porcentagem de acerto global de 32,66% e 30,42%, respectivamente. Este resultado indica que o número de amostras não foi relevante para a precisão da classificação de áreas com ou sem patologias.
3.4.2 Matrizes de confusão e gráficos de dispersão
As Tab. 3 e 4 representam matrizes de erro de classificação. Os termos 'Px', 'Pav' e 'class', referem-se a Pixels, Pavimento bom e Classificados, respectivamente. As linhas contêm dados classificados, enquanto as colunas, dados de referência. Valores internos representam os pixels, sendo destacados pixels identificados corretamente.
Pav. | Trinca | Panela | Remendo | Vegetação | Terra | Px class | |
---|---|---|---|---|---|---|---|
Pav. | 48682 | 9749 | 148 | 726 | 430 | 59735 | |
Trinca | 3722 | 61794 | 123 | 667 | 1458 | 67764 | |
Panela | 307 | 5885 | 489 | 222 | 1150 | 755 | 8808 |
Remendo | 9887 | 13114 | 24 | 12162 | 182 | 35369 | |
Vegetação | 34 | 97 | 39 | 62564 | 207 | 62941 | |
Terra | 19 | 3 | 7 | 61161 | 61190 | ||
Px reais | 62632 | 90658 | 787 | 13816 | 65791 | 62123 | 295807 |
Pav. | Trinca | Panela | Remendo | Vegetação | Terra | Px class | |
---|---|---|---|---|---|---|---|
Pav. | 190051 | 12879 | 450 | 1130 | 551 | 11 | 205072 |
Trinca | 18926 | 55103 | 785 | 1757 | 299 | 76870 | |
Panela | 2367 | 4299 | 2354 | 1183 | 312 | 89 | 10604 |
Remendo | 9549 | 5383 | 229 | 12819 | 21 | 28001 | |
Vegetação | 402 | 88 | 15 | 2 | 35516 | 17 | 36040 |
Terra | 309 | 12 | 44 | 26 | 6725 | 7116 | |
Px reais | 221604 | 77764 | 3877 | 16891 | 36725 | 6842 | 363703 |
A partir da sobreposição de polígonos definidos nas classificações manual e supervisionada, verificou-se a correspondência das patologias identificadas. Nas Fig. 6 e 7 estão representados os gráficos de dispersão da porcentagem de patologias identificadas, por classe, para 24 amostras (Figura 6) e 48 amostras (Figura 7), derivados das matrizes de confusão para estes casos.
Observa-se, na Fig. 6, que as classes terra e vegetação apresentaram melhores resultados, com porcentagem de acerto maiores que 60 e 70%, respectivamente. O pavimento bom, trincas e remendo apresentaram valores entre 30 e 50%, o que pode ser entendido como um resultado ruim. As panelas apresentam o pior resultado, com acerto de aproximadamente 25%, além de terem uma quantidade superior de áreas classificadas erroneamente como remendo.
Conforme a Fig. 7, verifica-se que as porcentagens de acerto foram similares às da Fig. 6a, porém com aumento significativo para asepanelas. Isto pode ser explicado pela forma como o algoritmo Maximum Likelihood aplica a máxima verossimilhança (MaxVer). Segundo o INPE (2006), o método pondera a distância entre médias dos valores dos pixels do elemento através de parâmetros estatísticos, assumindo que todasas bandas possuem distribuição normal, e calcula a verossimilhança de um pixel pertencer a um elemento específico, baseado nas amostras. Assim, pelo fato de a classe panela apresentar características distintas em uma mesma ocorrência, o número de amostras maior colaborou para uma maior porcentagem de acerto desse classificador.
3.4.3 Estatística Kappa
O índice Kappa foi calculado para quatro cenários, em duas comparações distintas, a primeira, e mais conhecida, refere-se ao grau de concordância entre categorias previstas pela classificação supervisionada, para 24 e 48 amostras, em relação aos dados obtidos in loco. A segunda consiste no grau de concordância entre classificação supervisionada e classificação manual, referente à identificação visual e delimitação manual das patologias. Esta análise tem como objetivo elucidar a pertinência do índice Kappa para a análise de patologias em pavimentos por meio de RPAs, a partir de classificação supervisionada de imagens. Na Tab. 5 são apresentados os índices Kappa calculados a partir das matrizes de confusão apresentadas no item 3.4.2.
Matriz Utilizada | 24 amostras | 48 amostras |
---|---|---|
Classificação supervisionada | 0,791 | 0,718 |
Sobreposição classificações manual e supervisionada | 0,378 | 0,396 |
Conforme a classificação de Landis e Koch (1977), os índices de ambos os classificadores estão entre 0,61 e 0,80, caracterizado como concordância boa. Porém, quando se observa o acerto por meio da sobreposição da classificação manual com as supervisionadas, os valores de Kappa passam para o intervalo de 0,21 a 0,40, correspondente à concordância fraca.
A discrepância entre valores Kappa, obtidos pelo classificador e sobreposição da classificação manual e supervisionada, evidencia que o índice não é conveniente para a análise qualitativa de patologias a partir de RPAs, apesar de muito utilizado no Sensoriamento Remoto. Quantitativamente, os algoritmos apresentaram concordância classificada como boa. No entanto, não representaram fielmente posições e geometrias das patologias, o que pode levar a interpretações errôneas quanto à acurácia da avaliação e, consequentemente, na tomada de decisões acerca das estratégias de manutenção e reabilitação dos pavimentos.
3.4.4 Coeficiente de Correlação de Matthews (MCC)
Pela semelhança espectral dos elementos envolvidos no processo de classificação, analisou-se o desempenho do classificador, para 24 e 48 amostras, de cada classe, por meio do MCC (Tab. 6).
Classe | 24 amostras | 48 amostras |
---|---|---|
Pav, Bom | 0,74 | 0,72 |
Trinca | 0,71 | 0,63 |
Panela | 0,18 | 0,35 |
Remendo | 0,52 | 0,56 |
Vegetação | 0,96 | 0,97 |
Solo | 0,99 | 0,96 |
Os resultados de classificação para 24 e 48 amostras foram similares. Por apresentarem diversas colorações, por vezes sombreadas ou com material argiloso, as panelas resultaram em mais erros de classificação. O elemento remendo apresentou MCC de 0,52 a 0,56, enquanto os elementos “trinca” e “pavimento bom” apresentaram MCCs acima de 0,6 e 0,7, respectivamente, apontando que trincas apresentam maior potencial para a classificação automatizada.
4. Conclusão
O estudo aponta que a identificação de patologias asfálticas por RPAs pode ser uma alternativa ao levantamento tradicional, por caminhamento, sendo mais ágil e seguro, além de não interromper o tráfego local. O bom nível de detalhamento das imagens possibilitou uma classificação manual confiável (93,1% de acerto) na identificação visual e representação do perímetro de patologias (extensão), ao tomar como referência os dados registrados em levantamentos por caminhamento.
A classificação supervisionada, a partir de RPA, é mais complexa se comparada à avaliação por caminhamento, pois depende de equipamentos específicos, planejamento adequado de planos de voo e técnicas e algoritmos de classificação confiáveis. A quantidade de amostras de treinamento não foi relevante, porém o modo de seleção de cada amostra foi determinante, devendo ser padronizado e realizado de forma que o treinamento do algoritmo seja satisfatório.
Os índices Kappa, obtidos pela sobreposição das imagens das classificações manual e supervisionada, devem ser utilizados com cautela para a análise de acurácia da classificação, pois, sem a consideração da localização, aqui verificada por meio da sobreposição das patologias e verificação do tipo e extensão de cada elemento-alvo, podem levar a interpretações equivocadas acerca da assertividade da classificação e, consequentemente, da condição dos pavimentos.
Os resultados obtidos a partir de análises complementares indicam que a classificação supervisionada não apresentou acurácia desejada para aplicações voltadas à gerência de pavimentos, por não caracterizar patologias de modo detalhado, no que se refere ao tipo, localização e extensão, quando comparado ao levantamento in loco e à classificação manual das imagens. Em virtude disso, recomenda-se que, em estudos futuros, sejam utilizadas técnicas de tratamento de imagens que contemplem a combinação da coloração de pixels, geometria das patologias e pré-tratamento de imagens, além da aplicação de outros algoritmos e técnicas de processamento que permitam a utilização de um maior número de amostras para treinamento.