Perceptron de múltiplas camadas otimizado para a classificação geográfica e genotípica de quatro genótipos de café arábica



Baixar 470.99 Kb.
Página2/2
Encontro29.10.2017
Tamanho470.99 Kb.
1   2

3. Resultados e discussões


Um espectro FTIR típico obtido e tratado para o genótipo IPR 105 cultivado em Cornélio Procópio está representado na Figura 2. Através da análise do espectro destaca-se a banda em 1744 cm-1 resultante da deformação axial simétrica do C=O de ésteres de ácidos graxos (WANG et al., 2011). As bandas na região de 1654 cm-1 e 1603 cm-1 estão relacionadas com a carbonila da cafeína (WANG et al., 2011). A região de 1285 cm-1 pode estar relacionada com os ácidos clorogênicos (BRIANDET et al., 1996). As regiões de 1200 cm-1 a 900 cm-1 e de 1500 cm-1 a 1400 cm-1 estão relacionadas ao conteúdo de carboidratos (BRIANDET et al., 1996; RIBEIRO et al., 2010).














1744 cm-1

1654 cm-1

1603 cm-1


1285 cm-1

Figura 2 – Espectro obtido para o genótipo IPR 105 cultivado em Cornélio Procópio.



3.1. Perceptron de múltiplas camadas (MLP)


Todas as redes utilizadas possuem uma camada oculta. Após a otimização dos parâmetros selecionados (Tabela 2), foram criadas mil redes para cada faixa de trabalho no FTIR e tipo de tratamento do espectro (Tabelas 3 e 4). A melhor rede de cada tipo foi selecionada pelo menor erro quadrado médio e maior porcentagem de classificação para as amostras de teste. Foi utilizado também a média de ensemble com 50 redes (HAYKIN, 2001). Os resultados obtidos para os perceptron de múltiplas camadas propostos para a classificação geográfica e genotípica de café arábica estão representados nas Tabelas 3 e 4. É importante salientar que as condições de cada problema influenciam na escolha dos parâmetros ótimos obtidos para cada rede (SUKTHOMYA e TANNOCK, 2005).

A partir de uma análise da Tabela 3, é possível concluir que, o perceptron de múltiplas camadas que obteve menor erro quadrado médio e maior porcentagem de classificação correta para a segmentação das amostras de café arábica por região de cultivo foi a Rede 4, que foi treinada com os espectros originais (sem derivá-los) e com o número de onda entre 1900-800 cm-1, uma faixa espectral mais específica que contem as impressões bioquímicas (fingerprints) para discriminação de diferentes amostras de cafés (BRIANDET et al., 1996; LYMAN et al., 2003; WANG et al., 2009). Para a segmentação genotípica (Tabela 4) o MLP que obteve menor erro quadrado médio e maior porcentagem de classificação correta (Rede 11) foi o que utilizou a primeira derivada do espectro e, assim como para a classificação geográfica, com a faixa espectral entre 1900-800 cm-1. Os espectros variam muito pouco por se tratarem de uma mesma variedade de café, por isso, a primeira derivada do espectro obteve melhores resultados, pois ela acentua as diferenças espectrais removendo ruídos em uma mesma região espectral e/ou definindo bandas que se encontram sobrepostas (COSTA FILHO e POPPI, 2002). Através da análise da performance dos MLPs nas Tabelas 3 e 4 fica evidente que a classificação genotípica é um problema mais difícil de ser modelado. Os MLPs desenvolvidos apresentam melhor desempenho quando comparados ao SIMCA (Soft Independent Modelling of Class Analogies) que obteve 83,33% de acerto para a classificação geográfica e 55,56% para a classificação genotípica (SATO et al., 2012). Devido ao SIMCA, ser um método linear de classificação que se baseia na classificação de uma nova amostra a partir de sua projeção nas componentes principais de cada classe (BRANDEN e HUBERT, 2005), era esperado um desempenho superior dos MLPs desenvolvidos, já que o MLP realiza o mapeamento de relações não lineares entre múltiplas variáveis de entrada e saída.

Destaca-se também que para a classificação das amostras por região as redes com função de ativação da camada oculta do tipo tangente hiperbólica sigmoide obtiveram um erro quadrado médio menor e uma porcentagem de classificação superior aquelas com função de ativação do tipo função logística, provando que para a segmentação geográfica a tangente hiperbólica sigmoide é a função de ativação adequada. Para a classificação dos genótipos a combinação da função de ativação do tipo tangente hiperbólica sigmoide tanto na camada oculta quanto na camada de saída apresentou melhores resultados, sendo esta combinação adequada para este outro problema.

Com relação a normalização, ficou evidente que o método minimax é superior ao autoescalonamento, devido as redes que apresentaram melhores resultados (Rede 4 e Rede 11) apresentarem o mesmo método de normalização.

A média de componentes principais utilizadas foi de 19 para a classificação geográfica e 18 para a classificação genotípica. Tais valores encontram-se próximos do que era esperado, pois de acordo o critério da raiz latente qualquer componente principal deve explicar a variância de pelo menos uma variável se a mesma há de ser mantida para interpretação. Cada variável contribui com um valor 1 do autovalor total. Logo, apenas os fatores que têm raízes latentes maiores que 1 são considerados significantes (HAIR et al., 2005). Para este estudo obteve-se 19 componentes principais que apresentaram valores de raízes latentes maiores que 1, comprovando assim, a capacidade que a ACP possui para compactar os dados e a capacidade de otimização do simplex sequencial.

Tabela 3 - Resultados obtidos para os perceptron de múltiplas camadas propostos para a classificação geográfica de café arábica.






Número de onda




3750-750 cm-1

1900-800 cm-1




Rede 1

Rede 2

Rede 3

Rede 4

Rede 5

Rede 6

Espectros

Original

Derivada


2ª Derivada

Original

Derivada


Derivada


Neurônios (camada oculta)

4

8

10

2

2

10

Função de pré-processamento (entradas)a

MM

MM

AE

MM

MM

MM

Função de Ativação (Camada oculta)b

FL

THS

THS

THS

FL

THS

Função de Ativação (Saída)b

THS

THS

L

THS

THS

THS

Componentes utilizadas

20

17

20

20

20

18

Desempenho das melhores redes obtidas para os dados de treinamento

Erro quadrado médio (Ensemble)

0,0014

0,0016

0,0330

0,0015

0,0031

0,0161

Erro quadrado médio (Melhor Rede)

0,0002

0,0066

0,0463

0,0377

0,0000

0,0196

%Classificação correta (Ensemble)

100,00%

100,00%

100,00%

100,00%

100,00%

100,00%

%Classificação correta (Melhor Rede)

100,00%

98,61%

94,44%

95,83%

100,00%

93,06%

Desempenho das melhores redes obtidas para os dados de teste

Erro quadrado médio (Ensemble)

0,0250

0,0209

0,0792

0,0064

'0,0240

0,0650

Erro quadrado médio (Melhor Rede)

0,2147

0,0406

0,1042

0,0353

0,0000

0,1337

%Classificação correta (Ensemble)

94,44%

100,00%

88,89%

100,00%

94,44%

88,89%

%Classificação correta (Melhor Rede)

55,56%

88,89%

72,22%

100,00%

83,33%

93,06%

a Função de pré-processamento: MM (Minimax) e AE (Autoescalonamento).

b Função de ativação: FL (Função Logística), THS (Tangente Hiperbólica Sigmoide) e L (Linear)
A partir de uma análise das Tabelas 3 e 4, observa-se uma redução no erro quadrado médio e um aumento na porcentagem de classificação correta quando são comparadas as respostas da melhor rede e da média de ensemble. No trabalho realizado por Bona et al. (2011) foram observados resultados semelhantes, comprovando assim, que o uso da resposta do ensemble melhora o desempenho e aumenta a precisão da rede que se torna estável e convergente, duas qualidades importantes em um modelo neural (HAYKIN, 2001).
Tabela 4 - Resultados obtidos os perceptron de múltiplas camadas propostos para a classificação genotípica de café arábica.




Número de onda




3750-750 cm-1

1900-800 cm-1




Rede 7

Rede 8

Rede 9

Rede 10

Rede 11

Rede 12

Espectros

Original

Derivada


2ª Derivada

Original

Derivada


Derivada


Neurônios (camada oculta)

9

6

5

3

6

8

Função de pré-processamento (entradas)a

AE

MM

MM

MM

MM

AE

Função de Ativação (Camada oculta)b

THS

FL

THS

FL

THS

THS

Função de Ativação (Saída)b

L

L

L

L

THS

THS

Componentes utilizadas

20

19

20

19

16

13




Desempenho das melhores redes obtidas para os dados de treinamento

Erro quadrado médio (Ensemble)

0,0563

0,0305

0,0698

0,0280

0,0251

0,0235

Erro quadrado médio (Melhor Rede)

0,0811

0,0667

0,0171

0,0944

0,0213

0,0229

%Classificação correta (Ensemble)

100,00%

98,61%

97,22%

98,61%

100,00%

100,00%

%Classificação correta (Melhor Rede)

86,11%

91,67%

95,83%

79,17%

95,83%

94,44%




Desempenho das melhores redes obtidas para os dados de teste

Erro quadrado médio (Ensemble)

0,1381

0,0961

0,1365

0,0862

0,0835

0,1316

Erro quadrado médio (Melhor Rede)

0,1766

0,1557

0,9482

0,1092

0,0986

0,2476

%Classificação correta (Ensemble)

61,11%

77,78%

55,56%

72,22%

83,33%

61,11%

%Classificação correta (Melhor Rede)

55,56%

72,22%

50,00%

72,22%

77,78%

50,00%

a Função de pré-processamento: MM (Minimax) e AE (Autoescalonamento).

b Função de ativação: FL (Função Logística), TH (Tangente Hiperbólica Sigmoide) e L (Linear).
A Figura 5 apresenta a porcentagem de confiança de classificação das amostras de teste pelas melhores redes otimizadas obtidas (Rede 4 e Rede 11). A partir de uma análise das Tabela 3 e da Figura 3 é possível observar que a Rede 4 obteve 100% de classificação correta. Todas as amostras foram classificadas com mais de 60% de confiança (exceção de uma amostra de Cornélio Procópio), ou seja, o classificador neural obtido classificou todas as amostras com alta confiança apesar das cidades estudadas estarem geograficamente próximas. A maioria dos trabalhos realizados para classificação de cafés utilizam amostras geograficamente muito distantes, de espécies diferentes e com diferentes graus de torra (KEMSLEY et al., 1995; BRIANDET et al., 1996; LYMAN et al., 2003; WANG et al., 2009). Neste trabalho, além das amostras serem de uma mesma espécie de café verde (arábica), os cafés são de regiões geograficamente muito próximas, sendo aproximadamente 195 km a distância máxima entre as cidades (Figura 4), comprovando assim, a capacidade do modelo neural obtido. A classificação por genótipos obteve porcentagens de confiança inferiores (Figura 5) por se tratar de um problema mais complexo como já comentado anteriormente. A Rede 11 que alcançou melhores resultados para a classificação por genótipo obteve 77,78% de classificação correta (classificação incorreta de 4 amostras de teste), duas amostras (IPR 105 e IPR 106) foram confundidas com IPR99, uma amostra IA 59 foi confundida com IPR 106 e uma amostra IPR 99 foi confundida com IPR 105. Novamente ressalta-se que estes resultados demonstram que a classificação genotípica é muito mais complexa do que a segmentação geográfica.

Figura 3 - Confiança de classificação das amostras de teste pelos perceptron de múltiplas camadas propostos (rede 4 e 11) para a classificação geográfica e genotípica de café arábica.


A Rede 4 apresenta 20 neurônios na camada de entrada (componentes utilizadas), 2 neurônios na camada oculta e 4 na camada de saída. A Rede 11 apresenta 16 neurônios na camada de entrada, 6 neurônios na camada oculta e 4 na camada de saída. Devido ao elevado número de neurônios da Rede 11, ela apresenta um número muito alto de pesos sinápticos (130). Este número de pesos sinápticos deve ser menor que o número de exemplos utilizados no treinamento da rede neural (72 exemplos) para que ela possa aprender de maneira confiável, ou seja, devem haver graus de liberdade suficiente para que a aprendizagem da rede seja segura, o que não se observa na Rede 11. Portanto, para melhorar o desempenho da classificação genotípica, os autores sugerem a utilização de outro tipo de RNA com menos parâmetros livres.

Figura 4 - Mapa da distância entre as cidades dos cafés estudados.



4. Conclusão


Os perceptrons de múltiplas camadas otimizados foram capazes de classificar geograficamente as amostras de café arábica. Entretanto, para a classificação genotípica o desempenho não foi totalmente satisfatório. Além disso, o perceptron de múltiplas camadas desenvolvido para classificação genotípica apresenta um número muito elevado de pesos sinápticos, não proporcionando número suficiente de graus de liberdade para que a rede neural possa aprender de maneira confiável. As redes que utilizaram a faixa de 1900-800 cm-1 do espectro FTIR obtiveram menor erro quadrado médio e maior porcentagem de classificação correta para a segmentação das amostras de café arábica tanto por região de cultivo quanto por genótipo. Nos próximos trabalhos serão avaliadas a aplicação de outras redes neurais e a informação do infravermelho próximo na tentativa de melhorar a classificação dos genótipos.

5. Referências

ABIC. Indicadores da indústria de café no Brasil – 2012. http://www.abic.com.br/publique/cgi/cgilua.exe/sys/start.htm?sid=61#1389, 2012. Acesso em: 26 de Agosto de 2012.


BISHOP, C. M. Neural Networks for Pattern Recognition. Oxford: Oxford University: 1995. 482p.
BONA, E. et al. Optimized Neural Network for Instant Coffee Classification through an Electronic Nose. International Journal of Food Engineering, v. 7, 2011.
BORSATO, D. et al. Application of artificial neural networks in the geographical identification of coffee samples. Eur Food Res Technol, v. 233, p. 533-543, 2011.
BRANDEN, K. V.; HUBERT, M. Robust classification in high dimensions based on the SIMCA Method. Chemometrics and Intelligent Laboratory Systems, v. 79, p. 10-21, 2005.
BRASIL. Regulamento técnico de identidade e de qualidade para a classificação do café beneficiado e de grão verde. Instrução Normativa n° 8 de 11 jun. 2003. http://www.claspar.pr.gov.br/arquivos/File/pdf/cafebenef008_03.pdf, 2011. Acesso em: 09 de novembro de 2011.
BRIANDET, R.; KEMSLEY, E. K.; WILSON, R. H. Approaches to Adulteration Detection in Instant Coffees using Infrared Spectroscopy and Chemometrics. J Sci Food Agric, v. 71, p. 359-366, 1996.
______. Discrimination of Arabica and Robusta in Instant Coffee by Fourier Transform Infrared Spectroscopy and Chemometrics. J. Agric. Food Chem., v. 44, p. 170-174, 1996.
CECAFÉ. Dados estatísticos. http://www.cncafe.com.br/ba/file/CECAFE%20-%20Resumo%20das%20Exportacoes%20de%20Cafe%20MARCO%202012.pdf, 2012. Acesso em: 19 de Outubro de 2012.
COSTA FILHO, P. A. D.; POPPI, R. J. Aplicação de algoritmos genéticos na seleção de variáveis em espectroscopia no infravermelho médio: determinação simultânea de glicose, maltose e frutose. Química Nova, v. 25, p. 46-52, 2002. ISSN 0100-4042.
DOWNEY, G. et al. Near- and Mid-Infrared Spectroscopies in Food Authentication: Coffee Varietal Identification. J. Agric. Food Chem., v. 45, p. 4357-4361, 1997.
FARAH, A. Coffee as a speciality and functional beverage. Cambridge: Woodhead Publishing Limited: 2009. p.370-395.
GALÃO, O. F. et al. Artificial Neural Networks in the Classification and Identification of Soybean Cultivars by Planting Region. J. Braz. Chem. Soc., v. 22, p. 142-147, 2011.
GAO, F.; HAN, L. Implementing the Nelder-Mead simplex algorithm with adaptive parameters. Comput Optim Appl, v. 51, p. 259–277, 2012.
HAIR, J. F. et al. Análise Fatorial em: Análise Multivariada de Dados. 5ªed. Porto Alegre: Bookman, 2005. 38p.
HAYKIN, S. Redes Neurais: Princípios e Prática. 2ª edição. Porto Alegre: Bookman, 2001. 900p.
HIMMELBLAU, D. M. Applied Nonlinear Programming. 1972.
HUANG, Y.; KANGAS, L. J.; RASCO, B. A. Applications of artifical neural networks (ANNs) in food science. Critical Reviews in Food Science and Nutrition., v. 47, p. 13, 2007.
KAROUI, R.; DOWNEY, G.; BLECKER, C. Mid-Infrared Spectroscopy Coupled with Chemometrics: A Tool for the Analysis of Intact Food Systems and the Exploration of Their Molecular Structure-Quality Relationships - A Review. Chemical Reviews, v. 110, p. 6144-6167, 2010.
KEMSLEY, E. K.; RUAULT, S.; WILSON, R. H. Discrimination between Coffea arabica and Coffea canephora variant robusta beans using infrared spectroscopy. Food Chemistry, v. 54, p. 321-327, 1995.
LUCIA, S. M. D.; MINIM, L. A. Redes Neurais Artificiais: Fundamentos e Aplicações. 2006. p.173-194.
LYMAN, D. J. et al. FTIR-ATR Analysis of Brewed Coffee: Effect of Roasting Conditions. J. Agric. Food Chem., v. 51, p. 3268-3273, 2003.
MARINI, F. Artificial neural networks in foodstuff analyses: Trends and perspectives A review. Analytica Chimica Acta, v. 635, p. 121–131, 2009.
NAKAI, S.; KOIDE, R.; EUGESTER, K. A. A new mapping super-simplex optimization for food products and process development. J. Food Sci., v. 49, p. 1143-1148, 1984.
NELDER, J. A.; MEAD, R. A. simplex method for function minimization. Computer J, v. 7, p. 308-312, 1965.
NETO, B. D. B.; SCARMINIO, I. S.; BRUNS, R. E. Como fazer experimentos. Pesquisa e desenvolvimento na ciência e na indústria. 4ªed. Porto Alegre: Bookman, 2010. 413p.
PIRES, M. V. P.; BORSATO, D.; SILVA, R. S. F. Desenvolvimento de aplicativo para microinformática visando a otimização de sistemas alimentares, 16, 1998, Rio de Janeiro. Anais ... SBCTA. Em: Congresso Brasileiro de Ciência e Tecnologia de Alimentos, v. 3, p. 1565-1568, 1998.
PÉREZ-MAGARIÑO, S. et al. Comparative study of artificial neural network and multivariate methods to classify Spanish DO rose wines. Talanta, v. 62, n. 5, p. 983-990, 2004. ISSN 0039-9140. Disponível em: < http://www.sciencedirect.com/science/article/pii/S0039914003006155 >.
RIBEIRO, J. S.; SALVA, T. J.; FERREIRA, M. M. C. Chemometric studies for quality control of processed brazilian coffees using drifts. Journal of Food Quality, v. 33, p. 212-227, 2010.
RUBAYIZA, A. B.; MEURENS, M. Chemical discrimination of arabica and robusta coffees by Fourier transform Raman spectroscopy. Journal of Agriculture and Food Chemistry, v. 53, p. p.4654-4659, 2005.
SATO, H. P. et al. Viabilidade de uso do FTIR e análise multivariada para a segmentação de amostras de café verde. XVII Seminário de Iniciação Científica e Tecnológica da UTFPR - SICITE. Curitiba: 8 p. 2012.
SINDICAFÉ. Dados Estatísticos. http://sindicafe.com.br/plus/modulos/conteudo/?tac=cafe-no-mundo, 2011. Acesso em: 24 de Novembro de 2012.
SPLENDLEY, W.; HIMSWORTH, F. R.; HEXT, G. R. Sequential application of simplex designs in optimization and evolutionary operation. Technometrics, v. 4, p. 441-461, 1962.
SUKTHOMYA, W.; TANNOCK, J. The optimization of neural network parameters using Taguchi's design of experiments approach: an application in manufacturing process modeling. Neural Computation & Application, v. 14, p. 7, 2005.
SÁ, J. P. M. D. Applied Statistics Using SPSS, STATISTICA, MATLAB and R. 2nd ed. New York: 2007.
WANG, J. et al. Fourier Transform Infrared Spectroscopy for Kona Coffee Authentication. Journal of food science, v. 74, p. 385-389, 2009.
WANG, N.; FU, Y.; LIM, L.-T. Feasibility Study on Chemometric Discrimination of Roasted Arabica Coffees by Solvent Extraction and Fourier Transform Infrared Spectroscopy. J. Agric. Food Chem., v. 59, p. 3220-3226, 2011.


Catálogo: files old -> files -> journals
journals -> AvaliaçÃo das características físico-químicas da cachaça industrial e artesanal comercializadas no centro norte paranaense
journals -> AvaliaçÃo das características físico-químicas da cachaça industrial e artesanal comercializadas no centro norte paranaense
journals -> Apis mellifera do nordeste brasileiro em funçÃo do tempo de armazenamento em entreposto para exportaçÃo resumo
journals -> ANÁlise físico-química de leite cru do município de nanuque – mg nery, A. M.;* Moura Jr., M. R; Locatelli, G.; Vilas Boas, L. A.; Moura Martins, D. P. Resumo
journals -> Evolution of acidity of milk in different methods of conservation
journals -> Conservação de salsichas utilizando biofilme de quitosana Conservation of sausages utilizing chitosan biofilm Resumo
journals -> Escherichia coli Microbiological analysis of milk unfermented kefir produced with milk contaminated by
journals -> Conservação de salsichas utilizando biofilme de quitosana Conservation of sausages utilizing chitosan biofilm Resumo
journals -> Perceptron de múltiplas camadas otimizado para a classificação geográfica de quatro genótipos de café arábica
journals -> Atualidades sobre a química e a utilização do urucum

Baixar 470.99 Kb.

Compartilhe com seus amigos:
1   2




©bemvin.org 2020
enviar mensagem

    Página principal
Prefeitura municipal
santa catarina
Universidade federal
prefeitura municipal
pregão presencial
universidade federal
outras providências
processo seletivo
catarina prefeitura
minas gerais
secretaria municipal
CÂmara municipal
ensino fundamental
ensino médio
concurso público
catarina município
Dispõe sobre
reunião ordinária
Serviço público
câmara municipal
público federal
Processo seletivo
processo licitatório
educaçÃo universidade
seletivo simplificado
Secretaria municipal
sessão ordinária
ensino superior
Relatório técnico
Universidade estadual
Conselho municipal
técnico científico
direitos humanos
científico período
espírito santo
pregão eletrônico
Curriculum vitae
Sequência didática
Quarta feira
prefeito municipal
distrito federal
conselho municipal
língua portuguesa
nossa senhora
educaçÃo secretaria
segunda feira
Pregão presencial
recursos humanos
Terça feira
educaçÃO ciência
agricultura familiar