Uso de Redes Neurais Recorrentes para Modelagem de Propagação Não Linear de Pulsos Ópticos e Geração de Supercontínuos
Nome: GUSTAVO ROSSI MARTINS
Data de publicação: 19/04/2024
Banca:
Nome | Papel |
---|---|
CARLOS EDUARDO SCHMIDT CASTELLANI | Presidente |
HELDER ROBERTO DE OLIVEIRA ROCHA | Coorientador |
JORGE LEONID ACHING SAMATELO | Examinador Interno |
REGINALDO BARBOSA NUNES | Examinador Externo |
Resumo: As fibras óticas formam o backbone do sistema de telecomunicações moderno, interligando países e continentes via extensos cabos submarinos. Mesmo com uma atenuação de apenas 0,2 dB/km, esse meio de comunicação não é tão transparente ou passivo, e seus efeitos de dispersão e auto-modulação de fase podem ser destrutivos para os sistemas de comunicação. Tais efeitos são demasiado complexos e exigem simulações computacionais sofisticadas baseadas na equação não linear de Schrödinger (NLSE). O algorítimo estado da arte splitstep Fourier é uma solução simples para avaliar a propagação de pulsos óticos, contudo, esse método pode ser um gargalo para experimentos em tempo real, casos muito não lineares, ou com grande número de simulações numéricas. O presente trabalho faz uso de redes neurais recorrentes para predizer a evolução temporal e espectral no caso de propagação não linear de pulsos óticos, dispensando o uso de soluções numéricas no modelo. Devido ao caráter temporal do problema de propagação, faz sentido o uso de redes recorrentes como a long short-term memory (LSTM). Na primeira etapa do trabalho foram testadas duas redes, a LSTM e a convolutional LSTM (CLSTM). Uma gama de hiperparâmetros foi testado empiricamente em busca da configuração que melhor captura as transformações ópticas. Ambas redes apresentaram boa performance, com R2 > 96%, no entanto, uma análise mais profunda, estendendo as condições iniciais, e a forma de onda do pulso, evidenciou a dificuldade da CLSTM em se adaptar, destacando a LSTM, com erro máximo de RMSE = 5,328 ×103. Na segunda etapa, buscamos generalizar a aplicação das redes também para o domínio espectral. A rede bidirecional LSTM (BiLSTM) é proposta devido a sua estrutura mais complexa, bidirecional, para capturar os efeitos não lineares mais complicados. O domínio temporal e espectral são tratados simultaneamente nesse caso. A BiLSTM apresentou excelente desempenho, com R2 > 97% para ambos domínios, com RMSE = 4,39×103 no domínio temporal e com RMSE = 1,21×102 no domínio espectral, superior ao LSTM para as mesmas condições. Ainda, as mesmas redes foram aplicadas para um caso de geração de supercontínuo, mais complexo, e ambas redes apresentaram bons resultados. A BiLSTM, por exemplo, apresentou um RMSE = 1,75×102 no domínio temporal e RMSE =1,32×102 no domínio espectral. Este trabalho contribui para as aplicações de machine learning em fotônica não linear, auxiliando na construção de modelos neurais para lidar com dinâmicas presentes na propagação de pulsos ópticos e geração de supercontínuos.