Modelo empírico da dinâmica de produção de etanol baseado em redes de aprendizagem profunda LSTM [recurso eletrônico]
DISSERTAÇÃO
Português
T/UNICAMP So85m
[Empirical modeling of ethanol production dynamics using long short-term memory recurrent neural networks]
Campinas, SP : [s.n.], 2021.
1 recurso online (98 p.) : il., digital, arquivo PDF.
Orientadores: Flávio Vasconcelos da Silva, Rodolpho Rodrigues Fonseca
Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Química
Resumo: A biotecnologia tem papel fundamental no desenvolvimento de produtos específicos devido à alta complexidade estrutural das substâncias desejadas que impede a obtenção via rota química, à implementação fácil e barata dos processos e ao menor custo de operação. Apesar do amplo uso dos...
Resumo: A biotecnologia tem papel fundamental no desenvolvimento de produtos específicos devido à alta complexidade estrutural das substâncias desejadas que impede a obtenção via rota química, à implementação fácil e barata dos processos e ao menor custo de operação. Apesar do amplo uso dos processos biotecnológicos, a operação contínua está sujeita a alta variabilidade dos produtos finais em consequência da grande susceptibilidade dos sistemas biológicos aos efeitos de diversas variáveis. Desse modo, a modelagem fenomenológica torna-se menos precisa por simplificações assumidas no modelo tais como invariabilidade dos parâmetros cinéticos ou por não contabilizar os efeitos de algumas variáveis importantes do sistema, porém, não contempladas no modelo matemático e que muitas vezes estão disponíveis nos bancos de dados. Assim, foram desenvolvidos modelos empíricos baseados em redes recorrentes com topologia Long Short-Term Memory para predizer o comportamento dinâmico das variáveis endógenas volume e concentrações de células, de substrato e de etanol em um processo de fermentação alcoólica. O banco de dados foi obtido por meio de simulação numérica empregando um modelo fenomenológico com parâmetros cinéticos variantes por meio de redes neurais artificiais adaptados às condições operacionais propostas. Três variáveis exógenas foram modificadas para gerar o banco de dados e descrever o comportamento das variáveis de processo. O melhor modelo obtido para predição apresentou vinte neurônios e três passos temporais, alta capacidade de generalização como visto pelo baixo valor de MSE de 2,21·10-4, grande correlação linear representado pelos coeficientes de determinação R2 próximos à unidade e não apresentou repetição do valor das entradas endógenas como predições. Entretanto, esse modelo não foi capaz de operar em simulação recursiva, ou seja, empregando suas predições como entradas posteriores, para três diferentes bancos de dados. O MSE total foi calculado em 6,98·10-2 e os altos erros relativos indicam a grande influência das variáveis endógenas no desempenho do modelo. Assim, novas redes com maior complexidade da topologia foram treinadas para verificar a viabilidade de usá-las em modo recursivo. Entre os novos modelos, a rede com 30 neurônios, 7 passos temporais e duas unidades LSTM empilhadas apresentou melhor desempenho com MSE de 1,32·10-3. Os erros percentuais foram reduzidos para um valor máximo de 12%, e as respostas preditas distam dos valores reais em aproximadamente a faixa de precisão dos sensores comerciais
Abstract: Biotechnology has a central role in the manufacturing of specific products due to the high structural complexity of the desired substances that prevents obtaining them via chemical route, the easy and inexpensive implementation and the lower cost of operation. Despite the widespread use of...
Abstract: Biotechnology has a central role in the manufacturing of specific products due to the high structural complexity of the desired substances that prevents obtaining them via chemical route, the easy and inexpensive implementation and the lower cost of operation. Despite the widespread use of biotechnology processes, the continuous operation is subject to high variability of final products as result of the susceptibility of biological systems to the effects of several variables. In this way, phenomenological modeling becomes less precise due to the simplifications of the proposed model such as kinetic parameters invariability or because it does not account for the effects of some important system variables that are not included in the mathematical model, although they are often available in databases. Thereby, empirical models based on Long Short-Term Memory recurrent neural networks were developed to predict the dynamic behavior of the endogenous variables volume and cell, substrate and ethanol concentrations in a alcoholic fermentation process. The database was generated through numerical simulation applying a phenomenological model in which the kinetic parameters were varied by an artificial neural network according to the operational conditions. Three exogenous variables were modified to generate the database that describes the process variables behavior. The best prediction model obtained had ten neurons and one time-step, high generalization capability as shown by its low MSE of 2,21·10-4, high linear correlation indicated by the determination coefficients R2 near to unity and it did not show repetition of the endogenous input values as predictions. However, this model was not able to operate in a recursive simulation, that is, using its predictions as future inputs, for three different datasets. The total MSE calculated as 6.98·10-2 and the high relative errors indicate that the endogenous inputs have great influence on the model performance. Thereby, more complex networks were trained to verify the viability of using them in recursive mode. Amongst the new models, the 2 stacked LSTM, 30 neurons and 7 time-steps network showed the best results with MSE equals to 1.32·10-3. Maximum relative errors were reduced to 12% and the predicted responses differ from the real values in approximately the accuracy range of commercial sensors
Requisitos do sistema: Software para leitura de arquivo em PDF