Dissertations / Theses on the topic 'Linear Quadratic Regulator'
Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles
Consult the top 50 dissertations / theses for your research on the topic 'Linear Quadratic Regulator.'
Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.
You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.
Browse dissertations / theses on a wide variety of disciplines and organise your bibliography correctly.
Mouadeb, Abdu-Nasser R. "Extension of linear quadratic regulator theory and its applications." Thesis, University of Ottawa (Canada), 1992. http://hdl.handle.net/10393/7535.
Full textBenner, Peter, and Jens Saak. "Linear-Quadratic Regulator Design for Optimal Cooling of Steel Profiles." Universitätsbibliothek Chemnitz, 2006. http://nbn-resolving.de/urn:nbn:de:swb:ch1-200601597.
Full textKhalid, Muhammad Salman. "Linear Quadratic Regulator and Receding Horizon Control for Constrained Systems." Thesis, University of Sheffield, 2009. http://ethos.bl.uk/OrderDetails.do?uin=uk.bl.ethos.515489.
Full textAravinthan, Abhiramy. "Linear quadratic regulator design for doubly fed induction generator using singular perturbation techniques." Thesis, Wichita State University, 2012. http://hdl.handle.net/10057/5523.
Full textThesis (M.S.)--Wichita State University, College of Engineering, Dept. of Electrical Engineering and Computer Science
Nelson, Karen E. (Karen Elizabeth) M. Eng Massachusetts Institute of Technology. "Active control of tensegrity structures and its applications using Linear Quadratic Regulator algorithms." Thesis, Massachusetts Institute of Technology, 2011. http://hdl.handle.net/1721.1/66845.
Full textCataloged from PDF version of thesis.
Includes bibliographical references (p. 61-62).
The concept of responsive architecture has inspired the idea structures which are adaptable and change in order to better fit the user. This idea can be extended to structural engineering with the implementing of structures which change to better take on their external loading. The following text explores the utilization of active control for tensegrity systems in order to achieve an adaptable structure. To start, a background of the physical characteristics of these structures is given along with the methods which are used to find their form. Next, the different methods which have been previously used to achieve active control in tensegrity are reviewed as well as the objectives they intended to achieve. From there, the Linear Quadratic Regulator (LQR) algorithm is introduced as a possible method to be used in designing active control. A planar tensegrity beam is described, whose form was found by the force density method. A simulation is then conducted, which applies the LQR algorithm to this structure for the purposes of active control. This simulation served both to demonstrate the force density and LQR methods, as well as to study how different control parameters and actuator placements effects the efficiency of the control. This text concludes with a discussion of the results of this simulation.
by Karen E. Nelson.
M.Eng.
Uddin, Md Mosleh. "Active Vibration Control of Helicopter Rotor Blade by Using a Linear Quadratic Regulator." ScholarWorks@UNO, 2018. https://scholarworks.uno.edu/td/2499.
Full textBushong, Philip Merton. "A multi-loop guidance scheme using singular perturbation and linear quadratic regulator techniques simultaneously." Diss., This resource online, 1991. http://scholar.lib.vt.edu/theses/available/etd-07282008-135643/.
Full textVugrin, Eric D. "On Approximation and Optimal Control of Nonnormal Distributed Parameter Systems." Diss., Virginia Tech, 2004. http://hdl.handle.net/10919/11149.
Full textPh. D.
Bagheri, Shahriar. "Modeling, Simulation and Control System Design for Civil Unmanned Aerial Vehicle (UAV)." Thesis, Umeå universitet, Institutionen för tillämpad fysik och elektronik, 2014. http://urn.kb.se/resolve?urn=urn:nbn:se:umu:diva-96458.
Full textAlvarez, Genesis Barbie. "Control Design for a Microgrid in Normal and Resiliency Modes of a Distribution System." Thesis, Virginia Tech, 2019. http://hdl.handle.net/10919/94627.
Full textMaster of Science
Reliable power supply from the electric grid is an essential part of modern life. This critical infrastructure can be vulnerable to cascading failures or natural disasters. A solution to improve power systems resilience can be through microgrids. A microgrid is a small network of interconnected loads and distributed energy resources (DERs) such as microturbines, wind power, solar power, or traditional internal combustion engines. A microgrid can operate being connected or disconnected from the grid. This research emphases on the potentially use of a Microgrid as a resiliency source during grid restoration to pick up critical load. In this research, controllers are designed to pick up critical loads (i.e hospitals, street lights and military bases) from the distribution system in case the electric grid is unavailable. This case study includes the design of a Microgrid and it is being tested for its feasibility in an actual integration with the electric grid. Once the grid is restored the synchronization between the microgrid and electric must be conducted. Synchronization is a crucial task. An abnormal synchronization can cause a disturbance in the system, damage equipment, and overall lead to additional system outages. This thesis develops various controllers to conduct proper synchronization. Interconnecting inverter-based distributed energy resources (DERs) such as photovoltaic and battery storage within the distribution system can use the electronic devices to improve power quality. This research focuses on using these devices to improve the voltage profile within the distribution system and the frequency within the Microgrid.
Krueger, Denise A. "Stabilized Finite Element Methods for Feedback Control of Convection Diffusion Equations." Diss., Virginia Tech, 2004. http://hdl.handle.net/10919/11214.
Full textPh. D.
Monte, Alegre Dário [UNESP]. "Metodologia dos observadores de estado para diagnose de falhas em sistemas contendo elementos finitos de placas de Kirchoff." Universidade Estadual Paulista (UNESP), 2009. http://hdl.handle.net/11449/94560.
Full textFundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)
O presente trabalho apresenta a metodologia dos observadores de estado para a detecção e localização de falhas em sistemas contendo elementos finitos de placas de Kirchoff. Tal metodologia consiste na montagem de um banco de observadores de estado, o qual é capaz de detectar falhas presentes no sistema, além de localizar o componente danificado e a porcentagem de falha. As matrizes de ganho dos observadores de estado foram determinadas por dois métodos distintos: o método Regulador Quadrático Linear e das Desigualdades Matriciais Lineares. Nesse trabalho, foi utilizada uma placa plana fina montada sobre um sistema de suspensão similar ao de uma plataforma veicular, representando um veiculo simplificadamente. A modelagem da plataforma utilizada foi realizada mediante a utilização do método dos elementos finitos, considerando-se diferentes números de elemento no modelo. O tipo do elemento finito utilizado foi o elemento de placa de Kirchoff. Adicionalmente foi analisada a influência de elementos de controle junto à suspensão da plataforma no movimento da mesma. O modelo considerado, juntamente com os programas computacionais desenvolvidos, foram utilizados para a simulação do movimento da plataforma. Na literatura, normalmente são apresentadas simulações para o movimento de apenas ¼ do veículo, neste trabalho, no entanto, os programas desenvolvidos podem simular o movimento do veiculo inteiro. Foram realizadas simulações computacionais para o movimento da plataforma com a finalidade de se detectar e localizar falhas introduzidas nos elementos da suspensão e também foram realizados testes experimentais, com os mesmos fins. Mediante tais testes (teóricos e experimentais) verificou-se a eficácia da metodologia desenvolvida e a sua principal limitação: o número de elementos finitos considerado no modelo relacionado com o número de medidas efetuadas e a observabilidade do sistema.
This work presents the state observers methodology for the detection and location of faults in systems containing finite elements of plate of Kirchoff. This methodology consists in the assembly of a bank of state observers, which is capable of detecting faults in the system, and also to locate the damaged component and the percentage of failure. The gain matrices of the state observers were determined by two different methods, these are the method Linear Quadratic Regulator and the Linear Matrix Inequalities. In this work was considered a thin plate mounted on a suspension system that is similar to a vehicle platform, representing a vehicle in a simplified way. The modeling of the platform used was performed by using the finite element method, considering different numbers of element in the model. The finite element used was the Kirchoff’s plate element. It was also studied the influence of elements of control, together with the suspension of the platform, into its movement. The model considered, together with the developed computational programs, were used to simulate the movement of the platform. In the literature, usually are presented simulations for the movement of only ¼ of the vehicle, in this work, the developed programs can simulate the movement of the entire vehicle. It was realized computational simulations for the movement of the platform in order to detect and locate faults introduced in the elements of the suspension and experimental tests were also conducted with the same purpose. Through such tests (theoretical and experimental) it was verified the effectiveness of the developed methodology and its major limitation: the number of finite elements considered in the model related with the number of outputs and the observability of the system.
Giesselmann, Jens Uwe Michael, and jens giesselmann@gmx net. "Development of an Active Magnetic Attitude Determination and Control System for Picosatellites on highly inclined circular Low Earth Orbits." RMIT University. Aerospace, Mechanical and Manufacturing Engineering, 2006. http://adt.lib.rmit.edu.au/adt/public/adt-VIT20070514.162516.
Full textSILVA, Márcio Eduardo Gonçalves. "Algoritmos da Família LMS para a Solução Aproximada da HJB em Projetos Online de Controle Ótimo Discreto Multivariável e Aprendizado por Reforço." Universidade Federal do Maranhão, 2014. http://tedebc.ufma.br:8080/jspui/handle/tede/1891.
Full textMade available in DSpace on 2017-09-04T13:10:41Z (GMT). No. of bitstreams: 1 Marcio Eduardo.pdf: 7939176 bytes, checksum: 3b90c4b32aeabafd3b87e4f3c36d2ed6 (MD5) Previous issue date: 2014-08-21
The technique of linear control based on the minimization of a quadratic performance index using the second method of Lyapunov to guarantee the stability of the system, if this is controllable and observable. however, this technique is inevitably necessary to find the solution of the HJB or Riccati equation. The control system design online need, real time, to adjust your feedback gain to maintain a certain dynamic, it requires the calculation of the Riccati equation solution in each sampling generating a large computational load that can derail its implementation. This work shows an intelligent control system design that meets the optimal or suboptimal control action from the sensory data of process states and the instantaneous cost observed after each state transition. To find this optimal control action or policy, the approximate dynamic programming and adaptive critics are used, based on the parameterizations given by the problem of linear quadratic regulator (LQR), but without explicitly solving the associated Riccati equation. More specifically, the LQR problem is solved by four different methods which are the Dynamic Programming Heuristic, the Dual Heuristic Dynamic Programming, Action Dependent Dynamic Programming Heuristic and Action Dependent Dual Heuristic Dynamic Programming algorithms. However, these algorithms depend on knowledge of the value functions to derive the optimal control actions. These value functions with known structures have their parameters estimated using the least mean square family and Recursive Least Squares algorithms. Two processes that have the Markov property were used in the computational validation of the algorithms adaptive critics implemented, one corresponds to the longitudinal dynamics of an aircraft and the other to an electrical circuit.
A técnica de controle linear baseado na minimização de um índices de desempenho quadrático utilizando o segundo método de Liapunov garante a estabilidade do sistema, se este for controlável e observável. Por outro lado, nessa técnica inexoravelmente é necessário encontrar a solução da Equação Hamilton-Jacobi-Bellman (HJB) ou Riccati. Em projeto de sistema de controle online que necessita, em tempo real, alterar seus ganhos de retroação para manter uma certa dinâmica, impõe o cálculo da solução da equação de Riccati em cada instante de amostragem gerando uma grande carga computacional que pode inviabilizar sua implementação. Neste trabalho, mostra-se o projeto de um sistema de controle inteligente que encontra a ação de controle ótima ou subótima a partir de dados sensoriais dos estados do processo e do custo instantâneo observados após cada transição de estado. Para encontrar essa ação de controle ou política ótima, a programação dinâmica aproximada ou críticos adaptativos são utilizados, tendo como base as parametrizações dado pelo problema do regulador linear quadrático (LQR), mas sem resolver explicitamente a equação de Riccati associada. Mais especificamente, o problema do LQR é resolvido por quatro métodos distintos que são os algoritmos de Programação Dinâmica Heurística, a Programação Dinâmica Heurística Dual, a Programação Dinâmica Heurística Dependente de Ação e a Programação Dinâmica Heurística Dual Dependente de Ação. Entretanto, esses algoritmos dependem do conhecimento das funções valor para, assim, derivar as ações de controle ótimas. Essas funções valor com estruturas conhecidas tem seus parâmetros estimados utilizando os algoritmos da família dos mínimos quadrados médios e o algoritmo de Mínimos Quadrados Recursivo. Dois processos que obedecem à propriedade de Markov foram empregados na validação computacional dos algoritmos críticos adaptativos, um corresponde à dinâmica longitudinal de uma aeronave e o outro à de um circuito elétrico.
Ababnah, Ahmad A. "Sensor deployment in detection networks-a control theoretic approach." Diss., Kansas State University, 2010. http://hdl.handle.net/2097/6699.
Full textDepartment of Electrical and Computer Engineering
Balasubramaniam Natarajan
For any automated surveillance operation to be successful, it is critical to have sensing resources strategically positioned to observe, interpret, react and maybe even predict events.In many practical scenarios, it is also expected that different zones within a surveillance area may have different probability of event detection (or false alarm) requirements. The operational objective in such surveillance systems is to optimize resources (number of sensors and the associated cost) and their deployment while guaranteeing a certain assured level of detection/false alarm performance. In this dissertation, we study two major challenges related to sensor deployment in distributed sensor networks (DSNs) for detection applications. The first problem we study is the sensor deployment problem in which we ask the following question: Given a finite number of sensors (with a known sensing profile), how can we deploy these sensors such that we best meet the detection and false alarm requirements in a DSN employing a specific information fusion rule? Even though sensor deployment has garnered significant interest in the past, a unified, analytical framework to model and study sensor deployment is lacking. Additionally, the algorithms proposed in literature are typically heuristic in nature and are limited to (1) simplistic DSN fusion architectures, and (2) DSNs with uniform detection/false alarm requirements. In this dissertation, we propose a novel treatment of the sensor deployment problem using concepts from optimal control theory. Specifically, the deployment problem is formulated as a linear quadratic regulator (LQR) problem which provides a rigorous and analytical framework to study the deployment problem. We develop new sensor deployment algorithms that are applicable to a wide range of DSN architectures employing different fusion rules such as (1) logical OR fusion; (2) value fusion; (3) majority decision fusion, and (4) optimal decision fusion. In all these cases, we demonstrate that our proposed control theoretic deployment approach is able to significantly outperform previously proposed algorithms. The second problem considered in this dissertation is the “self healing” problem in which we ask the following question: After the failure of a number of sensors, how can one reconfigure the DSN such that the performance degradation due to sensor loss is minimized? Prior efforts in tackling the self healing problem typically rely on assumptions that don’t accurately capture the behavior of practical sensors/networks and focus on minimizing performance degradation at a local area of the network instead of considering overall performance of the DSN. In this work, we propose two self healing strategies the first approach relies on adjusting decision thresholds at the fusion center. The second approach involves sensor redeployment based on our control theoretic deployment framework. Simulation results illustrate that the proposed algorithms are effective in alleviating the performance degradation due to sensor loss.
Ortega, Felix Mauricio Escalante. "Filtragem e controle recursivos robustos aplicados em um pêndulo invertido." Universidade de São Paulo, 2016. http://www.teses.usp.br/teses/disponiveis/18/18153/tde-15092016-075814/.
Full textThe study of stability and performance in control systems is a relevant topic in systems theory. When uncertainties are considered in the model of the plant, there is a greater difficulty in ensuring an appropriate performance level of the dynamic system, plus, the stability could be compromised as well. In this dissertation a robust linear quadratic regulator and a robust Kalman filter are used in a unified manner to deal with uncertain dynamic systems in real time. The selected case study is the inverted pendulum. Its main control challenges found in the literature will be considered: stabilization, tracking and catching swing-up. The used algorithms are motivated by the fact that stochastic problems can be solved through deterministic arguments based on the concepts of penalty function and regularized least-squares. Thus, it is possible to obtain an optimal performance for the maximum acceptable uncertainty. The performance analysis of the robust control is carried out by practical experiments including uncertainties in the plant, noise in the sensors and disturbance in the pendulum control signal.
Brito, Filho Joaquim Gomes. "CONTROLE ROBUSTO LQG/LTR COM RECUPERAÇÃO DO GANHO DA MALHA DE TRANSFERÊNCIA." Universidade Federal do Maranhão, 2006. http://tedebc.ufma.br:8080/jspui/handle/tede/392.
Full textIn this work is presented a method to solve the Eigenstructure Allocation pro- blem for multivariable dynamic systems by means of Robust Controllers Design Linear Quadratic Gaussian, LQG/LTR Loop transfer Recovery and Hierarchical Genetic Algorithm in three levels. It shows an uni¯ed method for controllers ro- bust design that are one systematical of the three stages of LQG/LTR methodo- logy. The evolutionary computation is used in the primary level that is the gain controller optimal determination to guarantee the terms of robust stability. The intermediary level, consists in the utilization of a AG to determine the Kalman state observer gain. The last level of this hierarchy consists of recovery the ro- bustness properties of the LQR design which were lost due to inclusion of the LQG loop by means of a GA. The method is veri¯ed in a dynamic system which represents an aircraft in cruzeiro speed, a LQG/LQR-hierarchic design perfor- mance analysis in the frequency domain and of time show the commitments that should be taken over in applications of the real world systems.
Apresenta-se um método para resolver o problema de Alocação de Auto-estrutura para sistemas dinâmicos multivariáveis por meio do Projeto de Controladores Ro- busto Gaussiano Linear Quadrático, Recuperação da Malha de Transferência e Algoritmo Genético Hierárquico em três níveis. Mostra-se um método unificado para o projeto de controladores robustos que são uma sistematização das três etapas da metodologia LQG/LTR. A computação evolutiva é utilizada no nível primário que é a determinação dos ganhos do controlador ótimo para garantir as condições de estabilidade robusta. O nível intermediário, consiste na utilização de um AG para determinar os ganhos de Kalman do observador de estado. O último nível desta hierarquia consiste da recuperação das propriedades de ro- bustez do projeto LQR que foram perdidas devido a inclusão da malha LQG por meio de um AG. O método é verficado em um sistema dinâmico que re- presenta uma aeronave em velocidade cruzeiro, uma análise de desempenho do projeto LQG/LQR-hierárquico no domínio da frequência e do tempo mostram os compromissos que devem ser assumidos em aplicações de sistemas do mundo real.
Kaplan, Ceren. "Leo Satellites: Attitude Determination And Control Components." Master's thesis, METU, 2006. http://etd.lib.metu.edu.tr/upload/12607189/index.pdf.
Full textVick, Tyler J. "Geometry Modeling and Adaptive Control of Air-Breathing Hypersonic Vehicles." University of Cincinnati / OhioLINK, 2014. http://rave.ohiolink.edu/etdc/view?acc_num=ucin1397468045.
Full textMonte, Alegre Dário. "Metodologia dos observadores de estado para diagnose de falhas em sistemas contendo elementos finitos de placas de Kirchoff /." Ilha Solteira : [s.n.], 2009. http://hdl.handle.net/11449/94560.
Full textBanca: Luiz de Paula do Nascimento
Banca: Silmara Cassola
Resumo: O presente trabalho apresenta a metodologia dos observadores de estado para a detecção e localização de falhas em sistemas contendo elementos finitos de placas de Kirchoff. Tal metodologia consiste na montagem de um banco de observadores de estado, o qual é capaz de detectar falhas presentes no sistema, além de localizar o componente danificado e a porcentagem de falha. As matrizes de ganho dos observadores de estado foram determinadas por dois métodos distintos: o método Regulador Quadrático Linear e das Desigualdades Matriciais Lineares. Nesse trabalho, foi utilizada uma placa plana fina montada sobre um sistema de suspensão similar ao de uma plataforma veicular, representando um veiculo simplificadamente. A modelagem da plataforma utilizada foi realizada mediante a utilização do método dos elementos finitos, considerando-se diferentes números de elemento no modelo. O tipo do elemento finito utilizado foi o elemento de placa de Kirchoff. Adicionalmente foi analisada a influência de elementos de controle junto à suspensão da plataforma no movimento da mesma. O modelo considerado, juntamente com os programas computacionais desenvolvidos, foram utilizados para a simulação do movimento da plataforma. Na literatura, normalmente são apresentadas simulações para o movimento de apenas ¼ do veículo, neste trabalho, no entanto, os programas desenvolvidos podem simular o movimento do veiculo inteiro. Foram realizadas simulações computacionais para o movimento da plataforma com a finalidade de se detectar e localizar falhas introduzidas nos elementos da suspensão e também foram realizados testes experimentais, com os mesmos fins. Mediante tais testes (teóricos e experimentais) verificou-se a eficácia da metodologia desenvolvida e a sua principal limitação: o número de elementos finitos considerado no modelo relacionado com o número de medidas efetuadas e a observabilidade do sistema.
Abstract: This work presents the state observers methodology for the detection and location of faults in systems containing finite elements of plate of Kirchoff. This methodology consists in the assembly of a bank of state observers, which is capable of detecting faults in the system, and also to locate the damaged component and the percentage of failure. The gain matrices of the state observers were determined by two different methods, these are the method Linear Quadratic Regulator and the Linear Matrix Inequalities. In this work was considered a thin plate mounted on a suspension system that is similar to a vehicle platform, representing a vehicle in a simplified way. The modeling of the platform used was performed by using the finite element method, considering different numbers of element in the model. The finite element used was the Kirchoff's plate element. It was also studied the influence of elements of control, together with the suspension of the platform, into its movement. The model considered, together with the developed computational programs, were used to simulate the movement of the platform. In the literature, usually are presented simulations for the movement of only ¼ of the vehicle, in this work, the developed programs can simulate the movement of the entire vehicle. It was realized computational simulations for the movement of the platform in order to detect and locate faults introduced in the elements of the suspension and experimental tests were also conducted with the same purpose. Through such tests (theoretical and experimental) it was verified the effectiveness of the developed methodology and its major limitation: the number of finite elements considered in the model related with the number of outputs and the observability of the system.
Mestre
Mattei, Rafael Daia. "Detecção de danos em sistemas mecânicos via observadores de estado de ordem plena em paralelo /." Ilha Solteira, 2019. http://hdl.handle.net/11449/181663.
Full textResumo: As metodologias de monitoramento da integridade estrutural baseadas em observadores de estado, em sua grande maioria, utilizam o resíduo obtido a partir da diferença entre a medida e a estimativa de dada resposta dinâmica do sistema para o processo de detecção de danos. Contudo, em determinadas situações, tem-se interesse em realizar o monitoramento através de certa resposta dinâmica que não pode ser medida diretamente. Desta forma, a principal contribuição deste trabalho é propor uma metodologia de detecção de danos para sistemas mecânicos, cujo resíduo é obtido a partir da diferença entre as estimativas do comportamento dinâmico de determinada região do sistema. Estas estimativas são geradas por dois observadores de estado de ordem plena em paralelo, ambos projetados a partir do modelo físico-matemático do sistema em monitoramento sem danos, cujos os ganhos ótimos são determinados pelo método LQR, do inglês Linear Quadratic Regulator. A diferença entre os observadores consiste em serem baseados em conjuntos de medidas distintos. Simulações computacionais são apresentadas para demonstrar a aplicação desta metodologia, de maneira que são discutidas as vantagens e desvantagens em monitorar o sistema utilizando diferentes tipos de força de excitação. Os resultados obtidos são satisfatórios para a detecção dos tipos de dano considerados neste trabalho.
Abstract: Structural health monitoring methodologies based on state observers, for the most part, use the residual obtained from the di erence between the measurement and the estimate of the given dynamic response of the system to the damage detection process. However, in certain situations, it is interesting to carry out the monitoring through a certain dynamic response that can not be measured directly. In this way, the main contribution of this work is to propose a methodology of damage detection for mechanical systems, whose residue is obtained from the di erence between the estimates of the dynamic behavior of a certain region of the system. These estimates are generated by two parallel full-order state observers, both designed from the physical-mathematical model of the monitoring system without damages, whose optimal gains are determined by the LQR (Linear Quadratic Regulator) method. The di erence between observers is that they are based on di erent sets of measures. Computational simulations are presented to demonstrate the application of this methodology, so that the advantages and disadvantages of monitoring the system using di erent types of excitation force are discussed. The results obtained are satisfactory for the detection of the types of damage considered in this work.
Mestre
Murari, André Luiz de Lacerda Ferreira. "Regulador quadrático linear ponderado com otimização por enxame de partículas modificado aplicado a geradores de indução com rotor bobinado." reponame:Repositório Institucional da UFABC, 2018.
Find full textCoorientador: Prof. Dr. José Alberto Torrico Altuna
Tese (doutorado) - Universidade Federal do ABC. Programa de Pós-Graduação em Energia, Santo André, 2018.
McDowell, Journey. "Comparison of Modern Controls and Reinforcement Learning for Robust Control of Autonomously Backing Up Tractor-Trailers to Loading Docks." DigitalCommons@CalPoly, 2019. https://digitalcommons.calpoly.edu/theses/2100.
Full textFarrell, Michael David. "Error-State Estimation and Control for a Multirotor UAV Landing on a Moving Vehicle." BYU ScholarsArchive, 2020. https://scholarsarchive.byu.edu/etd/7879.
Full textPrešinský, Ján. "Návrh a rozbor LQ-regulátoru pro podélný a stranový pohyb letadla." Master's thesis, Vysoké učení technické v Brně. Fakulta strojního inženýrství, 2015. http://www.nusl.cz/ntk/nusl-232106.
Full textErdogan, Zeynep. "Development Of A Control Strategy For Road Vehicles With Semi-active Suspensions Using A Full Vehicle Ride Model." Master's thesis, METU, 2009. http://etd.lib.metu.edu.tr/upload/12610392/index.pdf.
Full textJohansson, Stefan. "Tools for Control System Design : Stratification of Matrix Pairs and Periodic Riccati Differential Equation Solvers." Doctoral thesis, Umeå, 2009. http://opac.nebis.ch/cgi-bin/showAbstract.pl?u20=9789172647336.
Full textRÊGO, Patricia Helena Moraes Rêgo. "Convergência de Algoritmo Genético Hierárquico para Recuperação da Malha LQR por Controladores LQG/LTR." Universidade Federal do Maranhão, 2007. http://tedebc.ufma.br:8080/jspui/handle/tede/1852.
Full textMade available in DSpace on 2017-08-22T13:19:28Z (GMT). No. of bitstreams: 1 Patricia Moraes Rêgo.pdf: 1511056 bytes, checksum: 21108136b08107eeb212f5d74ed79ef7 (MD5) Previous issue date: 2007-08-03
FAPEMA
In this work are proposed models and a convergence analysis of a hierarchical genetic algorithm for the linear quadratic regulator design loop recovery through LQG/LTR controllers. Models are oriented to the weighting and covariance matrices searching of the performance indices of the LQR and LQG design, respectively, and to the selection of the matrices for the LQR design loop recovery gain. The convergence analysis aims at promoting the enhancement of the algorithm performance, as well as to generate satisfactory solutions and speed up the convergence time. The algorithm performance is evaluated with respect to the e ects of an elitist strategy embodied into the algorithm and to variations in the values of some given parameters of the algorithm. The proposed methodology is evaluated in a multi-variable dynamical system representing an aircraft.
Propõe-se neste trabalho os modelos e a análise de convergência de um algoritmo genético hierárquico para recuperação da malha de projeto do regulador linear quadrático por controladores LQG/LTR (Linear Quadratic Gaussian/Loop Transfer Recovery). Os modelos dedicam-se à busca das matrizes de ponderações e covariâncias dos índices de desempenho dos projetos de controladores LQR (Linear Quadratic Regulator) e LQG (Linear Quadratic Gaussian), respectivamente, e à seleção de matrizes de ajuste para o ganho de recuperação da malha do projeto LQR. O objetivo da análise de convergência é promover melhorias no desempenho do algoritmo no sentido de gerar soluções satisfatórias e acelerar o tempo de convergência. O desempenho do algoritmo é avaliado em relação aos efeitos de uma estratégia elitista incorporada ao algoritmo e à variações nos valores de determinados parâmetros do algoritmo. A metodologia proposta é avaliada em um sistema dinâmico multivariável que representa uma aeronave.
SILVA, Fabio Nogueira da. "Métodos neuronais para a solução da equação algébrica de Riccati e o LQR." Universidade Federal do Maranhão, 2008. http://tedebc.ufma.br:8080/jspui/handle/tede/1817.
Full textMade available in DSpace on 2017-08-14T18:28:45Z (GMT). No. of bitstreams: 1 FabioSilva.pdf: 1098466 bytes, checksum: a72dcced91748fe6c54f3cab86c19849 (MD5) Previous issue date: 2008-06-20
Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPQ)
Fundação de Amparo à Pesquisa e ao Desenvolvimento Científico e Tecnológico do Maranhão (FAPEMA)
We present in this work the results about two neural networks methods to solve the algebraic Riccati(ARE), what are used in many applications, mainly in the Linear Quadratic Regulator (LQR), H2 and H1 controls. First is showed the real symmetric form of the ARE and two methods based on neural computation. One feedforward neural network (FNN), that de¯nes an error as function of the ARE and a recurrent neural network (RNN), which converts a constrain optimization problem, restricted to the state space model, into an unconstrained convex optimization problem de¯ning an energy as function of the ARE and Cholesky factor. A proposal to chose the learning parameters of the RNN used to solve the ARE, by making a surface of the parameters variations, thus we can tune the neural network for a better performance. Computational experiments related with the plant matrices perturbations of the tested systems in order to perform an analysis of the behavior of the presented methodologies, that are based on homotopies methods, where we chose a good initial condition and compare the results to the Schur method. Two 6th order systems were used, a Doubly Fed Induction Generator(DFIG) and an aircraft plant. The results showed the RNN a good alternative compared with the FNN and Schur methods.
Apresenta-se nesta dissertação os resultados a respeito de dois métodos neuronais para a resolução da equação algébrica de Riccati(EAR), que tem varias aplicações, sendo principalmente usada pelos Regulador Linear Quadrático(LQR), controle H2 e controle H1. É apresentado a EAR real e simétrica e dois métodos baseados em uma rede neuronal direta (RND) que tem a função de erro associada a EAR e uma rede neuronal recorrente (RNR) que converte um problema de otimização restrita ao modelo de espaço de estados em outro de otimização convexa em função da EAR e do fator de Cholesky de modo a usufruir das propriedades de convexidade e condições de otimalidade. Uma proposta para a escolha dos parâmetros da RNR usada para solucionar a EAR por meio da geração de superfícies com a variação paramétrica da RNR, podendo assim melhor sintonizar a rede neuronal para um melhor desempenho. Experimentos computacionais relacionados a perturbações nos sistemas foram realizados para analisar o comportamento das metodologias apresentadas, tendo como base o princípio dos métodos homotópicos, com uma boa condição inicial, a partir de uma ponto de operação estável e comparamos os resultados com o método de Schur. Foram usadas as plantas de dois sistemas: uma representando a dinâmica de uma aeronave e outra de um motor de indução eólico duplamente alimentado(DFIG), ambos sistemas de 6a ordem. Os resultados mostram que a RNR é uma boa alternativa se comparado com a RND e com o método de Schur.
Beteto, Marco Antonio Leite. "Less conservative conditions for the robust and Gain-Scheduled LQR-state derivative controllers design /." Ilha Solteira, 2019. http://hdl.handle.net/11449/180976.
Full textResumo: Neste trabalho é proposta a resolução do problema do regulador linear quadrático (Linear Quadratic Regulator - LQR) via desigualdades matriciais lineares (Linear Matrix Inequalities - LMIs) para sistemas lineares e invariantes no tempo sujeitos a incertezas politópicas, bem como para sistemas lineares sujeitos a parâmetros variantes no tempo (Linear Parameter Varying - LPV). O projeto dos controladores é baseado na realimentação derivativa. A escolha da realimentação derivativa se dá devido à sua fácil implementação em certas aplicações como, por exemplo, no controle de vibrações. Os sinais usados na realimentação são aceleração e velocidade, sendo obtidos por meio de acelerômetros. Por meio do método proposto é possível obter condições LMIs para a síntese de controladores que garantam a estabilização do sistema em malha fechada, sendo que os controladores possuem desempenho otimizado. Para a formulação das condições LMIs, uma função de Lyapunov do tipo quadrática é utilizada. Exemplos teóricos e simulações são utilizados como forma de validação dos métodos propostos, além de mostrar que os novos resultados apresentam condições menos conservadoras. Além disso, ao final é apresentada uma implementação prática em um sistema de suspensão ativa, produzida pela Quanser®.
Abstract: The resolution of linear quadratic regulator (LQR) problem via linear matrix inequalities (LMIs) for linear time-invariant systems subject to polytopic uncertainties, as linear systems subjects to linear parameter varying (LPV), is proposed in this work. The controllers' designs are based on the state derivative feedback. The aim to the choice of the state derivative feedback is your easy implementation in a class of mechanical systems, such as in vibration control, for example. The signals used for feedback are acceleration and velocity, it is obtained by means of accelerometers. Through the proposed method it is possible to obtain LMIs conditions for the synthesis of controllers that guarantee the stabilisation of the closed-loop system, being that the controllers have optimised performance. For the LMIs conditions formulations, a Lyapunov function of type quadratic is used. As a form of validation, theoretical examples and simulations are performed, besides to show that the new results are less conservative. Furthermore, a practical implementation in an active suspension system, produced by Quanser®, is performed.
Mestre
Silva, Fabio Nogueira da. "Métodos Neuronais para a Solução da Equação Algébrica de Riccati e o LQR." Universidade Federal do Maranhão, 2008. http://tedebc.ufma.br:8080/jspui/handle/tede/401.
Full textFUNDAÇÃO DE AMPARO À PESQUISA E AO DESENVOLVIMENTO CIENTIFICO E TECNOLÓGICO DO MARANHÃO
We present in this work the results about two neural networks methods to solve the algebraic Riccati(ARE), what are used in many applications, mainly in the Linear Quadratic Regulator (LQR), H2 and H1 controls. First is showed the real symmetric form of the ARE and two methods based on neural computation. One feedforward neural network (FNN), that de¯nes an error as function of the ARE and a recurrent neural network (RNN), which converts a constrain optimization problem, restricted to the state space model, into an unconstrained convex optimization problem de¯ning an energy as function of the ARE and Cholesky factor. A proposal to chose the learning parameters of the RNN used to solve the ARE, by making a surface of the parameters variations, thus we can tune the neural network for a better performance. Computational experiments related with the plant matrices perturbations of the tested systems in order to perform an analysis of the behavior of the presented methodologies, that are based on homotopies methods, where we chose a good initial condition and compare the results to the Schur method. Two 6th order systems were used, a Doubly Fed Induction Generator(DFIG) and an aircraft plant. The results showed the RNN a good alternative compared with the FNN and Schur methods.
Apresenta-se nesta dissertação os resultados a respeito de dois métodos neuronais para a resolução da equação algébrica de Riccati(EAR), que tem varias aplicações, sendo principalmente usada pelos Regulador Linear Quadrático(LQR), controle H2 e controle H1. É apresentado a EAR real e simétrica e dois métodos baseados em uma rede neuronal direta (RND) que tem a função de erro associada a EAR e uma rede neuronal recorrente (RNR) que converte um problema de otimização restrita ao modelo de espaço de estados em outro de otimização convexa em função da EAR e do fator de Cholesky de modo a usufruir das propriedades de convexidade e condições de otimalidade. Uma proposta para a escolha dos parâmetros da RNR usada para solucionar a EAR por meio da geração de superfícies com a variação paramétrica da RNR, podendo assim melhor sintonizar a rede neuronal para um melhor desempenho. Experimentos computacionais relacionados a perturbações nos sistemas foram realizados para analisar o comportamento das metodologias apresentadas, tendo como base o princípio dos métodos homotópicos, com uma boa condição inicial, a partir de uma ponto de operação estável e comparamos os resultados com o método de Schur. Foram usadas as plantas de dois sistemas: uma representando a dinâmica de uma aeronave e outra de um motor de indução eólico duplamente alimentado(DFIG), ambos sistemas de 6a ordem. Os resultados mostram que a RNR é uma boa alternativa se comparado com a RND e com o método de Schur.
Mohammadzadeh, Soroush. "System identification and control of smart structures: PANFIS modeling method and dissipativity analysis of LQR controllers." Digital WPI, 2013. https://digitalcommons.wpi.edu/etd-theses/868.
Full textAasa, Johan. "Linear-Quadratic Regulation of ComputerRoom Air Conditioners." Thesis, Luleå tekniska universitet, Institutionen för system- och rymdteknik, 2018. http://urn.kb.se/resolve?urn=urn:nbn:se:ltu:diva-71031.
Full textMaciel, Allan James Ferreira. "CONVERGÊNCIA DO ESTIMADOR RLS PARA ALGORITMOS DE PROGRAMAÇÃO DINÂMICA HEURÍSTICA." Universidade Federal do Maranhão, 2012. http://tedebc.ufma.br:8080/jspui/handle/tede/494.
Full textCoordenação de Aperfeiçoamento de Pessoal de Nível Superior
The union of methodologies for optimal control and dynamics programming has stimulated the development of algorithms for realization of discrete control systems of the type linear quadratic regulator (DLQR). The methodology is based on reinforcement learning methods based on temporal differences and approximate dynamic programming. The proposed method combines the approach of the value function by method RLS (recursive least squares) and approximate policy iteration schemes heuristic dynamic programming (HDP). The approach is directed to the assessment of convergence of the solution DLQR and the heuristic weighting matrices and of the utility function associated with DLQR. The investigation of convergence properties related to consistency, persistent excitation and polarization of the RLS estimator is performed. The methodology involved in a project achievements online DLQR controllers and is evaluated in a fourth order multivariable dynamic system.
A união das metodologias de controle ótimo e de programação dinâmica tem impulsionado o desenvolvimento de algoritmos para realizações de sistemas de controle discreto do tipo regulador linear quadrático (DLQR). A metodologia utilizada neste trabalho é fundamentada sobre métodos de aprendizagem por reforço baseados em diferenças temporais e programação dinâmica aproximada. O método proposto combina a aproximação da função valor através do método RLS (mínimos quadrados recursivos) e iteração de política aproximada em esquemas de programação dinâmica heurística (HDP). A abordagem é orientada para a avaliação da convergência da solução DLQR e para a sintonia heurística das matrizes de ponderação e da função de utilidade associada ao DLQR. É realizada a investigação das propriedades de convergência relacionadas à consistência, excitação persistente e polarização do estimador RLS. A metodologia contempla realizações de projetos de forma online de controladores DLQR e é avaliada em um sistema dinâmico multivariável de quarta ordem.
SANTOS, Watson Robert Macedo. "Metodos para Solução da Equação HJB-Riccati via Famíla de Estimadores Parametricos RLS Simplificados e Dependentes de Modelo." Universidade Federal do Maranhão, 2014. http://tedebc.ufma.br:8080/jspui/handle/tede/1892.
Full textMade available in DSpace on 2017-09-04T13:42:58Z (GMT). No. of bitstreams: 1 Watson Robert.pdf: 2699368 bytes, checksum: cf204eec3df50b251f4adbbbd380ffd0 (MD5) Previous issue date: 2014-08-21
Due to the demand for high-performance equipments and the rising cost of energy, the industrial sector is developing equipments to attend minimization of the theirs operational costs. The implementation of these requirements generate a demand for projects and implementations of high-performance control systems. The optimal control theory is an alternative to solve this problem, because in its design considers the normative specifications of the system design, as well as those that are related to the operational costs. Motivated by these perspectives, it is presented the study of methods and the development of algorithms to the approximated solution of the Equation Hamilton-Jacobi-Bellman, in the form of discrete Riccati equation, model free and dependent of the dynamic system. The proposed solutions are developed in the context of adaptive dynamic programming that are based on the methods for online design of optimal control systems, Discrete Linear Quadratic Regulator type. The proposed approach is evaluated in multivariable models of the dynamic systems to evaluate the perspectives of the optimal control law for online implementations.
Devido a demanda por equipamentos de alto desempenho e o custo crescente da energia, o setor industrial desenvolve equipamentos que atendem a minimização dos seus custos operacionais. A implantação destas exigências geram uma demanda por projetos e implementações de sistemas de controle de alto desempenho. A teoria de controle ótimo é uma alternativa para solucionar este problema, porque considera no seu projeto as especificações normativas de projeto do sistema, como também as relativas aos seus custos operacionais. Motivado por estas perspectivas, apresenta-se o estudo de métodos e o desenvolvimento de algoritmos para solução aproximada da Equação Hamilton-Jacobi-Bellman, do tipo Equação Discreta de Riccati, livre e dependente de modelo do sistema dinâmico. As soluções propostas são desenvolvidas no contexto de programação dinâmica adaptativa (ADP) que baseiam-se nos métodos para o projeto on-line de Controladores Ótimos, do tipo Regulador Linear Quadrático Discreto. A abordagem proposta é avaliada em modelos de sistemas dinâmicos multivariáveis, tendo em vista a implementação on-line de leis de controle ótimo.
Uzinski, Julio Cezar [UNESP]. "A state-space parameterization for perfect-reconstruction wavelet FIR filter banks with special orthonormal basis functions." Universidade Estadual Paulista (UNESP), 2016. http://hdl.handle.net/11449/146716.
Full textApproved for entry into archive by Felipe Augusto Arakaki (arakaki@reitoria.unesp.br) on 2016-12-20T16:20:21Z (GMT) No. of bitstreams: 1 uzinski_jc_dr_ilha.pdf: 2380247 bytes, checksum: 910b14a40501433136262e638e586b5f (MD5)
Made available in DSpace on 2016-12-20T16:20:21Z (GMT). No. of bitstreams: 1 uzinski_jc_dr_ilha.pdf: 2380247 bytes, checksum: 910b14a40501433136262e638e586b5f (MD5) Previous issue date: 2016-11-25
Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)
Esta tese apresenta uma parametrização no espaço de estados para a transformada wavelet rápida. Esta parametrização é baseada em funções de base ortonormal e filtros de resposta finita ao impulso simultaneamente, uma vez que, a transformada rápida wavelet é um algoritmo que consiste em decompor sinais no domínio do tempo em sequências de coeficientes baseados numa base ortogonal de funções wavelet. Deste modo, vantagens apresentadas por ambas as propostas são incorporadas. Modelos de resposta finita ao impulso têm propriedades atrativas como vantagens computacionais e analíticas, garantia de estabilidade BIBO e robustez para a mudança de alguns parâmetros, dentre outras. Por outro lado, séries de funções de base ortonormal têm características que as fazem atrativas para a modelagem de sistemas dinâmicos, como ausência de recursão da saída, a não necessidade de se conhecer previamente a estrutura exata do vetor de regressão, possibilidade de aumentar a capacidade de representação do modelo aumentando-se o número de funções ortonormais utilizadas, desacoplamento natural das saídas em modelos multivariáveis; tolerância a dinâmicas não modeladas. Além disso, a realização no espaço de estados é mínima. A contribuição deste trabalho consiste no desenvolvimento de uma realização no espaço de estados para bancos de filtros wavelet, em que há a presença explícita de parâmetros que podem ser livremente ajustados mantendo as propriedades de reconstrução perfeita e ortonormalidade. Para ilustrar o funcionamento e as vantagens da técnica proposta, alguns exemplos de decomposição de sinais no contexto de processamento de sinais mostrando que ela proporciona os mesmos coeficientes wavelet que a transformada wavelet rápida, e uma aplicação em controle através de realimentação dinâmica de estados também são apresentados nesta tese.
This thesis presents a state-space parameterization for the fast wavelet transform. This parameterization is based on orthonormal basis functions and finite impulse response filters at the same time, since the fast wavelet transform is an algorithm, which converts a signal in the time domain into a sequence of coefficients based on an orthogonal basis of small finite wavelet functions. Advantages presented by both proposals are incorporated. Finite impulse response systems have attractive properties, for instance, computational and analytical advantages, BIBO stability and robustness guarantee to some parameter changes, and others. On the other hand, orthonormal basis functions have some characteristics that make them attractive for dynamic systems modeling, examples are, output recursion absence, not requiring prior regression vector exact structure knowledge; possibility of increasing the model representation capacity by increasing the number of orthonormal functions employed; natural outputs uncoupling in multivariable models; tolerance to unmodeled dynamics, and others. Furthermore, the state-space realization is minimal. The contribution of this work consists in the development of a state-space realization for a wavelet filter bank, with the explicit presence of the parameters that can be freely adjusted, keeping perfect-reconstruction and orthonormality guarantees. In order to illustrate advantages and how the proposed technique works, some decomposition examples in signal processing context are presented showing that it provides the same wavelet coefficients as the fast wavelet transform, and an application on dynamic state feedback control is also presented in this thesis.
CNPq: 160545/2013-7
Uzinski, Julio Cezar. "A state-space parameterization for perfect-reconstruction wavelet FIR filter banks with special orthonormal basis functions /." Ilha Solteira, 2016. http://hdl.handle.net/11449/146716.
Full textResumo: Esta tese apresenta uma parametrização no espaço de estados para a transformada wavelet rápida. Esta parametrização é baseada em funções de base ortonormal e filtros de resposta finita ao impulso simultaneamente, uma vez que, a transformada rápida wavelet é um algoritmo que consiste em decompor sinais no domínio do tempo em sequências de coeficientes baseados numa base ortogonal de funções wavelet. Deste modo, vantagens apresentadas por ambas as propostas são incorporadas. Modelos de resposta finita ao impulso têm propriedades atrativas como vantagens computacionais e analíticas, garantia de estabilidade BIBO e robustez para a mudança de alguns parâmetros, dentre outras. Por outro lado, séries de funções de base ortonormal têm características que as fazem atrativas para a modelagem de sistemas dinâmicos, como ausência de recursão da saída, a não necessidade de se conhecer previamente a estrutura exata do vetor de regressão, possibilidade de aumentar a capacidade de representação do modelo aumentando-se o número de funções ortonormais utilizadas, desacoplamento natural das saídas em modelos multivariáveis; tolerância a dinâmicas não modeladas. Além disso, a realização no espaço de estados é mínima. A contribuição deste trabalho consiste no desenvolvimento de uma realização no espaço de estados para bancos de filtros wavelet, em que há a presença explícita de parâmetros que podem ser livremente ajustados mantendo as propriedades de reconstrução perfeita e ortonormalidade. ... (Resumo completo, clicar acesso eletrônico abaixo)
Doutor
Ferreira, Ernesto Franklin Marçal. "Melhorias de estabilidade numérica e custo computacional de aproximadores de funções valor de estado baseados em estimadores RLS para projeto online de sistemas de controle HDP-DLQR." Universidade Federal do Maranhão, 2016. http://tedebc.ufma.br:8080/jspui/handle/tede/1687.
Full textMade available in DSpace on 2017-06-23T20:34:27Z (GMT). No. of bitstreams: 1 ErnestoFerreira.pdf: 1744167 bytes, checksum: c125c90e5eb2aab2618350567f88cb31 (MD5) Previous issue date: 2016-03-08
The development and the numerical stability analysis of a new adaptive critic algorithm to approximate the state-value function for online discrete linear quadratic regulator (DLQR) optimal control system design based on heuristic dynamic programming (HDP) are presented in this work. The proposed algorithm makes use of unitary transformations and QR decomposition methods to improve the online learning e-ciency in the critic network through the recursive least-squares (RLS) approach. The developed learning strategy provides computational performance improvements in terms of numerical stability and computational cost which aim at making possible the implementations in real time of optimal control design methodology based upon actor-critic reinforcement learning paradigms. The convergence behavior and numerical stability of the proposed online algorithm, called RLSµ-QR-HDP-DLQR, are evaluated by computational simulations in three Multiple-Input and Multiple-Output (MIMO) models, that represent the automatic pilot of an F-16 aircraft of third order, a fourth order RLC circuit with two input voltages and two controllable voltage levels, and a doubly-fed induction generator with six inputs and six outputs for wind energy conversion systems.
Neste trabalho, apresenta-se o desenvolvimento e a análise da estabilidade numérica de um novo algoritmo crítico adaptativo para aproximar a função valor de estado para o projeto do sistema de controle ótimo online, utilizando o regulador linear quadrático discreto (DLQR), com base em programação dinâmica heurística (HDP). O algoritmo proposto faz uso de transformações unitárias e métodos de decomposição QR para melhorar a e-ciência da aprendizagem online na rede crítica por meio da abordagem dos mínimos quadrados recursivos (RLS). A estratégia de aprendizagem desenvolvida fornece melhorias no desempenho computacional em termos de estabilidade numérica e custo computacional, que visam tornar possíveis as implementações em tempo real da metodologia do projeto de controle ótimo com base em paradigmas de aprendizado por reforço ator-crítico. O comportamento de convergência e estabilidade numérica do algoritmo online proposto, denominado RLSµ-QR-HDP-DLQR, são avaliados por meio de simulações computacionais em três modelos Múltiplas-Entradas e Múltiplas-Saídas (MIMO), que representam o piloto automático de uma aeronave F-16 de terceira ordem, um circuito de quarta ordem RLC com duas tensões de entrada e dois níveis de tensão controláveis, e um gerador de indução duplamente alimentados com seis entradas e seis saídas para sistemas de conversão de energia eólica.
RÊGO, Patrícia Helena Moraes. "Aprendizagem por Reforço e Programação Dinâmica Aproximada para Controle Ótimo: Uma Abordagem para o Projeto Online do Regulador Linear Quadrático Discreto com Programação Dinâmica Heurística Dependente de Estado e Ação." Universidade Federal do Maranhão, 2014. http://tedebc.ufma.br:8080/jspui/handle/tede/1879.
Full textMade available in DSpace on 2017-08-30T15:33:12Z (GMT). No. of bitstreams: 1 Patricia Helena.pdf: 11110405 bytes, checksum: ca1f067231658f897d84b86181dbf1b9 (MD5) Previous issue date: 2014-07-24
In this thesis a proposal of an uni ed approach of dynamic programming, reinforcement learning and function approximation theories aiming at the development of methods and algorithms for design of optimal control systems is presented. This approach is presented in the approximate dynamic programming context that allows approximating the optimal feedback solution as to reduce the computational complexity associated to the conventional dynamic programming methods for optimal control of multivariable systems. Speci cally, in the state and action dependent heuristic dynamic programming framework, this proposal is oriented for the development of online approximated solutions, numerically stable, of the Riccati-type Hamilton-Jacobi-Bellman equation associated to the discrete linear quadratic regulator problem which is based on a formulation that combines value function estimates by means of a RLS (Recursive Least-Squares) structure, temporal di erences and policy improvements. The development of the proposed methodologies, in this work, is focused mainly on the UDU T factorization that is inserted in this framework to improve the RLS estimation process of optimal decision policies of the discrete linear quadratic regulator, by circumventing convergence and numerical stability problems related to the covariance matrix ill-conditioning of the RLS approach.
Apresenta-se nesta tese uma proposta de uma abordagem uni cada de teorias de programação dinâmica, aprendizagem por reforço e aproximação de função que tem por objetivo o desenvolvimento de métodos e algoritmos para projeto online de sistemas de controle ótimo. Esta abordagem é apresentada no contexto de programação dinâmica aproximada que permite aproximar a solução de realimentação ótima de modo a reduzir a complexidade computacional associada com métodos convencionais de programação dinâmica para controle ótimo de sistemas multivariáveis. Especi camente, no quadro de programação dinâmica heurística e programação dinâmica heurística dependente de ação, esta proposta é orientada para o desenvolvimento de soluções aproximadas online, numericamente estáveis, da equação de Hamilton-Jacobi-Bellman do tipo Riccati associada ao problema do regulador linear quadrático discreto que tem por base uma formulação que combina estimativas da função valor por meio de uma estrutura RLS (do inglês Recursive Least-Squares), diferenças temporais e melhorias de política. O desenvolvimento das metodologias propostas, neste trabalho, tem seu foco principal voltado para a fatoração UDU T que é inserida neste quadro para melhorar o processo de estimação RLS de políticas de decisão ótimas do regulador linear quadrá- tico discreto, contornando-se problemas de convergência e estabilidade numérica relacionados com o mal condicionamento da matriz de covariância da abordagem RLS.
Salazar, Cortés Jean Carlo. "Contribution to reliable control of dynamic systems." Doctoral thesis, Universitat Politècnica de Catalunya, 2018. http://hdl.handle.net/10803/669250.
Full textAquesta tesi presenta algunes contribucions al camp del control basat en la salut dels components "Health-Aware Control" (HAC) de sistemes dinàmics. A la primera part d'aquesta tesi, es presenta una revisió dels conceptes i metodologies relacionats amb la fiabilitat versus degradació, el control tolerant a fallades versus el HAC. En primer lloc, i per unificar els conceptes, s'introdueixen els conceptes de degradació i fiabilitat, models de fiabilitat i de HAC incloent algunes de les contribucions teòriques i aplicades més rellevants. La tesi, a més, el modelatge de la fiabilitat es formalitza i exemplifica utilitzant la funció d'estructura del sistema, xarxes bayesianes (BN) i xarxes bayesianes dinamiques (DBN) com a eines de modelat i anàlisi de la fiabilitat com també presenta algunes mesures d'importància de la fiabilitat (RIMs). En particular, aquesta tesi desenvolupa models de BNs per a l'anàlisi de la fiabilitat del sistema a través de l'ús de tècniques d'inferència bayesiana. Les xarxes bayesianes són eines poderoses en l'avaluació de la fiabilitat del sistema gràcies a la seva flexibilitat en el modelat de la fiabilitat de sistemes complexos. Per a la implementació de l?esquema de HAC, aquesta tesi presenta i discuteix la integració de la informació sobre la salut i degradació dels actuadors mitjançant les RIMs en algoritmes de control predictiu basat en models (MPC) i control lineal quadràtic (LQR). En les estratègies proposades, els paràmetres de la funció de cost s'ajusten utilitzant els RIMs. Aquestes tècniques de control fiable permetran millorar la disponibilitat i la seguretat dels sistemes evitant l'aparició de fallades a través de la incorporació d'aquesta informació de la salut dels components en l'algoritme de control. Les estratègies de HAC proposades s'apliquen a una xarxa d'aigua potable (DWN) i a un sistema UAV multirrotor. A més, un tercer enfocament fent servir la degradació dels actuadors com a restricció dins l'algoritme de control MPC s'aplica a un sistema aeri a dos graus de llibertat (TRMS). Finalment, aquesta tesi també presenta i discuteix dues interpretacions de la fiabilitat. Aquestes interpretacions, nomenades instantània i esperada, difereixen en la forma en què s'avalua la fiabilitat i com es considera la seva evolució al llarg del temps. Aquesta comparació es realitza en el marc del control HAC i estudia la fiabilitat del sistema en tots dos enfocaments.
Esta tesis presenta algunas contribuciones en el campo del control basado en la salud de los componentes “Health-Aware Control” (HAC) de sistemas dinámicos. En la primera parte de esta tesis, se presenta una revisión de los conceptos y metodologíasrelacionados con la fiabilidad versus degradación, el control tolerante a fallos versus el HAC. En primer lugar, y para unificar los conceptos, se introducen los conceptos de degradación y fiabilidad, modelos de fiabilidad y de HAC incluyendo algunas de las contribuciones teóricas y aplicadas más relevantes. La tesis, demás formaliza y ejemplifica el modelado de fiabilidad utilizando la función de estructura del sistema, redes bayesianas (BN) y redes bayesianas diná-micas (DBN) como herramientas de modelado y análisis de fiabilidad como también presenta algunas medidas de importancia de la fiabilidad (RIMs). En particular, esta tesis desarrolla modelos de BNs para el análisis de la fiabilidad del sistema a través del uso de técnicas de inferencia bayesiana. Las redes bayesianas son herramientas poderosas en la evaluación de la fiabilidad del sistema gracias a su flexibilidad en el modelado de la fiabilidad de sistemas complejos. Para la implementación del esquema de HAC, esta tesis presenta y discute la integración de la información sobre la salud y degradación de los actuadores mediante las RIMs en algoritmos de control predictivo basado en modelos (MPC) y del control cuadrático lineal (LQR). En las estrategias propuestas, los parámetros de la función de coste se ajustan utilizando las RIMs. Estas técnicas de control fiable permitirán mejorar la disponibilidad y la seguridad de los sistemas evitando la aparición de fallos a través de la incorporación de la información de la salud de los componentes en el algoritmo de control. Las estrategias de HAC propuestas se aplican a una red de agua potable (DWN) y a un sistema UAV multirotor. Además, un tercer enfoque que usa la degradación de los actuadores como restricción en el algoritmo de control MPC se aplica a un sistema aéreo con dos grados de libertad (TRMS). Finalmente, esta tesis también presenta y discute dos interpretaciones de la fiabilidad. Estas interpretaciones, llamadas instantánea y esperada, difieren en la forma en que se evalúa la fiabilidad y cómo se considera su evolución a lo largo del tiempo. Esta comparación se realiza en el marco del control HAC y estudia la fiabilidad del sistema en ambos enfoques.
Alepuz, Menéndez Salvador Simón. "Aportación al control del convertidor CC/CA de tres niveles." Doctoral thesis, Universitat Politècnica de Catalunya, 2004. http://hdl.handle.net/10803/6330.
Full textThis dissertation study, propose and carry out the main contributions in the field of three-level inverter control, using the topology Neutral-Point-Clamped, although results can be extended to other topologies and/or number of levels. A procedure for modelling is presented, based on line-switching functions, moving average operator and D-Q transformation. Then, the obtained models in D-Q frame contain complete information about system dynamics. Switching strategy is simple and can be considered as an extension of two-level sinusoidal PWM to three level. The system variables are not controlled by the switching strategy. In this work, all the system variables are controlled by the regulator, including DC-link balance. This control approach is different than the conventional one, where DC-link balance is achieved by means of a proper selection of redundant states in the switching strategy, and the other variables are controlled by the regulator. The regulator is based on the multivariable linear control technique LQR (Linear Quadratic Regulator), in combination with the non-linear adaptive control technique Gain Scheduling. Moreover, a methodology for the calculation of the controller is presented. This controller is versatile, open and adaptable. However, the controller can be built depending on the concrete specifications of each application. The controller is calculated by means of simulation using MatLab-Simulink. The mathematical models based on the switching functions of the converter give the best trade-off between simulation speed and precision. In order to validate the proposed controller, an experimental prototype has been designed and implemented. Experimental results show that the controller is useful and effective for the regulation of different loads and applications, even with non-linear loads, different operation points and variables to control, in steady-state and transitory operation. Dynamic response speed and quality are similar to other control systems in the literature. The DC-link balance control achieved is specially interesting. Furthermore, steady-state error is cancelled due to the robustness of the controller, even though significant deviation of different system parameters are present. The use of Gain-Scheduling in combination with LQR is effective, allowing the calculation of regulators with different control strategies. Good agreement between simulations and experimental results has been found. This result validates simulation models and the design method for the controller, based on simulations.
Alepuz, Menéndez Salvador Simón. "Aportació al control del convertidor CC/CA de tres nivells." Doctoral thesis, Universitat Politècnica de Catalunya, 2004. http://hdl.handle.net/10803/6330.
Full textThis dissertation study, propose and carry out the main contributions in the field of three-level inverter control, using the topology Neutral-Point-Clamped, although results can be extended to other topologies and/or number of levels. A procedure for modelling is presented, based on line-switching functions, moving average operator and D-Q transformation. Then, the obtained models in D-Q frame contain complete information about system dynamics. Switching strategy is simple and can be considered as an extension of two-level sinusoidal PWM to three level. The system variables are not controlled by the switching strategy. In this work, all the system variables are controlled by the regulator, including DC-link balance. This control approach is different than the conventional one, where DC-link balance is achieved by means of a proper selection of redundant states in the switching strategy, and the other variables are controlled by the regulator. The regulator is based on the multivariable linear control technique LQR (Linear Quadratic Regulator), in combination with the non-linear adaptive control technique Gain Scheduling. Moreover, a methodology for the calculation of the controller is presented. This controller is versatile, open and adaptable. However, the controller can be built depending on the concrete specifications of each application. The controller is calculated by means of simulation using MatLab-Simulink. The mathematical models based on the switching functions of the converter give the best trade-off between simulation speed and precision. In order to validate the proposed controller, an experimental prototype has been designed and implemented. Experimental results show that the controller is useful and effective for the regulation of different loads and applications, even with non-linear loads, different operation points and variables to control, in steady-state and transitory operation. Dynamic response speed and quality are similar to other control systems in the literature. The DC-link balance control achieved is specially interesting. Furthermore, steady-state error is cancelled due to the robustness of the controller, even though significant deviation of different system parameters are present. The use of Gain-Scheduling in combination with LQR is effective, allowing the calculation of regulators with different control strategies. Good agreement between simulations and experimental results has been found. This result validates simulation models and the design method for the controller, based on simulations.
Krejčí, Roman. "Řízení modelu v reálném čase." Master's thesis, Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií, 2015. http://www.nusl.cz/ntk/nusl-221296.
Full textCerqueira, Marcio Mendes. "Observadores de Estados para Sistemas de Medição Indireta e Controle RLQD-GA." Universidade Federal do Maranhão, 2010. http://tedebc.ufma.br:8080/jspui/handle/tede/432.
Full textConselho Nacional de Desenvolvimento Científico e Tecnológico
Motivated by the necessity of efficient algorithms, it s presented the development of a methodology for the design and analysis of state observers in open and closed loops that are dedicated to monitoring and control of dynamic systems. The development of observers are based on OE models, description in state space and Kalman filter. The models are evaluated for temperature control of a aluminum cube that is inside of a sterilizer oven. In addition to the models assessment in terms of its ability to represent behavior of plants, these models also evaluated for the design of discrete linear quadric regulator DLQR that are tuned by genetic algorithms. The monitoring models are evaluated for open and closed loops structures that are represented by algorithms in terms of difference equations, these algorithms are seen as software core for the indirect measurement systems.
Motivado pela necessidade de algoritmos eficientes, apresenta-se o desenvolvimento de uma metodologia para projeto e análise de observadores de estado em malhas aberta e fechada que são dedicados a monitoração e controle de sistemas dinâmicos. O desenvolvimento dos observadores estão fundamentados em modelos OE, descrição no espaço de estados e filtro de Kalman. Os modelos são avaliados para o controle da temperatura de um cubo de alumínio que encontra-se no interior de uma estufa. Além das avaliações dos modelos em termos de sua habilidade em representar comportamento de plantas, estes são também avaliados para o projeto do regulador linear quadrático discreto (RQLD) que são sintonizados por algoritmos genéticos. Aplicação dos modelos para monitoração é avaliada nas estruturas das malhas aberta e fechada que são representadas por algoritmos em da equação à diferença, tendo em vistas o desenvolvimento de núcleos de software para os sistemas de medição indireta.
Caldeira, Fabrício Reis. "Design of an automatic landing system using linear quadratic tracker." Instituto Tecnológico de Aeronáutica, 2008. http://www.bd.bibl.ita.br/tde_busca/arquivo.php?codArquivo=725.
Full textSlabý, Vít. "Návrh a realizace demonstračního modelu dvojítého kyvadla." Master's thesis, Vysoké učení technické v Brně. Fakulta strojního inženýrství, 2018. http://www.nusl.cz/ntk/nusl-378727.
Full textSá, Denis Fabrício Sousa de. "MODELOS BASEADOS EM REDES NEURAIS ARTIFICIAIS COM APLICAÇÃO EM CONTROLE INDIRETO DE TEMPERATURA." Universidade Federal do Maranhão, 2015. http://tedebc.ufma.br:8080/jspui/handle/tede/295.
Full textCoordenação de Aperfeiçoamento de Pessoal de Nível Superior
The representation of dynamic systems or plants via mathematical models occupies an important position in control system design that allow the performance evaluation of the controller during his development stage. These models are also used as an alternative to solve the problem of the hardness or impracticability to install sensors that measure the controlled variables, the dynamic systems representations enable non-invasive measurement of these variables. As consequence the designer has an alternative way to perform adaptive and optimal sensorless control for a given process. In this dissertation is presented a proposal for control systems schemas and algorithms, based on recurrent neural networks (ANN) and Box-Jenkins models, that are dedicated to sensorless or indirect control of dynamic systems. The proposed models and algorithms are associated with the systems identification and recurrent ANN approaches. The algorithms developed for the AAN training are Backpropagation Accelerated and RLS types that are compared with classical methods and strategies to obtain it online parameters of indirect control of system for a thermal plant, where the actuator is Peltier cell. The performance the parametric models of the plant and adaptive PID digital controllers and linear quadratic regulator (DLQR) that are the main elements of the sensorless temperature control system, are evaluated by means of hybrid simulations, where the algorithms implemented in micro controllers and the plant represented by mathematical models. The performance results of the proposed sensorless control algorithms are promissory, not only, in terms of the control system performance, but also due to the reexibility to deploy it in other dynamic systems.
A representação de sistemas dinâmicos ou plantas por meio modelos matemáticos ocupa uma posição relevante no projeto de sistemas de controle, permitindo que o projetista avalie o desempenho dos controladores durante a fase de desenvolvimento do projeto. Estes modelos também são utilizados para resolver o problema da dificuldade ou impossibilidade da inserção de sensores em plantas para medição de variáveis controladas, onde os modelos viabilizam a mediação não invasiva destas variáveis, fornecendo uma alternativa para realização do controle indireto adaptativo e ótimo de um dado processo. Nesta dissertação apresenta-se o desenvolvimento de modelos propostos baseados em redes neurais artificiais recorrentes para o controle sensorless ou indireto da planta. Os modelos propostos estão associados com as abordagens de Identificação de Sistemas e de RNA's recorrentes. OS algoritmos desenvolvidos para o treinamento das RNAs são do tipo Backpropagation acelerado e RLS, que são comparados com estratégias e métodos clássicos, para obtenção online dos parâmetros do sistema de controle indireto de uma planta térmica, tendo como atuador uma célula Peltier. Para uns de avaliação de desempenho do sistema de controle indireto da planta, os modelos paramétricos e controladores digitais adaptativos do tipo PID e regulador linear quadrático (DLQR) são avaliados por meio de simulações híbridas, sendo os algoritmos dos controladores implementados em microcontroladores e a planta representada por modelos matemáticos. Os resultados apresentados são promissores, não são sentido do desempenho do sistema de controle, mas também nos custos reduzidos para seu desenvolvimento, operação e flexibilidade de aplicação em outros sistemas dinâmicos.
Yilmaz, Fatma Bilge. "A Mathematical Modeling And Approximation Of Gene Expression Patterns By Linear And Quadratic Regulatory Relations And Analysis Of Gene Networks." Master's thesis, METU, 2004. http://etd.lib.metu.edu.tr/upload/12605382/index.pdf.
Full textJackson, James Scott. "Enabling Autonomous Operation of Micro Aerial Vehicles Through GPS to GPS-Denied Transitions." BYU ScholarsArchive, 2019. https://scholarsarchive.byu.edu/etd/8709.
Full textXiong, Hao. "Constrained expectation-maximization (EM), dynamic analysis, linear quadratic tracking, and nonlinear constrained expectation-maximation (EM) for the analysis of genetic regulatory networks and signal transduction networks." Thesis, [College Station, Tex. : Texas A&M University, 2008. http://hdl.handle.net/1969.1/ETD-TAMU-2332.
Full text