Publicação
Non-canonical DNA secondary structures as a therapeutic strategy for lung cancer
| datacite.subject.fos | Ciências Naturais::Ciências Químicas | |
| datacite.subject.sdg | 03:Saúde de Qualidade | |
| dc.contributor.advisor | Cruz, Carla Patrícia Alves Freire Madeira | |
| dc.contributor.advisor | Mergny, Jean-Louis | |
| dc.contributor.advisor | Oliveira, Paula Alexandra Martins de | |
| dc.contributor.author | Miranda, André Filipe Rodrigues | |
| dc.date.accessioned | 2026-02-10T09:38:37Z | |
| dc.date.available | 2026-02-10T09:38:37Z | |
| dc.date.issued | 2026-01-19 | |
| dc.description.abstract | Nucleic acids store and control genetic information and, beyond the canonical B-form DNA double helix, can adopt a variety of non-canonical architectures, including G-quadruplex (G4s), i-motifs (iMs), triplexes, R-loops, and Z-DNA/Z-RNA. These structures are widespread across genomes and transcriptomes and play important biological roles (transcription, replication, translation, and genome stability). They are recognized as regulatory hotspots enriched at promoters, enhancers, telomeres, untranslated regions, and viral genomes and their involvement in cancer, viral infection, neurodegeneration, and inflammatory disorders. Their in vivo functions have also opened therapeutic avenues both as drug targets and therapeutic tools. As drug targets, these non-canonical structures can be modulated to alter cellular behavior, while as therapeutic agents, nucleic acids can be engineered to adopt non-canonical folds that bind key cellular partners and exert biological effects. This dual role is unusual for other approaches and positions non-canonical structures at the forefront of modern drug discovery. These structures are emerging as important tools in oncological research and therapeutic development. Proto-oncogenes encode proteins essential to normal physiology; however, when mutated or amplified become oncogenes, they drive unchecked growth and survival. The transcription factors (TFs) are a particularly important class of proto-oncogenes that bind to DNA and recruit co-regulators, orchestrating broad gene-expression programs. Their sweeping control of transcription makes them powerful cancer drivers but also challenging drug targets. Unlike enzymes with well-defined catalytic pockets, TFs often rely on flexible, intrinsically disordered regions for interactions, contributing to their reputation as “undruggable.” Numerous TFs have been reported as dysregulated in cancer and are frequently correlated with poor prognosis and resistance to chemotherapy. Other TF are gaining relevance, such as B-MYB (MYBL2), a transcription factor from the MYB family required for normal cell-cycle progression, which acts as an oncogene when overexpressed or deregulated. Functionally, the B-MYB protein serves as a master cell-cycle regulator by integrating into multiprotein assemblies, most notably the DREAM and MMB complexes, that coordinate cell-cycle gene expression. Beyond these physiological functions, B-MYB is upregulated in multiple cancers, such as breast and lung, and its overexpression is correlated with aggressive disease, treatment resistance, and unfavorable prognosis. The molecular mechanisms linking B-MYB to tumorigenesis include gene amplification, cell cycle deregulation, genomic instability, apoptosis suppression, post-transcriptional and post-translational modifications, or can contribute to epithelial-to-mesenchymal transition. Thus, B-MYB TF can be seen as a relevant clinical biomarker and one of the main orchestrators of carcinogenesis; however, until now, no pharmacological therapy against B-MYB has been developed, also related to its “undruggable” profile. Also, it’s known, by bioinformatic analysis of the human genome, that oncogene promoter regions are G/C rich around transcription start sites (TSS), which allows the formation of structures called G4 or iM. The G4s are formed by the self-association of four guanine bases in a quasi-planar arrangement via Hoogsteen bonds and are described as having a gene regulatory function, namely at the transcriptional level, while the iM is formed by Hoogsteen bonds between protonated and deprotonated cytosines. Motivated by these observations, the central objective of this thesis was to explore alternative routes to target the B-MYB oncogene using non-canonical nucleic-acid structures: first as drug targets and later as therapeutics. The thesis started by the identification of G-rich sequences at the B-MYB promoter capable of forming G4 structures. The identification of G-rich sequences was performed using the G4Hunter algorithm, and their conservation across mammalian species was also verified. The experimental validation of their formation was performed by combining 10 biophysical and biochemical methods. Later, the in-cell relevance of G4 structures was evaluated employing the G4access method, which reveals that from the predicted sequences, only the most stable one (B-MYB 43R) was shown to be significantly formed in cells, evidencing a potential impact on the transcription of this gene to its location closest to the TSS. Next, the ability of C-rich sequences to form iM structure was evaluated. Again, the iM-forming sequences were predicted using the G4Hunter algorithm and the experimental validation started by circular dichroism (CD) and nuclear magnetic resonance (NMR) to determine if the sequences fold into an iM structure. Then, stability parameters such as pHT (pH transitional midpoint) were determined by acquiring spectra at different pH values (between pH=5 and pH=8; 0.25-unit increments). The thermal stability and thermodynamic parameters were also calculated using the denaturation and renaturation melting curves. Then, the in-cell formation was assessed using iM-CUT&Tag experiments in HEK293T, which revealed the formation of the iB-MYB 43 that was characterized to have the highest Tm and the highest pHT among the studied sequences. After this characterization, the interaction of small molecules with iB-MYB structures was assessed. As a general tendency, the ligands did not affect the CD spectral shape; however, some of them evidenced changes in secondary structure or thermal destabilization. After evaluating the capacity to form G4 or iM, we continued to validate the G4 formation within a cellular environment using a G4-triggered fluorogenic hybridization probe. This strategy circumvents the limitations of the antibodies and small-molecule probes, which show a lack of structural selectivity labeling diverse DNA and RNA G4s indiscriminately, and cannot specifically target the desired G4. The molecular probe was composed of G4-recognizing light-up ligand (acridine derivative) with an antisense oligonucleotide that hybridizes adjacent region of B-MYB G4. Before probe synthesis using a click chemistry approach, the ligands were photophysically characterized, biophysically evaluated against G4, and further validated spectroscopically and in cells. Cellular studies confirmed the co-localization between the molecular probe and B-MYB G4 in-cell, offering promise for future applications in cancer research in terms of targeted therapies and monitoring of G4. Although G4s are highly dynamic and topologically diverse, promoter G4s are commonly parallel, whereas antiparallel forms are underreported and less characterized. In earlier work, we identified a B-MYB promoter sequence (B-MYB 26RA), that forms an antiparallel G4. Thus, a biophysical pipeline, starting in solution NMR spectroscopy alongside in-cell NMR studies, was made to predict a three-dimensional model (antiparallel quadruplex-duplex junction) and to assess the formation in a live complex environment of B-MYB 26RA. Interestingly, B-MYB 26RA evidenced an ionic sensitivity to K+ and Na+, increasing their topological dynamics, and demonstrated that, when associated with PhenDC3 ligand, a conformational shift from hybrid to antiparallel topology happens. Then, we moved to B-MYB 43R G4 to discuss the therapeutic relevance and the capacity to be targeted by small molecules. Thus, using spectroscopic methods, the G4 formation and its interaction with a panel of G4-stabilizing ligands were confirmed. From the tested ligands, PhenDC3 and TMPyP4 demonstrated the highest binding affinity and stabilization and revealed that both ligands inhibited proliferation and migration in two lung cancer cell lines (A549 and H1299), with PhenDC3 showing potent cytotoxic and cytostatic effects. Furthermore, PhenDC3 upregulated B-MYB expression despite its strong phenotypic effects, highlighting the complexity of G4-targeting mechanisms and supporting the growing evidence that ligands do not always downregulate their target genes. Finally, we explored the use of Polypurine Reverse-Hoogsteen (PPRH) hairpins as an alternative therapeutic approach to target the B-MYB promoter. PPRH are DNA oligonucleotides that fold into intramolecular hairpins and bind complementary polypyrimidine, forming stable DNA triplexes, impeding transcription, and displacing the G-rich strand, inducing G4 formation, enabling dual-level regulation of oncogene expression. Thus, using a bioinformatic tool (TFO Searching Tool), a PPRH was designed against the G4-forming region at the B-MYB promoter (B-MYB 43R), and then experimentally assessed the triplex formation using biophysical methods. The biological effects of designed PPRH, evaluated in lung cellular models (A549, H1299 and MRC-5), demonstrated a low cell viability and clonogenic capacity accompanied by mRNA expression reduction and proteomic profile alterations. Thus, the combination of triplex-based approaches with G4 biology could be a future venue for therapy. Overall, this thesis establishes non-canonical nucleic-acid structures as both actionable targets and therapeutic agents. As a target, the formation of G4 and iM structures at the promoter region of the B-MYB oncogene; was provided new insights about structure and topological dynamics according to the surrounding environment; was validated their formation in-cell, as well as explored the interaction with small molecules. On the other side, the therapeutic potential was explored using PPRH, which revealed a selective and powerful tool to target B-MYB. Together, these findings provide fundamental insights and open new avenues for translational research on the B-MYB oncogene. | eng |
| dc.description.abstract | Os ácidos nucleicos armazenam e controlam a informação genética e, para além da dupla hélice de ADN na forma B, podem adotar uma variedade de estruturas não canónicas, incluindo G-quadruplex (G4), i-motifs (iM), triplexes, R-loops e Z-ADN/Z-ARN. Estas estruturas estão disseminadas por genomas e transcriptomas e desempenham papéis biológicos importantes (transcrição, replicação, tradução e estabilidade do genoma). São reconhecidas como “hotspots” regulatórios, enriquecidos em promotores, “enhancers”, telómeros e genomas virais, e o seu envolvimento no cancro, na neurodegeneração e na infeção viral intensificou o interesse pelos seus mecanismos. As suas funções in vivo abriram igualmente novas vias terapêuticas, tanto como alvos farmacológicos como ferramentas terapêuticas. Enquanto alvos, estas estruturas não canónicas podem ser moduladas para alterar o comportamento celular enquanto, como agentes terapêuticos, podem ser concebidos para se ligarem a alvos celulares exercendo efeitos biológicos. Este duplo papel é invulgar noutras abordagens e coloca as estruturas não canónicas na vanguarda da descoberta moderna de fármacos. Estas estruturas têm vindo a ganhar destaque em várias áreas, sendo a oncologia uma das mais promissoras. Os proto-oncogenes codificam proteínas essenciais para a fisiologia celular normal; no entanto, quando sofrem mutações ou amplificações, transformam-se em oncogenes, promovendo o crescimento e a sobrevivência celulares descontrolados. Os fatores de transcrição (FT) constituem uma classe particularmente importante de proto-oncogenes que se ligam ao ADN e recrutam co-reguladores, orquestrando amplos programas de expressão génica. O seu vasto controlo da transcrição torna-os poderosos motores do cancro, mas também alvos farmacológicos desafiantes. Ao contrário das enzimas com centros ativos bem definidos, os FT dependem frequentemente de regiões flexíveis e intrinsecamente desordenadas para as suas interações, contribuindo para a sua reputação de “undruggable” (de difícil abordagem farmacológica). Muitos FT têm sido descritos como desregulados no cancro e estão frequentemente associados a mau prognóstico e resistência à quimioterapia. Recentemente outro FT tem ganho relevância, como o B-MYB (MYBL2), um fator de transcrição da família MYB necessário para a progressão normal do ciclo celular, que atua como oncogene quando sobre-expresso ou desregulado. Funcionalmente, a proteína B-MYB atua como reguladora-mestre do ciclo celular ao integrar-se em complexos multiproteicos, nomeadamente os complexos DREAM e MMB, que coordenam a expressão génica do ciclo celular. Para além destas funções fisiológicas, o B-MYB encontra-se sobre-expresso em múltiplos cancros, como os da mama e do pulmão, e a sua sobre-expressão está correlacionada com doença agressiva, resistência ao tratamento e prognóstico desfavorável. Os mecanismos moleculares que ligam o B-MYB à tumorgénese incluem amplificação génica, desregulação do ciclo celular, instabilidade genómica, supressão da apoptose e modificações pós-transcricionais e pós-translacionais, podendo ainda contribuir para a transição epitélio-mesênquima. Assim, o FT B-MYB pode ser considerado um biomarcador clínico relevante e um dos principais orquestradores da carcinogénese, no entanto, até ao momento, não foi desenvolvida qualquer terapêutica farmacológica dirigida ao B-MYB, também devido ao seu perfil “undruggable”. Além disso, sabe-se, por análise bioinformática do genoma humano, que as regiões promotoras de oncogenes são ricas em G/C em torno dos locais de início de transcrição (TSS), o que permite a formação de estruturas denominadas G4 ou iM. Os G4 formam-se pela associação de quatro guaninas numa disposição quasi-planar através de ligações de Hoogsteen e têm sido descritos como desempenhando funções reguladoras dos genes, nomeadamente ao nível transcricional, enquanto os iM se formam por ligações de Hoogsteen entre citosinas protonadas e desprotonadas. Assim, o objetivo central desta tese foi explorar vias alternativas para alvejar o oncogene B-MYB utilizando estruturas não canónicas de ácidos nucleicos: primeiro como alvos terapêuticos e, posteriormente, como agentes terapêuticos. A tese começou por se focar na identificação de sequências ricas em guaninas no promotor de B-MYB, capazes de formar estruturas G4. A identificação destas sequências ricas em guaninas foi realizada com recurso ao algoritmo G4Hunter, tendo sido igualmente verificada a sua conservação em espécies de mamíferos. A validação experimental da sua formação foi efetuada combinando 10 métodos biofísicos e bioquímicos. Posteriormente, a relevância celular das estruturas G4 foi avaliada utilizando o método G4access, que revelou que, das sequências previstas, apenas a mais estável (B-MYB 43R) se mostrou significativamente formada em células, evidenciando um potencial impacto na transcrição deste gene devido à sua localização mais próxima do TSS. De seguida, avaliou-se a capacidade de sequências ricas em citosinas formarem estruturas iM. Mais uma vez, as sequências formadoras de iM foram previstas usando o algoritmo G4Hunter e a validação experimental iniciou-se por espectroscopias de dicroísmo circular (CD) e ressonância magnética nuclear (RMN) para determinar se as sequências formavam estruturas iM. Depois, parâmetros de estabilidade como o pHT (ponto médio de transição de pH) foram determinados adquirindo espetros a diferentes valores de pH (entre pH=5 e 8, incrementos de 0,25 unidades). A estabilidade térmica e os parâmetros termodinâmicos foram também calculados a partir das curvas de fusão de desnaturação e renaturação. De seguida, a formação destas estruturas em ambiente celular foi avaliada por experiências iM-CUT&Tag em HEK293T, que revelaram a formação de iB-MYB 43, caracterizado por apresentar o Tm mais elevado e o pHT mais alto entre as sequências estudadas. Após esta caracterização, avaliou-se a interação de moléculas de baixo peso molecular com as estruturas iB-MYB. Como tendência geral, as moléculas de baixo peso molecular não afetaram a forma do espetro de CD; no entanto, alguns evidenciaram alterações na estrutura secundária ou desestabilização térmica. Depois de avaliar a capacidade de formar G4 ou iM, iniciou-se a validação da formação de G4 num ambiente celular utilizando uma sonda de hibridação fluorescente. Esta estratégia contorna as limitações de anticorpos e de sondas fluorescentes, que apresentam falta de seletividade estrutural, reconhecendo indiscriminadamente ADN e ARN G4, e não conseguem direcionar especificamente o G4 pretendido. A sonda molecular desenvolvida era composta por um ligando fluorescente reconhecedor de G4 (derivado de acridina) conjugado com um oligonucleótido complementar que hibridiza com a região adjacente ao G4 de B-MYB. Antes da síntese da sonda usou-se a abordagem de “click chemistry”, as moléculas de baixo peso molecular foram caracterizadas fotofisicamente, avaliados biofisicamente contra G4 e, posteriormente, validados espectroscopicamente e em células. Estudos celulares confirmaram a co-localização entre a sonda molecular e o G4 de B-MYB em células, oferecendo perspetivas promissoras para futuras aplicações na investigação do cancro em terapias dirigidas e na monitorização de G4. Embora os G4 sejam altamente dinâmicos e topologicamente diversos, os G4 localizados nos promotores são geralmente paralelos, enquanto as formas antiparalelas são pouco relatadas e menos caracterizadas. Nesta tese identificámos uma sequência do promotor de B-MYB (B-MYB 26RA) que forma um G4 antiparalelo. Assim, foi estabelecida uma abordagem biofísica, iniciando na RMN em solução até estudos de in-cell RMN, para prever um modelo da estrutura tridimensional (quadruplex-duplex) e avaliar a formação de B-MYB 26RA num ambiente celular complexo. Curiosamente, o B-MYB 26RA evidenciou sensibilidade iónica ao K+ e Na+, aumentando a sua dinâmica topológica, e demonstrou que, quando associado ao ligando PhenDC3, ocorre uma mudança conformacional de topologia híbrida para antiparalela. De seguida, avançámos para o G4 B-MYB 43R para avaliar a sua relevância terapêutica e a capacidade de ser alvo de moléculas de baixo peso molecular. Assim, com recurso a técnicas espectroscópicas, confirmou-se a formação do G4 e a sua interação com um conjunto de moléculas de baixo peso molecular estabilizadoras de G4. Das moléculas de baixo peso molecular testadas, o PhenDC3 e o TMPyP4 demonstraram as mais altas afinidades de ligação e maior estabilização e revelou-se que ambos inibiram a proliferação e a migração em duas linhas celulares de cancro do pulmão (A549 e H1299), com o PhenDC3 a apresentar efeitos citotóxicos e citostáticos potentes. Além disso, o PhenDC3 aumentou a expressão de B-MYB apesar dos seus efeitos fenotípicos, evidenciando a complexidade dos mecanismos de direcionamento de G4 e apoiando as evidências crescentes de que as moléculas de baixo peso molecular nem sempre regulam negativamente os seus genes-alvo. Por fim, explorámos o uso de “Polypurine Reverse-Hoogsteen (PPRH) hairpins” como abordagem terapêutica alternativa direcionada o promotor do B-MYB. As PPRH são oligonucleótidos de ADN que se dobram em “hairpins” intramoleculares e se ligam a cadeias de polipirimidinas complementares, formando triplexes de ADN estáveis, impedindo a transcrição e deslocando a cadeia rica em G, induzindo a formação de G4, e assim permitindo uma regulação da expressão do oncogene a dois níveis. Desta forma foi desenhada um PPRH contra a região formadora de G4 no promotor de B-MYB (B-MYB 43R), recorrendo a uma ferramenta bioinformática (TFO Searching Tool), tendo a formação do triplex sido depois validada experimentalmente por técnicas biofísicas. Os efeitos biológicos do PPRH desenhado, avaliados em modelos celulares de cancro do pulmão (A549, H1299) e fibroblastos humanos provenientes de tecido pulmonar (MRC-5), demonstraram baixa viabilidade e baixa capacidade clonogénica, associadas a uma redução na expressão de mRNA e a alterações do perfil proteómico. Assim, a integração de abordagens focadas na formação de triplex e G4 pode representar uma estratégia promissora para o desenvolvimento de terapias mais eficientes. Em suma, esta tese estabelece as estruturas não canónicas de ácidos nucleicos como alvos farmacológicos promissores e agentes terapêuticos. Como alvos, foram identificadas estruturas G4 e iM na região promotora do oncogene B-MYB, permitindo avanços na elucidação estrutural e na caracterização da sua dinâmica topológica em função de condições distintas de sais/iões metálicos e moléculas de baixo peso molecular; validou-se a sua formação em meio celular e explorou-se a interação com moléculas de baixo peso molecular ( 500 Da). Por outro lado, o potencial terapêutico foi avaliado usando PPRH, revelando-se uma estratégia eficaz e seletiva para alvejar o B-MYB. Em conjunto, estes resultados permitiram identificar novas direções para a investigação translacional do oncogene B-MYB. | por |
| dc.description.sponsorship | Fundação para a Ciência e Tecnologia (FCT); European Biophysics Societies Association (EBSA), à International Union for Pure and Applied Biophysics (IUPAB), à agência ERASMUS+ e à Fundação Luso-Americana para o Desenvolvimento (FLAD). | |
| dc.identifier.tid | 101688873 | |
| dc.identifier.uri | http://hdl.handle.net/10400.6/19876 | |
| dc.language.iso | eng | |
| dc.relation | B-MYB G-quadruplex motif as a therapeutic strategy for Lung Cancer | |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-sa/4.0/ | |
| dc.subject | Estruturas não-canónicas | |
| dc.subject | Ácidos nucleicos | |
| dc.subject | ADN | |
| dc.subject | B-MYB | |
| dc.subject | MYBL2 | |
| dc.subject | Cancro | |
| dc.subject | G-quadruplex | |
| dc.subject | i-motif | |
| dc.subject | Terapia | |
| dc.subject | Moléculas de baixo peso molecular | |
| dc.subject | PPRH | |
| dc.subject | Biofísica | |
| dc.subject | Biologia-Química | |
| dc.subject | Bioquímica | |
| dc.subject | Espectroscopia | |
| dc.subject | Non-Canonical Structures | |
| dc.subject | Nucleic Acids | |
| dc.subject | DNA | |
| dc.subject | Cancer | |
| dc.subject | Therapy | |
| dc.subject | G4 Ligands | |
| dc.subject | Biophysics | |
| dc.subject | Chemical-Biology | |
| dc.subject | Biochemistry | |
| dc.subject | Spectroscopy | |
| dc.title | Non-canonical DNA secondary structures as a therapeutic strategy for lung cancer | por |
| dc.type | doctoral thesis | |
| dspace.entity.type | Publication | |
| oaire.awardTitle | B-MYB G-quadruplex motif as a therapeutic strategy for Lung Cancer | |
| oaire.awardURI | http://hdl.handle.net/10400.6/19875 | |
| person.familyName | Miranda | |
| person.givenName | André Filipe Rodrigues | |
| person.identifier.ciencia-id | 1916-0D73-4D2D | |
| person.identifier.orcid | 0000-0001-9787-3446 | |
| person.identifier.scopus-author-id | 57218800447 | |
| relation.isAuthorOfPublication | 9a6ed137-62f0-4864-8a10-77a59352e80e | |
| relation.isAuthorOfPublication.latestForDiscovery | 9a6ed137-62f0-4864-8a10-77a59352e80e | |
| relation.isProjectOfPublication | e2df3d4e-4351-4bba-84c1-ce014c2c9ee1 | |
| relation.isProjectOfPublication.latestForDiscovery | e2df3d4e-4351-4bba-84c1-ce014c2c9ee1 | |
| thesis.degree.name | Doutoramento em Bioquímica |
Ficheiros
Principais
1 - 1 de 1
Miniatura indisponível
- Nome:
- 0. TESE_André Miranda_versao_final_signed.pdf
- Tamanho:
- 32.35 MB
- Formato:
- Adobe Portable Document Format
- Descrição:
- Documento em Acesso Embargado até dia 26-01-2029. Tente solicitar cópia ao autor carregando no ficheiro
Licença
1 - 1 de 1
Miniatura indisponível
- Nome:
- license.txt
- Tamanho:
- 4.03 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição:
