INSTITUTO DE PESQUISAS ENERGÉTICAS E NUCLEARES
Repositório Digital da Produção Técnico Científica

Evaluation of breast cancer molecular subtypes using artificial intelligence in micro-FTIR hyperspectral images

Mostrar registro simples

dc.contributor.advisor Denise Maria Zezell pt_BR
dc.date 2023 pt_BR
dc.date.accessioned 2023-07-28T17:42:15Z
dc.date.available 2023-07-28T17:42:15Z
dc.identifier.uri http://repositorio.ipen.br/handle/123456789/34178
dc.description.abstract Breast cancer is the most incident cancer worldwide. The evaluation of molecular subtypes and their biomarkers plays an essential role in prognosis. The biomarkers used are Estrogen Receptor (ER), Progesterone Receptor (PR), Human Epidermal growth factor Receptor-type 2 (HER2), and Ki67. Based on these, subtypes are classified as Luminal A (LA), Luminal B (LB), HER2 subtype, and Triple-Negative Breast Cancer (TNBC). The gold standard for this analysis is histology and immunohistochemistry, semi-quantitative techniques that present inter-laboratory and inter-observer variations. The Fourier Transform Infrared micro-spectroscopy (micro-FTIR), which provides hyperspectral images with biochemical information of biological tissues, is applied together with artificial intelligence (AI) for cancer evaluation. In this thesis, twenty samples of two breast cancer cell lines, BT-474 and SK-BR-3, were used to define the optimal number of co-added scans for machine learning (ML) techniques. Linear Discriminant Analysis (LDA), Partial Least Squares Discriminant Analysis (PLS-DA), K-Nearest Neighbors (KNN), Support Vector Machines (SVM), Random Forest (RF), and Extreme Gradient Boosting (XGB) models were used. Sixty hyperspectral images of 320x320 pixels were collected from thirty patients of a human breast biopsies microarray, each containing a breast cancer (CA) and an adjacent tissue (AT) core. Automated methods based on K-Means clustering were developed for data organization and pre-processing to one-dimensional (1D) and two-dimensional (2D) data. The dataset was used to train two new deep learning models for breast cancer subtype evaluation: CaReNet-V1, a 1D Convolutional Neural Network (CNN); and CaReNet-V2, a 2D CNN. All ML models achieved similar performances with the b256_064 (256 background scans and 64 sample scans), b256_128, and b128_128 groups, where the best accuracy of 0.995 was presented by the XGB model. The b256_064 was established as the ideal among the three due to the shortest acquisition time. The K-Means-based method enabled fully automated preprocessing and organization, improving data quality and optimizing CNN training. CaReNet-V1 effectively classified CA and AT (individual spectra test accuracy of 0.89), as well as HER2 and TNBC subtypes (0.83 and 0.86), with greater difficulty for LA and LB (0.74 and 0.68). The model enabled the evaluation of the most contributing wavenumbers to the predictions, providing a direct relationship with the biochemical content of the samples. CaReNet-V2 demonstrated better performance than 1D, with test accuracies above 0.84, and enabled the prediction of ER, PR, and HER2 levels, where borderline values showed lower performance (minimum accuracy of 0.54). The Ki67 percentage regression demonstrated an absolute mean error of 3.6%. On the other hand, its impact evaluation by wavenumber was inferior to 1D. Thus, this study indicates image-based AI techniques using micro-FTIR as potential providers of additional information to pathological reports, also serving as patient biopsy screening techniques. pt_BR
dc.description.sponsorship Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) pt_BR
dc.description.sponsorship Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) pt_BR
dc.description.sponsorship Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) pt_BR
dc.format.extent 126 pt_BR
dc.rights openAccess pt_BR
dc.title Evaluation of breast cancer molecular subtypes using artificial intelligence in micro-FTIR hyperspectral images pt_BR
dc.title.alternative Avaliação de subtipos moleculares de câncer de mama utilizando inteligência artificial em imagens hiperespectrais por micro-FTI pt_BR
dc.type Tese pt_BR
ipen.identifier.ipendoc 29802 pt_BR
sigepi.autor.atividade DEL VALLE, MATHEUS:15209:920:S pt_BR
dc.coverage N pt_BR
dc.creator.author DEL VALLE, MATHEUS pt_BR
dc.description.notasgerais Tese (Doutorado em Tecnologia Nuclear) pt_BR
dc.description.notastese IPEN/T pt_BR
dc.description.teseinstituicao Instituto de Pesquisas Energéticas e Nucleares - IPEN-CNEN/SP pt_BR
dc.local São Paulo pt_BR
ipen.autor DEL VALLE, MATHEUS pt_BR
ipen.date.recebimento 23-07
ipen.meioeletronico https://www.teses.usp.br/teses/disponiveis/85/85134/tde-10072023-162427/pt-br.php pt_BR
ipen.codigoautor 15209 pt_BR
dc.description.sponsorshipID FAPESP: 05/51689-2; 17/50332-0 pt_BR
dc.description.sponsorshipID CAPES: 001; PROCAD 88881.068505/2014-01 pt_BR
dc.description.sponsorshipID CNPq: INCT-465763/2014-6; PQ-309902/2017-7; 142229/2019-9 pt_BR
dc.identifier.doi 10.11606/T.85.2023.tde-10072023-162427 pt_BR
dc.contributor.coadvisor Emerson Soares Bernardes pt_BR


Arquivos deste item

Arquivos Tamanho Formato Visualização

Não existem arquivos associados a este item.

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples

A pesquisa no RD utiliza os recursos de busca da maioria das bases de dados. No entanto algumas dicas podem auxiliar para obter um resultado mais pertinente.

É possível efetuar a busca de um autor ou um termo em todo o RD, por meio do Buscar no Repositório , isto é, o termo solicitado será localizado em qualquer campo do RD. No entanto esse tipo de pesquisa não é recomendada a não ser que se deseje um resultado amplo e generalizado.

A pesquisa apresentará melhor resultado selecionando um dos filtros disponíveis em Navegar

Os filtros disponíveis em Navegar tais como: Coleções, Ano de publicação, Títulos, Assuntos, Autores, Revista, Tipo de publicação são autoexplicativos. O filtro, Autores IPEN apresenta uma relação com os autores vinculados ao IPEN; o ID Autor IPEN diz respeito ao número único de identificação de cada autor constante no RD e sob o qual estão agrupados todos os seus trabalhos independente das variáveis do seu nome; Tipo de acesso diz respeito à acessibilidade do documento, isto é , sujeito as leis de direitos autorais, ID RT apresenta a relação dos relatórios técnicos, restritos para consulta das comunidades indicadas.

A opção Busca avançada utiliza os conectores da lógica boleana, é o melhor recurso para combinar chaves de busca e obter documentos relevantes à sua pesquisa, utilize os filtros apresentados na caixa de seleção para refinar o resultado de busca. Pode-se adicionar vários filtros a uma mesma busca.

Exemplo:

Buscar os artigos apresentados em um evento internacional de 2015, sobre loss of coolant, do autor Maprelian.

Autor: Maprelian

Título: loss of coolant

Tipo de publicação: Texto completo de evento

Ano de publicação: 2015

Para indexação dos documentos é utilizado o Thesaurus do INIS, especializado na área nuclear e utilizado em todos os países membros da International Atomic Energy Agency – IAEA , por esse motivo, utilize os termos de busca de assunto em inglês; isto não exclui a busca livre por palavras, apenas o resultado pode não ser tão relevante ou pertinente.

95% do RD apresenta o texto completo do documento com livre acesso, para aqueles que apresentam o significa que e o documento está sujeito as leis de direitos autorais, solicita-se nesses casos contatar a Biblioteca do IPEN, bibl@ipen.br .

Ao efetuar a busca por um autor o RD apresentará uma relação de todos os trabalhos depositados no RD. No lado direito da tela são apresentados os coautores com o número de trabalhos produzidos em conjunto bem como os assuntos abordados e os respectivos anos de publicação agrupados.

O RD disponibiliza um quadro estatístico de produtividade, onde é possível visualizar o número dos trabalhos agrupados por tipo de coleção, a medida que estão sendo depositados no RD.

Na página inicial nas referências são sinalizados todos os autores IPEN, ao clicar nesse símbolo será aberta uma nova página correspondente à aquele autor – trata-se da página do pesquisador.

Na página do pesquisador, é possível verificar, as variações do nome, a relação de todos os trabalhos com texto completo bem como um quadro resumo numérico; há links para o Currículo Lattes e o Google Acadêmico ( quando esse for informado).

ATENÇÃO!

ESTE TEXTO "AJUDA" ESTÁ SUJEITO A ATUALIZAÇÕES CONSTANTES, A MEDIDA QUE NOVAS FUNCIONALIDADES E RECURSOS DE BUSCA FOREM SENDO DESENVOLVIDOS PELAS EQUIPES DA BIBLIOTECA E DA INFORMÁTICA.

O gerenciamento do Repositório está a cargo da Biblioteca do IPEN. Constam neste RI, até o presente momento 20.950 itens que tanto podem ser artigos de periódicos ou de eventos nacionais e internacionais, dissertações e teses, livros, capítulo de livros e relatórios técnicos. Para participar do RI-IPEN é necessário que pelo menos um dos autores tenha vínculo acadêmico ou funcional com o Instituto. Nesta primeira etapa de funcionamento do RI, a coleta das publicações é realizada periodicamente pela equipe da Biblioteca do IPEN, extraindo os dados das bases internacionais tais como a Web of Science, Scopus, INIS, SciElo além de verificar o Currículo Lattes. O RI-IPEN apresenta também um aspecto inovador no seu funcionamento. Por meio de metadados específicos ele está vinculado ao sistema de gerenciamento das atividades do Plano Diretor anual do IPEN (SIGEPI). Com o objetivo de fornecer dados numéricos para a elaboração dos indicadores da Produção Cientifica Institucional, disponibiliza uma tabela estatística registrando em tempo real a inserção de novos itens. Foi criado um metadado que contém um número único para cada integrante da comunidade científica do IPEN. Esse metadado se transformou em um filtro que ao ser acionado apresenta todos os trabalhos de um determinado autor independente das variáveis na forma de citação do seu nome.

A elaboração do projeto do RI do IPEN foi iniciado em novembro de 2013, colocado em operação interna em julho de 2014 e disponibilizado na Internet em junho de 2015. Utiliza o software livre Dspace, desenvolvido pelo Massachusetts Institute of Technology (MIT). Para descrição dos metadados adota o padrão Dublin Core. É compatível com o Protocolo de Arquivos Abertos (OAI) permitindo interoperabilidade com repositórios de âmbito nacional e internacional.

1. Portaria IPEN-CNEN/SP nº 387, que estabeleceu os princípios que nortearam a criação do RDI, clique aqui.


2. A experiência do Instituto de Pesquisas Energéticas e Nucleares (IPEN-CNEN/SP) na criação de um Repositório Digital Institucional – RDI, clique aqui.

O Repositório Digital do IPEN é um equipamento institucional de acesso aberto, criado com o objetivo de reunir, preservar, disponibilizar e conferir maior visibilidade à Produção Científica publicada pelo Instituto, desde sua criação em 1956.

Operando, inicialmente como uma base de dados referencial o Repositório foi disponibilizado na atual plataforma, em junho de 2015. No Repositório está disponível o acesso ao conteúdo digital de artigos de periódicos, eventos, nacionais e internacionais, livros, capítulos, dissertações, teses e relatórios técnicos.

A elaboração do projeto do RI do IPEN foi iniciado em novembro de 2013, colocado em operação interna em julho de 2014 e disponibilizado na Internet em junho de 2015. Utiliza o software livre Dspace, desenvolvido pelo Massachusetts Institute of Technology (MIT). Para descrição dos metadados adota o padrão Dublin Core. É compatível com o Protocolo de Arquivos Abertos (OAI) permitindo interoperabilidade com repositórios de âmbito nacional e internacional.

O gerenciamento do Repositório está a cargo da Biblioteca do IPEN. Constam neste RI, até o presente momento 20.950 itens que tanto podem ser artigos de periódicos ou de eventos nacionais e internacionais, dissertações e teses, livros, capítulo de livros e relatórios técnicos. Para participar do RI-IPEN é necessário que pelo menos um dos autores tenha vínculo acadêmico ou funcional com o Instituto. Nesta primeira etapa de funcionamento do RI, a coleta das publicações é realizada periodicamente pela equipe da Biblioteca do IPEN, extraindo os dados das bases internacionais tais como a Web of Science, Scopus, INIS, SciElo além de verificar o Currículo Lattes. O RI-IPEN apresenta também um aspecto inovador no seu funcionamento. Por meio de metadados específicos ele está vinculado ao sistema de gerenciamento das atividades do Plano Diretor anual do IPEN (SIGEPI). Com o objetivo de fornecer dados numéricos para a elaboração dos indicadores da Produção Cientifica Institucional, disponibiliza uma tabela estatística registrando em tempo real a inserção de novos itens. Foi criado um metadado que contém um número único para cada integrante da comunidade científica do IPEN. Esse metadado se transformou em um filtro que ao ser acionado apresenta todos os trabalhos de um determinado autor independente das variáveis na forma de citação do seu nome.