O aprendizado de máquina é um campo de estudo dentro da inteligência artificial que busca criar modelos capazes de aprender com base em dados, tendo uma grande interseção com a modelagem estatística preditiva. Dependendo do tipo de aprendizado, podemos chamá-lo de supervisionado ou não supervisionado, sendo classificado pela existência ou ausência da variável de resposta original para realizar algum tipo de supervisão no modelo. Dentro desses grupos, temos modelos para classificação e regressão no caso supervisionado, assim como análise de agrupamento e redução de dimensionalidade para o caso não supervisionado. Assim, nesta linha de pesquisa, será de interesse desenvolver trabalhos com a aplicação dessas classes de modelos mencionados. Entre essas classes, podemos citar como modelos de maior interesse as técnicas de aprendizado supervisionado, como máquinas de vetores de suporte, modelos de árvores (árvore de decisão, árvore de regressão e floresta aleatória) e KNN. Bem como métodos hierárquicos e não hierárquicos (k-means e fuzzy c-means) de análise de agrupamento, e redução de dimensionalidade por meio da análise de componentes principais.
Além do próprio processo de modelagem, será dedicada atenção ao processo conhecido como engenharia de dados, onde todo o processo de limpeza, transformação, adição e remoção de variáveis é realizado. Esse processo é responsável por 80% do tempo utilizado durante a análise de dados, portanto, atenção e cuidado são necessários, dada a importância desse processo para a fase de modelagem. Além do processo de engenharia, também é necessário aplicar algumas técnicas de visualização de dados para compreender e comunicar melhor as informações apresentadas pelos dados. Assim, espera-se que esta linha de pesquisa possa desenvolver projetos de forma independente, bem como oferecer suporte para o desenvolvimento de projetos para outras linhas de pesquisa.
Coordenador de Pesquisa e Líder da Equipe
Coordenador de Pesquisa e Líder da Equipe
- Neto, E. D. A. L., & Rodrigues, P. C. (2023). Kernel robust singular value decomposition. Expert Systems with Applications, 211, 118555.
- de Oliveira, G. P., Fonseca, A., & Rodrigues, P. C. (2022). Diabetes diagnosis based on hard and soft voting classifiers combining statistical learning models. Brazilian Journal of Biometrics, 40(4), 415-427.
- Pimentel, J. S., & Rodrigues, P. C. (2022). Clustering the world currency exchange rates using hierarchical methods based on dynamic time warping. Fluctuation and Noise Letters, 21(01), 2250001.
- Pimentel, J. S., Ospina, R., & Ara, A. (2021). Learning time acceleration in support vector regression: a case study in educational data mining. Stats, 4(3), 682-700.
- Maia, M., Pimentel, J. S., Pereira, I. S., Gondim, J., Barreto, M. E., & Ara, A. (2020). Convolutional support vector models: Prediction of coronavirus disease using chest x-rays. information, 11(12), 548.