???global.info.a_carregar???
Identificação

Identificação pessoal

Nome completo
João Pedro Lebre Magalhães Pereira

Nomes de citação

  • João L. M. Pereira

Identificadores de autor

Ciência ID
9813-025F-6310
ORCID iD
0000-0002-3247-5524
Google Scholar ID
n9-ph6AAAAAJ&hl
Researcher Id
IYJ-9715-2023
Scopus Author Id
57198007997

Domínios de atuação

  • Ciências da Engenharia e Tecnologias - Engenharia Eletrotécnica, Eletrónica e Informática
  • Ciências Exatas - Ciências da Computação e da Informação - Ciências da Informação

Idiomas

Idioma Conversação Leitura Escrita Compreensão Peer-review
Português (Idioma materno)
Inglês Utilizador proficiente (C1) Utilizador proficiente (C1) Utilizador proficiente (C1) Utilizador proficiente (C1)
Espanhol; Castelhano Utilizador independente (B1) Utilizador independente (B1) Utilizador elementar (A1) Utilizador independente (B1)
Formação
Grau Classificação
2016 - 2023/02/24
Concluído
Engenharia Informática e de Computadores (Doutoramento)
Universidade de Lisboa Instituto Superior Técnico, Portugal
"Towards effective and effortless data cleaning: from automatic approaches to user involvement" (TESE/DISSERTAÇÃO)
Aprovado com Distinção
2014
Concluído
Master of Science (Technology) in Computer Science and Engineering (Master)
Aalto-yliopisto, Finlândia
"Supervised Learning for Relationship Extraction From Textual Documents " (TESE/DISSERTAÇÃO)
3 (Finnish scale)
2013/11/11
Concluído
Engenharia Informática e de Computadores (Mestrado)
Universidade de Lisboa Instituto Superior Técnico, Portugal
"Supervised Learning for Relationship Extraction From Textual Documents" (TESE/DISSERTAÇÃO)
16
2013 - 2013
Concluído
Scientific Writing and Communication - Short Course for Researchers (Curso médio)
Universidade de Lisboa Instituto Superior Técnico, Portugal
2011
Concluído
Licenciatura Bolonha em Engenharia Informática e de Computadores - Alameda (Licenciatura)
Universidade de Lisboa Instituto Superior Técnico, Portugal
14
Percurso profissional

Ciência

Categoria Profissional
Instituição de acolhimento
Empregador
2015/07 - 2015/10 Estagiário de Investigação (Investigação) Webdetials, a Pentaho Company, Portugal

Docência no Ensino Superior

Categoria Profissional
Instituição de acolhimento
Empregador
2023/09 - Atual Professor Auxiliar Convidado (Docente Universitário) Universidade de Évora, Portugal

Cargos e Funções

Categoria Profissional
Instituição de acolhimento
Empregador
2021/08/23 - 2023/09 Teacher 4 (Lecturer) Universiteit van Amsterdam Faculteit der Natuurwetenschappen Wiskunde en Informatica, Países Baixos

Outros

Categoria Profissional
Instituição de acolhimento
Empregador
2015/10 - 2016/04 Engenheiro de software (Técnica Superior) Webdetials, a Pentaho Company, Portugal
2015/01 - 2015/07 Investigador Junior (Investigação Científica) Instituto de Engenharia de Sistemas e Computadores, Investigação e Desenvo, Portugal
2014/01 - 2014/12 Investigador Junior (Investigação Científica) Instituto de Engenharia de Sistemas e Computadores, Investigação e Desenvo, Portugal
2013/03 - 2013/12 Investigador Junior (Investigação Científica) Instituto de Engenharia de Sistemas e Computadores, Investigação e Desenvo, Portugal
Projetos

Bolsa

Designação Financiadores
2018/09 - 2021/08 FCT PhD Scholarship
SFRH/BD/135719/2018
Bolseiro de Doutoramento
Instituto de Engenharia de Sistemas e Computadores Investigação e Desenvolvimento em Lisboa, Portugal
Fundação para a Ciência e a Tecnologia
Concluído
2016 - 2018 ULisboa PhD Scholarship
BD ULisboa
Bolseiro de Doutoramento
Instituto de Engenharia de Sistemas e Computadores Investigação e Desenvolvimento em Lisboa, Portugal
Concluído

Projeto

Designação Financiadores
2024 - 2028 HarmonicAI: Human-guided collaborative multi-objective design of explainable, fair, and privacy-preserving AI for digital health
101131117
Investigador
Universidade do Minho Centro ALGORITMI, Portugal

Universidade de Évora, Portugal
Horizon Europe Excellent Science
2015/03/01 - 2021/04/01 Instituto de Engenharia de Sistemas e Computadores, Investigação e Desenvolvimento em Lisboa
UID/CEC/50021/2019
SFRH/BPD/110695/2015
Instituto de Engenharia de Sistemas e Computadores Investigação e Desenvolvimento em Lisboa, Portugal
Fundação para a Ciência e a Tecnologia
Concluído
2015/01/12 - 2015/07/12 Project DataStorm - Large-Scale Data Management in Cloud Environments
EXCL/EEI-ESS/0257/2012
Bolseiro de Investigação
Instituto de Engenharia de Sistemas e Computadores Investigação e Desenvolvimento em Lisboa, Portugal
Fundação para a Ciência e a Tecnologia
Concluído
2014/01/01 - 2014/12/31 Project DataStorm - Large-Scale Data Management in Cloud Environments
EXCL/EEI-ESS/0257/2012
Bolseiro de Investigação
Instituto de Engenharia de Sistemas e Computadores Investigação e Desenvolvimento em Lisboa, Portugal
Fundação para a Ciência e a Tecnologia
Concluído
2013/03/15 - 2013/12/15 SMARTIES
PTDC/EIA-EIA/115346/2009
Bolseiro de Investigação
Instituto de Engenharia de Sistemas e Computadores Investigação e Desenvolvimento em Lisboa, Portugal
Fundação para a Ciência e a Tecnologia
Concluído
Produções

Publicações

Artigo em conferência
  1. Berry Blom; João L. M. Pereira. "Domain Adaptation in Transformer Models: Question Answering of Dutch Government Policies". Trabalho apresentado em Intelligent Data Engineering and Automated Learning, Évora, 2023.
    10.1007/978-3-031-48232-8_19
  2. Lorincz, Anna; Graus, David; Lavi, Dor; João Pedro Lebre Magalhães Pereira. "Transfer learning for multilingual vacancy text generation". 2022.
    10.18653/v1/2022.gem-1.18
  3. Pereira, João Pedro Lebre Magalhães; Helena Galhardas; Bruno Martins. "A Benchmark for Relation Extraction Kernels". Trabalho apresentado em East-European Conference on Advances in Databases and Information Systems, Poitiers, 2015.
    Publicado • 10.1007/978-3-319-23135-8_13
  4. Pereira, João Pedro Lebre Magalhães; Gonçalo Simões; Helena Galhardas; Bruno Martins. "Uma Benchmark para Kernels de Extracção de Relações". Trabalho apresentado em INFORUM, Porto, 2014.
    Publicado
Artigo em revista
  1. João L. M. Pereira; Manuel J. Fonseca; Antónia Lopes; Helena Galhardas. "Cleenex: Support for User Involvement During an Iterative Data Cleaning Process". Journal of Data and Information Quality (2024): http://dx.doi.org/10.1145/3648476.
    10.1145/3648476
  2. João Pedro Lebre Magalhães Pereira; João Casanova; Helena Galhardas; Dennis Shasha. "AcX: system, techniques, and experiments for acronym expansion". Proceedings of the VLDB Endowment 15 11 (2022): 2530-2544. http://dx.doi.org/10.14778/3551793.3551812.
    10.14778/3551793.3551812
Relatório
  1. Pereira, João Pedro Lebre Magalhães; Gonçalo Simões; Helena Galhardas; Bruno Martins. 2015. A Benchmark for Relation Extraction Kernels.
Atividades

Orientação

Título / Tema
Papel desempenhado
Curso (Tipo)
Instituição / Organização
2023 - 2023 Enhancing Acronym Identification: Introducing a parentheses-free rule-based algorithm - ParenlessAI and a novel Bulgarian Data Set
Orientador
Information Studies (Mestrado)
Universiteit van Amsterdam, Países Baixos
2023 - 2023 Summarization of Webpages to Generate Company Descriptions
Orientador
Information Studies (Mestrado)
Universiteit van Amsterdam, Países Baixos
2023 - 2023 Long-Form Question Answering in the Dutch Municipal Domain
Orientador
Information Studies (Mestrado)
Universiteit van Amsterdam, Países Baixos
2023 - 2023 Enhancing Topic Classification of Dutch Provincial Motions through Transfer Learning: A Comparative Analysis of Machine Learning Models
Coorientador
Information Studies (Mestrado)
Universiteit van Amsterdam, Países Baixos
2023 - 2023 Using A Web Search Engine for Automatic Acronym Disambiguation
Orientador
Information Studies (Mestrado)
Universiteit van Amsterdam, Países Baixos
2023 - 2023 Evaluating Large Language Models for Author Name Extraction in Noisy and Context-restricted Settings
Coorientador
Information Studies (Mestrado)
Universiteit van Amsterdam, Países Baixos
2023 - 2023 Extraction of Acronyms and Expansions from Text using Machine Learning Methods
Orientador
Information Studies (Mestrado)
Universiteit van Amsterdam, Países Baixos
2022 - 2022 Acronym identification techniques and experiments for acronym expander systems
Orientador
Information Studies (Mestrado)
Universiteit van Amsterdam, Países Baixos
2022 - 2022 Acronym expansion in Dutch: Improving out-expansion performance with BERT and SBERT
Orientador
Information Studies (Mestrado)
Universiteit van Amsterdam, Países Baixos
2022 - 2022 Acronym expansion for Spanish language
Orientador
Information Studies (Mestrado)
Universiteit van Amsterdam, Países Baixos
2022 - 2022 Domain Adaptation in Transformer models: Question Answering of Dutch Government Policies
Orientador
Information Studies (Mestrado)
Universiteit van Amsterdam, Países Baixos
2022 - 2022 Identifying football talent profiles: a feature reduction and cluster analysis
Orientador
Information Studies (Mestrado)
Universiteit van Amsterdam, Países Baixos
2022 - 2022 Transfer learning for multilingual vacancy text generation
Orientador
Information Studies (Mestrado)
Universiteit van Amsterdam, Países Baixos
2020 - 2021 Acronym and Definition Extraction
Coorientador
Engenharia Informática e de Computadores (Mestrado)
Universidade de Lisboa Instituto Superior Técnico, Portugal

Organização de evento

Nome do evento
Tipo de evento (Tipo de participação)
Instituição / Organização
2014 - 2014 Data Integration in the Life Sciences
Conferência (Outra)
Fundação para a Ciência e a Tecnologia, Portugal
2014 - 2014 DataStorm Big Data Summer School
Outro (Outra)
Fundação para a Ciência e a Tecnologia, Portugal

Participação em evento

Descrição da atividade
Tipo de evento
Nome do evento
Instituição / Organização
2023/11/22 - Atual Session Chair
Conferência
Intelligent Data Engineering and Automated Learning
Universidade de Évora, Portugal

Júri de grau académico

Tema
Tipo de participação
Nome do candidato (Tipo de grau)
Instituição / Organização
2023 An Experimental Evaluation of Cluster K Estimation Methods on Deep Learned Vector Embeddings for Page Stream Segmentation
Arguente principal
Eric Alfaro (Mestrado)
Universiteit van Amsterdam, Países Baixos
2023 Testing for the efficacy and applicability of NLP approaches in capturing the dynamics of the British security environment between 2010 and 2021
Arguente principal
Saskia Heyster (Mestrado)
Universiteit van Amsterdam, Países Baixos
2023 Provenance and Dependency Analysis of Slide Decks
Arguente principal
Gargi Nandanpawar (Mestrado)
Universiteit van Amsterdam, Países Baixos
2023 Recognizing Complex Named Entities Using GPT-3
Arguente principal
Mark Geurts (Mestrado)
Universiteit van Amsterdam, Países Baixos
2022 Information Retrieval and Knowledge Extraction on the Dutch Government Information Public Access Act Decision Letters
Arguente principal
Julián Venhuizen (Mestrado)
Universiteit van Amsterdam, Países Baixos
2022 A comparison between two page-stream segmentation approaches using content evaluated on Dutch governmental data
Arguente principal
Stefan Dijkstra (Mestrado)
Universiteit van Amsterdam, Países Baixos
2022 Combining Computer Vision and Deep Learning to split concatenated policy documents
Arguente principal
Sang Pham Minh (Mestrado)
Universiteit van Amsterdam, Países Baixos
2022 Prediction of Post-Operative Esophagectomy Complications through Structured and Unstructured EHR Data
Arguente principal
Emily Bakker (Mestrado)
Universiteit van Amsterdam, Países Baixos
2022 Improving readability and searchability of documents provided by the Dutch government under the WOB
Arguente principal
Justin Bon (Mestrado)
Universiteit van Amsterdam, Países Baixos
2022 Detecting Redaction in publicly published government documents
Arguente principal
Ammar Alhashmi (Mestrado)
Universiteit van Amsterdam, Países Baixos
2022 Generalisibility of deep learning page-stream segmentation methods evaluated on governmental data
Arguente principal
Pepijn Groenen (Mestrado)
Universiteit van Amsterdam, Países Baixos
2022 Data structuring for climate change research: Carbon net-zero-specific label assignment to scientific documents
Arguente principal
Suvendu Pati (Mestrado)
Universiteit van Amsterdam, Países Baixos
2022 Applying Dutch pre-trained word embedding models to classify grocery products
Arguente principal
Gijs Gubbels (Mestrado)
Universiteit van Amsterdam, Países Baixos
2022 Using deep learned vector representations for page stream segmentation by agglomerative clustering
Arguente principal
Lukas Busch (Mestrado)
Universiteit van Amsterdam, Países Baixos

Arbitragem científica em conferência

Nome da conferência Local da conferência
2023/06/21 - 2023/06/23 International Conference on Computational Science London, United Kingdom

Curso / Disciplina lecionado

Disciplina Curso (Tipo) Instituição / Organização
2014 - 2014 Java for Big Data Especialização (Curso médio) DataStorm Big Data Summer School, Portugal
2014 - 2014 Streaming Data Hands-On Lab Session Especialização (Curso médio) DataStorm Big Data Summer School, Portugal

Outro júri / avaliação

Descrição da atividade Instituição / Organização
2023 - Atual Membro do júri para a contratação de dois docentes em Sistemas de Informação na University of Amsterdam Universiteit van Amsterdam, Países Baixos
Distinções

Prémio

2022 IST Excellent Teacher 2020/2021
Universidade de Lisboa Instituto Superior Técnico, Portugal
2012 3rd place in the EBEC Aalto Software Development Competition