Repository logo
 
Publication

Multiple imputation in big identifiable data for educational research: An example from the Brazilian education assessment system

dc.contributor.authorFerrão, Maria Eugénia
dc.contributor.authorPrata, Paula
dc.contributor.authorAlves, Maria Teresa G.
dc.date.accessioned2020-10-26T09:41:00Z
dc.date.available2020-10-26T09:41:00Z
dc.date.issued2020
dc.description.abstractAlmost all quantitative studies in educational assessment, evaluation and educational research are based on incomplete data sets, which have been a problem for years without a single solution. The use of big identifiable data poses new challenges in dealing with missing values. In the first part of this paper, we present the state-of-art of the topic in the Brazilian education scientific literature, and how researchers have dealt with missing data since the turn of the century. Next, we use open access software to analyze real-world data, the 2017 Prova Brasil , for several federation units to document how the naïve assumption of missing completely at random may substantially affect statistical conclusions, researcher interpretations, and subsequent implications for policy and practice. We conclude with straightforward suggestions for any education researcher on applying R routines to conduct the hypotheses test of missing completely at random and, if the null hypothesis is rejected, then how to implement the multiple imputation, which appears to be one of the most appropriate methods for handling missing data.pt_PT
dc.description.abstractQuase todos os estudos quantitativos em aferição, avaliação e pesquisa educacional são baseados em conjuntos de dados incompletos, que têm sido um problema há anos sem solução única. O uso de grandes dados identificáveis apresenta novos desafios para lidar com valores ausentes. Na primeira parte deste artigo, apresentamos o estado-da-arte do tópico na literatura científica educacional brasileira e como os pesquisadores têm tratado os dados omissos. Em seguida, usamos o software de acesso livre para analisar dados do mundo real, a Prova Brasil 2017, para várias unidades da federação, e documentamos como pressuposto de dados omissos completamente aleatórios pode afetar os resultados estatísticos, as interpretações e implicações subsequentes para políticas e práticas. Concluímos com sugestões diretas para qualquer pesquisador de Educação sobre a aplicação de rotinas R para realizar o teste de hipóteses de dados omissos completamente aleatórios e, se a hipótese nula for rejeitada, como implementar a imputação múltipla, que parece ser um dos métodos mais apropriados para manipular dados ausentes.pt_PT
dc.description.abstractCasi todos los estudios cuantitativos en evaluación, evaluación e investigación educativa se basan en conjuntos de datos incompletos, que han sido un problema desde hace años sin solución única. El uso de grandes datos identificables presenta nuevos desafíos para manejar los valores ausentes. En la primera parte de este artículo, presentamos el estado del arte del tópico en la literatura científica educativa brasileña y cómo los investigadores han tratado los datos omisos. A continuación, utilizamos el software de acceso libre para analizar datos del mundo real, la Prueba Brasil 2017, para varias unidades de la federación, y documentamos cómo la asunción de datos omisos completamente aleatorios puede afectar los resultados estadísticos, las interpretaciones e implicaciones subsecuentes para políticas y prácticas. Concluimos con sugerencias directas para cualquier investigador de Educación sobre la aplicación de rutinas R para realizar la prueba de hipótesis de datos omisos completamente aleatorios y, si la hipótesis nula es rechazada, cómo implementar la imputación múltiple, que parece ser uno de los métodos más apropiados para manipular datos ausentes.pt_PT
dc.description.sponsorshipCentro-01-0145-FEDER-000019-C4-Centro de Competências em Cloud Computing and by the Brazilian Coordination for the Improvement of Higher Education Personnel Foundation, through a post-doc fellowship for a research project, which took place at the Faculty of Sciences of the University of Beira Interior, Portugal (Capes-PVE88881.169888/2018-01), and partially supported by the Brazilian National Council for Scientific and Technological Development (CNPq-process 440172 / 2017-9).pt_PT
dc.description.versioninfo:eu-repo/semantics/publishedVersionpt_PT
dc.identifier.citationFerrão, Maria Eugénia, Prata, Paula, & Alves, Maria Teresa Gonzaga. (2020). Multiple imputation in big identifiable data for educational research: An example from the Brazilian education assessment system. Ensaio: Avaliação e Políticas Públicas em Educação, 28(108), 599-621. Epub May 08, 2020.https://doi.org/10.1590/s0104-40362020002802346pt_PT
dc.identifier.doi10.1590/s0104-40362020002802346pt_PT
dc.identifier.urihttp://hdl.handle.net/10400.6/10484
dc.language.isoengpt_PT
dc.peerreviewedyespt_PT
dc.publisherScielopt_PT
dc.relationCEMAPRE - Centre for Applied Mathematics and Economics
dc.relationInstituto de Telecomunicações
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0/pt_PT
dc.subjectProva Brasilpt_PT
dc.subjectMissing datapt_PT
dc.subjectRpt_PT
dc.subjectMultiple imputationpt_PT
dc.titleMultiple imputation in big identifiable data for educational research: An example from the Brazilian education assessment systempt_PT
dc.typejournal article
dspace.entity.typePublication
oaire.awardTitleCEMAPRE - Centre for Applied Mathematics and Economics
oaire.awardTitleInstituto de Telecomunicações
oaire.awardURIinfo:eu-repo/grantAgreement/FCT/6817 - DCRRNI ID/UID%2FMulti%2F00491%2F2019/PT
oaire.awardURIinfo:eu-repo/grantAgreement/FCT/6817 - DCRRNI ID/UIDB%2F50008%2F2020/PT
oaire.citation.endPage621pt_PT
oaire.citation.issue108pt_PT
oaire.citation.startPage599pt_PT
oaire.citation.titleEnsaio: Avaliação e Políticas Públicas em Educaçãopt_PT
oaire.citation.volume28pt_PT
oaire.fundingStream6817 - DCRRNI ID
oaire.fundingStream6817 - DCRRNI ID
person.familyNameFerrão
person.familyNamePrata
person.familyNameAlves
person.givenNameMaria Eugénia
person.givenNamePaula
person.givenNameMaria Teresa G.
person.identifier.ciencia-id651F-C1C8-44AD
person.identifier.orcid0000-0002-1317-0629
person.identifier.orcid0000-0002-3072-0186
person.identifier.orcid0000-0001-5820-4311
person.identifier.ridA-2665-2011
person.identifier.ridN-3912-2018
person.identifier.scopus-author-id24075949800
person.identifier.scopus-author-id6506143567
project.funder.identifierhttp://doi.org/10.13039/501100001871
project.funder.identifierhttp://doi.org/10.13039/501100001871
project.funder.nameFundação para a Ciência e a Tecnologia
project.funder.nameFundação para a Ciência e a Tecnologia
rcaap.rightsopenAccesspt_PT
rcaap.typearticlept_PT
relation.isAuthorOfPublicationf32b6cd9-ea61-4de5-898c-d4e0d40a057f
relation.isAuthorOfPublication138a0dac-5e5d-466c-901d-4ed34f860403
relation.isAuthorOfPublication5e776620-d590-4205-92f3-e2816959b0e3
relation.isAuthorOfPublication.latestForDiscovery138a0dac-5e5d-466c-901d-4ed34f860403
relation.isProjectOfPublication3c03382d-40bb-4377-8ced-49d3b96873a8
relation.isProjectOfPublication5a9bd4c8-57a9-46c4-95dc-a5e5c220c117
relation.isProjectOfPublication.latestForDiscovery3c03382d-40bb-4377-8ced-49d3b96873a8

Files

Original bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
publicado-1809-4465-ensaio-S0104-40362020002802346.pdf
Size:
1.31 MB
Format:
Adobe Portable Document Format