Repository logo
 
Publication

Anonimização de Dados em Educação

datacite.subject.fosEngenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informáticapor
dc.contributor.advisorSousa, Maria Paula Prata de
dc.contributor.advisorSilva, Maria Eugénia Neto Ferrão da
dc.contributor.authorSantos, Wilson Gama dos
dc.date.accessioned2023-01-18T15:18:47Z
dc.date.available2023-01-18T15:18:47Z
dc.date.issued2021-02-17
dc.date.submitted2020-12-21
dc.description.abstractInterest in data privacy is not only growing, but the quantity of data collected is also increasing. This data, which is collected and stored electronically, contains information related with all aspects of our lives, frequently containing sensitive information, such as financial records, activity in social networks, location traces collected by our mobile phones and even medical records. Consequently, it becomes paramount to assure the best protection for this data, so that no harm is done to individuals even if the data is to become publicly available. To achieve it, it is necessary to avoid the linkage between records in a dataset and a real world individual. Despite some attributes, such as gender and age, though alone they can not identify a corresponding individual, their combination with other datasets can lead to the existence of unique records in the dataset and a consequent linkage to a real world individual. Therefore, with data anonymization, it is possible to assure, with various degrees of protection, that said linkage is avoided the best we can. However, this process can have a decline in data utility as consequence. In this work, we explore the terminology and some of the techniques that can be used during the process of data anonymization. Moreover, we show the effects of said techniques on information loss, data utility and re-identification risk, when applied to a dataset with personal information collected from college graduated students. Finally, and once the results are presented, we perform an analysis and comparative discussion of the obtained results.eng
dc.description.abstractHoje em dia é possível observar que tanto a preocupação com a privacidade dos dados pessoais como a quantidade de dados recolhidos estão a aumentar. Estes dados, recolhidos e armazenados eletronicamente, contêm informação relacionada com todos os aspetos das nossas vidas, informação essa muitas vezes sensível, tal como registos financeiros, atividade em redes sociais, rastreamento de dispositivos móveis e até registos médicos. Consequentemente, torna-se vital assegurar a proteção destes dados para que, mesmo se tornados públicos, não causem danos pessoais aos indivíduos envolvidos. Para isso, é necessário evitar que registos nos dados sejam associados a indivíduos reais. Apesar de atributos, como o género e a idade, singularmente não conseguirem identificar o individuo correspondente, a sua combinação com outros conjuntos de dados, pode levar à existência de um registo único no conjunto de dados e consequente associação a um individuo. Com a anonimização dos dados, é possível assegurar, com variados graus de proteção, que essa associação a um individuo real seja evitada ao máximo. Contudo, este processo pode ter como consequência uma diminuição na utilidade dos dados. Com este trabalho, exploramos a terminologia e algumas das técnicas que podem ser utilizadas no processo de anonimização de dados. Mostramos também os efeitos dessas várias técnicas tanto na perda de informação e utilidade dos dados, como no risco de re-identificação associado, quando aplicadas a um conjunto de dados com informação pessoal recolhida a alunos que conluíram o ensino superior. No final, e uma vez feita a apresentação dos resultados, é feita uma análise e discussão comparativa dos resultados obtidos.por
dc.identifier.tid203175280
dc.identifier.urihttp://hdl.handle.net/10400.6/12689
dc.language.isoengpor
dc.relationInstituto de Telecomunicações
dc.relationResearch in Economics and Mathematics
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/4.0/
dc.subjectAnonimização de Dadospor
dc.subjectK-Anonimatopor
dc.subjectL-Diversidadepor
dc.subjectT-Proximidadepor
dc.titleAnonimização de Dados em Educaçãopor
dc.typemaster thesis
dspace.entity.typePublication
oaire.awardTitleInstituto de Telecomunicações
oaire.awardTitleResearch in Economics and Mathematics
oaire.awardURIinfo:eu-repo/grantAgreement/FCT/6817 - DCRRNI ID/UIDB%2F50008%2F2020/PT
oaire.awardURIinfo:eu-repo/grantAgreement/FCT/6817 - DCRRNI ID/UIDB%2F05069%2F2020/PT
oaire.fundingStream6817 - DCRRNI ID
oaire.fundingStream6817 - DCRRNI ID
person.familyNameSantos
person.givenNameWilson
person.identifier.orcid0000-0002-2557-8947
project.funder.identifierhttp://doi.org/10.13039/501100001871
project.funder.identifierhttp://doi.org/10.13039/501100001871
project.funder.nameFundação para a Ciência e a Tecnologia
project.funder.nameFundação para a Ciência e a Tecnologia
rcaap.rightsopenAccesspor
rcaap.typemasterThesispor
relation.isAuthorOfPublication084665cf-d2ed-402e-a6e8-1dc74a13c999
relation.isAuthorOfPublication.latestForDiscovery084665cf-d2ed-402e-a6e8-1dc74a13c999
relation.isProjectOfPublication5a9bd4c8-57a9-46c4-95dc-a5e5c220c117
relation.isProjectOfPublication6d4350a2-a786-44ff-9ab8-6350f3b4ae97
relation.isProjectOfPublication.latestForDiscovery6d4350a2-a786-44ff-9ab8-6350f3b4ae97
thesis.degree.name2º Ciclo em Engenharia Informáticapor

Files

Original bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
8043_17279.pdf
Size:
1.89 MB
Format:
Adobe Portable Document Format