Kontaktperson
Olof Mogren
Senior Researcher
Kontakta OlofIdag används stora datamängder för att träna AI-system som kan vara till stor nytta för mänskligheten. Men vad de tränade systemen minns från datan som den tränats på är inte alltid tydligt. Vi jobbar för att göra det tydligt vad ett system kommer ihåg, samt för metoder som kan garantera att systemet minns det vi önskar.
Maskininlärning som kan bevara privacy i känslig data är system som kan ge privacy för användare. Det kan exempelvis vara användare som går med på att deras personliga data får användas för en studie, men att vissa attribut inte kan tas med i datan. Exempel på känsliga sådana attribut kan vara adresser, personnummer, telefonnummer och namn. En möjlig strategi för att kunna bidra med data i sådana sammanhang kan vara mekanismer som privatiserar datan mer eller mindre automatiskt.
RISE har satsningar på utveckling av tekniker för känslig data, som kan vara medicinska texter eller bilder, eller personlig data såsom fotografier på sociala medier. I nedanstående publikation presenterar vi ett sådant exempel för bilder, som bygger på adverseriell inlärning och djupa neuronnät (convolutional neural networks); en metod som bygger på att modellen tränas med hjälp av en inlärd motståndare. Detta är ett område som vi jobbar med aktivt inom både bildanalys och språk, och som inte blir mindre aktuellt.
Relevanta publikationer:
John Martinsson, Edvin Listo Zec, Daniel Gillblad, Olof Mogren, Adversarial representation learning for synthetic replacement of private attributes, arxiv preprint, 2020, https://arxiv.org/abs/2006.08039
David Ericsson, Adam Östberg, Edvin Listo Zec, John Martinsson, Olof Mogren, Adversarial representation learning for private speech generation, arxiv preprint, 2020, https://arxiv.org/abs/2006.09114