Ladies of Data editie 2022: een volle kapel en inspirerende gesprekken
Posted on
Een volle kapel en inspirerende gesprekken tijdens Ladies of Data 2022. Op 14 april kwamen 100+ data scientists bij elkaar voor Ladies of Data, een inclusief evenement rond data science en diversiteit. Dit jaar was het thema NLP (Natural Language Processing).
In de keynotes werden bezoekers geïnspireerd door twee succesvolle leiders in data science, die vertelden over de lessen die ze hebben geleerd en hun unieke perspectieven. In de presentatie van Margot Rozendaal besprak ze use cases voor marketing, reclame en de redactie bij DPG Media. Ze legde uit hoe DPG door middel van onderwerpmodellering, transformatoren en segmentatie de artikelen analyseert die hun bezoekers prefereren en hun klantreis kan personaliseren. Rina Joosten van Seedlink sprak over het creëren van menselijke en maatschappelijke impact door middel van technologie en hoe Seedlink een beoordelingsindustrie van miljarden dollars uitdaagt. De presentaties waren interactief en persoonlijk, met veel vragen uit het publiek.

Margot Rozendaal (DPG) tijdens haar presentatie
In de breakout-sessies organiseerden we een aantal interessante presentaties en discussies over actuele actuele onderwerpen in data science en AI.
Breakout 1
Wat(/welke vooroordelen) hebben taalmodellen geleerd?
door Heleen Rutjes en Emiel van Miltenburg

In deze interactieve sessie van Heleen Rutjes en Emiel Miltenburg spraken we over vooroordelen in taalmodellen. We hebben vooral gesproken over taalgenererende modellen. Taalgeneratiemodellen zijn NLP-modellen die tekst kunnen genereren op basis van gegeven gebruikersinvoer. Over het algemeen worden taalgeneratiemodellen getraind op grote hoeveelheden (historische) teksten. Uiteraard erven deze modellen veel van de vooroordelen die in onze samenleving heersten. We onderzochten enkele van de gevolgen die dit soort vooroordelen kunnen hebben en hoe we ze kunnen blootleggen. Een cool voorbeeld dat tot stand is gekomen, is een tool gemaakt door PAIR. Je kunt het hier bekijken: https://pair.withgoogle.com/explorables/fill-in-the-blank/
Breakout 2
Automatische spraakherkenning
door Esther van den Berg uit Amberscript

Met de opkomst van grote, vooraf getrainde automatische spraakherkenning, beginnen ASR-oplossingen een handelsartikel te worden. De meeste automatisch gegenereerde ondertitels bereiken echter niet het nauwkeurigheidsniveau dat nodig is om audio toegankelijk te maken voor niet-moedertaalsprekers of voor doven en slechthorenden. In deze break-outsessie besprak Esther de principes van ASR, het belang van audiotoegankelijkheid en het voordeel van human-in-the-loop ASR-oplossingen voor een betere toegankelijkheid voor iedereen.
Breakout 3
NLP-technieken omzetten in zakelijke inzichten
door Milou Ehrismann en Elena Weber van Underlined

In de breakout-sessie met Underlined legde Milou uit hoe zij NLP-technieken gebruiken om bedrijven te helpen met het optimaliseren van customer journeys. Underlined integreert tekst uit meerdere databronnen en verrijkt deze data met behulp van geavanceerde NLP-algoritmen en process mining. Zaken als het modelleren van de complexe Nederlandse taal en het maken van aangepaste stopwoordenlijsten kwamen tijdens de sessie aan bod. Via een themaboom geeft Underlined bedrijven zakelijke inzichten om acties te ondernemen om het klantgeluk te verbeteren. Daarnaast besprak Elena een van de onderzoeksprojecten bij Underlined waar ze bij betrokken is. Ze onderzoekt hoe NLP-technieken die in banken worden gebruikt kunnen worden geëvalueerd om feedback van klanten automatisch in onderwerpen te classificeren.
We willen alle sprekers en deelnemers bedanken voor dit geweldige evenement en hopen jullie allemaal volgend jaar te zien!