Åbne danske data til træning af AI

Åbne danske data til træning af AI

Råmaterialet for kunstig intelligens er data. Masser af data. Det gælder for machine learning, deep learning og især for de store sprogmodeller og moderne chatbots – og den almindelige konsensus er nok, at de store AI-firmaer mildest talt overskredet grænserne når det angår legitimiteten af deres dataindsamling.

Men rundt omkring er der også projekter og organisationer der forsøger at indsamle data på en forsvarlig og juridisk vandtæt facon, specifikt til AI-træning.

Denne gang har jeg besøgt Open Data DK, der formidler adgang til mange slags datasæt til fri anvendelse, og som altså nu også udforsker mulighederne i at lave datasæt specifikt til AI-træning.

I første omgang handler det om kommunale tekster og om stemmeprøver med danske dialekter, og det kan man høre meget mere om lidt senere, når jeg har selskab af Amalie Stauner og Birgitte Kjærgaard.

I Siden Sidst skal det blandt andet handle om LEGO, Corti og Apple (såkaldt) Intelligence.

Lyt med 🤖

LINKS
NYHEDER
ÅBNE DATA
© 2021 aidenmark.dk