Hogyan fejleszd az MI rendszeredet?

2023. október 24. 11:45 - poklaszlo

Praktikus útmutató a francia adatvédelmi hatóságtól

A mesterséges intelligencia (MI) rendszerek fejlesztése során sok fejtörést okozhat, miként történhet az adatvédelmi szabályoknak megfelelően a fejlesztés. Az adatvédelmi követelmények alkalmazása során számos kihívással találkozhatnak a fejlesztők, amelyekre még kevés kézzelfogható iránymutatás áll rendelkezésre. Éppen ezért jelentős mérföldkő, hogy - a mesterséges intelligencia témák kapcsán egyébként is igen akítv - francia adatvédelmi hatóság (CNIL) október 16-án közzétett egy praktikus ("how-to") útmutatót a GDPR-nak is megfelelő MI fejlesztések előmozdítása érdekében. (Az útmutató november 16-ig véleményezhető, ezt követően a visszajelzések feldolgozását követően nyeri el majd a végleges formáját.)

1. Mire vonatkozik az útmutató?

Az útmutató kifejezetten a fejlesztési fázisra (development) vonatkozik és nem érinti a kifejlesztett MI rendszerek, illetve MI komponenst tartalmazó rendszerek forgalomba helyezésével (deployment) kapcsolatos adatvédelmi kérdéseket. Az útmutató a GDPR szabályaira tekintettel készült, így szektorális (pl. bűnügyi adatkezelés) vagy egyes tagállamok jogában meglévő egyéb, az MI fejlesztés szempontjából (is) releváns adatvédelmi szabályra nem tér ki.

Az útmutató - értelemszerűen - azokra az esetekre vonatkozik, amikor személyes adat kezelésére kerül sor vagy legalábbis, az adatkezelés nem zárható ki. Ez utóbbi esetben azonban, ha a személyes adatok kiszűrhetők az adatbázisból (akár manuálisan, akár automatizáltan), akkor elkerülhető lehet az adatvédelmi szabályok alkalmazása további alkalmazása.

A fejlesztési szakaszon belül az útmutató az alábbi lépéseket különíti el:

2. Az alkalmazandó jog meghatozása

Az útmutató két alapvető esetet tárgyal az alkalmazandó jog meghatározása kapcsán:

már a fejlesztési szakaszban egyértelmű, hogy milyen célra kerül majd felhasználásra a fejlesztés alatt álló rendszer és a fejlesztési szakaszban is kizárólag ugyanebből a célból kerül sor adatkezelésre: ebben az esetben - tipikusan - ugyanazon jogszabályi keretek vonatkoznak a két szakaszra (azaz a fejlesztésre és a rendszer későbbi használatára),
a felhasználás célja a fejlesztés során még nem egyértelmű (általános célú MI rendszer): ebben az esetben a két szakaszra alkalmazandó jogi rezsim különböző lehet, ugyanakkor a fejlesztési szakaszban tipikusan a GDPR rendelkezéseinek kell megfelelni (később viszont nem kizárt, hogy a felhasználás már más rezsim, pl. a bűnüldözési célú adatkezelés körébe tartozik majd).

3. A cél meghatározása

Az adatkezelés céljának meghatározásával kapcsolatos általános követelményeknek az AI rendszerek fejlesztése során is érvényesülniük kell.

A cél meghatározása kapcsán is - az alkalmazandó jogi rezsim meghatorzásánál látott - két esetet különbözteti meg az útmutató:

már a fejlesztési szakaszban egyértelmű, hogy milyen célra kerül majd felhasználásra a fejlesztés alatt álló rendszer: az adatkezelés célja a két szakasz tekintetében megegyezik és ha a cél meghatározása a fejlesztési szakasz tekintetében "rendben van", azaz kellően meghatározott, egyértelmű és jogszerű az adatkezelési cél, akkor ez a felhasználási szakaszra is alkalmazható,
általános célú MI rendszer: a fejlesztési szakaszra külön célmeghatározás szükséges, amelynek önmagában meg kell felelnie a célhoz kötöttség elvének, a cél meghatározása nem lehet túlzottan általános (pl. "MI rendszer fejlesztése és továbbfejlesztése"), hanem akkor tekinthető kellően pontosnak, ha legalább (a) a fejlesztés alatt álló rendszer típusára utal (pl. nagy nyelvi modell (LLM) fejlesztése vagy generatív MI rendszer fejlesztése képek, viedók és hangok létrehozása céljából, stb.), és (b) a fejlesztés megkezdése előtt előre látható funkcioanlitások és képességek meghatározása.

Az útmutató példákat is ad megfelelő és nem megfelelő célmeghatározásokra. Ezeket is érdemes lehet áttanulmányozni a megfelelőség érdekében.

Az útmutató szerinti példa a megfelelőnek tekinthető célmeghatározásra:

Nagy nyelvi modell (large language model, LLM) fejlesztése, amely alkalmas kérdések megválaszolására, kontextusnak megfelelő szövegek létrehozatalára (emailek, levelek, jelentések, beleértve a számítógépes kódokat is), szövegek fordítására, összefoglalók készítésére és szövegek kijavítására, továbbá a szövegek osztályozására, érzések elemzésére, stb.

Példa a nem megfelelő cél meghatározására:

Generatív MI modell fejlesztése

A fenti két eseten kívül az útmutató külön kitért a tudományos kutatási célú MI fejlesztések kérdésére, mivel ez a GDPR alapján is bizonyos tekintetben eltérésekre adhat alapot az általános szabályoktól (pl. egyes érintetti jogok gyakorlása kapcsán vagy a megőrzési idő tekintetében). Természetesen a cél meghatározása ebben az esetben is elengedhetetlen és az érintetteket védő intézkedések alkalmazása szükséges (vö. GDPR 89. cikk).

A cél meghatározásával kapcsolatos információkat az alábbiak szerint foglalja össze az útmutató:

4. A fejlesztésben résztvevők szerepének meghatározása

Az adatvédelmi kötelezettségek teljesítéséhez szükséges előzetesen tisztázni, hogy a fejlesztésben résztvevő szereplők - adatvédelmi szempontból - milyen kategóriába tartoznak: adatkezelő, közös adatkezelő, adatfeldolgozó. Az útmutató végigveszi a különböző kategóriákat és példákat is ad a kategorizálás megkönnyítése érdekében.

5. Megfelelő jogalap meghatározása

Az adatkezelőnek gondoskodnia kell a fejlesztéshez szükséges adatkezelés tekintetébenb a megfelelő jogalap rendelkezésre állásáról. Az MI rendszer tanításához szükséges adatbázis felépítésére több lehetőség is adódik, az adatok különböző forrásokból szerezhetők be. A jogalapot ennek megfelelően kell meghatározni. Az útmutató számba veszi a szóba jöhető jogalapokat és példákon keresztül illusztrálja, hogy az egyes jogalapok tekintetében milyen módon kerülhet sor a GDPR-nak megfelelő adatbázis felépítésére. Az útmutató röviden kitér a már meglévő adatbázisok további felhasználásával kapcsolatos követelményekre is.

Az alábbi ábra ad áttekintést az adatbázis létrehozásának különböző lehetséges esetköreiről:

6. Adatvédelmi hatásvizsgálat

Az MI fejlesztések gyakran jelenthetnek olyan kockázattal járó adatkezelést, amely adatvédelmi hatásvizsgálat elvégzését teszi szükségessé. Az útmutató ennek megfelelően kitér arra, hogy miként mérlegelhető a hatásvizsgálat elvégzésének szükségessége, illetve milyen MI-specifikus kockázatok értékelésére érdemes kitérni a hatásvizsgálatban (természetesen ezt minden esetben külön értékelni és mérlegelni szükséges, hiszen az adott fejlesztéshez kapcsolódó kockázatokhoz kell igazodnia a vizsgálatnak).

Néhány, az útmutató szerint az MI fejlesztésekhez kapcsolódó tipikus kockázat:

a tréning adatbázisban található adatokkal való visszaélés, különösen adatvédelmi incidens esetén,
az MI rendszer általi diszkrimináció,
téves, hamis tartalom előállítása létező személyről (különösen generatív MI rendszerek esetében), amely az adott személy reputációját érintheti,
az automatizált döntéshozatallal összefüggő kockázatok,
az adatok feletti ellenőrzés elvesztése, különösen ha az adatok nyilvánosan és szabadon hozzáférhetők,
MI rendszereket célzó támadások (pl. data poisioning, "hátsó kapuk" (backdoor) beépítése, stb.),
az adatok bizalmasságával összefüggő kockázatok.

Miért fontos a megfelelő kockázatértékelés elkészítése az MI rendszerek fejlesztése során? Erre már a gyakorlatból is láthatunk példát: a brit adatvédelmi hatóság, az ICO a Snap "MyAI" generatív chatbotja kapcsán azért indított pár hete eljárást, mert - a gyermekek körében is népszerű - szolgáltatás bevezetése során - a hatóság előzetes értékelése alapján - az adatkezelő nem megfelelően végezte el a kockázatértékelést. (Az Egyesült Királyságban ugyan nem a GDPR szabályai szerint kerül sor az adatkezelésre, ugyanakkor a brit adatvédelmi szabályok jelentős hasonlóságot mutatnak a GDPR rendelkezéseivel.)

7. Az adatvédelmi szempontok figyelembe vétele a rendszer tervezésekor

Az MI rendszerek tervezésekor az adatvédelem alapelveit, különösen az adattakarékosság elvét figyelembe kell venni. Ennek öt szintjét említi az útmutató:

a rendszer céljának a meghatározásakor,
a rendszer technikai felépítésének tervezésekor,
a felhasználásra kerülő adatforrások kapcsán,
az adatbázsiból feltétlenül szükséges adatok meghatározásakor,
a korábbi döntések validálása (pl. pilot révén vagy egy etikai bizottság véleménye alapján).

8. Az adatvédelmi szempontok figyelembe vétele az adatbázis létrehozásakor

Az adatbázis öszseállításának és az adatok előzetes feldolgozása (pre-processing) során figyelembe vételre ajánlott szempontokat is végigveszi az útmutató (lásd a fenti 1. pontnál szereplő ábrán a "dataset creation" alatti pontokat).

A gyűjtés kapcsán az útmutató az interneten elérhető adatok felhasználásának lehetőségével foglalkozik ("web scraping"). Fontos szem előtt tartani, hogy az interneten elérhető adatok nem jelentenek "szabad prédát", ezek tekintetében is vizsgálni kell az adatkezelés feltételeinek a meglétét és az adatvédelmi követelményeknek megfelelően kell eljárni.

Összességében egy nagyon jól használható, az MI fejlesztések során felmerülő adatvédelmi kérdésekre fókuszáló útmutatót tett közzé a francia adatvédelmi hatóság, amely jó kiindulópont lehet az adatvédelmi követelményeknek megfelelő MI fejlesztésekhez.

A CNIL MI fejlesztésekre fókuszáló útmutatója mellet érdemes lehet alaposan áttanulmányozni - MI fejlesztések esetében is - a brit adavédelmi hatóság (ICO) termékfejlesztések teljes életciklusának adatvédelmi kérdéseit tárgyaló iránymutatását és a katalán adatvédelmi hatóság fejlesztőket célzó, a beépített és alapértelmezett adatvédelem alapelveinek gyakorlatba történő átültetését elősegítő iránymutatását. Ezekkel a segédletekkel felvértezve az MI fejlesztéseknek már korai szakaszában kiküszöbölhető sok, az adatvédelmi megfelelőséget veszélyeztető hiba.

Szólj hozzá!

GDPR

Adatvédelem mindenkinek / Data protection for everyone

Hogyan fejleszd az MI rendszeredet?

Praktikus útmutató a francia adatvédelmi hatóságtól

A bejegyzés trackback címe:

Kommentek:

GDPR

Adatvédelem mindenkinek / Data protection for everyone

Hogyan fejleszd az MI rendszeredet?

Praktikus útmutató a francia adatvédelmi hatóságtól

Ajánlott bejegyzések:

A bejegyzés trackback címe:

Kommentek: