Yksityiset github -reposit ovat edelleen tavoitettavissa Copilotin kautta

Turvallisuustutkijat ovat havainneet, että tuhannet GitHub-arkistot, jotka olivat kerran julkisesti saatavilla, mutta ovat sittemmin tehneet yksityisiä, ovat edelleen saatavissa AI-käyttävien työkalujen, kuten GitHub Copilotin, avulla. Tämä kysymys korostaa tietojen altistumisen jatkuvaa luonnetta Internetissä, jossa generatiiviset AI -järjestelmät voidaan säilyttää ja käyttää tietoa, vaikka se olisi lyhyesti julkista, kauan sen jälkeen, kun sitä on rajoitettu.

GitHubin yhteistyössä Openain ja Microsoftin kanssa kehittämä Github Copilot on AI-pohjainen koodausassistentti, joka ehdottaa koodinpätkiä ja loppuun saattajia kehittäjille. Se on koulutettu laajalla julkisesti saatavilla olevalla koodilla, mikä antaa sen antaa asiayhteyteen liittyviä ehdotuksia. Nämä koulutustiedot sisältävät kuitenkin koodin arkistoista, jotka olivat julkisia koulutuksen aikaan, mutta jotka on sittemmin tehty yksityisesti. Seurauksena on, että Copilot voi silti tuottaa koodiehdotuksia näiden nykyisten ennakkovarastojen sisällön perusteella.

Katso myös:NordVPN -sovellus käynnistyy TVOS: ssä, joka tarjoaa turvallista suoratoistoa ja yksityistä selaamista

Tämä tilanne herättää merkittäviä huolenaiheita tiedonsuojasta ja turvallisuudesta. Kehittäjät, jotka paljastavat vahingossa arkaluontoisia tietoja julkisissa arkistoissa, voivat huomata, että AI -mallit ovat nauttinut nämä tiedot ja voivat silti käyttää epäsuorasti Copilotin kaltaisten työkalujen kautta. Tämä korostaa varovaisuuden käytön merkitystä jakaessasi koodia julkisesti ja tietojen kokonaan vetämisen haasteet, kun se on altistunut verkossa.

Vastauksena näihin huolenaiheisiin GitHub on toteuttanut ominaisuuksia parantaakseen avoimuutta ja hallitsemaan AI: n tuotettuja koodiehdotuksia. Esimerkiksi Visual Studio tukee nyt Github Copilot -kokouksen viitemistä, jolloin kehittäjät voivat tarkistaa, perustuvatko ehdotukset julkiseen koodiin, jolla voi olla lisensointiharjoittelu. Tämä ominaisuus tarjoaa yksityiskohtaisia ​​tietoja kaikista löydetyistä julkisista koodi -otteluista, joiden avulla kehittäjät voivat tehdä tietoisia päätöksiä ehdotetun koodin sisällyttämisestä projektiinsa.

Näistä toimenpiteistä huolimatta tapaus muistuttaa tietojen kestävää luonnetta, kun se on julkistettu. Kehittäjiä kehotetaan tarkistamaan perusteellisesti arkaluontoisten tietojen koodinsa ennen julkistamista ja tietoisia siitä, että vaikka arkisto yksityinen, aiemmin paljastettu tieto voi silti olla saatavissa aikaisempaan julkiseen tietoon koulutettujen AI -työkalujen avulla.

Lähde:TechCrunch