Az Apple kiadja a nyílt forráskódú OpenELM-et az eszközön lévő mesterséges intelligencia számára

Az Apple az OpenELM-mel (Open-source Efficient Language Models – nyílt forráskódú hatékony nyelvi modellek) jelentős előrelépést tett az eszközön található mesterséges intelligencia terén. Ezt a nyílt forráskódú, nagy nyelvű modelleket úgy tervezték, hogy közvetlenül iPhone-on, iPaden vagy Mac-en futhassanak, és közelebb hozza Önhöz a hatékony mesterséges intelligencia-képességeket. Ez a megközelítés előnyben részesíti a felhasználók adatvédelmét azáltal, hogy adatait az eszközön tartja, ahelyett, hogy távoli szerverekre hagyatkozna.

Az OpenELM nyolc, kompakt nyelvi modellből álló család, amelyet kifejezetten az Apple-eszközök hatékony működésére optimalizáltak. Ezek a modellek 270 millió és 3 milliárd paraméter között mozognak, és nyilvánosan elérhető adatkészleteken alapulnak. Ezeket a Hugging Face Hub-on keresztül érheti el, amely a mesterséges intelligencia-fejlesztők népszerű platformja a kód megosztására és együttműködésére.

További olvasnivalók:A kínai nyílt forráskódú AI-modell, a „Goku” kihívást jelent az Egyesült Államok uralmának

Az OpenELM-et az különbözteti meg, hogy rétegenkénti skálázási stratégiát alkalmaz. Ez az erőforrások hatékonyabb elosztását jelenti a modellen belül, ami nagyobb pontosságot eredményez. Az Apple előre kiképzett modelleket és konkrét utasításokkal tovább hangolt modelleket is kiadott, demonstrálva elkötelezettségét a nyitott kutatás és együttműködés iránt az AI területén. Mintkörvonalazvaaz Apple által:

OpenELM, a legkorszerűbb nyílt nyelvi modell. Az OpenELM rétegenkénti skálázási stratégiát használ a paraméterek hatékony kiosztására a transzformátormodell minden egyes rétegében, ami fokozott pontosságot eredményez. Például körülbelül egymilliárd paraméteres paraméter-költségvetés mellett az OpenELM 2,36%-os pontossági javulást mutat az OLMo-hoz képest, miközben kétszer kevesebb előképzési tokenre van szüksége.

Eltérve a korábbi gyakorlatoktól, amelyek csak modellsúlyokat és következtetési kódot biztosítanak, valamint a privát adatkészletekre előtanítanak, kiadásunk tartalmazza a nyelvi modell betanításának és kiértékelésének teljes keretét a nyilvánosan elérhető adatkészleteken, beleértve a képzési naplókat, a többszörös ellenőrzőpontokat és a képzés előtti konfigurációkat.

Az OpenELM nyílt forráskódúvá tételével az Apple felkéri a szélesebb kutatói közösséget ezeknek a modelleknek a felfedezésére és fejlesztésére. Ez elősegíti az átláthatóságot, lehetővé téve a kutatók számára, hogy azonosítsák és kezeljék az adatok és a modelltervezés lehetséges torzításait. Ezen túlmenően a fejlesztők és a vállalkozások az OpenELM-et speciális alkalmazásokhoz adaptálhatják, felgyorsítva az innovációt.

Bár az OpenELM még nincs integrálva az Apple készülékekbe, a pletykák szerint az iOS 18 izgalmas új AI-funkciókat fog bemutatni. Az elvárás az, hogy az Apple kihasználja az OpenELM-et, hogy javítsa a felhasználói élményt az eszközein, miközben az Ön személyes adatait is kiemelten kezeli.

Összességében az OpenELM Apple általi bevezetése jelentős előrelépést jelent az eszközön történő mesterséges intelligencia feldolgozás terén. Ez a megközelítés előtérbe helyezi a felhasználók adatvédelmét, és elősegíti az együttműködést az AI-kutatói közösségen belül. Az OpenELM iOS 18-ba történő potenciális integrációja révén a közeljövőben erősebb és biztonságosabb mesterséges intelligencia élményre számíthatunk Apple-eszközeinken.