Applen uraauurtava MM1 AI -malli mullistaa tekstiä ja visuaalista ymmärrystä

Äskettäisessä tutkimuspaperissa, jonka otsikko on ”MM1: menetelmät, analyysit ja oivallukset multimodaalisesta LLM-esikoulutuksesta”, Apple-tutkijat paljastavat uraauurtavan menetelmän suurten kielimallien (LLMS) kouluttamiseksi, jotka integroivat saumattomasti teksti- ja visuaaliset tiedot. Tämän innovaation odotetaan mullistavan AI -ominaisuudet, etenkin aloilla, kuten kuvakuvateksti, visuaalinen kysymykseen vastaaminen ja luonnollisen kielen ymmärtäminen.

Applen matkalle AI: hen on ominaista strategiset sijoitukset ja keskittyminen käyttäjäkokemusten parantamiseen. Huolimatta siitä, että Apple on ollut LLM -kohtauksen myöhässä tukeva, se on edistynyt huomattavasti, hyödyntäen asiantuntemustaan ​​laitteisto- ja ohjelmistojen integroinnissa tehokkaiden AI -työkalujen luomiseksi.

Lisätietoja:Apple mullistaa tukea all-in-one-käsikirjoilla, teknisillä ja latauksilla ”-sivustolla

Yrityksen toimitusjohtaja Tim Cook on korostanut AI: n ja koneoppimisen merkitystä Applen tuoteekosysteemissä. Tämä strateginen visio heijastaa Applen sitoutumista huipputeknologian toimittamiseen priorisoimalla käyttäjän yksityisyyttä ja tietoturvaa.

Applen uusi MM1 AI -malli voisi tehdä Siri -älykkäämmän ja hyödyllisemmän

Applen MM1-mallin ytimessä on sen kyky yhdistää monipuoliset tietojoukot, jotka käsittävät kuva-paria, lomitettuja kuvatekstiasiakirjoja ja vain tekstitietoja. Tämä ainutlaatuinen lähestymistapa antaa AI -järjestelmää ymmärtää ja luoda kieltä, joka perustuu visuaalisten ja kielellisten vihjeiden sekoitukseen. Hyödyntämällä tätä multimodaalista koulutusta Apple pyrkii asettamaan uuden standardin AI: n kyvyssä tulkita monimutkaisia ​​kuvia ja suorittaa vivahteena olevaa ymmärrystä vaativat tehtävät.

Applen MM1 esittelee poikkeuksellista suorituskykyä, jopa ylittäen jotkut vakiintuneet kilpailijat. Mallin suurin kokoonpano, jolla on jopa 30 miljardia parametria, on merkittäviä kontekstin oppimista ja monen kuvan päättelytapoja. Tämä antaa MM1: lle mahdollisuuden käsitellä monimutkaisia, avoimia ongelmanratkaisutehtäviä minimaalisilla esimerkeillä, mikä tekee siitä erittäin tehokkaan ja tehokkaan.

Vaikka Apple ei ole nimenomaisesti maininnut erityisiä tuoteintegraatioita, spekulaatiota on runsaasti MM1: n mahdollisista vaikutuksista Sirin kehitykseen. Keskittyminen tehokkuuteen, minimaaliseen kehotukseen ja multimodaalisiin ominaisuuksiin kohdistuu Applen jatkuviin pyrkimyksiin parantaa käyttäjäkokemuksia sen ekosysteemissä. MM1: n ominaisuudet voisivat antaa Sirille mahdollisuuden ymmärtää sekä tekstin että kuvien perustuvien kyselyihin ja niihin tarjoamalla käyttäjille henkilökohtaisemman ja intuitiivisemman vuorovaikutuksen.

Samanaikaisesti näiden kehityksen kanssa Apple jatkaa monitahoista lähestymistapaa AI-ominaisuuksiensa edistämiseksi edelleen. Tähän sisältyy jatkuvia keskusteluja Googlen Gemini -mallin lisensoimiseksi ja yhteistyön tutkimiseksi Openain kanssa.

Lue Applen ”MM1: menetelmät, analyysi ja oivallukset multimodaalisesta LLM: n esisarjoituksesta”, paperitässä.