Apple ulazi u svet AI-a sa novim modelom za uređivanje fotografija na osnovu tekstualnih komandi

februar 14, 2024

Apple, iako do sada nije bio među vodećim kompanijama u oblasti veštačke inteligencije, predstavio je novi open source AI model za uređivanje fotografija, nazvan MLLM-Guided Image Editing (MGIE). Ovaj model koristi multimodalne velike jezičke modele (MLLM) za interpretaciju tekstualnih komandi prilikom manipulacije fotografijama, pokazujući Appleov potencijalni doprinos u oblasti AI.

Razvijen u saradnji sa istraživačima sa Univerziteta u Kaliforniji, MGIE model omogućava korisnicima da uređuju fotografije unosom tekstualnih naredbi. Na primer, korisnik može zatražiti da fotografija pizze bude „učinjena zdravijom“, a model će to protumačiti kao zahtev za dodavanje povrća na fotografiju.

MGIE ne samo da može izvršavati velike promene na fotografijama, već takođe omogućava izrezivanje, promenu veličine, rotaciju, kao i poboljšanje svetline, kontrasta i balansa boja kroz jednostavne tekstualne naredbe. Model takođe poseduje sposobnost da uređuje specifične delove fotografije, uključujući modifikaciju izgleda osobe na fotografiji, kao što su kosa, oči i odeća, te uklanjanje elemenata iz pozadine.

Apple je učinio MGIE model dostupnim preko GitHuba, a zainteresovani korisnici mogu isprobati demo verziju na platformi Hugging Face Spaces.

Iako Apple još uvek nije najavio da li će ovaj AI model biti integrisan u neki od njihovih budućih proizvoda, predstavljanje MGIE modela ukazuje na to da kompanija istražuje nove mogućnosti u oblasti umetne inteligencije i kako ona može unaprediti korisničko iskustvo.