Un esempio di ciò che sarà possibile fare è stato mostrato in un altro documento di ricerca di Apple, in cui un modello di intelligenza artificiale generativa denominato MM1 è stato in grado di analizzare due fotografie - un menu e delle bottiglie di birra su un tavolo - e rispondere correttamente alla domanda sul conto da pagare, dimostrando una sorprendente capacità di comprendere e interpretare in modo dettagliato i contenuti visivi.