Apple veröffentlicht in Zusammenarbeit mit UC-Forschern das Open-Source-Bildbearbeitungsmodell MGIE mit KI-Unterstützung und Anweisungen in natürlicher Sprache.
Apple hat in Zusammenarbeit mit Forschern der University of California ein neues KI-Bildbearbeitungsmodell, MGIE, auf den Markt gebracht. MGIE, das für MLLM-Guided Image Editing steht, nutzt multimodale Large Language Models (MLLMs) und ermöglicht Benutzern die Bearbeitung von Bildern auf der Grundlage natürlichsprachlicher Anweisungen. Das Modell wurde in einem Papier auf der International Conference on Learning Representations 2024 vorgestellt und demonstrierte seine Fähigkeit, automatische Metriken und menschliche Bewertungen zu verbessern und gleichzeitig die Effizienz der Wettbewerbsinferenz aufrechtzuerhalten.
February 07, 2024
4 Artikel