Germany

Analoge Fotos mit KI erhalten: Ein Open-Source-Tool stellt alte Fotos wieder her

Auf GitHub ist ein Open-Source-Tool verfügbar, mit dem Gesichter aus alten Fotos rekonstruiert werden können: Generative Facial Prior (GFP) heißt das in China entwickelte Tool und ist ein maschinelles Lernmodell des Generative Adversarial Network (GAN). . Laut Projektbeschreibung bietet GFP-GAN „praktische Algorithmen zur realistischen Gesichtsrekonstruktion“ in Bildern.

GFP-GAN ist eine Open-Source-Software, die unter der Apache-Lizenz 2.0 lizenziert ist und vom ARC Lab-Entwicklungsteam stammt, wobei ARC für Applied Research Center steht. Dahinter steckt der chinesische Social-Media-Anbieter Tencent, der das Lab 2019 gegründet hat und nach eigenen Angaben damit medienbezogene KI-Forschung betreibt.

Unter der Haube: Mehrphasen-Bilderzeugung

Der kanadische Informatiker und KI-Meister Louis Bouchard hat sich die zugrunde liegende Technologie genauer angeschaut und stellt das Tool auf seinem YouTube-Kanal „What’s AI“ vor: Während herkömmliche Methoden zur Restaurierung alter Fotos bisher ein künstliches Intelligenzmodell verwenden, das die Unterschiede misst den generierten Fotos und den Originalen kombiniert die neue Technologie offenbar Informationen aus zwei komplementären KI-Modellen und ergänzt fehlende Details fotorealistisch.

Laut Bouchard nutzt der neue Ansatz eine vortrainierte Version eines KI-Modells, das den Bilderzeugungsprozess in mehrere Phasen unterteilt. Mit der Technologie lassen sich die Identitäten von Menschen auf Fotos besser als bisher bewahren – unter anderem, weil Gesichtszügen wie Augen- und Mundpartie besondere Aufmerksamkeit geschenkt wird. Auch die neue Technik ist nicht perfekt, so bekommen vor allem alte oder beschädigte Fotos neue Details, die sie ursprünglich nicht enthielten. Je nach Erhaltungsgrad können die rekonstruierten Bilder deutlich anders aussehen als die Personen im Original.

Was ist KI: „Wiederherstellung von Erinnerungen durch KI“ – Louis Bouchard

Ein GitHub-Repository und Online-Demos sind verfügbar

Es gibt eine Colab-Demo für das Projekt sowie Online-Demos unter anderem bei Huggingface, Replicate und BaseTen. Wenn Sie GFP-GAN selbst ausführen möchten, benötigen Sie Python Version 3.7 oder höher, PyTorch Version 1.7 oder höher. Das ARC Lab-Team empfiehlt außerdem die Installation von Anaconda oder Miniconda. Optional kann das Modell mit NVIDIA GPU und CUDA arbeiten, das Arbeiten soll sowohl unter Windows als auch Linux möglich sein. Das GitHub-Repository enthält Installationshinweise, Schulungstipps und eine Kurzreferenz.

Wer das Tool ausprobieren möchte, kann über eine Webanwendung namens BaseTen Bilder zur Browseroptimierung hochladen oder den Quellcode aus dem GitHub-Repository laden und das Modell in eigene Anwendungen integrieren.

(sie)

Zur Startseite