Die Hand - Midjourneys größte Herausforderung
Lange Zeit waren verunstaltete Hände das Markenzeichen von Midjourney. Kaum ein Bild war ohne verdrehte Finger oder verknotete Handgelenke. Das beeindruckte Staunen über die „Magie“ der generierten Bilder wich schnell Häme und erstaunen, dass so was Wichtiges wie Hände nicht generiert werden können.
Doch was anfangs unmöglich schien, wurde in wenigen Monaten Realität. Die Fortschritte bei der Hand-Generierung sind atemberaubend. Mittlerweile sind die Hände von Midjourney kaum noch von echten zu unterscheiden.
Aber wie hat Midjourney diesen irren Leistungssprung geschafft? Was war so schwer an Händen? Und wie zaubert die KI heute Hände aus dem Nichts, die selbst Küstler:innen beeindrucken?
Das Hand-Trauma von Midjourney
Für uns Menschen sind Hände etwas Alltägliches. Für KI sind sie die Hölle. Schuld ist die irre Komplexität von Händen:
- 27 winzige Hand-Knochen
- Dutzende Muskeln und Sehnen
- Nervenbahnen wie Spaghetti
- Unermessliche Vielfalt an Formen und Größen
- Bewegungen ohne Ende
- Feine Linien und Texturen
- Verdrehte Finger bei jeder Geste
Kurzum: Eine Zumutung für jede KI! Midjourney war da keine Ausnahme. Am Anfang waren die Hände nur verdrehte Klumpen.
Nicht nur Midjourney tut sich schwer mit Händen
Man könnte meinen, perfekte Hände seien für Menschen eine Leichtigkeit. Doch dem ist nicht so. Auch professionelle Künstler und Anatomie-Experten tun sich mitunter schwer, natürlich wirkende Hände zu zeichnen oder modellieren.
Die unzähligen Knochen, Muskeln und Sehnen sind enorm schwierig abzubilden. Die richtigen Proportionen zu treffen ebenfalls. Und eine natürliche Pose oder Bewegung einzufangen, erfordert jahrelange Übung. Manche Künstler spezialisieren sich sogar nur auf die Darstellung von Händen.
So gesehen sind die Probleme von KI wie Midjourney zu Beginn nachvollziehbar. Was selbst Menschen jahrelang trainieren müssen, kann keine KI einfach so perfekt beherrschen. Umso erstaunlicher sind die rasanten Fortschritte, die gemacht wurden. In kürzester Zeit hat Midjourney gelernt, wofür Menschen ein ganzes Künstlerleben brauchen.
Midjourneys kurzer Weg zur perfekten Hand
Die Entwicklungsgeschichte von Midjourney zeigt eindrücklich, wie schnell KI dazulernen kann. Innerhalb weniger Versionssprünge wurden aus verdrehten Klumpen fotorealistische Hände.
Midjourney greift nach den Sternen
In der aktuellen Version 5.2 sind den AI-Händen keine Grenzen mehr gesetzt. Midjourney generiert mühelos komplexe Szenen mit vielen sich bewegenden Händen. Die Fortschritte sind schlicht Beeindruckend, bedenkt man die kurze Entwicklungszeit zwischen den Klumpen in Juli 2022 und den Bildern, die weniger als 12 Monate später erstellt werden!
Für Midjourney sind unsere vielseitigen Hände nun nur noch selten ein Problem. Die KI beherrscht inzwischen sogar die feinsten Details und schafft es Hände verschiedenen Alters detailgetreu nachzubilden. Bald werden wir staunen, was noch alles möglich ist! Die Zukunft ist zum Greifen nah!
Wenn du also das nächste mal glaubst, etwas sei für KI unmöglich - denk nochmal nach. Was heute utopisch erscheint, ist morgen oft schon Realität. Die Tools, die gerade entstehen sind nie wieder so schlecht wie heute. KI lernt in einem Tempo, das wir Menschen kaum fassen können. !”