2D-3D KONVERSION

Auf dieser Seite stelle ich aktuelle Pakete zur 2D-3D-Konversion zum Download bereit.
Gemeinsame Eigenschaft aller dieser KI-Pakete ist ihre Portabilität, d.h. sie funktionieren
komplett unabhängig von einer Internetanbindung. Dafür sind die Hardware-Anforderungen
entsprechend hoch, es werden leistungsfähige CPUs und GPUs benötigt.
Die KI-Entwicklung zur Herstellung von Tiefenmasken ist hochdynamisch, deshalb ist diese Seite
immer nur bedingt aktuell. Auch stelle ich nicht alle Pakete, die ich bisher zusammengestellt habe,
zur Verfügung. Momentan gibt es hier zwei Pakete, DepthStick V5.2 und DepthStick V6.0.



DepthStick V5.2

DepthStick V5.2 vereint die Pakete Depth-Anything-V2 (https://github.com/DepthAnything/Depth-Anything-V2)
zur Erzeugung von Tiefenmaskenbildern und Video-Depth-Anything (https://github.com/DepthAnything/Video-Depth-Anything)
zur Erzeugung von konsistenen Tiefenmaskenvideos.

Für Depth-Anything-V2 kann man die Modelle Small, Base, Large und Giant auswählen,
für Video-Depth-Anything gibt es nur die Modelle Small, Base und Large. Die großen Modelle
rechnen detaillierter, aber dafür auch deutlich langsamer als die kleinen Modelle.
Die großen Modelle werden bei der erstmaligen Verwendung heruntergeladen, die kleinen Modell werden im Archiv ausgeliefert.

Die Oberfläche von DepthV52

Hardware-Voraussetzungen:

Bilder lassen sich mit einer modernen CPU auch ohne Cuda konvertieren, Videos nicht.
Für Video: Das Small model benötigt mindestens 6GByte VRAM, Base und Large mindestens 16GByte.
Alles oberhalb einer RTX 1060 sollte prinzipiell funktionieren, wer eine neue Grafikkarte kaufen möchte,
nicht unterhalb einer RTX 5060-16GByte (Achtung, die Modelle werden mit verschiedenen VRAM-Ausbaustufen angeboten.)
Cuda (Compute Unified Device Architecture) ist ein Markenzeichen von nVidia.

Download:

Download KI Software DepthStick V5.2 (5.3) GByte: DepthStick_V52

Troubleshooting:

Performance:

Beispiel für einen i7-14700K/RTX 4060Ti (16GB VRAM)-Rechner:

Images/Video           Model      Time/CPU   Time/GPU
=====================================================
Images MonaLisa        Base         1.4s        0.14s
Images MonaLisa        Large          5s         0.4s
Images MonaLisa        Giant          xs           xs

Video  Rollercoaster   Base    2h 4m 52s           8s
Video  Rollercoaster   Large          -         4m 9s


DepthStick V6.0

DepthStick V5.x arbeitet mit der Version DepthAnythingV2. Inzwischen gibt es eine neue Version DepthAnythingV3.
Auch dafür stelle ich mit DepthStick V6.0 ein Paket bereit, das im Prinzip genauso funktioniert wie die 5er-Serie,
allerdings mit folgenden Änderungen:

Hardware-Voraussetzungen:

Bilder lassen sich mit einer modernen CPU auch ohne Cuda konvertieren, Videos nicht.
Für Video: Das Small model benötigt mindestens 6GByte VRAM, Base und Large mindestens 16GByte.
Alles oberhalb einer RTX 1060 sollte prinzipiell funktionieren, wer eine neue Grafikkarte kaufen möchte,
nicht unterhalb einer RTX 5060-16GByte (Achtung, die Modelle werden mit verschiedenen VRAM-Ausbaustufen angeboten.)
Cuda (Compute Unified Device Architecture) ist ein Markenzeichen von nVidia.

Download:

Download KI Software DepthStick V6.0 (4.1 GByte): DepthStick_V60

Troubleshooting:

Performance:

Beispiel für einen i7-14700K/RTX 4060Ti (16GB VRAM)-Rechner:

Images/Video           Model      Time/CPU   Time/GPU
=====================================================
Images (1920x1028)     Base        23.8s        0.45s
Images (1920x1028)     Large       84.5s        1.25s
Images (1920x1028)     Giant        314s        3.0s

Video  robot_unitree   Base          -          96.6s
Video  robot_unitree   Large         -         235.6s
Video  robot_unitree   Giant         -         648.9s


Kommentar



© Gerhard P. Herbig, 2026,     back to cosima homepage