Den nya Depth Pro-modellen kan innebära ett stort steg framåt i branscher som förstärkt verklighet och självkörande fordon.
Apples forskargrupp har presenterat en ny grundmodell, Depth Pro, som snabbt kan generera tredimensionella djupkartor med hög skärpa och detaljer baserat på en tvådimensionell bild. Det är inte den första i sitt slag, men klart den mest avancerade. Det hela uppmärksammades först av Venture Beat.
Modellens förutsägelser är metriska med absolut skala och behöver inte använda metadata som kamerainställningar. Den är också snabb och bör kunna generera en 2,25 megapixel djupkarta på 0,3 sekunder på en typisk GPU.
Enligt forskarna själva kan Depth Pro avsevärt förbättra hur maskiner uppfattar djup, vilket kan leda till stora förändringar i flera branscher. Bland annat augmented reality och självkörande fordon.
För de intresserade har forskargruppen släppt en demo av Depth Pro via Hugging Face AI-plattformen. Apple har gjort Depth Pro tillgängligt i öppen källkod och både koden och förtränade modellvikter finns på Github.
Lämna kommentar