Apple heeft jarenlang zijn zelfrijdende onderzoek geheim gehouden, maar nu heeft het bedrijf enkele van zijn autonome rijsoftwaretechnieken gepubliceerd die de detectie van obstakels verbeteren.
Gepubliceerd op 17 november op de gemodereerde wetenschappelijke pre-print repository arXiv door Apple's experts op het gebied van kunstmatige intelligentie en machine learning Yin Zhou en Oncel Tuzel. De papieren contouren detecteren kleine obstakels met behulp van de Light Detection and Ranging (LiDAR) detectiemethode.
In plaats van te vertrouwen op met de hand gemaakte functies (bijvoorbeeld een projectie in vogelperspectief), stellen de wetenschappers van Apple een nieuwe end-to-end trainbare diepe architectuur voor 3D-detectie op basis van puntenwolk voor. Het wordt VoxelNet genoemd en kan rechtstreeks op schaarse 3D-punten werken en 3D-vorminformatie effectief vastleggen.
Vroege experimenten met VoxelNet-technologie hebben aangetoond dat het met een grote marge beter presteert dan de modernste LiDAR-gebaseerde 3D-detectiemethoden. Voor meer uitdagende taken, zoals 3D-detectie van voetgangers en fietsers, heeft de VoxelNet-aanpak bemoedigende resultaten opgeleverd, waaruit blijkt dat het een betere 3D-weergave en detectie biedt.
Groene 3D-vakken duiden op potentiële obstakels die zijn gedetecteerd met LiDAR
De mogelijkheid om objecten in 3D-puntenwolken nauwkeurig te detecteren is cruciaal om obstakels te vermijden.
Van de krant:
VoxelNet verdeelt een puntenwolk in gelijkmatig verdeelde 3D-voxels en transformeert een groep punten binnen elke voxel in een uniforme kenmerkrepresentatie door de nieuw geïntroduceerde voxel-functiecoderingslaag (VFE). Op deze manier wordt de puntenwolk gecodeerd als een beschrijvende volumetrische weergave, die vervolgens wordt verbonden met een RPN om detecties te genereren.
Experimenten met de KITTI autodetectiebenchmark tonen aan dat VoxelNet met een grote marge beter presteert dan de op LiDAR gebaseerde 3D-detectiemethoden. Bovendien leert ons netwerk een effectieve discriminerende weergave van objecten met verschillende geometrieën, wat leidt tot bemoedigende resultaten in 3D-detectie van voetgangers en fietsers, gebaseerd op alleen LiDAR.
De VoxelNet-architectuur, geïllustreerd bovenaan de post, beschikt over een leernetwerk dat een onbewerkte puntenwolk als input neemt, vervolgens de ruimte verdeelt in voxels en punten binnen elke voxel omzet in een vectorweergave die de vorminformatie karakteriseert.
Het is geweldig dat Apple zich begint te openen als het gaat om autonoom rijonderzoek, waarvan wordt gezegd dat het gericht is op de markt voor ritten en de interne pendeldienst van het bedrijf.
De iPhone-maker heeft blijkbaar een grote investering gedaan in autonoom rijden en heeft volgens CEO Tim Cook 'een groot project' in die ruimte.