Els disruptors desencadenaran una onada d'aplicacions de visió artificial en 3D? - Notícies

Mentre que la tecnologia de visió 3D encara s'estava debatint entre les solucions de llum estructurada, visió monocular/binocular i ToF, l'equip va triar fermament la ruta de la tecnologia de visió làser + binocular de línia. Aquest enfocament va millorar la resistència a la llum de la visió 3D fins a 180.000 lúmens, aconseguint una precisió de 0,02 mm i ampliant la profunditat de camp fins a un rang de 500-4000 mm. 3. La visió D ja no es limita a escenaris de línies de muntatge industrials amb escenaris de línia de muntatge industrials amb una llum ambiental fixa, una versatilitat a l'interior i a l'exterior, una veritable resistència a la llum. capacitats anti-reflexos i adaptabilitat a tot l'escenari en entorns febles. La tecnologia 3D làser de línia + visió binocular està penetrant ràpidament en la fabricació tradicional, construint un "nou paradigma" per a la transformació digital industrial.

Innovació en maquinària agrícola: càmera estèreo 3D de desenvolupament personal{0}

En aquell moment, la producció de cotó de Xinjiang havia ocupat el primer lloc al país durant 22 anys consecutius, però els costos laborals de la collita anuals ascendien a 15.000 milions de RMB. En avaluar el potencial del mercat, l'equip va assenyalar que si poguessin capturar el 10% del mercat dels robots de recol·lecció de cotó, aquest únic article podria generar de manera conservadora 1.500 milions de RMB en ingressos.

Tanmateix, va sorgir un problema espinós durant el desenvolupament dels robots de recol·lecció agrícoles. Tot i que el robot de coordenades s'havia desenvolupat amb èxit, la manca d'un sistema de posicionament visual fiable va afectar greument la precisió del reconeixement i l'eficiència de la collita. L'equip també havia comprat solucions de visió 3D de marques estrangeres. Tanmateix, sense excepció, aquests sistemes de visió no podrien satisfer fonamentalment les necessitats reals de la recol·lecció del cotó. No podien resoldre el problema de reconèixer el cotó ni adaptar-se als requisits de treball de la llum exterior d'alta-intensitat.

Actualment, les tecnologies de visió estèreo 3D principals del mercat inclouen principalment solucions de llum estructurada, solucions de temps-de-vol (ToF) i solucions de visió binocular. Tot i que es diferencien en escenaris d'aplicació i abast, sense cap excepció, independentment de la solució tecnològica escollida, hi ha certes limitacions.

La llum estructurada funciona segons el principi de la codificació de puntes làser, utilitzant un mètode de mesura actiu, que normalment consisteix en un làser o DLP i un parell de càmeres binoculars. La mesura del punt làser il·lumina la superfície de treball amb centenars de milers de punts làser, i les càmeres binoculars esquerra i dreta creen coordenades xyz per generar una imatge estructurada. DLP emet una font de llum d'una longitud d'ona específica i la font de llum amb informació codificada es projecta sobre l'objecte. La distorsió del patró codificat retornat es calcula mitjançant algorismes per obtenir la informació de la posició i la profunditat de l'objecte. Actualment, la majoria de les empreses del mercat utilitzen generalment solucions de llum estructurada. Tanmateix, aquesta solució s'enfronta a una sèrie de reptes en entorns exteriors amb molta llum solar:

1) La llum solar intensa pot reduir la visibilitat dels punts làser, cosa que dificulta que la càmera binocular capti amb precisió la informació de posició dels punts làser.

2) En situacions amb una gran profunditat de camp, la interferència lumínica pot impedir que les càmeres binoculars esquerra i dreta distingeixin clarament els punts làser, provocant un alias de la imatge i afectant la precisió de la mesura.

3) És altament sensible a les fonts de llum externes i pot ser interferit per altres fonts de llum de l'entorn, afectant la precisió de la mesura de profunditat.

4) La profunditat de camp és generalment estreta i el camp de visió és limitat. A causa de la seva susceptibilitat a la llum, normalment només pot funcionar en condicions d'il·luminació interior constants.

La tecnologia ToF (Time-of-Flight) funciona enviant polsos de llum contínuament a l'objectiu i després utilitzant un sensor per rebre la llum reflectida per l'objecte. La distància a l'objectiu es determina detectant el temps de vol (anada i tornada) d'aquests polsos de llum emesos i rebuts. El sensor calcula la distància de l'escena que es fotografia calculant la diferència de temps o diferència de fase entre la llum emesa i reflectida, generant així informació de profunditat. Combinat amb la imatge tradicional de la càmera, això permet que el contorn tridimensional de l'objecte es presenti com un mapa topogràfic amb diferents colors que representen diferents distàncies.

Tanmateix, tot i que la tecnologia ToF és de baix cost- i té una velocitat de resposta ràpida, la seva imatge està limitada per la resolució de píxels del patró de llum estructurat. La superfície d'imatge del patró de llum estructurada sol estar limitada a 600.000 píxels, i la solució ToF sovint es queda curta en termes de precisió de la imatge i captura de detalls. Per tant, la tecnologia ToF està limitada en aplicacions industrials d'alta-precisió i gran-escala i s'utilitza més habitualment en aplicacions de consum amb requisits de precisió relativament més baixos.

En canvi, el mètode de visió estèreo binocular de llum visible funciona observant el mateix objecte des de dos punts de vista per obtenir imatges del mateix objecte des de diferents perspectives. La imatge tridimensional de l'objecte s'obté calculant la desviació posicional (disparitat) entre píxels de la imatge utilitzant el principi de triangulació. Els seus avantatges inclouen alta resolució, alta precisió, alta resistència a la llum forta i baix cost.