Transformation de perspective

Quand les yeux humains voient des choses proches, ils semblent plus grands que ceux qui sont loin. C'est ce qu'on appelle la perspective d'une manière générale. Alors que la transformation est le transfert d'un objet, etc. d'un état à un autre.

Donc, dans l'ensemble, la transformation de perspective traite de la conversion du monde 3D en image 2D. Le même principe sur lequel fonctionne la vision humaine et le même principe sur lequel fonctionne la caméra.

Nous verrons en détail pourquoi cela se produit, que les objets qui sont près de vous paraissent plus grands, tandis que ceux qui sont loin, paraissent plus petits même s'ils paraissent plus gros lorsque vous les atteignez.

Nous commencerons cette discussion par le concept de cadre de référence:

Cadre de réference:

Le cadre de référence est essentiellement un ensemble de valeurs par rapport auxquelles nous mesurons quelque chose.

5 cadres de référence

Afin d'analyser un monde / image / scène 3D, 5 cadres de références différents sont nécessaires.

  • Object
  • World
  • Camera
  • Image
  • Pixel

Cadre de coordonnées de l'objet

Le cadre de coordonnées d'objet est utilisé pour la modélisation d'objets. Par exemple, vérifier si un objet particulier est au bon endroit par rapport à l'autre objet. C'est un système de coordonnées 3D.

Cadre de coordonnées du monde

Le cadre de coordonnées du monde est utilisé pour les objets associés dans un monde en 3 dimensions. C'est un système de coordonnées 3D.

Cadre de coordonnées de la caméra

Le cadre de coordonnées de la caméra est utilisé pour relier les objets par rapport à la caméra. C'est un système de coordonnées 3D.

Cadre de coordonnées d'image

Ce n'est pas un système de coordonnées 3D, mais plutôt un système 2D. Il est utilisé pour décrire comment les points 3D sont mappés dans un plan d'image 2D.

Cadre de coordonnées de pixel

C'est aussi un système de coordonnées 2D. Chaque pixel a une valeur de coordonnées de pixels.

Transformation entre ces 5 cadres

C'est ainsi qu'une scène 3D se transforme en 2D, avec une image de pixels.

Nous allons maintenant expliquer ce concept mathématiquement.

Y = objet 3D

y = Image 2D

f = distance focale de la caméra

Z = distance entre l'objet et la caméra

Maintenant, il y a deux angles différents formés dans cette transformée qui sont représentés par Q.

Le premier angle est

Où moins indique que l'image est inversée. Le deuxième angle formé est:

En comparant ces deux équations, nous obtenons

À partir de cette équation, nous pouvons voir que lorsque les rayons de lumière se reflètent après avoir frappé de l'objet, passé de la caméra, une image inversée se forme.

Nous pouvons mieux comprendre cela, avec cet exemple.

Par exemple

Calcul de la taille de l'image formée

Supposons qu'une image ait été prise d'une personne de 5 m de haut et se tenant à une distance de 50 m de la caméra, et nous devons dire que la taille de l'image de la personne, avec une caméra de distance focale est de 50 mm.

Solution:

Puisque la distance focale est en millimètre, nous devons donc tout convertir en millimètre pour pouvoir le calculer.

Donc,

Y = 5000 mm.

f = 50 mm.

Z = 50000 mm.

En mettant les valeurs dans la formule, nous obtenons

= -5 mm.

Là encore, le signe moins indique que l'image est inversée.