Lors d'un appel vidéo un logiciel peut vous espionner
Une personne qui tape pendant un appel vidéo peut donner plus qu’elle ne le pense. Un modèle informatique peut déterminer les mots que la personne tape en suivant simplement le mouvement de ses épaules et de ses bras dans le flux vidéo.
Un logiciel peut vous espionner
« Il y a des mouvements d’épaules importants, souvent difficiles à discerner, qui se produisent lorsque l’on tape », explique Murtuza Jadliwala de l’université du Texas à San Antonio. « Nous avons pensé que si nous étions capables de les modéliser scientifiquement, nous devrions pouvoir déduire différentes frappes en regardant les données vidéo ».
Jadliwala et ses collègues ont développé un modèle pour y parvenir. Ils ont tracé les mouvements sur un clavier et ont comparé les résultats avec un dictionnaire de mots couramment tapés. Ils ont découvert qu’ils pouvaient identifier le mot correctement tapé 75 % du temps. Leurs expériences ont été menées à la fois dans des conditions de laboratoire et en utilisant des données d’appel vidéo réelles.
Ce modèle informatique supprime d’abord les informations de fond d’une trame d’appel vidéo. Il détecte ensuite les bords extérieurs de l’épaule en analysant chaque trame d’une vidéo à l’aide d’une technique de traitement d’images appelée flux optique. Ce flux optique retrace la façon dont les pixels changent dans une vidéo et cartographie les mouvements des bras sur un clavier.
Ce modèle a des niveaux de succès variables selon les compétences de frappe de l’utilisateur. Les dactylos sont plus difficiles à discerner que ceux qui « tripotent » leur clavier, pour lesquels ce modèle pourrait récupérer 83 % des mots correctement. Ceux qui portent des vêtements avec des manches, sont également moins susceptibles d’être analysés correctement.
Des résultats variables
Ce logiciel d’appel vidéo a également une incidence sur les résultats : 3,4 % de mots en plus ont été récupérés sur les appels Skype que sur Zoom, ce qui, selon les chercheurs, pourrait être dû à la façon dont chaque application compresse la vidéo.
Ces résultats sont alarmants, déclare Alan Woodward, de l’université du Surrey, au Royaume-Uni. « Vous n’avez pas besoin d’autant de caractères pour combler les lacunes dans les mots », dit-il.
Flouter l’arrière-plan, pixelliser les épaules et les bras ou sauter des images dans la vidéo sont des moyens d’atténuer cette attaque, dit Murtuza, bien que Woodward estime que cela va à l’encontre du but recherché. « Le but d’un appel vidéo est de voir les gens », dit-il.
Cette recherche a été pré-publiée dans arXiv.
Source : New Scientist
Crédit photo : Pixabay