Note Tech 4

Category: French UFO Files  |  Format: PDF  |  File: note_tech_4.pdf
Keywords: variables, modalits, groupes, angulaire, autre, estimation, hauteur, nombre, inconnue, donnes, phnomne, outils, alors, tableau, distance, cette, observations, analyse, variable, celles, classes, relativement, entre, ainsi, ouest
View in interactive archive →
CENTRE NATIONAL D'ETUDES Rechmche a;lrkin;tiyue d'une ;typologie du da crU.p;tiunh de phnamnu aho~patiaux non idenCidi& GROUPE DIETUDES DES ~NOF~NES AROSPATI AUX NON IDENTI FI S 1.1. LES OUTILS 1.1.2. Analyses factorielles 1.1.3. Classification automatique 1.2. PREPARATION DES DONNEES 1.2.1. Localisation 1.2.2. Conditions sociologiques 1.2.3. Conditions physiques 1.2.4. Description 2.1. DESCRIPTION DES VARIABLES : DESCRI PTION DES MODAL ITES 2.2.1. Localisation 2.2.2. Conditions sociologiques 2.2.3. Conditions physiques 2.2.4. Estimation de la distance 2.2.5. Description de l'observation . Prliminaire . Comportement du phnomne . Description du phnomne . Description conjointe du phnomne et de son comportement 2.2.6. Liai sons i nter-groupes RESUME DE L'ANALYSE DESCRIPTIVE DES VARIABLES ET DE LEURS MODALITES 3.1. PRELrMINAIRE 3.2. RESULTATS 3.2.1. Comportement du phnomne 3.2.2. Description du phnomne 3.2.3. Description des phnomneset de leurs comportements 4.1. LES TECHNIQUES D'ANALYSES 4.2. LE CODAGE 4.3. CONCLUSION DE CETTE ETUDE ... A SUIVRE .... Le travail poursuit la dmarche aborde en (BES-80) l'aide d'outils statistiques lmentaires (histogrammes - tests d'ajustement) en utilisant cette fois les mthodes classiques mais plus labores, de l'analyse des donnes multidimensionnelles. Rappelons que ces outils permettent une approche synthtique d'un fichier donn (il s'agit ici des tmoignages recueillis par la Gendarmerie nationale), mais n'auto- risent aucune infrence sur l'ensemble des phnomnes. Alors que l'tude prcdente n'envisageait qua la description de chacune des variables, considres indpendamment, les outils statis- tiques, brivement dcrits dans le premier paragraphe, visent cette fois mettre en vidence les liaisons (ou "proximits" ou "corrlations") prsentes dans les donnes du fichier relatives aux observations de ph- nomnes arospatiaux non identifis (cas classs Dl. Dans cette perspective, trois ensembles sont successivement - les variables, - les modalits de celles-ci, - les observations. Comme prcdemment, ce travail, sans rsoudre des questions fondamentales, dfinit ce que seront les prochaines tapes de l'tude en tachant de cerner au mieux les limites des outils statistiques. 1 SE EN OEUVRE DES ANALYSES 1.1. LES OUTILS Les fondements thoriques des mthodes employes sont abondamment dcrits dans la littrature (Cap-76 des optiques (gomtriques, matricielles, probabilistes, ...) qui diffrent selon les habitudes des auteurs. Seuls les principes gnraux de ces techni- ques sont brivement rappels ; les logiciels sont ceux diffuss par le CESIA (CEntre de Statistiques et d'Informatique Appliques) et dcrits en On considre un ensemble de n individus (les rapports d'observa- tions) dcrits par p variables numriques du non. Pour permettre les comparaisons des variables et ainsl les analyses, on commence par recoder toutes les donnes en des tableaux (dits disjonctifs complets) comprenant les valeurs O ou 1 suivant la ralisation ou non d'un vnement, l'appartenance ou non une classe. Ainsi, par exemple, la variable "dpartement" est remplace par 6 variables (dites indicatrices des modalits) : qui prennent des valeurs O ou 1 suivant la rgion dans laquelle s'estproduitel'observation. L'ensemble des mthodes utilises reposent alors sur une repr- sentation vectorielle des donnes . chaque modalit d'une variable est ainsi reprsente par un vecteur de R~ constitu par une suite de O ou de 1 sui- vant l'appartenance ou non del'individu i (i la classe en question ; . inversement, chque individu est galement considr comme un vecteur comportant cette fois m composantes (m est le nombre total de modalits) O ou 1 suivant les modalits j = 1, ..., m) que prend l'individu en question. 1.1.2. Analyses factorielles Les donnes ainsi modlises, l'analyse vise alors une reprsen- tation optimum, c'est--dire qui modifie le "moins possiblen* les structures de ces donnes. Dans ce but, les vecteurs (individus ou variables) sont pwjets sur les plans engendrs par les axes principaux d' inertie du nuageff (ce sont aussi les directions as- socies aux plus grandes "variances"). On obtient ainsi une repr- sentation "au mieux" des "proximits" entre individus ou entre mo- L'tude directe des variables (reprsentes par des paquets d'in- dicatrices) se fait en considrant non plus des vecteurs, mais les sous-espaces vectoriels (engendrs pour chacun des paquets d'indi- catrices) et les "angles" que ceux-ci admettent entre eux deux deux (les cosinus au carr de ces angles sont les coefficients T~ de TCHUPROV - cf. Cap-76) L'emploi des guillemets signifie ici que l'explication prcise du sens du terme se trouve dans la bibliographie cite. Les individus (et les variables) tant munis de poids, et les espaces de mtriques, appropris. Par construction, ces coefficients sont en fait trs faibles et leur interprtation ne fait pas l'unanhit parmi les auteurs. Il faut donc se montrer trs prudent dans leur emploi. 1.1.3. Classification automatique La mthode employe est celle des "nues dynamiques", elle consis- excuter l'algorythme itratif ci-dessous afin de rpartir en k classes (k fix a priori) n points d'un espace euclidien. a) Slection a priori de faon alatoire de k groupes de quelques points comme "noyaux" provisoires des k classes. Chaque point est rang dans la classe dont le noyau est le plus "rapproch". c) Les noyaux sont remplacs par d'autres points choisis autour du "centre de gravit" de chaque classe. d) Les points b et c sont itrs jusqu' la stabilit des centres de gravit, 1.2. PREPARATION DES DONNEES Les outils d'analyse employs ncessitant des donnes de nature homogne, il faut donc procder un recodage partir des descriptions sommaires obtenues prcdemment (cf. BES-80) et surtout au regroupement des modalits d'effectifs trop faibles. Ces prliminaires conduisent l'abandon temporaire du param- tre "estimation de la taille" inexploitable dans l'immdiat car cod de faon trop disparate (taille mtrique, taille angulaire, taille par com- ...) . Cette lacune sera comble ultrieurement dans les tudes plus spcifiquement orientes vers la psychologie de la perception. A la suite de ce travail, on considrera donc 25 variables tou- jours rparties en quatre sous-groupes et dcrivant 207 observations des 74 78. Ces variables prennent les modalits prsentes ci-dessous. 1.2.1. Localisation janvier, fvrier, . . . . , dcembre inconnue, matin, vers midi, aprs-midi, soire, crpuscule, dbut nuit, fin nuit vers minuit, aurore. Liste des modalits estimation inconnue, DOMTOM ou tranger, Sud-Ouest, Sud-Est, Centre, Ouest, Nord, Est. 1.2.2. Conditions sociologiques Liste des modalits Inconnue, autre - dsert, haute montagne, - habitation isole - hameau, petit - bourgade, banlieue - ville - trs grande ville - un - deux - trois - quatre et - agriculteur, salari agricole - patron industrie et commerce - prof. lib- rale, cadre sup. - cadre moyen - employ - personnel de service - ouvrier - autre (ar- me, police) - non actif - inconnue - enfant ( L 13 ans) - adolescent masculin - fminin 1,2.3. Conditions physiques Conditions I~rodalit s Liste des modalits - ciel limpide -nuages pars - couvert en altitude - ciel bas sans pluie - pluie, neige - autre inconnue - en mtres - en hectomtres - en kilomtres - trs grande distance - oeil nu au sol - avec instrument - trace physique - bord d'un avion ou d'un - voiture en mouvement - voiture 1.2.4. Description la traj ec- sec. de la estimation estimation Liste des modalits un - deux - trois - quatre et plus - disque, soucoupe - rond, circulaire - cigare, cylindre - oeuf, ovale, - conique, toupie - carr, paralll- - canotier, couronne - ponctuel - croix - faible - lumineux - brillant - intense - non lumineux - clignotant - non lumlneux avec faisceau sans luminosit secondaire - plus ou moins - intense - variable non priodique clignotant - rouge - orange - jaune - vert - bleu - blanc - gris - mtallique - plusieurs - couleur changeante - autre inconnue, autre - droite, lgre courbe - virages, arabesques - complexe mais analysa- - stationnement prs du sol - atterrissage sans caractre secondaire - linaire - virages arabesques - complexe mais analysable - statioi prs du sol - atterrissage - monte vers les - vitesse nulle puis lente - vitesse nulle puis rapide - lent, immobile - trs rapide - variable - fulgurante - comme un avion - autre - faible - variable - leve - autre - silence - plutt dans les graves - plutt dans les aigus - autre - au znith - nord - nord/est - est - sud - sud/ouest - ouest - nord/ouest (t) Abrviation utilise pour les figures 2, DESCRIPTION DES VARIABLES ET DE LEURS ~DDALITS D'une manire gnrale, pour ce travail, on note que les iai- sons rencontres sont faibles (cf. tableau 1) et seules des tendances relativement peu marques peuvent tre releves partir des donnes tu- 2.1. DESCRIPTION DES VARIABIES Une premire approche lmentaire du corpus des donnes consiste construire partir du tableau des coefficients de TCHUPRW (cf. 1.1.2 et tableau 1) un arbre valu ou seules sont reprsentes les liaisons re- lativement les plus importantes. ZocaZisation Description /g/2/ Comportement du phnomne l=** du phnomdne Conditions Conditions physiques socio logiques (Les libells en clair des variables sont donns au 1.2.). On remarque alors que les regroupements a priori des variables (localisation - conditions - description) sont trs arbitraires au vu des liaisons rencontres et que la variable 24 (hauteur angulaire) semble jouer un rle pivot entre ces diffrents groupes sans qu'il soit pour autant pos- sible d'avancer une quelconque Interprtation en termes de causalit. Ce schma illustre seulement la complexit du problme et montre qu'il serait illusoire de vouloir isoler des sous-systmes "clos" de varia- bles, indpendants des autres paramtres. 2.2. DESCRIPTION DES MODALITES Mais, comme les natures des variables sont trs htrognes et leur nombre important (25), il est prfrable, dans un premier temps, d'ana- lyser chacun des groupes sparment avant de chercher expliciter les liai- sons inter-groupes globalement ou plus particulirement pour certains cou- ples de variables. Pour chacun de ces groupes, les figures suivantes reprsentent les projections, sur les plans dfinis par les deux premiers axes factoriels, des "vecteurs" modalits. Le pourcentage entre parenthse est 1a''part d'iner- tie explique par ce plan. 2.2.1. Localisation (figure Peu de faits marquants sont notables dans ce groupe dont les varia- bles les plus lies (cf. tableau 1) sont l'estimation de l'heure et la rsion sans qu'il soit possible d'en tirer une signification. On remarque seulement qu'en mars 1974, dans une priode favorable aux confusionss, un nombre relativement important d ' observations matinales ont t relates dans le sud-ouest. figure 1 (paqe suivante) . 2,2.2. Conditions sociologiques (figure 2) L'tude de ce groupe de variables, dont les plus lies sont la profession et l'age des tmoins, ne rserve aucune surprise. premier axe prend en compte cette liaison et discrimine nettement les groupes arme-police et non-actifs. En effet, une proportion importante de femmes, d'adolescents ou de ages est non-active alors qu'videmment le groupe arme-police recrute essentiellement des adultes de sexe masculin. Le deuxime axe reprsente le nombre de tmoins. Il oppose les observations faites dans une zone isole ou dserte par celles faites dans les hameaux ou petits villages par plusieurs tmoins ( 2 4) . Les agriculteurs se trouvent gnralement dans la premire catgorie alors que les patrons, cadres suprieurs ou titulaires d'une profession librale sont des tmoins principaux dans la deuxime. Dans un troisime cas, on remarque que, parmi les tmoins"employsy une majorit font leur observation en banlieue ou dans une ville conjointement un autre % Le pic de mars 74 a dj t signal (cf. BES-80) et suit directement une srie d'missions radio sur le problme vers minuit septh fvrier crpuscule adolescent juillet E b dbut nuit avril Il n'est gure possible de pousser l'analyse au-del de ces vidences. La population tudie ne semble donc pas prsenter de particularit sociologique ce niveau lmentaire*. La liaison qui apparait entre la nature du lieu d'observation et le nombre de tmoinsB ne prsente pas d'interprtation vidente. Le nombre relativement important d'observations mul- ( )/ 4), faites dans un hameau ou une banlieue par rapport au nombre de celles faites en ville, montre que le nombre de t- moins n'est pas directement proportionnel la densit de popula- tion. Il serait abusif d'essayer d'interprter cette "tendance" compte tenu de la complexit des facteurs mis en jeu et du peu de Voir la figure 2 (page prcdente). 2.2.3. Condttlons physiques (figure Ce groupe, malgr le manque de finesse du codage des modalits (surtout pour l'es-timation de la distance- ) amne des remar- ques plus originales. Les variables sont relativement peu lies et comme la variable hauteur angulaire est comparativement trs lie l'estimation de la distance, une autre analyse (fig 4) *"** comprenant galement lanaturedu lieu a t effectue. Dans la premire analyse,(figure 3), le premier axe discrimine fortement les observations brves(- de 20 mn) de celles plus lon- (+ de 20 mn). m cat des observations brves se trouve un regroupement facllement interprtable entre les observations faites dans une voiture en marche ou l'arrt et les tmoignages moins bien documents (pas d'information sur la mto ou sur la distance). De l'autre ct, on remarque que les observations, dont la distance estime est trs grande, durent relativement longtemps alors que l'emploi d'un instrument (jumelles, appareil photo, se rencontre plus particulirement pour des observations Sans oublier pour autant les sous ou sur reprsentations (dj releves en BES-80) de certaines classes par rapport la popu- lation totale et probablement introduites par le filtre que cons- titue la saisie des informations. Le test du @ conduit rejeter l'hypothse d' indpendance au La finesse d'un codage est fonction de la prcision des tmoignages mais aussi, pour viter les classes peu fournies, du nombre des obs. Ceci anticipe sur le suivant (liaisons inter-groupes) mais comme certaines variables (dure, distance, hauteur angulaire, ... ) concer- la fois le phnomne et les conditions dans lesquelles il a t observ, il semble artificiel de conserver une frontire trop stricte entre ces deux groupes. obaer. avec instrwnmt distance * trds grande distance t Les toiles (f) dsignent la modalit : information non disponible Le deuxime axe reprsente entre autres, la nbulosit croissante et si l'on distingue deux classes d'observations droite de l'axe, celles o'la distance estime est faible, . gauche, celles oh la distance est importante. On remarque que, dans chacune des classes prises sparment, la dure dcrort avec la nbulosit. L'estimation de la distance est un paramtre fondamental dont les caractristiques apparaissent peu dans cetteanalyse ; il est nces- saire de lui rserver un traitement plus particulier. Voir figure 3 (page prcdente) . 2.2.4. Estimation de la distance Les tableaux ci-dessous reprsentent les "prof ils horizontaux8'* des tableaux de frquences obtenus en croisant deux variables TABLEAU 2 : Distance . hauteur angulaire Inconnue.... en mtres... Rpartition de la varia- ble hauteur angulaire. (1 ) Hauteur angulaire (2) Estimation de la distance + Le total de chaque ligne est 100, la dernire ligne reprsente titre comparatif la rpartetion (toujours en %) des effectifs dans les classes de la variable hauteur angulaire. Le test du X calcul en regroupant certaines modalits (15-45O et 45-90) conduit rejeter l'hypothse d'indpendance au seuil a2 calcul = 59,07 avec 8 degrs de libert) . Les valeurs comparativement les plus significatives se retrouvent sur la diagonale exprimant ainsi la tendance du paramtre "estima- tion de la distance" crotre avec la hauteur angulaire, site de 1 'observation. Deux hypothses peuvent dlors tre avances mais sans qu'il soit encore possible de trancher 1) en supposant que la distance est correctment estime et que le phnomne tudi est qui-rparti dans l'espace, il serait logique, en considrant que le champ de vision d'un observateur crot avec la hauteur angulaire, d'obte- nir de tels rsultats (voir aussi Note Technique GEPAN no 1 Chapikre 6, paragraphe 4.1. : discussion de la loi de BOU- 2) l'estimation de la distance obit un mcanisme perceptif en troite relation avec le cadre ae rfrence dans lequel est peru le phnomne (cf. Jim-81). Ainsi, par exemple, la distance estime serait celle du point de rfrence angulairement le plus proche alors que le ph- nomne observ pourrait en tre, en ralit, une toute autre distance. Ces hypothses ne sont pas ncessairement exclusives. Il s'agit avant tout de tendances statistiques, affirmer ou infirmer par d'autres corpus d'observations, et non de lois strictes. Le tableau suivant suggre des remarques allant dans le mme sens (voir tableau no 3 - page suivante).