Prévisions trafic aérien

  • Published on
    22-Dec-2014

  • View
    2.810

  • Download
    0

Embed Size (px)

DESCRIPTION

Alexandre Servigne (ADP

Transcript

<ul><li> 1. ADN Alexanders Drifts NetPrpar et prsentpar Alexandre SERVIGNE Responsable des Prvisions de traficet Raphal BOUDRA Support Statistiques et MthodesPrsentation 8 juin 2012</li></ul><p> 2. Plan 1 PRESENTATION D ADN 1.1 Elments de contexte Principales variables prvues Diffrentes segmentations 2 PRESENTATION DU MOTEUR ADN 2.1 Architecture 2.2 Modles intgrs NP SARIMA SARIMAX DECOMPOSITION TENDANCE CYCLE MODELES ECONOMETRIQUES 2.3 Agrgation des prdicteurs 3 Piste: optimisation quadratique sous contrainte linaireOrly, Dcembre 2010 3. PRESENTATION D ADN Orly, Dcembre 2010 4. Elments de contexte Production des prvisions de trafic court, moyen et long termes, indispensables lentreprise : 1/ pour sa gestion courante; 2/ pour laborer son programme dinvestissement; 3/ pour alimenter sa rflexion stratgique; 4/ pour permettre dlaborer certains document contractuels ou lgaux ; 5/ pour alimenter ses tudes dopportunit sur les oprations dacquisition daroports tiers.Orly, Dcembre 2010 5. Principales variables prvues1.2 Principales variables prvuesOrly, Dcembre 2010 6. 1.2 Principales variables prvuesNombre de passagers : 88 Millions en 2011 Passagers en Origine/Destination Passagers en CorrespondanceOrly, Dcembre 2010 7. 1.2 Principales variables prvuesNombre de Mouvements : 735 400 en 2011 Mouvements mixtes Mouvements cargosOrly, Dcembre 2010 8. 1.2 Principales variables prvuesEmport ( nombre moyen de passagers par avion ) : 130Orly, Dcembre 2010 9. 1.2 Principales variables prvuesMasse Maximale au Dcollage par catgorie avion : 36 Millions tonnes/anOrly, Dcembre 2010 10. Une segmentation du trafic gomtrie variable selon la demande :Orly, Dcembre 2010 11. 1.3 segmentation du trafic gomtrie variable selon la demande gographique :12 rgions, 200 pays, 2000 destinationsOrly, Dcembre 2010 12. 1.3 segmentation du trafic gomtrie variable selon la demande physique: 2 plateformes, 13 arogaresOrly, Dcembre 2010 13. 1.3 segmentation du trafic gomtrie variable selon la demande stratgique : 200 compagnies ariennes, alliances et code-share.Orly, Dcembre 2010 14. 1.3 segmentation du trafic gomtrie variable selon la demande comptable : 5 faisceaux de facturationOrly, Dcembre 2010 15. Motivation de ADN Compte tenu : la multiplicit des facteurs prendre en compte de leurs intractions la multiplicit des flux et de leurs configurations lhomognit prserverOrly, Dcembre 2010 16. Motivation de ADN loutil ncessite : de la flexibilit de la traabilit de la modularit une excution rapideOrly, Dcembre 2010 17. Motivation de ADN En rsum il doit permettre de se faciliter la vie modliser et dgagerdu temps pour aborder le transport arien sous dautres aspects:conomique et gopolitiques : revenu des mnages, prix du ptrole, tensions gopolitiques, echanges commerciaux, Sociologique et dmographique :population,Techniques :volutions des types avions, consommation, ..stratgiques :concurrence des autres modes de transport, degr de concentration ( alliance, fusion,..), structure des rseaux, low-cost,.. Financires :taxes , redevances , prix du billet,..Rglementaires : suret, scurit, dveloppement durable,.. Capacitive :suret, scurit, dveloppement durable,..Orly, Dcembre 2010 18. 1.2 caractristiques ADN est un moteur de calcul intgr dans une architecture dont lesdonnes sont organises en arborescence.Il intgre des prdicteurs paramtriques et non paramtriqueset fournit une prvision en agrgeant ces prdicteurs. Orly, Dcembre 2010 19. 1.2 caractristiques Un outil de simulation et daide la dcision qui doit prendre encompte : 4. les prvisions du modle Kenza 5. lexpertise mtier 6. les points cibles dcids par le comit excutifOrly, Dcembre 2010 20. 1.4 Quelle architecture ?Quelle architecture ?Orly, Dcembre 2010 21. 1.4 Quelle architecture ?Une architecture dont les donnes sont organises en arborescence : ADPTerrainsRgionsPaysVillesOprateursOrly, Dcembre 2010 22. 1.4 Quelle architecture ?. Et les arborescences peuvent tre corrles entre elles PAXEMPORT MVT MMD Orly, Dcembre 2010 23. Une architecture approche diffrents niveaux par diffrentes mthodologies :KENZA ADN Point Cible Expertise mtier PAX ADPTerrains Orly CDGRgionsPaysVillesOprateursOrly, Dcembre 2010 24. Une architecture approche diffrents niveaux par diffrentes mthodologies :KENZA PAX ADPTerrains Orly CDGRgionsPaysVillesOprateursOrly, Dcembre 2010 25. Une architecture approche diffrents niveaux par diffrentes mthodologies : Expertise mtier PAX ADPTerrains Orly CDGRgionsPaysVillesOprateursOrly, Dcembre 2010 26. Une architecture approche diffrents niveaux par diffrentes mthodologies : Point Cible PAX ADPTerrains Orly CDGRgionsPaysVillesOprateursOrly, Dcembre 2010 27. Une architecture approche diffrents niveaux par diffrentes mthodologies :ADN PAX ADPTerrains Orly CDGRgionsPaysVillesOprateursOrly, Dcembre 2010 28. Exemple de segmentationOrly, Dcembre 2010 29. 1.5 Une architecture crer en fonction de la demande :Segmentation souhait : faisceaux de facturation ADP NATIONALSCHENGENAUTRE UE DOM-TOMLes faisceaux ne sont pas homognes en terme de comportement des consommateurs.RESTE DU MONDEIl nest donc pas pertinent de modliser ce niveau de dtail.Orly, Dcembre 2010 30. 1. Une architecture crer en fonction de la modlisationSegmentation pertinente pour la modlisation : la rgionLes rgions regroupent les pays qui voluent dans un contexte conomique et dmographique comparables.ADP AUTRE ASIEDOM-TOM NATIONALAMERIQUE DU NORD EUROPE DU SUD EUROPE DU NORDPOURTOUR MEDITERRANEEAFRIQUERESTE DU MONDEASIE DEVELOPPE AMERIQUE LATINE EUROPE DE LEST Orly, Dcembre 2010 31. 1.4 Cohrence des segmentations Les segmentations sont-elles cohrentes entre-elles?Orly, Dcembre 2010 32. 1. Cohrence entre segmentation souhaite et modliseNATIONAL SCHENGENAUTRE UE RESTE DU MONDE DOM-TOMFaisceauxRgions FRANCEEUROPE DE LESTDOM-TOM EUROPE DU SUDAMERIQUE LATINE EUROPE DU NORD AMERIQUE DU NORD ASIE DEVELOPPEAFRIQUE AUTRE ASIE MEDITERANNEEOrly, Dcembre 2010 33. 1. Cohrence entre segmentation souhaite et modliseA quel faisceau faut-il rattacher la rgion Europe de lest ? 3 faisceaux lui sont associs. NATIONAL SCHENGEN AUTRE UE RESTE DU MONDE DOM-TOMFaisceauxRgionsFRANCE EUROPE DE LESTDOM-TOMEUROPE DU SUDAMERIQUE LATINE EUROPE DU NORD AMERIQUE DU NORD ASIE DEVELOPPEAFRIQUE AUTRE ASIEMEDITERANNEE Orly, Dcembre 2010 34. 1. Cohrence entre le dcoupage souhait et celui modlis A quel niveau de dtail faut-il descendre pour ne pas avoir ce chevauchement ?Orly, Dcembre 2010 35. 1. Cohrence entre le dcoupage souhait et celui modlisLarborescence intgrera les pays afin dassocier les rgions aux faisceaux ADPAUTRE ASIENATIONALEUROPE DU SUDEUROPE DU NORD POURTOUR MEDITERRANEE DOM-TOM AFRIQUE RESTE DU MONDE AMERIQUE DU NORDASIE DEVELOPPEAMERIQUE LATINE EUROPE DE LESTRegroupement de pays : Rep. Tchque RoumanieAlbanie, ArmnieOrly, Dcembre 2010 36. 1. Cohrence entre le dcoupage souhait et celui modlisLarborescence intgrera les pays afin dassocier les rgions aux faisceaux ADPADPOrly, Dcembre 2010 37. 1. Cohrence entre le dcoupage souhait et celui modlisLarborescence intgrera les pays afin dassocier les rgions aux faisceaux ADPADPOrly, Dcembre 2010 38. 1.4 Contraintes de cohrence1. ADN intgre plusieurs mthodes statistiques... ...Lagrgation de modles permet de combiner les rsultats issus des diffrentes mthodes statistiques.2. Une modlisation indpendante chaque noeud delarborescence. ...Il ny a donc aucune raison pour que la prvision de la somme soit gale la somme des prvisions des parties .=&gt; On fait appel loptimisation quadratique pour solutionner leproblme. Orly, Dcembre 2010 39. Prsentation d ADN Dans la littrature on entend parler de : Blue Chip Average Forecast , Consensus Forecast .=&gt; Il sagit de moyennes de prvisions issues de divers organismes. ADN : SYSTME AUTOMATIQUE DE PREVISIONSPROPOSANT UNE ALTERNATIVE A LA SELECTION DEMODELE ... ADN permet dobtenir des prvisions par combinaisons de prdicteurs paramtriques et non paramtriques.Orly, Dcembre 2010 40. Formalisation du problme1.Notation/Dfinition On observe au cours du temps ( yt ) R d2.Objectif On cherche prvoir ytOrly, Dcembre 2010 41. Formalisation du problmeL ADN est un systme permettant de modliser le dtail tout en respectant les prvisions issues du modle KENZA.On suppose que(Yt ) R d est une srie temporelle. La prvision est dfinie par son esprance conditionnelle:yt := E (Yt I t )Orly, Dcembre 2010 42. Mthodes intgres dans ADN Orly, Dcembre 2010 43. Modlisation statistique: non paramtrique Mthode de Prvision base sur la notion de similarits. SIMILARITES = indices de proximit entre le bloc (Yn,...,Yn-r) etles blocs (Yi,...,Yi+r), i=1,...,n-r-1.Orly, Dcembre 2010 44. Modlisation statistique non paramtrique1.1.2 EXEMPLE: SERIE MENSUELLE DE TRAFIC FAISCEAU INTERNATIONAL DU 1er JANVIER 2003 AU 01APR2012r r r rBLOC 20BLOC 10 BLOC 1 DERNIER BLOC=BLOC TEMOINOrly, Dcembre 2010 45. Modlisation statistique non paramtriqueEXPRESSION DES POIDS: Wi ,T = K i ,T (Yn ,..., Ynr +1 ) (Yi ,..., Yi r +1 ) n,avec: K i ,T = K Ki =1 i ,T h( n) - La mise en uvre de cette prvision requiert de choisir:1- Le noyau K ( pas trs influent ): on choisit le noyau gaussien 2- la taille des blocs r = taille dune saison. 3- La fentre h(n) dtermine par validation croise. Orly, Dcembre 2010 46. Modlisation statistique non paramtrique COEFFICIENTS DE SIMILARITES : Wi,T ( r=12 ; h(n)=1,385) SERIE TRAFIC INTERNATIONALOrly, Dcembre 2010 47. Modlisation statistique non paramtriqueFORMULE POUR LA PREVISION:Yj centr rduit (provenant du pass) ^ nh Y j +h m j Y n+h= ().sn + mn ).W j j =r sj Rajustement de Yj aux valeurs prsentesO: mj : moyenne du bloc j. sj : cart-type du bloc j.w j : poids quantifiant la proximit entre le dernier bloc centrrduit et le bloc j centr rduit. Orly, Dcembre 2010 48. Modlisation statistique non paramtriqueCALCUL DUN INTERVALLE DE CONFIANCE DE LA PREVISION:Loi conditionnelle deYn+h sachant Yn ,..., Ynr +1 On estime cette loi conditionnelle par la loi discrte sur Yn , Yn1 ,..., Yr + h associe aux poids Wi,T: ^nhF ( x) = 1{ Yi+h x} .Wi ,T i =1 On utilise les quantiles de cette loi pour dterminer un intervalle de^ confiance de prvision conditionnelle Y n+h Orly, Dcembre 2010 49. Modlisation statistique SARIMAFORMULE:SARIMA( p, d , q )( P, D, Q) S Pp ( B )(1 B ) d PP ( B s )(1 B s ) D .Yn = QQ ( B S )Qq ( B ) n o: ( n ) est un bb de variance 2 . S : priode, (P,D,Q): ordres de la partie saisonnire. (p,d,q): ordres de la partie ARIMA classique. Nombre de jeux de paramtres et donc de prdicteurs potentiels lev!!!Introduction de procdures de tests afin de rduire les temps de calcul. Orly, Dcembre 2010 50. Modlisation statistique SARIMAX FORMULE : N1 ( B )QYn = a +. X 1,n + ( B). n D1 ( B) PDynamique de X1Dynamique propre YnEn pratique:- On identifie la structure ARMA de Yn. - On tudie le lien entre Yn et X1 via les corrlations croises.- On en dduit des ordres possibles pour N1 et D1.=&gt; Nombre de jeux de paramtres et donc de prdicteurs potentiels lev!!!Introduction de procdures de tests afin de rduire les temps de calcul.Orly, Dcembre 2010 51. Modlisation statistique DECOMPOSITION TENDANCE+ CYCLE (4/4) MODELE:Yt = Tt + St + t En pratique: On choisit une (ou plusieurs) forme pour la tendance(linaire, quadratique,). On rgresse la composante saisonnire sur des harmoniques ie:^ Yt Tt = a. cos(.t ) + b.sin(.t ) Orly, Dcembre 2010 52. Modlisation statistique MODELISATION ECONOMETRIQUE (4/4)Catalogue de modles: ADN intgre un catalogue de modles conomtriques: Modle linaire Yt=a.Xt+b; Modle Log-linaire Yt=a.log(Xt)+b; Modle exponentiel Yt=a.e(aXt+b); permettant de modliser simplement la dpendance entre plusieurs variables Orly, Dcembre 2010 53. Modlisation statistique : agrgation prdicteursA ce stade, on dispose de plusieurs prdicteurs j^ jfournissant chacun des prvisions:y t +h pour h=1,,N.=&gt; AGREGATIONOrly, Dcembre 2010 54. Modlisation statistique : agrgation prdicteurs Prvision par pondration uniforme =&gt; Poids exponentielsOrly, Dcembre 2010 55. Application On dispose de la srie de trafic arien du faisceau International . Afin de juger de lapport de la stratgie de pondration exponentielledans le systme ADN , nous modlisons cette srie sur la priodestalant du 1er janvier 2003 au 1er mars 2011. Nous disposons donc de 99 valeurs. Nous comparons les performances en prvision sur les 12 donnessuivantes de chacune des stratgies ( meilleur modle ,pondration uniforme, pondration exponentielle). Orly, Dcembre 2010 56. ApplicationSERIE MENSUELLE DE TRAFIC FAISCEAU INTERNATIONAL DU 1er JANVIER 2003 AU 01APR2012 TESTVALIDATIONOrly, Dcembre 2010 57. Modlisation statistique DECOMPOSITION TENDANCE+ CYCLE (4/4) 1.1.2 EXEMPLE: PERFORMANCES DE DIFFERENTES STRATEGIES (RMSE) sur les 12 derniers mois en prvision1 RMSET ,i := ( yt ,i yt ,i ) 2T t T Uniform weightsExponentialweights 11523 31230 5 Orly, Dcembre 2010 58. Modlisation statistique : agrgation prdicteursMOTIVATIONT Rappel: si lon dsigne par LT ( y ) := l ( yk layperte j , kj )k =1cumule du jme prdicteur sur les T premires chances, alors lastratgie dagrgation par des poids exponentiels nous assureen thorie de meilleures performances que celle du meilleurprdicteur. ^T sup LT ( En ) min LT ( j ) M . ln( N ) j =1,..., N 2Fonction de perte l : perte quadratiqueOrly, Dcembre 2010 59. Modlisation statistique : agrgation prdicteursponctuels STRATEGIE ALTERNATIVE A LA SELECTION DE MODELE: AGREGATION DES PREVISIONS INDIVIDUELLES PAR POIDS EXPONENTIELSp Problme squentiel =&gt;yt := ptj1 ytj j =1 Avec : ytj le j-me prdicteur la date t.exp(Lt ( y j )) 1 etptj := o = 2 ln( N ) / T j exp(Lt ( y j )) M l ( yt ,i , ytj,i ) et M un majorant deOrly, Dcembre 2010 60. Modlisation statistique : agrgation prdicteursprobabilistes pf t pt 1 f t :=j jj =1 Avec : j yt le j-me prdicteur la date t exp( Lt ( f j ))pt :=j L( yk , f j ) := log( f j ( yk )) et j, exp( L ( f j ))tOrly, Dcembre 2010 61. Rsum partielNous avons obtenus des prvisions pour diffrentes variables dintrt diffrents niveaux de dtailA ce stade, SOMME DES PREVISIONS != SOMME DES PREVISIONS DESPARTIESOrly, Dcembre 2010 62. Rsum partielDEVELOPPEMENTS FUTURS...Orly, Dcembre 2010 63. 2.5 Piste de rsolutionRsoudre la problmatique (respect des contraintes de cohrence +prvisions agrges) comme un problme doptimisation quadratiquesous contraintes linaires : Prvisions statistiques 2z := arg min zR d y z Cz = dContraintes Prvisions respectantCohrence Contraintes cohrenceOrly, Dcembre 2010 64. Fonction de perte adapte la prvisionLes prvisions sont dautant plus changes quelles ont t mauvaises dans lepass/ On cherche changer le moins possibles les prvisions qui ont tprcises dans le pass2y z :=( y z ) y z )(Avec / Lt 1 ( y1 ) 1 0 =: 1 / Lt ( y N ) N0 Orly, Dcembre 2010 65. Les contraintesContraintesKENZA K zK = KCd Cz = d C z = c c dc Contraintesde cohrenceOrly, Dcembre 2010 66. BibliographieJourn...</p>