Le Big Data

  • Published on
    25-Jul-2015

  • View
    123

  • Download
    0

Embed Size (px)

Transcript

<ul><li><p>Lyce Jeanne dArc Rennes </p><p>Chlo LE GALL </p><p>Lisa VIOTTY </p><p>Floriane TERRIER </p><p>Alexandra HOGER </p><p>BTS Communication 2me anne </p><p>Dossier </p><p>Veille Anne scolaire : 2014-2015 </p><p>BIG DATA </p></li><li><p> 2 </p><p>Introduction </p><p>Le Big Data est un terme phare de ces dernires annes, il traite des donnes, de leur </p><p>utilisation et de leur provenance. Cette rvolution de l'information, en particulier pour le </p><p>monde du marketing, est devenue la matire premire de l'conomie de l'information. Les </p><p>technologies n'ont jamais eu un tel rle jouer et le champ des opportunits n'as jamais t </p><p>aussi vaste. Nouvel or noir de la socit de l'information, le Big Data est devenu un </p><p>environnement de plus en plus complexe. Pour cause, les sources de donnes se sont </p><p>multiplies et la quantit d'information a explos au fil des annes. C'est ce potentiel </p><p>inpuisable des donnes qui explique en partie l'engouement des </p><p>acteurs marketing pour cet outil. </p><p>Toute l'information, tout le temps, est donc partout. Le Big Data, </p><p>c'est la ligne directrice de l'volution technologique actuelle. </p><p>Internet n'oublie rien, et nul ne peut effacer compltement des </p><p>donnes. C'est pourquoi des millions de donnes s'entassent </p><p>chaque anne. Face cet afflux massif, beaucoup de moyens </p><p>sont mis en uvre pour traiter toutes ces informations et on </p><p>observe l'apparition dorganismes spcialiss dans le traitement </p><p>et le stockage des donnes. </p><p>En effet, ce phnomne grandissant, la limite entre technologies, </p><p>outils conomiques et mthodes managriales, touchent de plus </p><p>en plus de secteurs chaque jour, et slargit toutes les chelles. </p><p>Mais jusquo son pouvoir s'tend t-il? Ses limites en termes de </p><p>possibilit d'exploitation restent dfinir. Encore faut-il savoir si </p><p>toutes les entreprises, organisations, qu'elles soiENt </p><p>internationales ou locales peuvent utiliser les donnes pour </p><p>promouvoir leur activit. Reste galement dissocier les fausses </p><p>informations des vraies informations, c'est le Smart Data. </p><p>Enfin, le concept du Big Data a rvolutionn le monde d'aujourd'hui et partage les opinions. </p><p>Quand certains voient en ce phnomne un rel potentiel, d'autre y voient des risques trs </p><p>importants. Tous s'accordent cependant a dire que les consquences sont irrmdiables. Le </p><p>retour en arrire tant impossible, certains organismes et entreprises visent protger les </p><p>utilisateurs et leurs donnes personnelles. </p><p> Dans la socit de </p><p>l'information notre </p><p>valeur ne viendras plus </p><p>de ce que l'on sait, </p><p>mais de ce que l'on </p><p>partage. </p><p>Ginni Rometty, </p><p>dirigeante d'IBM </p></li><li><p> 3 </p><p>Sommaire </p><p>I. Qu'est ce que le big data?................................................. p 4 7 </p><p>A. Dfinition.... p 4 5 </p><p>B. Utilisation.... p 5 6 </p><p>C. volution........ p 6 </p><p>D. Enjeux.... p 6 7 </p><p>II. Traitement des donnes..... p 8 11 </p><p>A. Une matire premire : les donnes....... p 8 9 </p><p>B. Les acteurs... p 9 10 </p><p>C. Les technologies du Big Data..... p 10 11 </p><p>D. Le stockage.. p 11 </p><p>III. L'exploitation des donnes p 12 15 </p><p>a. Au niveau international........ p 12 13 </p><p>b. Au niveau national.. p 13 14 </p><p>c. Au niveau des organisations. p 14 15 </p><p>IV. Partie juridique.. p 16 19 </p><p>a. Dontologie.. p 16 18 </p><p>b. Droit..... p 18 19 </p><p>c. Loi... p 19 </p><p>Conclusion. p 20 </p><p>Glossaire. p 21 22 </p><p>Annexes.. p 23 29 </p></li><li><p> 4 </p><p>I. Quest-ce que le </p><p>Big Data ? </p><p>A. Dfinition </p><p> Big Data a t lu mot numrique de lanne 2012, succdant ainsi Cloud </p><p>Computing lu en 2011. Pour lun comme pour lautre, il nexiste pas de traduction en </p><p>franais qui soit adopte. </p><p>Kenneth Cukier, journaliste de The Economist et auteur de Big Data : la rvolution des </p><p>donnes est en marche , considre le Big Data comme une rvolution qui va transformer </p><p>nos vies et refaonner le monde. Chaque jour, nous gnrons 2,5 trillion doctets de donnes </p><p>informatiques. Toutes ces sources constituent un volume massif de donnes, appeles Big </p><p>Data. Jamais les particuliers nont partag autant de dinformation et par consquent, laisss </p><p>autant de traces, cest une mine dor potentiellement exploitable pour les marques. </p><p>Depuis lmergence de ce terme, peu de remise en cause de ce phnomne sont apparues, </p><p>cette expression est dailleurs considre comme une formule marketing destine vendre. </p><p>Le Big Data serait donc une rvolution majeure dun point de vu conomique, appuye par </p><p>des volutions techniques, elles-mmes aliments par les progrs constants de </p><p>llectronique. </p><p>Ensemble de technologies et dalgorithme, le Big Data permet de classer une masse toujours </p><p>plus importante de donnes, afin de cerner de manire de plus en plus prcises les </p><p>comportements des internautes-consommateurs. </p><p>Volume, vivacit, varit, valeur et vitesse, ce sont les 5 dimensions, dites les 5V, que </p><p>regroupe le Big Data. On parle de volume pour dsigner le nombre important de donne </p><p>dont les entreprises sont envahies, de vivacit pour rendre compte de lutilisation du Big </p><p>Data mesure du temps, de varit pour montrer la diversit des sources de donnes et de </p><p>leurs nombreuses utilisations, de valeur afin de sassurer de la qualit des informations </p><p>recueillies et de vitesse pour dsigner la rapidit du traitements. </p></li><li><p> 5 </p><p>Le Big Data est un phnomne aliment par 4 forces gnratrices, qui se combinent et qui </p><p>ont un impact majeur sur lconomie du 21me sicle. Tout dabord le web 2.0 et les rseaux </p><p>sociaux avec la nouvelle vision du monde quils offrent et incarnent. Ensuite le mobile, avec </p><p>les quantits de plus en plus importantes de donnes gnres par chaque tre humain </p><p>possdant un smartphone. Egalement les objets lectroniques connects internet, que lon </p><p>estime plus de 10 milliards dans le monde. Enfin, le mouvement Open Data qui amne les </p><p>administrations publiques et para-publiques mettre disposition lensemble de leurs </p><p>donnes (traites et gnres) pour un accs libre de tous les acteurs. </p><p>B. Lutilisation du Big Data </p><p>Cest certains grands de linternet que lon doit lapparition de ce phnomne de collecte </p><p>de donnes, comme par exemple Amazon, qui en lchange de services gratuits, rcoltent les </p><p>donnes laisses par les internautes. Leur modle conomique est donc principalement bti </p><p>sur les informations personnelles de millions de personnes. Aujourdhui de nombreux </p><p>secteurs conomiques ont recours au Big Data : finance, sant, mdias, grande distribution </p><p>. Ce qui importe rellement ce ne sont pas les donnes en soit, mais la capacit donner </p><p>du sens ces dernires, afin de mieux connatre les consommateurs ce qui permet </p><p>loptimisation des campagnes marketing. </p><p>La data prsente un avantage important, elle se collecte tout moment et sur tout les </p><p>supports grce aux nouvelles technologies : CRM, mdia sociaux et e-mailing. Aujourdhui, </p><p>elles sont utilises pour faire des statistiques dans des domaines tels que la publicit ou </p><p>encore les ressources humaines. En effet une collecte suffisante de donnes permet </p><p>deffectuer des prdictions et de mettre en lumire certaines choses qui nous seraient </p><p>caches autrement, notamment en termes de comprhension de laudience, ce qui permet </p><p>de mieux interagir et rpondre ses attentes. Do limportance dadopter le Big Data , </p><p>qui rend les annonceurs plus comptitifs, dans lintrt doffrir le meilleur service aux </p><p>consommateurs, dans une dmarche de ciblage plus personnalise et donc plus intelligente. </p><p>Certaines agences mdias achtent par exemple des profils type de consommateurs, reflet </p><p>dune disposition de datas plus prcises, qui peuvent galement se combiner entre </p><p>elles : comme les donnes comportementales et les donnes mdias des annonceurs. </p><p>Le Big Data participe lamlioration de moteur de recherche. Par exemple, le projet Google </p><p>Flu (suivi de la grippe) permet didentifier une combinaison de 45 termes utiliss par les </p><p>internautes dans leur moteur de recherche qui, selon les chercheurs de Google, semble tre </p><p>de bons indicateurs de la propagation de la grippe saisonnire, en corrlation avec les </p><p>statistiques officielles issues des consultations mdicales sur le terrain, ce qui atteste de la </p><p>fiabilit des prdictions. On peut donc en conclure lutilit dun tel outil, sil tait rendu </p><p>disponible gratuitement sur Google. </p></li><li><p> 6 </p><p>Les modalits de reprsentation des donnes du Big Data permettent le dveloppement de </p><p>nouvelles technologies. Ces possibilits de visualisation de donnes, appele DataViz, sont </p><p>aux centre de la relation entre utilisateur et usagers du Big Data. </p><p>C. volution </p><p>Alors que pendant 20 ans nous sommes pass cot de la Data, il est aujourdhui impossible </p><p>de ngliger le Big Data. Il est le fruit de la numrisation croissante de notre socit, dont la </p><p>connectivit toujours plus accrue est notamment due laugmentation du taux </p><p>dquipement des franais : en 2013, 39% dentre eux possdait un Smartphone contre 17 % </p><p>en 2011, le taux dquipement en tablette tactile a quant lui doubl en 1 an, passant de 8% </p><p> 17%. Ladaptation est rapide et lapparition des rseaux sociaux, qui est un rel </p><p>bouleversement pour le web ces dernires annes, participe galement la production </p><p>toujours plus importante de donnes produites par notre socit. A tel point que 90% des </p><p>donnes dans le monde ont t cres au cours de ces deux dernires annes (2013-2014) </p><p>seulement. En effet le social mdia est lun des plus gros producteurs de donnes, o </p><p>chacune des interactions des internautes est source dinformation, on note : Facebook, </p><p>Twitter, Linkedin ou Foursquare. Courant 2015, lexploitation des donnes en grande </p><p>quantit devrait atteindre 16, 9 milliards de dollars. </p><p>Lancien ciblage, dit par critres comportementaux, est aujourdhui obsolte. Dsormais </p><p>lannonceur peut dfinir ses propres critres de segmentation en rapport avec son activit, </p><p>on appelle cela le ciblage attudinal. Ainsi, les gots, les avis, les souhaits mais galement les </p><p>critiques des internautes peuvent tre retenus et pris en compte. </p><p>Le Big Data est une volution technologique qui implique une rvolution managriale au sein </p><p>des acteurs conomiques. Pour les nouvelles entreprises numriques qui vont voir le jour, la </p><p>ressource premire sera linformation, mais surtout, la pertinence de cette information. </p><p>Malgr toutes ces volutions, le web nest qu la gense de ses possibilits et le </p><p>mouvement Big Data ne cesse de prendre de lampleur. </p><p>D. Enjeux </p><p>Pour les annonceurs et les prestataires technologiques, le Big Data constituent un enjeu </p><p>crucial. En effet linternaute est aujourdhui le plus grand producteur et consommateur de </p><p>data, do limportance de lvaluation de donnes. La collecte dinformations qui peuvent </p><p>sembler sans importance aux yeux des utilisateurs, permet aux marques de cibler clients et </p><p>prospects par affinit, ce qui donne un rel impact la communication et constitue une </p><p>relle valeur ajoute pour lannonceur. </p></li><li><p> 7 </p><p>Certaines associations franaises soutiennent le dveloppement du Big Data et </p><p>contribuent son mergence, pour le potentiel conomique et socital de la donne. Dans </p><p>le secteur de la communication, lAACC (Association des Agences-Conseils en </p><p>Communication) soutient les acteurs dominants et participe la rcompense de leur </p><p>dveloppement technologique. Ainsi, les diverses associations impliques permettent de </p><p>rendre compte au public de lavanc et du poids du march franais au niveau international. </p><p>Comme la plateforme Big Data dIBM, qui recours aux technologies les plus pointues et </p><p>des solutions danalyses brevetes afin douvrir la porte de nouvelles possibilit. </p><p>Les enjeux de lingnierie numrique sont importants. En effet, certains systmes complexes </p><p>demande de nouvelles modlisations, entrainant une modification des primtres de la </p><p>Data, avec la prise en compte de donnes encore inexistantes ce jour, comme les donnes </p><p>cres en temps rel sur les dplacements des usagers. LInstitut de Recherche </p><p>Technologique ddi lingnierie, travaille actuellement sur des programmes visant la </p><p>rsolution de ce genre de dfis poss par lingnierie numrique. De plus, dautres projets </p><p>varis sont mens de front, comme lextraction de donnes signifiantes issues de mdias et </p><p>de langues multiples, ainsi que la rvision de la gestion des rseaux lectriques. </p><p>Le march du Big Data tant en constante volution, le traitement de la donne devient </p><p>plus intelligent, duqu par diverses interactions qui tendent dmocratiser le traitement </p><p>de la donne, pour une meilleure comprhension de ce systme complexe par tous. Mme </p><p>si la valeur accorde son utilisation nest pas la mme pour toutes les activits, lenjeu </p><p>reste nanmoins central pour tous les acteurs. </p></li><li><p> 8 </p><p>II. Le traitement des </p><p>donnes </p><p>A. Une matire premire : les donnes </p><p>Chaque jour, des millions de donnes sont cres. Cette masse d'informations est la </p><p>consquence d'une multiplication des outils et appareils numriques, toujours plus </p><p>sophistiqus et de plus en plus connects sur le web. Le caractre omniprsent des rseaux </p><p>sociaux, des blogs ou encore des plateformes renforce leur accessibilit. Selon un sondage </p><p>d'AVAS, en 2013, 71% des internautes franais sont membres d'au moins un rseau social </p><p>grce leurs tablettes, ordinateur, smartphones ou plus rcemment via la TV connecte. Les </p><p>rseaux sociaux tels que Facebook, Twitter sont donc les premiers crateurs de donnes, ils </p><p>ont initi le phnomne. On peut dire que les informations sont dsormais accessibles de </p><p>partout et par n'importe qui. </p><p>Si le nombre de donnes est de plus en plus volumineux, leur forme est galement varie. En </p><p>effet, elles peuvent tre collectes sous la forme de textes, de schmas, d'images, de chiffres </p><p>ou encore de statistiques. Elles peuvent galement tre publiques et disponibles la </p><p>rutilisation pour les internautes (Open data), localises ou lies une personne prive, fixes </p><p>ou mobiles. En conclusion, les donnes viennent de partout et sous toutes les formes. </p><p>Le Big Data peut tre source de confusion pour les utilisateurs. En effet, ceux-ci se heurtent </p><p>l'immensit du phnomne, qui intgre en son cur d'innombrables anomalies, fausses </p><p>informations et incohrences. Le fait est qu'internet n'oublie rien et que toutes les donnes </p><p>entres sur le web sont stockes, quelles soient pertinentes ou non, vridiques ou non. </p><p>Il est indispensable que les donnes rcoltes soient fiables, utiles et d'actualits car la </p><p>qualit de l'information est un facteur ncessaire pour effectuer une bonne analyse et </p><p>gnrer de la valeur. Toutes les donnes ne sont donc pas bonnes prendre et demandent </p><p>beaucoup de temps exploiter. </p><p>Mais depuis peu, on ne parle plus de Big Data mais de Smart Data . Le </p><p>dveloppement du march, et l'intrt des entreprises pour l'exploitation des donnes ont </p><p>permis un traitement de plus de plus intelligent de celles-ci. Le Smart Data permet alors de </p></li><li><p> 9 </p><p>se focaliser uniquement sur les informations pertinentes pour empcher les erreurs. Le but </p><p>est d'exploiter une data filtre, trie et nettoye au pralable afin d'liminer tout risque de </p><p>rsultats biaiss. Cependant, trouver les bonnes informations sur internet peut se rvler </p><p>parfois encore plus compliqu. </p><p>En conclusion, les utilisateurs du Big Data se confrontent deux situations : d'une part, la </p><p>difficult de piocher les informations dites "filtres" et d'autre part, au manque d'outils et de </p><p>ressources pour exploiter les informations en masse. C'est ces pro...</p></li></ul>