Je m’appelle Jean-Valère Cossu je suis un chercheur originaire de corse. Après 3 années passées comme Ingénieur de Recherche, je suis Data Product Owner au sein de l'équipe de My Local Influence où je travaille depuis Janvier 2017 principalement l'analyse de l'E-Reputation de commerces locaux. Avant cette mission, j'étais durant 1 an ingénieur de recherche chez Vodkaster à Paris où je travaillais principalement autour des systèmes de recommandation de contenus sur un média social dédié aux cinéphiles. Je m'intéressais également la science des données, à la diffusion et l'encodage de flux multimédias. Je suis titulaire d’un doctorat en informatique (ma thèse portait sur l’analyse d’E-Réputation) de l’Université d’Avignon. Mes travaux portaient sur les méthodes d’apprentissage automatique et de traitement automatique des langues sous la supervision du professeur Marc El-Bèze, et un co-encadrement de Juan-Manuel Torres-Moreno et Eric SanJuan. Je m’intéresse à l’humanisme numérique, c’est-à-dire la place de l’homme et de son expertise dans un environnement technologique. Mes centres de recherches touchent à l’analyse d’E-Réputation selon les points de vues algorithmiques (traitement des langues, recherche d’information, intelligence artificielle) et sociologiques (évaluation d’experts, interface de compréhension et visualisation). Ma démarche est orientée données, je m’applique à fouiller des données et leurs métadonnées associées (ainsi qu’à en générer) pour ensuite appliqué des méthodes d’apprentissage automatique permettant de dégager des éléments de compréhension. Avant de m’intéresser à ces thématiques, j’ai effectué des formations en administration de réseaux et de systèmes d’informations. C’est à la suite d’une alternance en recherche pour valider mon master réseaux et télécoms la bascule s’est opérée. En alternance, ma mission était de concevoir un système de recommandation de produits culturels (films) en utilisant des commentaires émis par des experts (cinéphiles) sur un réseau social spécialiser : Vodkaster. J’ai assuré différents cours à l’Université d’Avignon dans le cadre de mon contrat de doctorant notamment en : Réseaux, Programmation (C/C++/Java) en ingénierie des réseaux sociaux. J’ai également co-encadré des projets de master 1 ainsi que des stages de fin d’études d’étudiants de master 2. L’un d’eux ayant débouché sur une « Partial Mean Square Path Modelling (PLS-PM) in football betting ». |
|
Mes derniers tweets |
Thématiques de Recherche Vodkaster/ALICIA Projet Imagiweb Campagnes d'évaluation Sujet de thèse : Analyse de l'image de marque sur le Web 2.0 Mission d'alternance (Master 2) Thématiques de Recherche
Vodkaster/ALICIAChez Vodkaster ma mission principale tournait autour des systèmes de recommandation de contenus. Une partie de ce travail est effectuée dans le cadre d'une projet collaboratif soutenu par l'ANR (ALICIA ANR-13-CORD-0020). Mon travail se composait à ce titre de fouille et science des données afin d'extraire de nouvelles caractéristiques permettant d'améliorer la pertinence des recommandations de la plateforme. Cela inclut en partie de travailler sur l'analyse et la modélisation des cycles d'appréciations d'une œuvre. Vodkaster n'étant pas seulement un réseau social mais également une Marketplace et une plateforme disc-to-digital, mes travaux couvraient également l'encodage vidéo, la diffusion over-http, la détection de fraude et le monitoring de ces services. Je m'intéressais par ailleurs également à la modélisation de la relation et la satisfaction client. Sujet de thèse : Analyse de l'image de marque sur le Web 2.0Encadrants : Marc El-Bèze, Juan-Manuel Torres-Moreno and Eric Sanjuan Mon travail de recherche consistait à identifier les différentes représentations de l'image de marque d'entités au travers de deux axes, l'analyse et la visualisation. Le contexte du web politisé français ajoutait une difficulté à tâche. Cela se manifeste par une prédominance des opinions négatives, de remise en cause ou en contradiction avec la communication de l'entité. D'ailleurs, en terme d'opinions politiques nous avons remarqué que beaucoup d'individus sont inconsistants et changent d'avis comme de chemise à la moindre occasion. S'agissant des aspects et modélisation et visualisation de l'image de marque dans son contexte, nous avons été confrontés à d'autres difficultés sur des aspects de personnalisation en fonction du commanditaire de l'analyse mais également dans l'estimation du cadre d'analyse (fenêtre temporelle, évaluation). Nous avons notamment montré qu'en 2012 les experts en communication n'accordaient aucune importance aux contenus mentionnant le groupe Volkswagen et portant sur l'environnement. Projet ImagiwebL'idée motrice du projet est de proposer des méthodes d'analyse de contenus permettant de répondre à la question suivante : "que pensent les gens de cette entité ?". Le cœur du projet est donc d'aller plus loin que la fouille de données et l'analyse d'opinions en considérant une problématique applicative plus réelle. On ne cherche plus seulement à qualifier l'opinion générale (en classes prédéfinies comme opinion positive, négative ou neutre) mais à l'associée à une thématique précise, un aspect de l'entité tel qu'il est exprimé dans un document comme le tweet. Ce type de documents limite d'ailleurs l'efficacité des méthodes habituelles basées principalement sur les lexiques d'opinions. La difficulté vient ensuite de la définition même des aspects analysés, ces derniers sont d'abords définis conceptuellement par des experts en communication pour cadrer l'analyse, toutefois ces concepts ne sont que rarement mentionnés tels quels dans les documents courts. Le sujet principal, la politique a déjà fait l'objet d'études par la littérature, mais principalement en anglais, espagnol ou portugais mais pas encore en français et encore moins avec le niveau de précision attendu avec l'implication de politologues dans le projet. Notons par ailleurs, que la base de connaissance établie avec ces derniers est disponible publiquement. Ce projet m'a permis de m'investir dans différentes tâches autour d'analyse de l'image de marque, ces tâches allant de de l'annotation de contenus à la mise en place de tableau de bord utilisant les résultats générés des systèmes d'analyse automatique de contenus. L'objectif du projet était d’aider des politologues et des équipes de communications (comme celle d’EDF partenaire du projet) en leur proposant des outils permettant d’annoter et analyser automatiquement les contenus concernant leurs réputations (tweets et billets de blogs au sujet des hommes politiques ou de l’entreprise). A ce titre, mes axes de recherches couvraient un large spectre de domaines autour de la fouille de données massive, le traitement automatique des langues avec des méthodes d’apprentissage automatique. Campagnes d'évaluationRepLab'2014 Cette édition est une extension de l'édition précédente se concentrant maintenant sur une caractérisation précise des auteurs des messages (en complémentarité avec le challenge PAN) et sur une analyse plus fin des thématiques en fonction de jugements d'experts (Framework RepTrack). Dans une optique de simplicité de mise en place et de réutilisation de nos méthodes, nous avons basé notre participation des systèmes statistiques de traitement automatique des langues. Nous avons également étudié des principes de correspondance (matching games). Dans le cadre de la caractérisation des auteurs, nos systèmes ont obtenu parmi les meilleurs performances. La catégorisation thématique fin des messages est très proche de la recherche de cibles évoquées dans le projet Imagiweb, cette tâche a donc continué à nous intéresser après la campagne. Ma contribution a consisté à la gestion de la participation ainsi qu'à la mise en place de systèmes pour chaque tâche. RepLab'2013 RepLab est une campagne d'évaluation portant sur les problématiques de suivi de réputation sur les réseaux sociaux et plus particulièrement Twitter. La campagne se compose de plusieurs tâches, comme de la désambiguïsation lexicale (est-ce qu'un message concerne vraiment l'entité ?), l'analyse d'opinions indirecte (est-ce que ce message aura un impact, et si oui lequel, sur la réputation de l'entité ?), la détection thématique (quel aspect de l'entité est présentement mentionné dans le message ?) et un classement d'importance des thématiques (est-ce qu'il faut réagir rapidement à ce message ?). Les données à analyser, fournies par l'organisation de la campagne couvraient 61 entités réparties dans 4 domaines économiques au travers de tweets en anglais et espagnol. Le fil conducteur de notre participation a été l’application de méthode issue du domaine de la reconnaissance de la parole à ces problématiques d’analyse de réputation notament pour les tâches 1 et 2 (filtrage, et détection d’opinions). Pour les tâches 3 et 4 (priorité et thématique) nous avons montré comment méthodes statistiques simples peuvent s’avérer aussi performantes que des systèmes de classement habituellement utilisées dans la littérature. Nous avons obtenu des performances compétitives dans l'ensemble des tâches. Ma contribution a consisté d'une part en qualité de chef de projet à gérer notre participation au travers de la mise en place de l'équipe LIA puis de l'agrégation des participations individuelles puis à la mise en place de mes systèmes. Deft’2013 Cette édition de DEFT s'intéresse à un thème déjà été au centre des attentions lors d'une précédente édition : les recettes de cuisines. Notre partition comporte deux composantes principales, une partie classification de document appliqué aux tâches 1 et 3, et une partie extraction d'information appliquée à la tâche 4. Ma contribution à la participation a consisté en un rôle d'annotateur expert, chargé de suivre l'optimisation des systèmes d'évaluer les sorties intermédiaires des systèmes dans ce que l'on peut considérer être un processus d'apprentissage actif. Mission d'alternance (Master 2)Sujet : Système de recommandation de films innonvant, à partir d'opinions de cinéphiles A partir des données recueillies sur le réseau social spécialisé www.vodkaster.com l'objectif de ces travaux est de concevoir un système de recommandation de films innovant. Ce dernier se base sur un module de traitement automatique du langage écrit qui analyse les opinions exprimées par des cinéphiles à partir d'opinions de cinéphiles. Ce travail couvre plusieurs points de vue, pour l'utilisateur choisir les films en fonction des gouts qu'il a exprimé sur des aspects précis. Pour le film arriver à résumer ce qui fait l'essence de film, les éléments pour lesquels il est apprécié par la communauté. A partir de cette analyse, nous sommes en mesure de proposer à chaque utilisateur une liste de suggestions personnalisée et argumentée. |
CLEF MC2 2018 lab overview
Journaux
Hajjem M., Cossu J-V., Latiri C., SanJuan E. 9th International Conference of the CLEF initiative, Avignon (France) September 10-14 2018 Lexical Context for Profiling Reputation of Corporate EntitiesCossu J-V. and Ermakova L. 19th International Conference on Enterprise Information Systems (ICEIS), Porto (Portugal) April 26-29 2017 Multi-Dimensional Reputation Modeling using Micro Blog contentsCossu J-V., San-Juan E., Torres-Moreno, J. M and El-Bèze M. 22nd International Symposium on Methodologies for Intelligent Systems, Lyon (France) October 21-23 2015 Detecting Real-World Influence Through TwitterCossu J-V., Dugue N. and Labatut V. The Second European Network Intelligence Conference, Karlskrona (Sweden) September 21-22 2015 NLP-based classifiers to generalize experts assessments in E-ReputationCossu J-V., Ferreira E., Gaillard J., Janod K. and El-Bèze M. Sixth International Conference of the CLEF initiative, Toulouse (France) September 8-11 2015 Automatic Classification and PLS-PM Modeling for Profiling Reputation of Corporate Entities on TwitterCossu J-V., San-Juan E., Torres-Moreno, J. M and El-Bèze M. 20th International Conference on Application of Natural Language to Information Systems (NLDB 2015), Passau (Germany) June 17-19 2015 An opinion mining Partial Least Square Path Modeling for football bettingEl Hamdaoui M. and Cossu J-V. PhD Session of the 7th European Conference on Machine Learning and Practice of Knowledge Discovery in Databases, Nancy (France) September 15-19 2014 Towards the improvement of topic priority assignment using various topic detection methods for e-reputation monitoring on TwitterCossu J-V., Bigot B., Bonnefoy L. and Senay G. 19th International Conference on Application of Natural Language to Information Systems (NLDB 2014), Montpellier (France) June 18-20 2014 A survey on evaluation of summarization methods Ermakova L., Cossu J-V. and Mothe J. Information Processing & Management Information Processing & Management 56 (5) Un modèle éditorial du troisième typeSire G., JV Cossu J-V. and Sonet V. Questions de communication Questions de communication 2018 (1) Active learning in annotating micro-blogs dealing with e-reputation on TwitterCossu J.-V, Molina A. and Tello-Signoret M. Journal of Interdisciplinary Methodologies and Issues in Science A review of features for the discrimination of twitter users: application to the prediction of offline influenceCossu J-V., Labatut V. and Dugue N. Social Network Analysis and Mining : SI Diffusion of Information and Influence in Social Networks Special Issue on Diffusion of Information and Influence in Social Networks (2016), 10.1007/s13278-016-0329-x Intweetive Text SummarizationCossu J-V., Torres-Moreno, J. M, San-Juan E. and El-Bèze M. International Journal of Computational Linguistics and Applications Vol. 7 No. 1, 2016 Bilingual and Cross Domain Politics AnalysisCossu J.-V, Abascal R., Molina A., Torres-Moreno, J. M. and SanJuan, E. Research in Computing Science (ISSN 1870-4069) Issue 85 (2014), page 9–19 Machine Learned Annotation of tweets about politicians' reputation during Presidential Elections: the cases of Mexico and France Cossu J.-V, Abascal R., Molina A., Torres-Moreno, J. M. and SanJuan, E. Bilingual and Cross Domain Politics AnalysisCossu J.-V, Abascal R., Molina A., Torres-Moreno, J. M. and SanJuan, E. Avances en la Ingeniería del Lenguaje y del Conocimiento 2nd International Symposium on Language & Knowledge Engineering, Puebla (Mexico) 4-5 December 2014 CLEF MC2 Lab: Évaluation, Résultats, et Perspectives. Hajjem M., Cossu J-V., Latiri C., SanJuan E. CORIA 2019 , Lyon (France) March 25-27 2019 Pour tout (sa) voir, cliquez ici!” Cinéphilie de niche, forums spécialisés, et stratégies de prescription des films sur InternetMoschenross A., F Gimello-Mesplomb F. and Cossu J-V colloque" La prescription culturelle en question", , Dijon (France) April 5-7 2017 Etude de l'image de marque d'entités dans le cadre d'une plateforme de veille sur le Web socialKhouas L., Brun C., Peradotto A., Cossu J-V., Boyadjian J. and Velcin J. 22ème Conférence sur le Traitement Automatique des Langues Naturelles, (DEFT/TALN 2013), Caen (France) June 22-25 2015 Recherche et utilisation d'entités nommées conceptuelles dans une tâche de catégorisationCossu J-V., Torres-Moreno J-M. and El-Bèze M. 20ème Conférence sur le Traitement Automatique des Langues Naturelles, (DEFT/TALN 2013), Sables d’Olonne (France) June 17-21 2013 LIA@RepLab 2014 : 10 systems for 3 tasks Cossu J.-V., Janod K., Ferreira E., Gaillard J. and El-Bèze M. Replab : An evaluation campaign for Online Reputation Management Systems Fifth International Conference of the CLEF initiative, Sheffield (UK) 15-18 September 2014 LIA@RepLab 2013Cossu J.-V., Bigot B., Bonnefoy L., Morchid M., Bost X., Senay G., Dufour R., Bouvier V., Torres-Moreno J.-M. and El-Bèze M. Replab : An evaluation campaign for Online Reputation Management Systems Fourth International Conference of the CLEF initiative, Valencia (Spain) September 23-26 2013 Systèmes du LIA à DEFT'13Bost X., Brunetti I., Cabrera-Diego L-A., Cossu J-V., Linhares A., Morchid M., Torres-Moreno J-M., El-Bèze M. and Dufour R. Défi Fouille de Texte (DEFT/TALN 2013), Sables d’Olonne (France) June 17-21 2013 Contextualisation de messages courts: l’importance des métadonnées Cossu J-V., Gaillard J., Torres-Moreno J-M. and El-Bèze M. Conférence Francophone sur l'Extraction et la Gestion des Connaissances (EGC 2013), Toulouse (France) January 28 2013
Analyser l'image de marque d'entités sur le web. Revue du projet ImagiWeb.
Velcin J., Peradotto A., Khouas L., Cossu J-V., Dormagen J-Y. and Brun C. Ingénierie des Systèmes d'Information 19(3): 159-162 (2014)
(poster) LIA@Replab2014
(poster) LIA@Replab2013
(poster) Recherche et utilisation d'entités nommées conceptuelles dans une tâche de catégorisation
(slides) LDetecting Real-World Influence Through Twitter
(slides) Best of RepLab - Content based classifier to generalize experts assements in E-Reputation
(slides) NLDB2015 Reputation Modeling with PLS-PM
(slides) LIA@Replab2014 : Author Profiling
(slides) 3 statistical summarizers at INEX2014, Contextualization applied to ORM
(slides) NLDB2014 Improving Topic Priority detection with Topic Detection Methods
(slides) LIA@Replab2013 : Topic Detection
(slides) Contextualisation de messages courts: l’importance des métadonnées
|
Période 2018-2020
Période 2014/2015
Période 2013/2014
Période 2012/2013
|
Depuis Janvier 2017, je suis ingénieur de recherche au sein de l'équipe de My Local Influence où je travaille principalement l'analyse de l'E-Reputation de commerces locaux.
Entre Octobre 2015 et Octobre 216, j'occupais le poste d'ingénieur de recherche chez Vodkaster à Paris où je travaillais principalement autour des systèmes de recommandation de contenus sur un média social dédié aux cinéphiles.
J'étais auparavant doctorant chargé d'enseignements à l'Université d'Avignon où j'ai travaillé sur l'E-Réputation dans le cadre du projet ANR Imagiweb.
CV
Manuscrit de thèse
Thématiques de recherche
Traitement Automatique des Langues Recherche d'Information E-Réputation, analyse et suivi Apprentissage Automatique Intelligence Artificielle Fouille et catégorisation de données auto-générées Analyse de données issues des médias sociaux Filtrage et sélection de contenus pertinents (Résumé) Analyse des réseaux sociaux Profilage d'utilisateur (Détection d'influence, Catégorisation CSP, Age, Genre, Personnalité, Orientation politique) Modélisation d'items à partir de contenus textuels Système de recommandation de produits culturels Formation09-2012 -- 08-2015 Doctorat en Informatique, sujet : Analyse de l'image de marque sur le Web 2.0, LIA - Université d'Avignon (France). 09-2009 -- 08-2012 Licence et Master en Informatique, spécialisation réseaux et télécoms, gestion des systèmes d'informations et traitement automatique des languesCERI - Université d'Avignon (France). Expériences professionnelles 10-2015 -- 10-2016 Ingénieur de recherche at Vodkaster / RIPLAY SAS - Paris (France). 09-2012 -- 08-2015 Doctorant chargé d'enseignements CERI - Université d'Avignon (France). 11-2011 -- 08-2012 Assistant de recherche (alternance) LIA - Université d'Avignon (France). LanguesFrançais (langue maternelle), Anglais, Italien (Corse), notions d'espagnol EnseignementsBase de Programmation C++C/C++ et Java (Programmation Orientée Réseau)Réseaux et TélécommsAnalyse de réseaux sociaux Références
Philippe Fillinger i-Roe Conseils
Phone: +33 6 16 55 68 15
Email:
[email protected]
|
45 Rue Frédéric Joliot Curie MYLI 13013 Marseille FRANCE +33 665 630 728 |