JV Cossu



Je m’appelle Jean-Valère Cossu je suis un chercheur originaire de corse. Je suis ingénieur de recherche au sein de l'équipe de My Local Influence depuis Janvier 2017 où je travaille principalement l'analyse de l'E-Reputation de commerces locaux.
J'ai quitté fin octobre mes fonctions d'ingénieur de recherche chez Vodkaster à Paris où je travaillais principalement autour des systèmes de recommandation de contenus sur un média social dédié aux cinéphiles. Je m'intéressais également la science des données, à la diffusion et l'encodage de flux multimédias.
Je suis titulaire d’un doctorat en informatique (ma thèse portait sur l’analyse d’E-Réputation) de l’Université d’Avignon. Mes travaux portaient sur les méthodes d’apprentissage automatique et de traitement automatique des langues sous la supervision du professeur Marc El-Bèze, et un co-encadrement de Juan-Manuel Torres-Moreno et Eric SanJuan.
Je m’intéresse à l’humanisme numérique, c’est-à-dire la place de l’homme et de son expertise dans un environnement technologique. Mes centres de recherches touchent à l’analyse d’E-Réputation selon les points de vues algorithmiques (traitement des langues, recherche d’information, intelligence artificielle) et sociologiques (évaluation d’experts, interface de compréhension et visualisation).
Ma démarche est orientée données, je m’applique à fouiller des données et leurs métadonnées associées (ainsi qu’à en générer) pour ensuite appliqué des méthodes d’apprentissage automatique permettant de dégager des éléments de compréhension.

Avant de m’intéresser à ces thématiques, j’ai effectué des formations en administration de réseaux et de systèmes d’informations. C’est à la suite d’une alternance en recherche pour valider mon master réseaux et télécoms la bascule s’est opérée. En alternance, ma mission était de concevoir un système de recommandation de produits culturels (films) en utilisant des commentaires émis par des experts (cinéphiles) sur un réseau social spécialiser : Vodkaster.

J’ai assuré différents cours à l’Université d’Avignon dans le cadre de mon contrat de doctorant notamment en : Réseaux, Programmation (C/C++/Java) en ingénierie des réseaux sociaux. J’ai également co-encadré des projets de master 1 ainsi que des stages de fin d’études d’étudiants de master 2. L’un d’eux ayant débouché sur une « Partial Mean Square Path Modelling (PLS-PM) in football betting ».



Thématiques de Recherche
En cours ou récents (Vodkaster/ALICIA)
Projets Imagiweb
Campagnes d'évaluation
Sujet de thèse : Analyse de l'image de marque sur le Web 2.0
Mission d'alternance (Master 2)

Thématiques de Recherche

  • Traitement Automatique du Langage Natural Ecrit
  • Apprentissage Automatique
  • Recherche d'Information


En cours ou récents (Vodkaster/ALICIA)

Chez Vodkaster ma mission principale tourne autour des systèmes de recommandation de contenus. Une partie de ce travail est effectué dans le cadre d'une projet collaboratif soutenu par l'ANR (ALICIA ANR-13-CORD-0020). Mon travail se compose à ce titre de fouille et science des données afin d'extraire de nouvelles caractéristiques permettant d'améliorer la pertinence des recommandations de la plateforme. Cela inclut en partie de travailler sur l'analyse et la modélisation des cycles d'appréciations d'une œuvre. Vodkaster n'étant pas seulement un réseau social mais également une Marketplace et une plateforme disc-to-digital, mes travaux couvrent également l'encodage vidéo, la diffusion over-http, la détection de fraude et le monitoring de ces services. Je m'intéresse par ailleurs également à la modélisation de la relation et la satisfaction client.


Sujet de thèse : Analyse de l'image de marque sur le Web 2.0

Encadrants : Marc El-Bèze, Juan-Manuel Torres-Moreno and Eric Sanjuan
Mon travail de recherche consistait à identifier les différentes représentations de l'image de marque d'entités au travers de deux axes, l'analyse et la visualisation.
Le contexte du web politisé français ajoutait une difficulté à tâche. Cela se manifeste par une prédominance des opinions négatives, de remise en cause ou en contradiction avec la communication de l'entité. D'ailleurs, en terme d'opinions politiques nous avons remarqué que beaucoup d'individus sont inconsistants et changent d'avis comme de chemise à la moindre occasion.
S'agissant des aspects et modélisation et visualisation de l'image de marque dans son contexte, nous avons été confrontés à d'autres difficultés sur des aspects de personnalisation en fonction du commanditaire de l'analyse mais également dans l'estimation du cadre d'analyse (fenêtre temporelle, évaluation). Nous avons notamment montré qu'en 2012 les experts en communication n'accordaient aucune importance aux contenus mentionnant le groupe Volkswagen et portant sur l'environnement.


Projet Imagiweb

L'idée motrice du projet est de proposer des méthodes d'analyse de contenus permettant de répondre à la question suivante : "que pensent les gens de cette entité ?". Le cœur du projet est donc d'aller plus loin que la fouille de données et l'analyse d'opinions en considérant une problématique applicative plus réelle. On ne cherche plus seulement à qualifier l'opinion générale (en classes prédéfinies comme opinion positive, négative ou neutre) mais à l'associée à une thématique précise, un aspect de l'entité tel qu'il est exprimé dans un document comme le tweet. Ce type de documents limite d'ailleurs l'efficacité des méthodes habituelles basées principalement sur les lexiques d'opinions. La difficulté vient ensuite de la définition même des aspects analysés, ces derniers sont d'abords définis conceptuellement par des experts en communication pour cadrer l'analyse, toutefois ces concepts ne sont que rarement mentionnés tels quels dans les documents courts.
Le sujet principal, la politique a déjà fait l'objet d'études par la littérature, mais principalement en anglais, espagnol ou portugais mais pas encore en français et encore moins avec le niveau de précision attendu avec l'implication de politologues dans le projet. Notons par ailleurs, que la base de connaissance établie avec ces derniers est disponible publiquement.

Ce projet m'a permis de m'investir dans différentes tâches autour d'analyse de l'image de marque, ces tâches allant de de l'annotation de contenus à la mise en place de tableau de bord utilisant les résultats générés des systèmes d'analyse automatique de contenus. L'objectif du projet était d’aider des politologues et des équipes de communications (comme celle d’EDF partenaire du projet) en leur proposant des outils permettant d’annoter et analyser automatiquement les contenus concernant leurs réputations (tweets et billets de blogs au sujet des hommes politiques ou de l’entreprise). A ce titre, mes axes de recherches couvraient un large spectre de domaines autour de la fouille de données massive, le traitement automatique des langues avec des méthodes d’apprentissage automatique.


Campagnes d'évaluation

RepLab'2014
Cette édition est une extension de l'édition précédente se concentrant maintenant sur une caractérisation précise des auteurs des messages (en complémentarité avec le challenge PAN) et sur une analyse plus fin des thématiques en fonction de jugements d'experts (Framework RepTrack). Dans une optique de simplicité de mise en place et de réutilisation de nos méthodes, nous avons basé notre participation des systèmes statistiques de traitement automatique des langues. Nous avons également étudié des principes de correspondance (matching games).
Dans le cadre de la caractérisation des auteurs, nos systèmes ont obtenu parmi les meilleurs performances.
La catégorisation thématique fin des messages est très proche de la recherche de cibles évoquées dans le projet Imagiweb, cette tâche a donc continué à nous intéresser après la campagne.
Ma contribution a consisté à la gestion de la participation ainsi qu'à la mise en place de systèmes pour chaque tâche.


RepLab'2013
RepLab est une campagne d'évaluation portant sur les problématiques de suivi de réputation sur les réseaux sociaux et plus particulièrement Twitter. La campagne se compose de plusieurs tâches, comme de la désambiguïsation lexicale (est-ce qu'un message concerne vraiment l'entité ?), l'analyse d'opinions indirecte (est-ce que ce message aura un impact, et si oui lequel, sur la réputation de l'entité ?), la détection thématique (quel aspect de l'entité est présentement mentionné dans le message ?) et un classement d'importance des thématiques (est-ce qu'il faut réagir rapidement à ce message ?). Les données à analyser, fournies par l'organisation de la campagne couvraient 61 entités réparties dans 4 domaines économiques au travers de tweets en anglais et espagnol. Le fil conducteur de notre participation a été l’application de méthode issue du domaine de la reconnaissance de la parole à ces problématiques d’analyse de réputation notament pour les tâches 1 et 2 (filtrage, et détection d’opinions). Pour les tâches 3 et 4 (priorité et thématique) nous avons montré comment méthodes statistiques simples peuvent s’avérer aussi performantes que des systèmes de classement habituellement utilisées dans la littérature. Nous avons obtenu des performances compétitives dans l'ensemble des tâches.
Ma contribution a consisté d'une part en qualité de chef de projet à gérer notre participation au travers de la mise en place de l'équipe LIA puis de l'agrégation des participations individuelles puis à la mise en place de mes systèmes.


Deft’2013
Cette édition de DEFT s'intéresse à un thème déjà été au centre des attentions lors d'une précédente édition : les recettes de cuisines. Notre partition comporte deux composantes principales, une partie classification de document appliqué aux tâches 1 et 3, et une partie extraction d'information appliquée à la tâche 4.
Ma contribution à la participation a consisté en un rôle d'annotateur expert, chargé de suivre l'optimisation des systèmes d'évaluer les sorties intermédiaires des systèmes dans ce que l'on peut considérer être un processus d'apprentissage actif.


Mission d'alternance (Master 2)

Sujet : Système de recommandation de films innonvant, à partir d'opinions de cinéphiles

Encadrant : Marc El-Bèze

A partir des données recueillies sur le réseau social spécialisé www.vodkaster.com l'objectif de ces travaux est de concevoir un système de recommandation de films innovant. Ce dernier se base sur un module de traitement automatique du langage écrit qui analyse les opinions exprimées par des cinéphiles à partir d'opinions de cinéphiles. Ce travail couvre plusieurs points de vue, pour l'utilisateur choisir les films en fonction des gouts qu'il a exprimé sur des aspects précis. Pour le film arriver à résumer ce qui fait l'essence de film, les éléments pour lesquels il est apprécié par la communauté. A partir de cette analyse, nous sommes en mesure de proposer à chaque utilisateur une liste de suggestions personnalisée et argumentée.


Conférences internationales

bib-iconpdf-iconLexical Context for Profiling Reputation of Corporate Entities

Cossu J-V. and Ermakova L.

19th International Conference on Enterprise Information Systems (ICEIS), Porto (Portugal) April 26-29 2017

bib-iconpdf-iconMulti-Dimensional Reputation Modeling using Micro Blog contents

Cossu J-V., San-Juan E., Torres-Moreno, J. M and El-Bèze M.

22nd International Symposium on Methodologies for Intelligent Systems, Lyon (France) October 21-23 2015

bib-iconpdf-iconDetecting Real-World Influence Through Twitter

Cossu J-V., Dugue N. and Labatut V.

The Second European Network Intelligence Conference, Karlskrona (Sweden) September 21-22 2015

bib-iconpdf-iconNLP-based classifiers to generalize experts assessments in E-Reputation

Cossu J-V., Ferreira E., Gaillard J., Janod K. and El-Bèze M.

Sixth International Conference of the CLEF initiative, Toulouse (France) September 8-11 2015

bib-iconpdf-iconAutomatic Classification and PLS-PM Modeling for Profiling Reputation of Corporate Entities on Twitter

Cossu J-V., San-Juan E., Torres-Moreno, J. M and El-Bèze M.

20th International Conference on Application of Natural Language to Information Systems (NLDB 2015), Passau (Germany) June 17-19 2015

pdf-iconAn opinion mining Partial Least Square Path Modeling for football betting

El Hamdaoui M. and Cossu J-V.

PhD Session of the 7th European Conference on Machine Learning and Practice of Knowledge Discovery in Databases, Nancy (France) September 15-19 2014

bib-iconpdf-iconTowards the improvement of topic priority assignment using various topic detection methods for e-reputation monitoring on Twitter

Cossu J-V., Bigot B., Bonnefoy L. and Senay G.

19th International Conference on Application of Natural Language to Information Systems (NLDB 2014), Montpellier (France) June 18-20 2014

Journaux

bib-iconpdf-iconActive learning in annotating micro-blogs dealing with e-reputation on Twitter

Cossu J.-V, Molina A. and Tello-Signoret M.

Journal of Interdisciplinary Methodologies and Issues in Science

Journal of Interdisciplinary Methodologies and Issues in Science, Vol 3 - Contextualisation digitale (2017)

bib-iconpdf-iconA review of features for the discrimination of twitter users: application to the prediction of offline influence

Cossu J-V., Labatut V. and Dugue N.

Social Network Analysis and Mining : SI Diffusion of Information and Influence in Social Networks

Special Issue on Diffusion of Information and Influence in Social Networks (2016), 10.1007/s13278-016-0329-x

bib-iconpdf-iconIntweetive Text Summarization

Cossu J-V., Torres-Moreno, J. M, San-Juan E. and El-Bèze M.

International Journal of Computational Linguistics and Applications Vol. 7 No. 1, 2016

bib-iconpdf-iconBilingual and Cross Domain Politics Analysis

Cossu J.-V, Abascal R., Molina A., Torres-Moreno, J. M. and SanJuan, E.

Research in Computing Science (ISSN 1870-4069)

Issue 85 (2014), page 9–19

Ateliers internationaux

bib-iconpdf-iconMachine Learned Annotation of tweets about politicians' reputation during Presidential Elections: the cases of Mexico and France

Cossu J.-V, Abascal R., Molina A., Torres-Moreno, J. M. and SanJuan, E.

bib-iconpdf-iconBilingual and Cross Domain Politics Analysis

Cossu J.-V, Abascal R., Molina A., Torres-Moreno, J. M. and SanJuan, E.

Avances en la Ingeniería del Lenguaje y del Conocimiento

2nd International Symposium on Language & Knowledge Engineering, Puebla (Mexico) 4-5 December 2014

Conférences nationales

bib-iconpdf-iconEtude de l'image de marque d'entités dans le cadre d'une plateforme de veille sur le Web social

Khouas L., Brun C., Peradotto A., Cossu J-V., Boyadjian J. and Velcin J.

22ème Conférence sur le Traitement Automatique des Langues Naturelles, (DEFT/TALN 2013), Caen (France) June 22-25 2015

pdf-iconRecherche et utilisation d'entités nommées conceptuelles dans une tâche de catégorisation

Cossu J-V., Torres-Moreno J-M. and El-Bèze M.

20ème Conférence sur le Traitement Automatique des Langues Naturelles, (DEFT/TALN 2013), Sables d’Olonne (France) June 17-21 2013

Campagnes d'évaluation
bib-iconpdf-iconLIA@RepLab 2014 : 10 systems for 3 tasks

Cossu J.-V., Janod K., Ferreira E., Gaillard J. and El-Bèze M.

Replab : An evaluation campaign for Online Reputation Management Systems

Fifth International Conference of the CLEF initiative, Sheffield (UK) 15-18 September 2014

bib-iconpdf-iconLIA@RepLab 2013

Cossu J.-V., Bigot B., Bonnefoy L., Morchid M., Bost X., Senay G., Dufour R., Bouvier V., Torres-Moreno J.-M. and El-Bèze M.

Replab : An evaluation campaign for Online Reputation Management Systems

Fourth International Conference of the CLEF initiative, Valencia (Spain) September 23-26 2013

bib-iconpdf-iconSystèmes du LIA à DEFT'13

Bost X., Brunetti I., Cabrera-Diego L-A., Cossu J-V., Linhares A., Morchid M., Torres-Moreno J-M., El-Bèze M. and Dufour R.

Défi Fouille de Texte (DEFT/TALN 2013), Sables d’Olonne (France) June 17-21 2013

Ateliers nationaux
bib-iconpdf-iconContextualisation de messages courts: l’importance des métadonnées

Cossu J-V., Gaillard J., Torres-Moreno J-M. and El-Bèze M.

Conférence Francophone sur l'Extraction et la Gestion des Connaissances (EGC 2013), Toulouse (France) January 28 2013

Autres

bib-iconpdf-iconAnalyser l'image de marque d'entités sur le web. Revue du projet ImagiWeb.

Velcin J., Peradotto A., Khouas L., Cossu J-V., Dormagen J-Y. and Brun C.

Ingénierie des Systèmes d'Information 19(3): 159-162 (2014)

Posters

Présentations


194 heures d'enseignements (TP/TD) :

Période 2014/2015

Monitorat, TP/TDHeures
Bases de programmation C/C++ (L1)17
Programmation C/C++ Avancée (L2)25.5
Base de données linguistique et analyse de graphes dans les réseaux sociaux (Master 2)21
Co-Encadrement stage de fin d'étude (Master 2) : Web-Crawler et réseaux complexes-
Co-Encadrement de projet (Master 1) : Hyperviseurs et conteneurs, quel choix pour du calcul scientifique-
Total63.5


Période 2013/2014

Monitorat, TP/TDHeures
Bases de programmation C/C++ (L1)24
Programmation C/C++ Avancée (L2)25.5
Réseaux sociaux et infrastructures réseaux (Master 2)21
Co-Encadrement stage de fin d'étude (Master 2) : PLS-PM et traitement automatique des langues pour des paris de football-
Total70.5


Période 2012/2013

Monitorat, TP/TDHeures
Bases de programmation C/C++ (L1)20
Programmation C/C++ Avancée (L2)24
Programmation réseau - C/C++/Java (Master 1)21
Co-Encadrement de projet (Master 1) : Réseau de neurones et traitement automatique des langues-
Total65


Depuis Janvier 2017, je suis ingénieur de recherche au sein de l'équipe de My Local Influence où je travaille principalement l'analyse de l'E-Reputation de commerces locaux. Entre Octobre 2015 et Octobre 216, j'occupais le poste d'ingénieur de recherche chez Vodkaster à Paris où je travaillais principalement autour des systèmes de recommandation de contenus sur un média social dédié aux cinéphiles. J'étais auparavant doctorant chargé d'enseignements à l'Université d'Avignon où j'ai travaillé sur l'E-Réputation dans le cadre du projet ANR Imagiweb.

pdf-iconCV

pdf-iconManuscrit de thèse

Thématiques de recherche

Traitement Automatique des Langues
Recherche d'Information
E-Réputation, analyse et suivi
Apprentissage Automatique
Intelligence Artificielle
Fouille et catégorisation de données auto-générées
Analyse de données issues des médias sociaux
Filtrage et sélection de contenus pertinents (Résumé)
Analyse des réseaux sociaux
Profilage d'utilisateur (Détection d'influence, Catégorisation CSP, Age, Genre, Personnalité, Orientation politique)
Modélisation d'items à partir de contenus textuels
Système de recommandation de produits culturels


Formation

09-2012 -- 08-2015 Doctorat en Informatique, sujet : Analyse de l'image de marque sur le Web 2.0, LIA - Université d'Avignon (France).

09-2009 -- 08-2012 Licence et Master en Informatique, spécialisation réseaux et télécoms, gestion des systèmes d'informations et traitement automatique des langues
CERI - Université d'Avignon (France).


Expériences professionnelles

10-2015 -- 10-2016 Ingénieur de recherche at Vodkaster / RIPLAY SAS - Paris (France).

09-2012 -- 08-2015 Doctorant chargé d'enseignements CERI - Université d'Avignon (France).

11-2011 -- 08-2012 Assistant de recherche (alternance) LIA - Université d'Avignon (France).


Langues

Français (langue maternelle), Anglais, Italien (Corse), notions d'espagnol


Enseignements

Base de Programmation C++
C/C++ et Java (Programmation Orientée Réseau)
Réseaux et Télécomms
Analyse de réseaux sociaux


Références

Philippe Fillinger
i-Roe Conseils
Phone: +33 6 16 55 68 15
Email: philippe.fillinger@i-roe.com

 


Chris Navas
Vodkaster / RIPLAY SAS
23 Rue Boyer 75020 Paris, France
Phone: +33 6 20 54 43 14
Email:Vodkaster.com"> chris@Vodkaster.com

 


Professeur Marc El-Bèze
University of Avignon
339 chemin des Meinajariès
84911 Avignon, France
Phone: +33 490 843 508
Email:marc.elbeze@univ-avignon.fr

Juan-Manuel Torres-Moreno
Maître de conférences (HDR)
University of Avignon
339 chemin des Meinajariès
84911 Avignon, France
Phone: +33 490 843 568
Email:juan-manuel.torres@univ-avignon.fr

Eric SanJuan
Maître de conférences
University of Avignon
339 chemin des Meinajariès
84911 Avignon, France
Phone: +33 490 843 568
Email:eric.sanjuan@univ-avignon.fr


mail-icon
45 Rue Frédéric Joliot Curie MYLI
13013 Marseille
FRANCE

carnet-icon
jvcossu@gmail.com

telephone-icon
+33 665 630 728

internet-icon
Twitter @jvcossu
Google Scholar
DBLP
LinkedIn