Comment Scinan facilite vos recherches

Posté le : 12/01/2021

Partager

Un peu de contexte

J’ai récemment débuté un doctorat en NLP (Natural Language Processing) avec un focus sur l’analyse du « langage mensonger » sur internet. Cela se matérialise généralement par un client malveillant publiant de faux avis négatifs à propos d’une entreprise ou bien par une société qui gonfle positivement les avis à son sujets pour redorer son image.

Les êtres humains sont dans l’incapacité de détecter des textes mensongers, par conséquent j’ai décidé de me pencher sur ce sujet mais je ne savais pas par où commencer.

La chose la plus évidente pour moi fût de commencer là où tout le monde commence : Google Scholar.

J’apprécie beaucoup cet outil, mais il existe de nombreux challenges à relever lorsque l’on est nouveau dans un domaine. Ceci dit, ce n’est pas un problème spécifique à Google Scholar, mais plutôt un problème global lorsque l’on débute dans sa « carrière de chercheurs ».

 

L’absence d’aperçu visuel d’un nouveau domaine

Graphique Scinan

Lorsque l’on intègre sa première année de doctorat, il est nécessaire de faire de longues et fastidieuses recherches sur le sujet que l’on choisit.

Il faut réussir à comprendre quels sont les ouvrages les plus importants dans ce domaine, quels sont les domaines liés et ainsi de suite.

Le simple fait de garder une trace de la donnée peut s’avérer difficile, il est cependant primordial d’avoir un aperçu visuel des tendances et dynamiques du domaine auquel vous vous intéressez.

Passer à côté de quelque chose d'important

Bureau mal rangé

Il n’existe pas de résumé de tous les articles écrits (c’est à vous de le faire), et plus vous lisez de documentation, plus il est facile de s’y perdre.

Ajouté à cela le fait que de nombreux ouvrages sont publiés chaque année, il est donc « naturel » de passer à côté d’écrits importants.

Il n’est pas facile de trouver les références des articles qui peuvent vous intéresser sans avoir un outil visuel qui les représente sous forme de graphique.

Ouvrages pionniers et dérivés

Si l’on prend comme exemple le sujet de Deceptive Opinion Spam, il s’agit d’un domaine impliquant de nombreux autres domaines (NLP, deep learning, théorie des graphiques, linguistique, psychologie…). Ainsi, il est crucial de déterminer quels sont les ouvrages pionniers dans ce domaine et dans les domaines connexes qui puissent représenter un intérêt pour votre recherche.

Pour palier ce problème il existe un outil appelé Scinan, permettant d’outrepasser tous les obstacles cités plus haut.

Voici une capture d’écran de mes dossiers de recherche avant que j’utilise Scinan :

 

organisation

 

Voici à quoi cela ressemble maintenant :

 

organisation folder

 

Effectivement, rien n’a changé car le but de Scinan n’est pas de vous faire lire moins, mais de vous faire lire mieux.

Voici la structure de connaissances basée sur Microsoft Academic Graph :

 

aperçu visuel

 

En utilisant ce graphique, on peut voir les articles les plus impactant, les domaines apparentés et dérivés et filtrer les résultats par mots clefs. Il existe aussi un outil permettant de créer des filtres plus sophistiqués en utilisant des paramètres logiques.

 

filtres

 

Mais quel rapport ?

Vous me demanderez ce qu’ont en commun la LSTM (Long- short term memory) et le Deceptive Opinion Spam ?

Si l’on va plus loin et que l’on se penche sur des articles apparentés on peut se retrouver face à des idées intéressantes. On peut par exemple découvrir qu’il existe un ensemble idéal de données appelé Ott Deceptive Opinion Spam corpus, qui est fréquemment utilisé par les chercheurs.

Voici un court résumé des différentes recherches faites sur cet ensemble :

 

recherches

 

En résumé, Scinan n’est pas le type d’outil qui vous fera apprendre sans faire aucun effort.

Bien au contraire, il s’agit d’une nouvelle approche dans la manière d’étudier qui vous permettra d’apprendre de la même façon que vous l’avez toujours fait mais sans perdre de vue les tendances globales et les dynamiques de votre domaine.

Un point très important lorsque l’on passe beaucoup de temps à faire des recherches.

Écrit par Alibek JAKUPOV

Contactez-nous Postuler Nos offres d'emploi