CERN Accélérateur de science

Guide de recherche

Notre moteur de recherche propose des fonctionnalités similaires à celles des moteurs de recherche actuellement disponibles sur le Web, tels que Google. La nature des recherches bibliographiques diffère cependant de la recherche de pages web. Nous proposons donc des extensions permettant des recherches structurées complexes et précises, dont une recherche combinée s'effectuant sur les metadonnées, le contenu des fichiers et les références de chaque notice. Cette page répertorie les trucs et astuces pouvant vous être utiles.

    Recherche simple versus recherche avancée
    Aide à la recherche
    Recherche de mots versus recherche de phrases
    Requêtes booléennes
    Parenthèses
    Caractères spéciaux et ponctuation
    Caractères internationaux
    Troncature des mots/indexation par radicaux
    Recherche structurée
    Expressions régulières
    Requêtes de plages
    Opérateurs de recherche refersto/citedby
    Recherche combinée métadonnées/fulltext/citation
    Foire aux questions
        Comment sélectionner vos termes de recherche de manière intelligente (en termes de vitesse)
        Comment rechercher les publications d'un auteur donné
        Comment trier d'après un certain critère
        Comment obtenir les documents d'autres serveurs (Google, SPIRES, KEK)
        Comment rechercher le contenu des fichiers
        Comment rechercher les citations

Recherche simple versus recherche avancée

Le mode de recherche par défaut est la recherche simple, qui consiste principalement en un seul champ dans lequel vous pouvez saisir votre requête. Vous avez également la possibilité de restreindre la recherche à un champ spécifique. Dans la majorité des cas, vous n'aurez qu'à saisir les mots-clés qui vous intéressent et lancer la recherche. Si, par exemple, vous souhaitez trouver des documents relatifs au standard model écrits (ou mentionnés) par Ellis, votre requête doit être la suivante:

Depuis la page des résultats vous pourrez également ajouter/supprimer des mots-clefs afin de parfaire votre recherche, comme expliqué plus loin.

L'interface de recherche avancée vous offre plus de contrôles: vous pouvez changer le type de correspondance (exacte, expression régulière, phrase partielle); vous pouvez effectuer des recherches booléennes dans différents index, etc. Par exemple pour trouver tous les documents écrits par Ellis, J (écrit exactement ainsi), qui contiennent les mots muon ou neutrino dans le titre et qui ont été publiés en 2001, saisissez:

 

Notez que la recherche simple peut obtenir le même résultat que la recherche avancée si vous utilisez la syntaxe expliquée plus bas. La différence entre la recherche simple et la recherche avancée ne se fait pas sur les fonctionnalités offertes mais plutôt sur le nombre de paramètres qu'il vous est possible de combiner. Nous nous conformons en ce sens aux modèles de recherches simples/avancées que l'on trouve dans d'autre moteurs de recherche.

Ce qui suit explique principalement la syntaxe qu'un utilisateur expérimenté peut utiliser dans le mode de recherche simple. Rappelez-vous que vous pouvez toujours utiliser la recherche avancée pour parvenir à des résultats ciblés sans avoir à utiliser de syntaxe particulière.

Aide à la recherche

Une fois votre requête envoyée, le moteur de recherche l'analyse et tente de vous aider si aucune correspondance exacte ne peut être trouvée. Il affiche, par exemple, une liste des termes indexés les plus proches en cas d'orthographe approximative:

Les alternatives sont affichées en rouge. Similairement, le moteur de recherche vous avertit lorsque votre requête ne peut aboutir, ou lorsque les éléments de recherche existent mais ne correspondent pas à votre requête booléenne. Le moteur de recherche essaie également de trouver des formes alternatives (suppression de la ponctuation, etc.) en arrière-plan.

Grâce aux multiples étapes de la recherche et à l'assistance fournie à chaque stade, il suffit généralement de saisir les éléments recherchés et de les adapter ensuite en fonction des réponses données par le système. Si vous n'êtes pas satisfait du résultat, il vous est alors possible de corriger votre requête petit à petit.

Recherche de mots versus recherche de phrases

Le mode de recherche par défaut est la recherche de mots. Cela signifie que les espaces entre les mots sont ignorés. Ils sont interpretés dans le sens "ajouter automatiquement un booléen AND (=ET) entre les mots", à la manière de Google. Par exemple, pour trouver toutes les notices qui contiennent à la fois le mot ellis et le mot muon, saisissez:

Les espaces sont significatifs si la requête est placée entre guillemets. Il existe également deux modes de recherche de phrases:
  1. Les guillemets doubles sont utilisés pour la recherche de phrases exactes. Ce mode de recherche ne trouvera de résultats que si, et seulement si une correspondance exacte est trouvée pour le champ donné. Par exemple, pour trouver tous les documents écrits par Ellis, J (écrit exactement ainsi), saisissez:
  2. Les guillemets simples sont utilisés pour la recherche de phrases partielles. Contrairement à la recherche de phrases exactes, ce mode permet de trouver une phrase même si celle-ci est contenue dans un texte plus grand. Ce mode s'apparente au mode de recherche commun à Google et aux autres moteurs cherchant des phrases à l'intérieur de pages Web. Par exemple, pour trouver tous les titres contenant l'expression muon decay sans tenir compte de sa position dans le titre, saisissez:
    Il est ainsi possible de rechercher un auteur dont le nom est parfois écrit Ellis, J et parfois Ellis, Jonathan Richard (et d'autres auteurs comme De Lellis, Jim):
    (Reportez-vous également la section dédiée à la recherche d'auteurs.)

La différence entre les modes de recherche de phrases exactes et de phrases partielles n'est pas forcément évidente au premier abord. Alors que le second mode correspond plutôt au mode de recherche tel qu'on l'entend dans le contexte de la recherche de pages Web, le premier mode est habituellement bien plus rapide si vous connaissez la valeur précise de ce que vous cherchez.

Il existe également un autre mode de recherche, celui de la recherche d'expressions régulières, introduit par des barres obliques ('/') à la place des guillemets. Par exemple, la requête 'muon decay' ci-dessus est totalement équivalente à la requête par expression régulière /muon decay/. La syntaxe des expressions régulières est très puissante et permet de construire des requêtes complexes. Pour plus d'informations, veuillez consulter la section de ce guide concernant les expressions régulières.

Requêtes booléennes

Nous avons déjà vu comment les espaces ajoutaient silencieusement un ET booléen dans la recherche par mots. Les autres opérateurs booléens sont:
+
AND
ellis +muon (= ET) cherche toutes les notices contenant à la fois le mot ellis et le mot muon
ellis muon idem (simplification syntaxique)
ellis and muon idem (simplification syntaxique)
-
NOT
ellis -muon (= NON) cherche toutes les notices qui contiennent le mot ellis mais qui ne contiennent pas le mot muon
ellis not muon idem (simplification syntaxique)
|
OR
ellis |muon (= OU) cherche toutes les notices qui contiennent au moins l'un des deux mots.
ellis or muon idem (simplification syntaxique)

Les opérations logiques sont chaînées de gauche à droite. Par exemple, si vous cherchez les documents écrits par Ellis sur les muons ou les kaons, écrivez:

qui recherche pour (muon or kaon) and ellis. Notez que cela donne un résultat différent de:
qui cherche pour (ellis and muon) or kaon

Ce chaînage de gauche à droite permet de facilement améliorer votre recherche en ajoutant/supprimant des mots avec les opérateurs and/not ou +/-. Par exemple, pour exclure les documents sur le "decay" de la recherche ci-dessus, ajoutez -decay:

pour obtenir une liste plus précise. Ajoutez/supprimez d'autres termes jusqu'à satisfaction.

Parenthèses

Vous pouvez aussi utiliser des parenthèses pour grouper des expressions booléennes:

Cette requête retourne toutes les notices contenant soit gravity ou supergravity, et soit ellis ou perelstein n'importe où dans la notice.

Notez que vous pouvez utiliser autant de parenthèses que nécessaire dans la requête. Les parenthèses imbriquées, telles que foo AND (bar OR (fuux NOT quux)), sont également supportées.

Caractères spéciaux et ponctuation

Lors de l'indexation des mots, nous veillons à les saisir avec et sans ponctuation, afin qu'il soit possible de rechercher des termes contenant des caractères spéciaux, comme dans C++:

Par exemple, pour trouver les notices contenant l'expression LaTeX $e^{+}e^{-}$ dans le titre, saisissez:
Par exemple, pour trouver le rapport avec le numéro hep-ph/0204133, saisissez:
Notez que la recherche est insensible à la casse:

Caractères internationaux

Le moteur de recherche prend en compte les caractères Unicode UTF-8, afin de rendre possible la recherche dans n'importe quelle langue. Par exemple, pour trouver les documents écrits par (ou concernant) Пушкин, saisissez:

Notez que les accents sont optionnels. Par exemple, saisissez Lemaitre pour trouver des articles de Lemaître.

Troncature des mots/indexation par radicaux

La troncature des mots est symbolisée à l'aide d'un caractère de remplacement (un astérisque (*)). Le caractère de remplacement indique au moteur de recherche que le caractère à cet emplacement peut être de n'importe quel type. Par exemple, pour trouver les résultats contenant les mots muon, muons, muonic etc, saisissez:

Les requêtes à l'aide de caractères de remplacement fonctionnent lorsque le caractère est placé en position de préfixe ou d'infixe. Par exemple, pour obtenir tous les termes commençant par CERN-TH et finissant par 31, saisissez:
Notez que le caractère de remplacement ne sera pas pris en compte s'il est inséré avant ou après une lettre isolée (a*, par exemple):
Le caractère de remplacement peut également être utilisé dans le cadre de la recherche par phrase. Par exemple, pour trouver tous les documents dont le titre commence par "Neutrino mass", saisissez:
Nous vous avons déjà expliqué les différences qui existent entre les modes de recherche de phrases exactes et de phrases partielles. On peut dire qu'un mode de recherche de phrases partielles lance une recherche exacte incluse entre des caractères de remplacement: 'foo bar baz' est ainsi l'équivalent de '*foo bar baz*'. Vous comprenez maintenant pourquoi la recherche de phrases partielles est plus lente: en raison de l'utilisation de deux astérisques au début et à la fin du texte de recherche, tous les titres de la base de données doivent être examinés afin de déterminer s'ils correspondent ou non (il n'existe actuellement pas d'index des phrases partielles).

Recherche structurée

La recherche au sein de différents champs bibliographiques (titre, auteur, etc.) est prise en charge de manière similaire à la syntaxe de Google. Si un élément de recherche est précédé d'un nom de champ et de deux points, le terme n'est recherché que dans le champ donné. Par exemple, pour trouver les documents contenant le mot ellis dans l'index des auteurs, saisissez:

Pour sélectionner les documents écrits par Ellis dont le titre contient des mots tels que muon, muons, muonic, saisissez:
Pour sélectionner les documents écrits par l'expérience NA60 en 2001, saisissez:
Les champs les plus fréquemment utilisés sont les suivants: author (auteur), title (titre), reportnumber (num. de rapport), abstract (résumé), keyword (mot-clef), year (année), experiment (expérience), fulltext (contenu), and reference (référence).

Expressions régulières

Les expressions régulières sont réservées à l'usage des utilisateurs avancés, familiers de la syntaxe des regexp Unix/POSIX. Dans le mode de Recherche Simple, on définit une expression régulière en substituant le signe / aux guillemets:

alors que dans le mode de Recherche Avancée il est possible de sélectionner explicitement la recherche par expressions régulières dans la liste des types de recherches. L'exemple ci-dessus va trouver tous les titres commençant pas la lettre E, suivi par n'importe quel nombre de caractères et se terminant par la lettre s.

Autre exemple: la recherche d'un auteur dont le prénom peut être abrégé ou entier, comme Ellis, J ou Ellis, John:

Une expression régulière vous permet de définir des paramètres de proximité entre plusieurs termes. Par exemple, rechercher tous les titres contenant les mots dense et matter séparés par un seul mot ne contenant pas la lettre l:

A noter que vous pouvez utiliser des intervalles comme [a-k] ou [0-9] et définir la longueur du mot, {3} p.ex., chercher l'ensemble des "Preprints" dont la date ne suit pas la règle de catalogage, soit YYYY pour spécifier une l'année de publication, éventuellement suivi par ? ou une autre année -YYYY (p.ex. 2003-2004 sera exclus) :

Il est aussi possible d'utiliser des "familles" de caractères, tel que [:alnum:], de telle sorte que la requête ci-dessus est équivalente à:

Pour plus d'informations sur les expressions régulières, voir les articles de Wikipedia et MySQL à ce sujet.

Requêtes de plages

La requête de plages est disponible via le signe ->. Par exemple, pour rechercher tous les documents relatifs au muon decay publiés entre 1983 et 1992, saisissez:

Pour trouver tous les documents dont l'orthographe du nom de l'auteur est comprise entre Ellis, J to Ellis, Qqq, saisissez:

Opérateurs de recherche refersto/citedby

Il est possible de rechercher dans la graphe des citations en utilisant les opérateurs de recherche citedby et refersto. Par exemple, pour trouver qui cite hep-th/0201100, vous pouvez entrer:

Par exemple, pour trouver quels articles sont cités par Klebanov, saisissez:

Pour mettre en place une alerte dès qu'un nouvel article cite l'auteur I. Klebanov, saisissez:

Notez que les opérateurs de recherche refersto et citedby fonctionnent pour n'importe quelle requête. Par exemple, pour trouver tous les articles qui citent des articles marqués du mot clé gravitino, saisissez:

Notez que ces opérateurs peuvent être librement combinés avec la recherche standard dans les métadonnées. Par exemple, pour trouver les articles écrits par Klebanov qui sont cités par des articles de Papadimitriou, mais qui ne citent en retour aucun des articles de Papadimitriou, indiquez:

Finalement, vous pouvez utiliser une syntaxe similaire à la recherche par expressions régulières ou par phrases pour combiner plusieurs expressions dans le même opérateur refersto/citedby. Par exemple, pour trouver les articles qui citent uniquement les articles de I. Klebanov mentionnant O(N) dans leur titre, saisissez:

Recherche combinée métadonnées/fulltext/citation

Les syntaxes détaillées ci-dessus peuvent être combinées dans une seule requête. Par exemple, pour trouver les documents dont le champ d'auteur contient le mot ellis, dont aucun des champs ne contient des mots tels que muon, 'muonic' etc. et dont le champ de résumé contient l'expression (ou sous-chaîne, pour être plus précis) 'dense quark matter', et qui ont été publiés dans les années 2000 et plus, saisissez:

Notez que la recherche dans "tous les champs" ne s'effectue que sur les métadonnées, et non pas sur les citations, ni le contenu des documents. Il vous faut explicitement indique une recherche dans les champs fulltext ou reference pour chercher dans ces données. Par exemple, pour trouver le terme Higgs dans les métadonnées, les références et le contenu des fichiers, saisissez:
Ceci permet de combiner la recherche dans les métadonnées, le contenu des fichiers et les citations dans une seule requête. Par exemple, pour trouver tous les documents écrits par Lin dont les fichiers contiennent les mots Schwarzschild et AdS, et citant le journal Adv. Theor. Math. Phys., saisissez:

Foire aux questions

Comment sélectionner vos termes de recherche de manière intelligente (en termes de vitesse)

Comment rechercher les publications d'un auteur donné

Il existe différentes méthodes de recherche d'un auteur. Chaque méthode a ses avantages et ses inconvénients.

  1. Tout d'abord, notez que les recherches basées sur des termes ne sont généralement pas adaptées. Si vous recherchez les mots Ellis J dans le champ de l'auteur, deux requêtes (pour les mots Ellis et J) sont d'abord effectuées. Le booléen ET n'est utilisé que par la suite:

    Une telle requête inclut également les documents dont le premier auteur est Ellis, R et le second Finch, A J. Or il est possible qu'il ne s'agisse pas du résultat que vous recherchez. La recherche est très rapide et peut vous présenter un certain nombre de résultats correspondant à l'auteur recherché. Il est néanmoins également possible qu'une telle technique vous renvoie de nombreuses réponses incorrectes, comme celle susmentionnée. Dans un tel cas, il est plus adapté de rechercher des phrases plutôt que des termes. Vous pouvez ainsi affiner votre recherche.

  2. Les noms d'auteurs sont généralement stockés sous une forme contenant uniquement des initiales, telle que Ellis, J. Pour obtenir la liste des publications d'un auteur dont le nom est orthographié de cette manière, saisissez:

    Cette méthode de recherche vous permet de procéder à une recherche très précise et d'éviter les réponses incorrectes (si l'on part du principe, souvent erroné, qu'aucun autre auteur dont le nom est orthographié Ellis, J existe dans la base de données). La recherche est très rapide.

  3. Il arrive que le prénom de l'auteur soit abrégé sur certains documents (Ellis, J) et complet sur d'autres (Ellis, John), éventuellement accompagné d'un second prénom (Ellis, John Rolfe). Pour obtenir la liste de publications correspondant à l'ensemble de ces formes, vous pouvez utiliser une requête booléenne OU:

    Cette méthode de recherche vous permet toujours de procéder à une recherche très précise et d'éviter les réponses incorrectes (si l'on part du principe, souvent erroné, qu'aucun autre auteur dont le nom est orthographié Ellis, J ou Ellis, John existe dans la base de données *). La recherche est rapide.

  4. Pour rassembler l'ensemble des formes susmentionnées dans une seule recherche de termes, vous pouvez baser la requête sur un caractère de remplacement:

    L'ensemble des noms d'auteurs qui commencent par Ellis, J, i.e. non seulement les formes recherchées Ellis, J et Ellis, John, mais aussi Ellis, Jim, ou Ellis, John Rolfe, ou Ellis, Jonathan Richard est affiché.

    Ce mode de recherche permet d'obtenir plus de résultats. Il peut être utile lorsque vous ne connaissez pas l'orthographe des noms dans la base de données. Vous risquez néanmoins d'obtenir des réponses incorrectes. La recherche est relativement rapide.

  5. L'alternative la plus fréquemment utilisée reste néanmoins la recherche de phrases partielles:

    Ce mode permet non seulement de trouver tous les auteurs mentionnés ci-dessus mais également ceux contenant l'expression Ellis, J au sein du nom, tels que De Lellis, Jim. Vous disposez ainsi du plus grand nombre possible de résultats. Le risque de réponses incorrectes est néanmoins très élevé. La recherche est relativement lente.

    (Notez que cette méthode de recherche peut néanmoins s'avérer très utile lors de la recherche de noms de famille composés tels que Pepe-Altarelli, M or 't Hooft, G, où une requête normale pour Hooft, G permet de trouver l'auteur recherché, contrairement aux méthodes susmentionnées).

  6. Finalement, notez que vous pouvez utiliser les expressions régulières pour construire n'importe quelle recherche d'auteur, même complexe. Un exemple simple est la recherche d'un auteur dont le nom est archivé en tant que Ellis, J ou Ellis, John:
    Consultez les astuces sur les expressions régulières pour en apprendre plus sur les possibilités qu'elles offrent.

*Remarque: si vous créez votre propre liste de publications et remarquez que le prénom est parfois épelé de manière abrégée et d'autres fois de manière complète ou si vous souhaitez identifier vos publications parmi celles de différents auteurs disposant du même nom en abrégé, veuillez contacter les administrateurs de CERN Document Server de manière à ce qu'ils vous aident à saisir les prénoms de manière correcte et cohérente dans l'ensemble de la base de données. Une base de données au contenu cohérent garantit des résultats satisfaisants lors de la recherche d'auteurs.

Comment trier d'après un certain critère

Il est possible de sélectionner le critère d'après lequel les résultats de la recherche sont ordrés, par exemple pour trier les résultats par titre. Cependant, il arrive parfois que l'on cherche à trier selon le numéro de rapport, alors que certains documents en ont plusieurs. Par exemple, les numéros de rapport hep-ph/0204140, CERN-TH-2002-069 et RM3-TH-02-4 appartiennent tous au même document. Si ce document se trouve dans vos résultats, le système ne prendra en compte qu' seul de ces numéros pour le tri. Il arrive que l'on cherche à trier parfois selon la référence hep-ph, et d'autres fois selon la référence CERN, selon que l'on veuille produire une liste des publications CERN ou hep-ph. Comment demander au moteur de recherche d'utiliser un des numéros plutôt que les autres?

En d'autres termes, par défaut le moteur de recherche répond à une requête "trier par le premier auteur" ou "trier par le premier numéro de rapport", mais il arrive qu'il soit nécessaire de demander "trier par le premier numéro de rapport qui commence par le texte CERN-". Cette dernière requête peut être formulée via un paramètre de tri "silencieux" appelé sp (pour "search pattern", motif de tri) qui trie de préférence selon le motif textuel qui lui est fourni. Ce paramètre est "silencieux" dans le sens qu'il n'est pas disponible dans l'interface web, mais doit être ajouté manuellement à l'URL Par exemple, pour obtenir toutes les publications de l'année 2001 triées d'après leur référence CERN-TH, il faut chercher CERN-TH-2001* dans l'index reportnumber, et sur la page des résultats (une fois que ceux-ci sont satisfaisants), ajouter &sp=CERN-TH à l'URL pour obtenir la liste triée selon ce paramètre.

Comment obtenir les documents d'autres serveurs (Google, SPIRES, KEK)

Sur la page des résultats, des liens vers d'autres serveurs tels que Google, SPIRES ou KEK sont automatiquement proposés dans une zone appelée "Essayez votre requête sur ...". Il suffit de cliquer sur ces liens pour obtenir les réponses de ces moteurs.

Notez que ces liens ne sont pas toujours imprimés pour tous les moteurs de recherche. Par exemple, SPIRES et KEK ne supportent pas la recherche par mot dans "tous les champs".

Comment rechercher le contenu des fichiers

Si une notice a des fichiers associés, CERN Document Server tente d'en extraire les informations textuelles et de les indexer dans l'index "fulltext". Pour chercher toutes les notices qui contiennent le terme e- dans leur fichiers, saisissez:

Rappelez-vous que les mots contenus dans les fichiers ne sont pas inclus dans l'index global ``tous les champs'', mais qu'il vous est possible de combiner librement la recherche dans le fichier avec la recherche dans les métadonnées. Par exemple, pour trouver tous les articles écrits par Ellis qui contiennent le mot muon dans les métadonnées et/ou dans le texte complet, saisissez:

Comment rechercher les citations

Si les métadonnées d'une notice contiennent un texte complet associé, CERN Document Server tente d'en extraire automatiquement les références et les indexe dans l'index references. Pour chercher tous les documents qui citent Ellis, saisissez:

Pour chercher toutes les notices qui citent le preprint hep-ph/0103062, saisissez:
Pour chercher toutes les notices qui citent un article de Giddings et Ross publié dans Physical Review D, volume 61 en 2000, saisissez:
Rappelez-vous que les citations ne sont pas incluses dans l'index global ``tous les champs'', mais qu'il vous est possible de combiner librement la recherche des citations avec la recherche dans les métadonnées. Par exemple, pour trouver tous les articles sur le standard model qui n'ont pas été écrits par Ellis mais qui le citent, saisissez: