Introduction
Un précédent article paru au mois de janvier 2011 présentait la création, l’adaptation et l’intégration du moteur de recherche personnalisé Google au sein de SQLPAC : Création et adaptation des moteurs de recherche personnalisés Google (CSE - Custom Search Engine)
3 critères sont implémentés dans le moteur de recherche intégré au sein du site SQLPAC :
- Requête (champ texte).
- Catégorie (liste déroulante).
- Périmètre (boutons radio).
Les adresses URL associées au moteur de recherche ont la forme suivante :
/recherche?q=<mots clés>&categorie=<catégorie>&perimetre=[all|htm]
Avec l’exemple ci-dessus (recherche sur le mot clé dbcc)
Recherche dans toutes les catégories et tout type de contenu (articles, news, thèmes…) :
Adresse URL | Requête Google |
---|---|
/recherche?q=dbcc&categorie=all&perimetre=all |
dbcc |
Recherche uniquement dans la catégorie Sybase et tout type de contenu (articles, news, thèmes…) :
Adresse URL | Requête à Google |
---|---|
/recherche?q=dbcc&categorie=sybase&perimetre=all |
sybase dbcc |
Recherche uniquement dans la catégorie Sybase et uniquement dans les articles :
Adresse URL | Requête Google |
---|---|
/recherche?q=dbcc&categorie=sybase&perimetre=htm |
sybase dbcc
filetype:htm
OR filetype:html
OR filetype:pdf |
Analyser les recherches effectuées par les internautes sur le moteur de recherches intégré à son site est très important car cette analyse permet d’appréhender précisément ce que recherchent les internautes lors de leur navigation dans le site.
Cet article présente les 2 méthodes alternatives permettant d’extraire ces informations depuis Google Analytics (hors APIs d’export de données), l’intégration de la recherche sur site dans Google Analytics étant de loin la plus efficace. Pour chacune des méthodes, la maîtrise des URLs lors des recherches demeure indispensable.
Recherche sur site dans Google Analytics
Activation et paramétrage de la recherche sur site dans Google Analytics
L’intégration de la recherche sur site dans Google Analytics est une nouveauté de novembre 2007 mais demeure relativement cachée.
Dans la page d’accueil du compte Google Analytics, cliquer sur le lien "Modifier" pour le site :
La page des paramètres de profil pour www.sqlpac.com s’affiche et indique si la recherche sur site est activée ou non (Informations relatives au profilRecherche sur site).
Si la recherche sur site n’est pas activée (Ne pas effectuer le suivi de la recherche sur site), cliquer sur le lien "Modifier".
La page "Modifier les informations sur le profil" propose alors à la fin un paragraphe intitulé "Recherche sur site", paragraphe contenant le formulaire consacré au paramétrage de la recherche sur site dans Google Analytics.
L’activation du suivi de la recherche sur site est réalisée en cochant le bouton radio "Effectuer le suivi de la recherche sur site". | |
La ou les variables utilisées pour les
mots clés dans les adresses URL sont
indiquées dans le champ "Paramètre de requête".
|
|
La ou les variables utilisées pour les
catégories dans les adresses URL sont
indiquées dans le champ "Paramètre de catégorie".
|
Que signifient les options "Oui, supprimer les paramètres de requête de l’URL" et "Oui, supprimer les paramètres de catégorie de l’URL" ?
Afin de ne pas obtenir dans le tableau de bord général "ContenuDétail des pages par URL" toutes les entrées avec les divers mots clés et catégories, exemple :
Page | Pages vues |
---|---|
/recherche?q=baie+configuration&categorie=all |
2 |
/recherche?q=2k+to+4k&categorie=all |
2 |
/recherche?… |
… |
Ces 2 options indiquent à Google, dans le tableau de bord général, de supprimer les paramètres de requête et de catégorie dans les adresses URLs et ainsi aggréger les statistiques sur les URLs contenant ces paramètres.
Page | Pages vues |
---|---|
/recherche?sa=+ |
28 |
Les tableaux de bord de la recherche sur site avec Google Analytics
Dès le suivi de la recherche sur site activé, le tableau de bord propose le nouveau menu "ContenuRecherche sur site". Le rapport sur les termes de recherche est le plus intéressant : il regroupe dans un tableau tous les mots clés, au format lisible, saisis par les internautes dans le moteur intégré.
Toutes les adresses /recherche?q=détruire+un+dbf
, etc. sont traduites dans
un format lisible dans ce rapport des termes de recherche.
Parmi les autres informations dans ce nouveau menu "Recherche sur site" (la liste n’est pas exhaustive) :
- le taux de visite avec recherche sur site.
- dans quelles catégories les visiteurs ont effectué leur recherche.
- où les visiteurs ont commencé leur recherche et quelles pages ont été trouvées
Utilisation des segments avancés
L’intégration du suivi de la recherche sur site est la plus efficace pour les analyses, mais pour ceux qui n’ont pas encore activé cette option, l’utilisation des segments avancés est une bonne solution pour analyser les statistiques déjà enregistrées.
Par exemple, créér un segment avancé "SEARCHENGINE
" (Mes personnalisations
Segments avancés), segment qui réalise un filtre sur la ou les adresses
URLs dédiées à la recherche : /recherche
dans ce cas
Le tableau de bord "ContenuDétail des pages par URL" pour le segment
SEARCHENGINE
liste alors toutes les URLs pour les pages contenant /recherche
:
Page | Pages vues |
---|---|
/recherche?q= +Flash+Recovery+Area+Usage |
2 |
/recherche?q=2k+to+4k |
1 |
/recherche?q=add+service |
1 |
… |
… |
Ces adresses ne sont pas aisément lisibles contrairement au rapport sur les termes de recherche avec la recherche sur site intégrée dans Google Analytics.
Google Analytics propose cependant une option d’export au format CSV de ce rapport (menu du haut). Le fichier résultat peut alors retraité avec sed et awk pour extraire les mots clés dans un format lisible.
sqlpac@MSYS$ cat analytics.csv | grep '^/recherche' | sed -e "s/\/recherche?q=//g" \ | awk -F"," '{print $1}' | sed -e "s/&sa=+//g" | sed -e "s/+/ /g" | sort -f
Flash Recovery Area Usage 2k to 4k 8i @printopts add service ajout service baie baie configuration configuration pfile cygwin DATA PUMP EXECUTE UTL_FILE privileges to PUBLIC fragmentation index gimp index migration ase MMON Msg 8009 Number of sort buffers openquery pagesize pagesize 2k to 4k raid rechercher job RMAN service sp_helptext statpack interpretation streams sybase ase tablespace TTS zfs