URL:
https://linuxfr.org/news/nocomprendo-version-1-0
Title: NoComprendo, version 1.0
Authors: be.root
ZeroHeure, patrick_g et Davy Defaud
Date: 2020-01-29T09:49:58+01:00
License: CC by-sa
Tags:
Score: 4
NoComprendo est une application de commandes vocales pour GNU/Linux basée sur l’environnement Qt et utilisant la bibliothèque PocketSphinx pour la partie reconnaissance vocale.
----
[Journal à l’origine de la dépêche](
https://linuxfr.org/users/be-root/journaux/nocomprendo-version-1-0)
[Site de NoComprendo](
http://be.root.free.fr/?soft=nocomprendo&menu=desc)
[PocketSphinx](
https://github.com/cmusphinx/pocketsphinx)
[Journal précédent sur NoComprendo](
https://linuxfr.org/users/be-root/journaux/nocomprendo-la-commande-vocale-pour-linux)
[Paquets d’installation chez OBS](
https://software.opensuse.org/download.html?project=home:be-root:nocomprendo&package=nocomprendo)
----
Il y a deux mois, [je vous présentais NoComprendo](
https://linuxfr.org/users/be-root/journaux/nocomprendo-la-commande-vocale-pour-linux), un logiciel de commande vocale développé pour mes besoins personnels.
Le journal a été apprécié, mais j’ai eu peu de retours d’utilisateurs, la plupart concernant des problèmes de compilation. Le site [Open Build Service](
https://build.opensuse.org/) ne fournissant aucune métrique des téléchargements, je m’interroge sur le nombre d’utilisateurs potentiels. Alors, s’il existe quelques utilisateurs réguliers, un petit courriel me permettrait de me sentir moins seul à parler devant mon écran.
J’ai donc continué à le faire évoluer en fonctions de mes inspirations. La nouvelle version apporte son lot de corrections de bogues que je ne détaillerai pas ici. L’interface a très peu changé :

Nouveautés
==========
Pilotage vocal de NoComprendo
-----------------------------
Les trois dialogues principaux de l’application sont maintenant ouvrables par méta‑commandes.
Cela permet d’activer ou désactiver les groupes de commandes avec la voix (ouvrir le dialogue, puis naviguer vocalement avec les commandes associées aux touches du clavier). On peut également naviguer dans le dialogue de configuration les bras croisés. Ça demande un peu d’entraînement mais ça fonctionne très bien.
Exportation CSV des commandes
-----------------------------
Avec un nombre de commandes qui enflait, j’ai ajouté une exportation au format CSV, avec l’idée d’imprimer un mémento. Cette exportation est toujours présente, même si une autre solution a été trouvée depuis (voir ci‑dessous).
Fenêtre OSD
-----------
Je travaille souvent avec deux écrans. NoComprendo trouve bien sa place sur l’écran de droite, mais avec seulement un seul écran, on économiserait bien la surface de la fenêtre, même réduite.
* Première solution : une fenêtre OSD (_On Screen Display_) pour afficher le dernier énoncé reconnu. On peut la positionner et la redimensionner où l’on veut, et modifier sa durée d’affichage.
Mémento des commandes
---------------------
La fenêtre principale propose la liste des commandes, mais celle‑ci est difficilement accessible (changer de fenêtre, faire défiler la liste, revenir d’où l’on vient).
* Deuxième solution : une fenêtre plein écran de rappel des commandes, activable par la méta‑commande « _Reminder_ » et qui se ferme d’un simple clic ou d’une action au clavier (par exemple en disant « clic » ou « échappe »).
Déplacement de souris
---------------------
De nouvelles commandes permettent maintenant de lancer la souris dans huit directions, c’est le mode « glissade ». Le problème qui se pose est celui d’arrêter la glisse. La solution choisie consiste à interrompre la glisse dès le début de détection d’un énoncé. La précision n’est pas au rendez‑vous, ça dérape un peu avant l’arrêt, mais ça permet de traverser l’écran facilement. Les autres commandes de la souris sont là pour la précision finale. Le pas et la vitesse de glissade sont bien sûr configurables.
La langue anglaise
------------------
Les modèles acoustiques et les dictionnaires phonétiques nécessaires pour la langue anglaise ont été ajoutés. J’ai l’impression que ça marche, mais mon terrible accent de grenouille fait que j’ai surtout du succès avec des énoncés comme « _page up_ » et « _page down_ ». Pour articuler correctement « _start browser_ », j’ai besoin d’une dizaine d’essais. Il faudrait que j’essaie en mâchant du chewing‑gum.
Les groupes de commandes fournis en démonstration sont à améliorer et à compléter par de vrais anglophones. Pour tester l’application en anglais lancez la depuis un terminal : `LANGUAGE=en_US nocomprendo`, ou plutôt `LANGUAGE=en_US nocomprendo 2>/dev/null` pour cacher les journaux de PocketSphinx.
Pour l’aide en anglais, j’ai « googletranslaté » sans vergogne.
Empaquetage
===========
Les deux langues _fr_FR_ et _en_US_ sont emballées dans le même paquet. Ce n’est sûrement pas la meilleure technique, mais ça reste la solution la plus simple dans un premier temps. Une fois installés, les dictionnaires anglais et français prennent 3,2 Mio chacun. Le modèle acoustique français fait 10 Mio et l’anglais 18 Mio.
Par ailleurs, un paquet pour Ubuntu 18.04 LTS a été ajouté suite à la demande d’utilisateurs.
Partage de groupes de commandes
===============================
Si vous avez réalisé un groupe de commandes pour une application ou un environnement spécifique qui peut être utile à d’autres personnes, envoyez‑moi le fichier produit par la fonction d’exportation, je le mettrai en partage sur le site du projet. Idem pour des groupes de commandes en anglais.
Suspension du projet
====================
Je considère ce projet comme terminé et souhaite retourner vers d’autres centres d’intérêts.
Pour marquer le coup, NoComprendo passe en version 1.0.0. J’assurerai les corrections de bogues, mais je ne prévois pas de nouvelles fonctionnalités pour l’instant. Pour des traductions vers d’autres langues, proposez vos services pour traduire l’aide et les menus. Les langues disponibles pour PocketSphinx sont basées ici : [CMU Sphinx](
https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/). Je m’occuperai volontiers de leur intégration.
-----
P.S. — Je tiens à présenter mes excuses à [nokomprendo](
https://linuxfr.org/users/nokomprendo-3), dont le pseudo collisionne avec le nom de mon programme. En cas de conflit insoluble entre nous, je propose de rebaptiser mon application GPasCompris, pour rester dans le même esprit.