% fr8hyph.src
% version june 2nd, 1992. (Daniel Flipo)
% Coding-independant version LS 6-92
% NOT TO BE INPUT DIRECTLY
% SEE fr8hyph.ck or fr8hyph.mac for use.
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%% This is *NOT* an official GUTenberg distribution %%
%% but my personal updated version of the 8bits %%
%% french hyphenation patterns. (Daniel Flipo) %%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% Hyphenation patterns for French
% from Jacques D'esarm'enien: how to run TeX in a French environment:
% hyphenation, fonts, typography. Tugboat, 5 (1984) 91-102.
% Modifications by Michael Ferguson (Tugboat, 10, 1989) (mjf),
% Norman Buckle (nb) and Justin Bur (jbb).
% Following modifications by Daniel Flipo (df):
% March 20, 92: addition of some missing uppercase codes
% June 1, 92 : add missing JD patterns (see TSI vol 5 No 4 1986)
% and check consistency with FRHYPH.TEX for MLTeX (Gould, Rennes)
% Patterns present in FRHYPH.TEX and not in original JD file are
% marked as `JD+'.
%
% Coding independant version LS 6-92
% as requested by Michael Ferguson in his presentation
% of the Cork norm Tugboat 11 (Nov. 1990) pages 514--6.
% <ag> is <a-grave>
% <ax> is <a-circumflex>
% <eg> is <e-grave>
% <ea> is <e-acute>
% <ex> is <e-circumflex>
% <ix> is <i-circumflex>
% <id> is <i-dieresis>
% <ox> is <o-circumflex>
% <od> is <o-dieresis>
% <ux> is <u-circumflex>
% <cc> is <u-cedilla>
% <oe> is <oe-ligature>
% for example by
%
%% Here are the substitutions that were used
%% to derive this table from Flipo's Cork norm table
% Change "^^e0" to "<ag>" "a"
% Change "^^e8" to "<eg>" "a"
%
% Change "^^e9" to "<ea>" "a"
%
% Change "^^e2" to "<ax>" "a"
% Change "^^ea" to "<ex>" "a"
% Change "^^ee" to "<ix>" "a"
% Change "^^f4" to "<ox>" "a"
% Change "^^fb" to "<ux>" "a"
%
% Change "^^ef" to "<id>" "a"
% Change "^^f6" to "<od>" "a"
%
% Change "^^e7" to "<cc>" "a"
%
% Change "^^f7" to "<oe>" "a"
%
\message{fr8hyph.tex french hyphenation patterns
of jun 2nd, 1992}
J'ai compar\'e les 3 fichiers suivants :
- FRHYPHEN pour MLTeX du Gould de Rennes, (GR)
- La liste de motifs de J. D\'esarm\'enien parue dans TSI, (JD)
- le fichier FR8HYPHEN de Yannis, (YH)
et je voudrais vous faire part des diff\'erences que j'ai observ\'ees et
des questions que je me pose.
D'apr\`es Bernard, la r\'ef\'erence \`a prendre est le Gould, je comparerai
donc les 2 autres \`a cette r\'ef\'erence.
1) Le motif `th2l' figure \`a Rennes contre `2thl' chez JD, lequel est le
bon ? Pour ma part je ne sais pas comment il faut couper athl\'etisme,
triathlon ou biathl\`ete. Avec le motif `th2l' (Rennes) j'obtiens :
pen-ta-thlon mais tri-athlon, est-ce correct ?
2) M\^eme probl\`eme avec `2ck3h' \`a Rennes contre `c2k3h' chez JD...
3) Que vient faire le motif '\"o2 ajout\'e par mjf (ligne 471 du fichier GR) ?
Existe-t-il des mots fran\c cais commen\c cant par `o-tr\'ema' ? Ce motif est
absent des 2 autres fichiers.
4) Quelle est l'utilit\'e des motifs (lignes 448--460)
a4 .\^a4 .e4 .\^e4 .\'e4 .\`e4 .i4 .\^\i4 .o4 .\^o4 .u4 .\^u4 .y4 ?
En fran\c cais \lefthyphenmin=2, il me semble donc inutile d'interdire
les c\'esures ci-dessus, en revanche les m\^emes motifs avec apostrophe
s'imposent ('a4 '\^a4 ... 'y4).
5) Dans le m\^eme ordre d'id\'ee, `on' a rajout\'e \`a Rennes un tas de motifs
de 2 lettres en fin de mot qui ne figuraient pas chez JD :
4be. 4ce. 4ch. 4ck. 4de. 4fe. 4ge. 4he. etc.
Ils ne servent \`a rien tant qu'on impose \righthyphenmin=3.
Faut-il les maintenir quand m\^eme ?
6) Les motifs suivants pr\'esents chez JD sont absents \`a Rennes :
- .re2s3cisi
- .re2s3ciso
(ils sont pr\'ec\'ed\'es d'un %) ne faut-il pas les remettre ?
7) Les motifs de JD concernant les d\'ebuts de mots en .d\'es (lignes 617--647)
ont \'et\'e assez profond\'ement retouch\'es sur la version de Rennes.
Est-ce par Norman Buckle ? Ces modifications ont-elles \'et\'e test\'ees ?
Une chose me trouble : JD affirme dans TSI que ses motifs donnent
d\'esami-don-ner, or dans cet exemple s'appliquent les motifs `.d\'e2s'
et `1mi', je ne vois pas pourquoi la coupure entre le `a' et le `m'
serait emp\^ech\'ee... En revanche on a sur le Gould le motif `.d\'e2s1a2'
qui emp\^eche la coupure entre le `a' et le `m' mais pourquoi avoir mis
un `1' entre le `s' et le `a' alors qu'on ne veut s\^urement pas d\'es-ami ?
Autre question : le Larousse des difficult\'es de la langue fran\c caise donne
pour bonne la division `d\'esa-bu-ser', pourquoi alors faut-il refuser
`d\'esa-mi-don-ner' ?
8) Pb de dis-convenance, dis-continuit\'e, dis-cours (cf. question de Bernard) :
je propose de changer `di2s3cop' (ligne 532) en `di2s3co', je ne connais
'ailleurs pas de mot en 'discop'. J'ai test\'e, \c ca marche \`a mon avis : j'obtiens
dis-con-ve-nance dis-con-ti-nuit\'e dis-co-bole dis-co-gra-phie
dis-con-ve-nir dis-co-phile dis-cor-dant dis-cou-rir dis-cour-tois.
Y a-t-il des objections ?
9) Ne faudrait-il pas ajouter des motifs pour le c-cedille ?
Je propose : `1\c ca' `1\c co' `1\c cu' si \c ca passe en MLTeX (?),
et en version 8-bits (fontes EC) : `1<cc>a' `1<cc>o' `1<cc>u'
(ex. : commen\c cant commer\c cant fa\c con ma\c connerie ger\c cure).
10) En essayant les mots dont la division est donn\'ee dans le Lexique
des r\`egles typographiques ou le Larousse des difficult\'es,
j'ai obtenu trois coupures apparemment incorrectes :
** tran-sac-tion au lieu de trans-ac-tion (selon le Lexique)
le motif `tran3s2act' pr\'esent \`a Rennes et chez JD est responsable,
`tran2s3act' me semble plus conforme \`a l'\'ethymologie.
** caout-chouc au lieu de caou-tchouc (selon le Lexique)
faut-il ajouter `caou3t2chou' ?
** post-hume au lieu de pos-thume (selon le Larousse)
l\`a c'est le motif `.pos2t3h' pr\'esent \`a Rennes et chez JD qui est responsable,
faut-il le changer ? Le Larousse affirme que dans ce cas c'est la coupure
phon\'etique qui s'impose, \c ca peut se discuter...
Qu'en pensent les sp\'ecialistes ? Question finale (fondamentale) :
existe-t-il un ouvrage de r\'ef\'erence qui tranche tous ces cas litigieux ?
=================================================================
Je signale pour terminer qq lacunes (graves) du fichier 8-bits
de Yannis (outre les doubles points...) :
- il manque tous les motifs phon\'etiques concernant les mots en `ill'
(lignes 222--260 dans le fichier de Rennes) ;
Il n'est pas le seul \`a faire cet oubli puisque le fichier FEhyphen.tex
diffus\'e avec le format FEPlain par le labo de typographie de Strasbourg
(proche de JD ?) fait la m\^eme chose !
- il manque tous les motifs concernant les mots en `ck' (lignes 75--85 sur
le Gould) ;
- il manque de tr\`es nombreux motifs commen\c cant par une apostrophe ;
- plus qq fautes de frappes et omissions diverses...
J'ai compl\'et\'e et corrig\'e le fichier 8-bits de Yannis en prenant pour
mod\`ele celui de Rennes. Il s'agit pour l'instant d'une version d'essai
annot\'ee en ce qui concerne les ajouts, corrections et pbs en suspens. Si \c
ca int\'eresse quelqu'un il suffit de me la demander.