diff options
author | pacien | 2018-02-23 23:07:22 +0100 |
---|---|---|
committer | pacien | 2018-02-23 23:07:22 +0100 |
commit | 4b4962b3acaaffe7f8e734faa142bb4a6fc49b11 (patch) | |
tree | 57ad0e8c2709c58ebf6910985fb39f4a654375c1 | |
parent | c0802bc17f856546b95a5b51252f7a35d9e1ab10 (diff) | |
download | tpc-compiler-4b4962b3acaaffe7f8e734faa142bb4a6fc49b11.tar.gz |
Reformat report
-rw-r--r-- | doc/rapport.md | 80 |
1 files changed, 47 insertions, 33 deletions
diff --git a/doc/rapport.md b/doc/rapport.md index 35b23fe..906d3ec 100644 --- a/doc/rapport.md +++ b/doc/rapport.md | |||
@@ -1,33 +1,37 @@ | |||
1 | --- | 1 | --- |
2 | title: "UPEM / Compilation / Projet" | 2 | title: "UPEM / Compilation / Projet / Rapport" |
3 | author: [Pacien TRAN-GIRARD, Adam NAILI] | 3 | author: [Pacien TRAN-GIRARD, Adam NAILI] |
4 | date: 2018-02-20 | 4 | date: 2018-02-20 |
5 | ... | 5 | ... |
6 | 6 | ||
7 | #Rapport | 7 | # Analyse lexicale |
8 | 8 | ||
9 | ##Analyse lexicale | ||
10 | L'analyse lexicale est réalisée avec Flex et est contenue dans le fichier `tpc.lex`. | 9 | L'analyse lexicale est réalisée avec Flex et est contenue dans le fichier `tpc.lex`. |
11 | *Les lexèmes ont été définis au sein de ce fichier:* | 10 | |
12 | 11 | ## Lexèmes | |
13 | | Symbole | Description | Token associé | | 12 | |
14 | |:-----------------:|:-----------------------------------------------:|:-------------:| | 13 | Les lexèmes ont été définis au sein de ce fichier : |
15 | | = | opérateur d'affectation | | | 14 | |
16 | | + | opérateur d'addition | ADDSUB | | 15 | | Symbole | Description | Token associé | |
17 | | - | opérateur de soustraction ou moins unaire | ADDSUB | | 16 | |:------------------------------:|:----------------------------------------------:|:-------------:| |
18 | | * | multiplication | DIVSTAR | | 17 | | `=` | opérateur d'affectation | | |
19 | | / et % | division et reste de la division entière | DIVSTAR | | 18 | | `+` | opérateur d'addition | `ADDSUB` | |
20 | | ! | négation booléenne | | | 19 | | `-` | opérateur de soustraction ou moins unaire | `ADDSUB` | |
21 | | ==, != | opérateur de comparaison | EQ | | 20 | | `*` | multiplication | `DIVSTAR` | |
22 | | <,>,<=,>= | opérateur de comparaison | ORDER | | 21 | | `/` et `%` | division et reste de la division entière | `DIVSTAR` | |
23 | | && | opérateur booléen | AND | | 22 | | `!` | négation booléenne | | |
24 | | || | opérateur booléen | OR | | 23 | | `==`, `!=` | opérateur de comparaison | `EQ` | |
25 | | ; et , | le point virgule et la virgule | | | 24 | | `<`, `>`, `<=` ,`>=` | opérateur de comparaison | `ORDER` | |
26 | | (, ), {, } [ et ] | les parenthèses, les accolades et les crochets | | | 25 | | `&&` | opérateur booléen | `AND` | |
27 | 26 | | `||` | opérateur booléen | `OR` | | |
28 | - Certains symboles ne sont pas associés à des tokens. En effet ils sont utilisés directement dans la grammaire, entourés de simple guillemets. (par exemple `'='`) | 27 | | `;` et `,` | le point virgule et la virgule | | |
29 | 28 | | `(`, `)`, `{`, `}`, `[` et `]` | les parenthèses, les accolades et les crochets | | | |
30 | - Les identificateurs sont constitués d'au moins une lettre, puis éventuellement de chiffres, et/ou d'"underscore" (`_`). Ils sont identifiés par le token `IDENT` | 29 | |
30 | - Certains symboles ne sont pas associés à des tokens. | ||
31 | En effet ils sont utilisés directement dans la grammaire, entourés de simple guillemets. (par exemple `'='`) | ||
32 | |||
33 | - Les identificateurs sont constitués d'au moins une lettre, puis éventuellement de chiffres, et/ou d'"underscore" (`_`). | ||
34 | Ils sont identifiés par le token `IDENT` | ||
31 | 35 | ||
32 | - Gestion de la casse | 36 | - Gestion de la casse |
33 | 37 | ||
@@ -37,13 +41,17 @@ L'analyse lexicale est réalisée avec Flex et est contenue dans le fichier `tpc | |||
37 | 41 | ||
38 | - Les commentaires sont délimités par `/*` et `*/` et ne peuvent pas être imbriqués. | 42 | - Les commentaires sont délimités par `/*` et `*/` et ne peuvent pas être imbriqués. |
39 | 43 | ||
40 | - `print`,`reade` et `readc` sont des identificateurs qui appartiennent au langage tpc, ils ne doivent pas être utilisé pour déclarer des variables. Nous avons donc créer des tokens spécifiques pour leur gestion dans la grammaire (respectivement les tokens `PRINT`, `READE` et`READC`) | 44 | - `print`,`reade` et `readc` sont des identificateurs qui appartiennent au langage tpc, ils ne doivent pas être utilisé pour déclarer des variables. |
45 | Nous avons donc créer des tokens spécifiques pour leur gestion dans la grammaire (respectivement les tokens `PRINT`, `READE` et`READC`) | ||
46 | |||
41 | 47 | ||
42 | ##Analyse syntaxique | 48 | # Analyse syntaxique |
43 | 49 | ||
44 | La grammaire est celle fournie sur la plateforme elearning. | 50 | La grammaire est celle fournie sur la plateforme elearning. |
45 | 51 | ||
46 | - Cette grammaire génère un conflit empiler/réduire pour la règle | 52 | ## Résolution des conflits |
53 | |||
54 | Cette grammaire génère un conflit empiler/réduire pour la règle | ||
47 | 55 | ||
48 | ```yacc | 56 | ```yacc |
49 | Instr : IF '('Exp')' Instr | 57 | Instr : IF '('Exp')' Instr |
@@ -56,11 +64,12 @@ Par exemple : | |||
56 | IF '('Exp')' IF '('Exp')' Instr ELSE Instr | 64 | IF '('Exp')' IF '('Exp')' Instr ELSE Instr |
57 | ``` | 65 | ``` |
58 | 66 | ||
59 | *Faut il empiler `ELSE` ? Ou réduire `IF '('Exp')' Instr` ?* | 67 | Faut il empiler `ELSE` ? Ou réduire `IF '('Exp')' Instr` ? |
60 | Pour résoudre le conflit, il faut gérer les `precedences`. | 68 | Pour résoudre le conflit, il faut gérer les `precedences`. |
61 | Nous avons choisi de rentre le `ELSE` plus précédant que `')'` qui est le dernier terminal. Ainsi, Bison va choisir d'empiler en priorité. | 69 | Nous avons choisi de rentre le `ELSE` plus précédant que `')'` qui est le dernier terminal. |
70 | Ainsi, Bison va choisir d'empiler en priorité. | ||
62 | 71 | ||
63 | - Un autre conflit existe, sur l'associativité de `,`: | 72 | Un autre conflit existe, sur l'associativité de `,`: |
64 | 73 | ||
65 | ```yacc | 74 | ```yacc |
66 | ListExp : ListExp ',' Exp | 75 | ListExp : ListExp ',' Exp |
@@ -68,6 +77,7 @@ ListExp : ListExp ',' Exp | |||
68 | ``` | 77 | ``` |
69 | 78 | ||
70 | Par exemple : | 79 | Par exemple : |
80 | |||
71 | ``` | 81 | ``` |
72 | ListExp ',' ListExp ',' ListExp | 82 | ListExp ',' ListExp ',' ListExp |
73 | ``` | 83 | ``` |
@@ -77,11 +87,15 @@ Dans les langages tel que le C, l'associativité se fait à gauche. | |||
77 | On déclare donc `%left ,` pour l'indiquer à Bison. | 87 | On déclare donc `%left ,` pour l'indiquer à Bison. |
78 | 88 | ||
79 | 89 | ||
80 | ##Améliorations enviseageables | 90 | # Améliorations enviseageables |
81 | 91 | ||
82 | - Récupération sur erreur | 92 | ## Récupération sur erreur |
83 | Nous pourrions envisager de parser entièrement le fichier et de ne pas s'arrêter dès la première erreur de syntaxe comme le fait gcc. Il est possible de réaliser ceci en modifiant le code de yyerror() par exemple. | 93 | |
94 | Nous pourrions envisager de parser entièrement le fichier et de ne pas s'arrêter dès la première erreur de syntaxe comme le fait `gcc`. | ||
95 | Il est possible de réaliser ceci en modifiant le code de `yyerror()` par exemple. | ||
96 | |||
97 | ## Numérotation des lignes | ||
84 | 98 | ||
85 | - Numérotation des lignes | ||
86 | En complément de la précédente amélioration, nous pourrions imaginer donner les lignes dans le message d'erreur de syntaxe. | 99 | En complément de la précédente amélioration, nous pourrions imaginer donner les lignes dans le message d'erreur de syntaxe. |
87 | Il suffit de maintenir une variable globale incrémentée à chaque saut de ligne `\n` | 100 | Il suffit de maintenir une variable globale incrémentée à chaque saut de ligne `\n` |
101 | |||