Na linguística generativa , as regras de reescrita , também chamadas de regras de frase, são usadas para criar frases ou cláusulas. Essa noção foi introduzida por Noam Chomsky como parte da teoria padrão e é uma resposta aos processos de distribuição de ZS Harris e L. Bloomfield para quem a sintaxe é o resultado da distribuição de morfemas na frase.
Este componente da gramática tem a particularidade de gerar frases de "cima para baixo", ou seja, partindo dos elementos mais abstratos para ir para os elementos mais concretos: os morfemas.
A outra vantagem deste tipo de gramática é simplificar a descrição de um idioma: por exemplo, um sintagma nominal pode aparecer em várias posições em uma frase (sujeito, cod, etc.), enquanto uma gramática de estado finito deve indicar para cada posição a regra para a composição deste elemento, a gramática frase-regra deve especificar a composição do sintagma nominal apenas uma vez.
Uma regra de reescrita é do tipo: XAY → XZY, com:
A manipulação de uma regra de reescrita consiste em substituir um único símbolo por uma sequência diferente de zero distinta. Um elemento é denominado inicial se nunca aparece à direita da seta e terminal se nunca aparece à esquerda da seta.
Em linguagens naturais, o único elemento inicial é P (para frase), enquanto os elementos terminais correspondem a morfemas . Além disso, os elementos não terminais incluem as diferentes categorias gramaticais.
Uma sequência de derivações por regras de reescrita é chamada de cadeia . Uma cadeia é considerada terminal quando nenhuma regra pode ser aplicada a qualquer elemento dessa cadeia.
Entre os tipos de regras existentes, duas permanecem particularmente importantes:
Uma regra de reescrita é formulada da seguinte forma:
Exemplos: deixe as regras 1 e 2:
E as variáveis:
Aplicação da regra 2 sobre a regra 1:
(R1): P → SN SV⇔ (R2): P → Det N SV
Substituição de variáveis:
P: o cachorro comeExistem várias maneiras de representar uma cadeia de derivações por regras de reescrita: