1 O Posicionamento Arquitetural da Synesis

A modelagem de conhecimento e a anotação de corpora qualitativos enfrentam um dilema arquitetural clássico: a tensão entre a ergonomia humana (a fluidez necessária para o pesquisador escrever e pensar) e o rigor formal computacional (a estruturação rigorosa necessária para que as máquinas possam compilar, validar e exportar os dados).

A Synesis foi projetada como uma Domain-Specific Language (DSL) declarativa especificamente para resolver esse dilema, transformando anotações interpretativas em estruturas canônicas, assegurando simultaneamente a inteligibilidade humana e o rigor formal. Para compreender as decisões de design da linguagem, é útil observar como outros paradigmas de representação de conhecimento lidam com essa mesma tensão.

1.1 O Extremo do Rigor: TEI/XML e Web Semântica

Historicamente, abordagens que priorizam a validação mecânica e a estruturação de dados sacrificam a legibilidade humana.

O Paradigma TEI/XML: A Text Encoding Initiative (TEI) baseada em XML é o padrão ouro para humanidades digitais. Embora ofereça um rigor ontológico absoluto, a experiência de escrita é exaustiva. O aninhamento constante de tags de abertura e fechamento polui visualmente o documento, drenando a energia cognitiva do pesquisador e dificultando a leitura fluida do texto analítico.

O Paradigma RDF/Turtle (Web Semântica): Desenhado para construir grafos de conhecimento, o RDF expressa dados em “triplas” (Sujeito → Predicado → Objeto). Embora seja excelente para análise de redes, é uma linguagem de modelagem de dados hostil à análise qualitativa profunda. Inserir longos excertos de texto ou densos memorandos analíticos no meio de declarações RDF quebra a naturalidade do processo hermenêutico.

1.2 O Extremo da Ergonomia: Markdown e PKMs

Em contrapartida, o surgimento de ferramentas de Personal Knowledge Management (PKMs), como Obsidian ou Logseq, popularizou o uso de Markdown aliado a frontmatters (YAML) para a anotação ágil (Zettelkasten).

A Ilusão da Estrutura: O Markdown oferece uma experiência de escrita imbatível e leve. Contudo, ele carece de um compilador estrito. Como o formato aceita essencialmente qualquer texto livre, não há um motor de validação para impedir que o pesquisador utilize nomes de campos inconsistentes ou omita metadados obrigatórios.

O Problema da Extração: Sem a imposição de regras rígidas, a extração de dados tabulares confiáveis, matrizes de relacionamento ou grafos consistentes a partir de anotações em Markdown frequentemente se transforma em um custoso trabalho de limpeza de dados (data wrangling).

1.3 A Síntese da Synesis

A Synesis encontra seu espaço ao combinar a agilidade de leitura do texto plano com a previsibilidade de uma linguagem de programação fortemente tipada. Este equilíbrio é alcançado através de três invariantes de design:

  1. Separação entre Regras e Dados: Diferente do Markdown, a linguagem orquestra os componentes da análise dividindo as responsabilidades do projeto. As regras de validação (quais campos são obrigatórios ou opcionais) são isoladas no arquivo de Template (.synt), enquanto o pesquisador foca apenas na interpretação dentro dos arquivos de Anotação (.syn).
  2. Cidadania de Primeira Classe para Texto e Grafos: A linguagem permite que blocos densos de texto humano — como excertos textuais da fonte (QUOTATION) ou anotações analíticas do pesquisador (MEMO) — coexistam de forma limpa com conectores topológicos (CHAIN). As cadeias semânticas replicam a lógica de grafos unindo códigos e relações, mas com uma sintaxe puramente fluida.
  3. Compilação Determinística: O compilador não tenta “adivinhar” formatos, garantindo que a mesma entrada sempre produza a mesma saída. A compilação completa gera artefatos estruturados rigorosos (JSON, CSV, Excel) ou falha de maneira educativa, reportando os diagnósticos de erro com contexto, arquivo, linha e coluna exatos.

2 💡 Prontidão para Data Science

Ao exigir que os dados sigam o contrato estabelecido pelo template, a Synesis elimina a necessidade de limpeza de dados pós-análise. O compilador produz corpora qualitativos estruturados — incluindo rastreabilidade absoluta em CSV através das colunas source_file, source_line e source_column — entregando bases de dados imediatamente prontas para fluxos de Data Science e Bancos de Grafos. :::