Data[s.d.]
Autor(a)[s.a.]
Tipologia[indeterminada]

1. Sumário do documento

Arquivo de extração sem conteúdo textual legível — contém apenas o caractere BOM (byte order mark). Nenhuma análise é possível. (CM-0039_f)

2. Análise e descrição do documento

O arquivo CM-0039_f.txt em sources/extracted/ está essencialmente vazio, contendo apenas o marcador de codificação UTF-8 (BOM). Três hipóteses são possíveis: (a) a página original do acervo está em branco; (b) o processo de OCR não conseguiu extrair texto da imagem — possivelmente por se tratar de fotografia, mapa, página manuscrita ilegível ou documento visual sem texto; (c) o arquivo foi corrompido durante a extração.

A identificação do tipo documental dependerá da consulta à imagem original (facsimile), não disponível no formato TXT.

3. Análise por entidade

Nenhuma entidade detectável — ausência de conteúdo textual.

4. Citações ambíguas / não atribuídas

Não aplicável.

5. Notas de continuidade (multi-página)

Não aplicável (arquivo único, sem conteúdo).

6. Notas do extractor

  • Releituras: não aplicável — arquivo sem conteúdo textual.
  • Qualidade do OCR: nula — impossível avaliar.
  • Lacunas: conteúdo integralmente ausente. Recomenda-se consultar a imagem original (facsimile) para determinar se é página em branco, documento visual (foto/mapa) ou falha de extração.
  • Providência: se a imagem original contiver conteúdo legível, re-extrair o TXT. Se for página em branco, manter o registro como documento de controle.