Arquivo de extração sem conteúdo textual legível — contém apenas o caractere BOM (byte order mark). Nenhuma análise é possível. (CM-0039_f)
O arquivo CM-0039_f.txt em sources/extracted/ está essencialmente vazio, contendo apenas o marcador de codificação UTF-8 (BOM). Três hipóteses são possíveis: (a) a página original do acervo está em branco; (b) o processo de OCR não conseguiu extrair texto da imagem — possivelmente por se tratar de fotografia, mapa, página manuscrita ilegível ou documento visual sem texto; (c) o arquivo foi corrompido durante a extração.
A identificação do tipo documental dependerá da consulta à imagem original (facsimile), não disponível no formato TXT.
Nenhuma entidade detectável — ausência de conteúdo textual.
Não aplicável.
Não aplicável (arquivo único, sem conteúdo).