Skip to content

Por qué los PDF "censurados" siguen filtrando su texto

6 min de lectura 28 de mayo de 2026
pdfcensuraseguridad

Dibujar un rectángulo negro sobre el texto no oculta nada. Las palabras quedan debajo, listas para que las copie cualquiera que sepa dónde hacer clic.

Por qué los PDF "censurados" siguen filtrando su texto — Hivly

Tachas un nombre. Dibujas un pulcro rectángulo oscuro sobre un número de la seguridad social, una cifra de sueldo, un testigo. El PDF parece censurado. Lo envías por correo, lo archivas, lo publicas. Y el texto que hay debajo sigue ahí, completamente intacto, esperando a la primera persona a la que se le ocurra arrastrar el cursor por la página.

Esta es una de las filtraciones de datos más comunes y más bochornosas que existen, y ocurre por un simple malentendido sobre cómo están construidos los PDF.

Resumen: un recuadro negro es pintura encima de la página, no un borrador. Los caracteres que hay debajo siguen en el archivo y se pueden copiar, extraer o dejar al descubierto en segundos. La censura real elimina el texto de la página, o aplanas la página en una imagen plana para que no quede nada recuperable.

Un PDF son capas, no una foto

Cuando miras un PDF ves una página terminada. Dentro del archivo, esa página es un conjunto de instrucciones. Hay un flujo de contenido que dice “dibuja la letra J en esta posición, luego la letra o, luego h, luego n”, junto con la fuente, el tamaño y las coordenadas. Esas instrucciones de caracteres son el texto de verdad. Son las que te permiten seleccionar un párrafo y copiarlo.

Cuando abres el archivo en un visor o en un editor de imágenes cualquiera y dibujas un rectángulo sobre una palabra, no estás tocando para nada ese flujo de contenido. Estás añadiendo un objeto nuevo encima. En términos de PDF suele ser una anotación o una forma vectorial, pintada al final para que quede por encima de todo lo demás. Visualmente cubre la palabra. A nivel de estructura, la palabra sigue intacta, una capa más abajo, deletreándose entera.

Así que el recuadro y el texto conviven. El recuadro oculta el texto a tus ojos. No oculta nada al archivo.

Cómo sale el texto a la luz

No necesitas un laboratorio forense para derrotar una censura falsa. Hay al menos tres maneras triviales.

Seleccionar y copiar. Abre el PDF, arrastra por la zona tachada como si la estuvieras resaltando y pega en cualquier campo de texto. Los caracteres que hay bajo el recuadro salen directamente, porque la selección lee el flujo de contenido, no los píxeles que ves.

Extraer el texto. Cualquier herramienta que saque texto de un PDF, incluido el buscador de tu propio lector, lee ese mismo flujo subyacente. Busca un nombre que creías haber ocultado y míralo iluminarse bajo su propio recuadro negro.

Borrar el recuadro. El rectángulo no es más que otro objeto. Un editor puede seleccionarlo y quitarlo, y la palabra original queda a la vista debajo, sin cambios. La “censura” tenía la profundidad de una sola tecla.

Nada de esto es exótico. El texto nunca desapareció. Solo estaba fuera de la vista.

Esto le sigue pasando a gente que debería saberlo

No es un error solo de principiantes. Tribunales, despachos de abogados, organismos públicos y grandes empresas han enviado documentos donde nombres sensibles, direcciones y cifras quedaban recuperables bajo recuadros negros.

En algunos escritos judiciales de gran repercusión, los abogados censuraron nombres de testigos y detalles confidenciales con recuadros superpuestos, y los periodistas extrajeron el texto supuestamente oculto del PDF publicado en cuestión de minutos. Organismos públicos han divulgado contratos e informes donde los precios o los datos personales estaban “tachados” pero se podían copiar sin esfuerzo. El patrón se repite porque el fallo parece un éxito. El documento aparenta estar censurado en pantalla, la persona ve una pulcra barra negra y da por hecho que el trabajo está hecho. La filtración es invisible hasta que alguien va a buscarla, y para entonces el archivo ya es público.

Si organizaciones con equipos jurídicos siguen haciendo esto, la conclusión honesta es que la herramienta los engañó, no que fueran descuidados. Un rectángulo negro en el flujo de trabajo equivocado es una trampa disfrazada de función.

Qué significa realmente una censura de verdad

La censura real tiene un único requisito: el contenido sensible ya no debe existir en el archivo. Ni oculto, ni cubierto, ni detrás de una capa. Desaparecido de las instrucciones de la página.

Hay dos maneras fiables de conseguirlo.

Eliminar el contenido y luego aplanar. Una censura correcta borra del flujo de contenido el texto subyacente y cualquier objeto de la zona cubierta, y después escribe una página limpia. Tras esto, seleccionar la zona no te da nada, porque no hay nada ahí. La búsqueda no encuentra nada. No hay recuadro que borrar porque las palabras que ocultaba ya no existen. Esto es lo que debería significar “censurar”, y es distinto de “dibujar un recuadro”.

Cubrir y luego rasterizar. El otro método fiable es colocar tus marcas de tapado y después convertir la página en una imagen plana, de modo que la página pase a ser píxeles en lugar de texto más formas. Una página rasterizada no tiene caracteres seleccionables ni una capa de recuadro separable. Lo que ves es de verdad todo lo que hay en el archivo. El inconveniente es que toda la página pierde su texto real, así que ya no se puede buscar ni copiar en ninguna parte, y el archivo suele ser más grande. Para una única página de algo que nunca debe filtrarse, ese inconveniente muchas veces merece la pena.

Los dos métodos comparten el mismo principio. El texto oculto no está detrás de algo. Está destruido.

Una decisión que sí puedes aplicar

Esta es la regla que le daría a cualquiera que maneje documentos sensibles.

Si no pasara nada porque el texto tapado saliera a la luz más adelante, en realidad no necesitas censura, y un recuadro visual es cosa tuya. Si el texto tapado nunca debe poder recuperarse, un recuadro visual no basta y nunca bastará. En ese caso tienes dos resultados aceptables: usar una censura real que borre el contenido subyacente, o cubrir la zona y luego rasterizar o aplanar la página para que no lleve texto recuperable. Cualquier cosa que deje los caracteres originales en el archivo no es censura. Es un disfraz.

Otra costumbre que vale la pena mantener. Después de censurar, comprueba tu propio trabajo antes de enviarlo. Abre el archivo terminado, intenta seleccionar por la zona que ocultaste y pégala en algún sitio. Haz una búsqueda del nombre o el número exacto que querías eliminar. Si no sale nada y no se encuentra nada, la censura aguantó. Si el texto aparece, acabas de pillar una filtración antes de que saliera de tu equipo, que es justo donde quieres pillarla.

Hacer esto sin subir el documento

Hay un detalle incómodo en todo esto. Los documentos que más necesitan censura, contratos, historiales médicos, escritos judiciales, documentos de identidad, son los mismos que menos quieres subir al servidor de un desconocido solo para tachar una línea. Enviar un archivo confidencial a una herramienta en línea para hacerlo más confidencial es, en sí mismo, otra filtración.

Por eso la censura pertenece a herramientas que funcionan por completo en tu navegador, donde el archivo nunca sale de tu dispositivo. Las herramientas locales de PDF para censurar, aplanar y rasterizar páginas llegarán pronto a pdf.hivly.net, creadas para que el trabajo ocurra en tu máquina, sin subidas ni cuentas. La idea es sencilla. Si estás quitando secretos de un archivo, el acto de quitarlos no debería entregarle el archivo a nadie más.

Hasta entonces, recuerda lo único que importa. Un recuadro negro es decoración. Si el texto tiene que desaparecer, haz que desaparezca.

Try the pdf toolsMerge, split, compress, protect, unlock, sign and convert PDFs to and from images.

Preguntas frecuentes

¿Un recuadro negro sobre el texto de un PDF borra realmente el texto?
No. Un recuadro negro suele ser una anotación o una forma dibujada encima de la página. Los caracteres originales permanecen en el flujo de contenido que hay debajo, así que todavía se pueden seleccionar, copiar o dejar a la vista al borrar el recuadro.
¿Cómo puede alguien leer el texto que hay debajo de un recuadro de censura?
Puede seleccionar y arrastrar por toda la página y pegar las palabras ocultas en un editor de texto, ejecutar una extracción de texto sobre el archivo o abrir el PDF en un editor y borrar el recuadro. Nada de esto requiere herramientas especiales de hackeo.
¿Qué hace en realidad una censura de verdad?
Una censura de verdad elimina el texto y los objetos subyacentes del flujo de contenido, no solo la capa visual. Después de eso, las palabras ya no existen en el archivo, así que no hay nada que copiar ni recuperar.
¿Aplanar un PDF es lo mismo que censurarlo?
Aplanar ayuda porque fusiona las capas y puede convertir una página en una imagen rasterizada, lo que elimina el texto seleccionable. Si primero cubres el texto y luego aplanas o rasterizas, las palabras ocultas desaparecen de esa página.

Sigue leyendo

¿Algo más ambicioso?

Hivly está hecho por CodingEagles, un estudio de software que publica aplicaciones web de producción. Si tienes un proyecto real, escríbenos.

Mira lo que hace CodingEagles →