Daniel Pimienta es Responsable del Observatorio de la diversidad lingüística y cultural en la Internet (https://obdilci.org)

Esta cuarta y ultima entrega observa cual es la naturaleza del plurilingüismo en la Internet a través algunos indicadores iniciales y plantea las razones por las cuales la diversidad lingüística y cultural esta destinado a ser un tema emergente de la gobernanza de la Internet, que lo había dejado de lado hasta la fecha.

La naturaleza del plurilingüismo en la Internet sigue siendo en gran medida desconocida, principalmente debido a la falta de datos sobre el tema hasta hace poco. Este velo apenas comienza a desvelarse gracias a los estudios exploratorios realizados en 2025 por OBDILCI[1]. Este trabajo fue posible gracias al acceso a una base de datos (https://DataProvider.com) que describe, según diversos parámetros, incluidos los idiomas, más del 80 % de los aproximadamente 200 millones de sitios web existentes.

Los resultados iniciales revelan una realidad dinámica y en rápida expansión, pero marcada por considerables disparidades según los criterios utilizados. En promedio, la proporción de sitios web multilingües se sitúa entre el 11 % y el 12 %. Sin embargo, esta cifra varía considerablemente de un país a otro: supera el 50 % en los sitios alojados en Mónaco, Moldavia, Kuwait, Ucrania, Mauritania o Luxemburgo, mientras que es inferior al 4 % en los ubicados en China, Sudáfrica o Corea del Sur.

El análisis por idioma revela contrastes igualmente llamativos. Más de la mitad de los sitios web escritos en euskera, ucraniano, letón, catalán o estonio son multilingües, mientras que, en el caso de los sitios web en chino, coreano o japonés, menos del 4 % ofrece acceso en otro idioma. Estos resultados ponen de relieve el papel crucial de los contextos sociolingüísticos y geopolíticos en las estrategias lingüísticas web.

Otro indicador revelador es el número medio de lenguas por sitio multilingüe, que está en claro aumento: pasó de unas cinco lenguas en 2023 a siete en 2026. Esta tendencia confirma la aceleración del plurilingüismo en la web.

Un indicador clave, especialmente revelador al compararlo con el de la humanidad en su conjunto, es la tasa de plurilingüismo. Para las poblaciones humanas, esta tasa se calcula típicamente como la razón entre el número de hablantes de L1+L2 y el número de hablantes nativos de L1. Según Ethnologue, alcanzó 1,43 en 2024. Para la web, se puede proponer un cálculo similar: dividir el número total de versiones lingüísticas de los sitios web entre el número de sitios web existentes. El valor resultante ronda el 1,8, y también está creciendo rápidamente.

¿Es de extrañar que la web parezca más multilingüe que la humanidad misma? Es innegable que es más fácil para un sitio web aprender un nuevo idioma que para un ser humano, y la tendencia a añadir nuevas versiones lingüísticas solo puede intensificarse a medida que las herramientas de traducción se integren en el software de edición web. Por lo tanto, cabe esperar un rápido crecimiento de estos indicadores en los próximos años.

Algunos temen que la adopción generalizada de herramientas de traducción basadas en IA desanime a las personas a aprender idiomas extranjeros. Pero ¿y si ocurriera lo contrario? ¿Y si el apetito lingüístico se viera impulsado por una mayor facilidad para cruzar las fronteras lingüísticas? Estas preguntas abren un vasto campo de investigación y representan indicadores clave que se deben observar de cerca en los próximos años, en el corazón de la revolución digital del lenguaje.

Cibergeografía del plurilingüismo

Los análisis iniciales revelan una geografía muy contrastante del plurilingüismo en la Internet. Los sitios web de los países árabes y europeos se encuentran entre los más multilingües, mientras que los niveles más bajos se encuentran en la web de los principales países asiáticos y en los países anglófonos en general. Esta distribución subraya que el plurilingüismo en la web no refleja automáticamente el peso demográfico o económico de un país, sino que es el resultado de decisiones políticas, culturales y económicas específicas.

Varios casos específicos ilustran con claridad esta complejidad. Luxemburgo, por ejemplo, ocupa un lugar destacado entre los países con sitios web multilingües. Por el contrario, los sitios web en luxemburgués se encuentran entre los menos multilingües en la clasificación lingüística. Esta discrepancia pone de relieve la posible desconexión entre las políticas lingüísticas nacionales y las estrategias lingüísticas reales empleadas para el contenido digital.

Norteamérica generalmente presenta un bajo rendimiento en términos de plurilingüismo, aunque esta tendencia no puede atribuirse a Canadá, cuyos resultados están por encima de la media. Entre las lenguas europeas, el portugués también tiene una puntuación relativamente baja, a pesar de la sólida posición de Portugal. Esta aparente contradicción se explica por el predominio de la web brasileña, que concentra más del 90 % del contenido en portugués y sigue siendo en gran medida poco multilingüe.

Con respecto a una de las aplicaciones más multilingües de la Internet, Wikipedia, con artículos enciclopédicos en 343 idiomas, y también, bajo el paraguas de la asociación Wikimedia, otras aplicaciones de intercambio abierto altamente multilingües (Wiktionary, WikiSource , Wikibooks, etc.),  destacan en las primeras posiciones, en una clasificación basada en los porcentajes promedio de presencia en todas estas aplicaciones, el inglés (23%), el alemán (10%), el francés (8%), el italiano (5%), el hebreo (4%) y polaco (3%), el español con 2%, en posición 10, tiene margen para la mejora.

Sin embargo, los resultados más alentadores se refieren a la fuerte correlación observada entre el plurilingüismo y el impacto económico de los sitios web, especialmente en el sector del comercio electrónico. Las plataformas con un alto valor añadido económico son también las que invierten con mayor decisión en el plurilingüismo. Por lo tanto, la «brújula lingüística» de la web apunta claramente hacia una aceleración continua del plurilingüismo.

Gobernanza de Internet y conclusión: la era del plurilingüismo 

La defensa de la diversidad lingüística en la Internet ha sido un planteamiento principalmente francófono[2]. Se ha expresado, en particular, a través de los procesos de diplomacia multilateral de la ONU vinculados a la Cumbre Mundial sobre la Sociedad de la Información, iniciados a principios de la década de 2000 y continuados, de diversas formas, en el marco más amplio de la gobernanza de la Internet. La diversidad lingüística nunca ha alcanzado la prioridad estratégica que merece, eclipsada por la urgencia de la brecha digital y por una visión dominante —a menudo defendida por actores del sector tecnológico— excesivamente centrada en la conectividad, en detrimento de un enfoque más holístico de la tecnología digital.

Sin embargo, las prioridades están cambiando. La diversidad lingüística y cultural, así como la alfabetización digital —y más específicamente su dimensión informacional—, están comenzando a recibir la atención y la prioridad que merecen. Varios factores explican el inicio de este cambio: el reconocimiento del daño causado por una alfabetización informacional insuficiente ante la desinformación y sus efectos perjudiciales en los procesos democráticos; la saturación progresiva de los niveles de conectividad en muchos países, que permite desviar la atención hacia otras prioridades; y, finalmente, la rápida irrupción de la inteligencia artificial en el ecosistema digital, que está alterando las certezas establecidas, reconfigurando arquitecturas centrales —como las de los motores de búsqueda y la cuestión subyacente de la descubrabilidad— y planteando nuevos e importantes desafíos éticos.

Ya en 2006, el lingüista británico David Graddol advirtió a los jóvenes angloparlantes monolingües que su futuro profesional se vería comprometido en una Europa donde se encontrarían compitiendo con colegas que, además de su lengua materna, dominaban el inglés y, a menudo, otro idioma[3]. Veinte años después, una advertencia similar se impone a los responsables de sitios web monolingües: su impacto digital se verá alterado si no se comprometen a desarrollar versiones multilingües de su contenido. El supuesto dominio absoluto del inglés en la web pertenece ya a una época pasada.

La era digital gira en torno al plurilingüismo. Desde Babel hasta la inteligencia artificial, la historia lingüística de la era digital nos recuerda que la pluralidad lingüística no es un obstáculo a superar, sino un activo estructural que debe reconocerse, organizarse y amplificarse.

Para concluir, tres fuentes para quienes desean profundizar el tema:

https://obdilci.org

-Indicadores de la presencia de las lenguas en la Internet , https://funredes.org/lc2022/Res.Ind.lang.Internet.es.pdf (versión en español del artículo Indicators of the presence of languages on the Internet, in Proceedings of the 1st Annual Meeting of the ELRA/ISCA Special Interest Group on Under–Resourced Languages, pages 83–91, Marseille, France. European Language Resources Association. https://aclanthology.org/2022.sigul–1.11/

Una historia breve de la observación de las lenguas en la Internet , en Proc. del VII Simposio de Historia de la Informática (SHIALC), pp294-312, Univ. de São Paulo, ISBN 978-65-981536-3-2 – 8/2022 – https://is.cos.ufrj.br/wp-content/uploads/2024/06/ebook-shialc-2022-final-compactado.pdf.pdf

[1] Consulte siete estudios sobre el multilingüismo en la Web: https://obdilci.org/projets/otros/mlreports-2/

[2] De notar que la actual ministra francesa de la francofonía, Eléonore Caroit, es una dominicana-francesa, criada en Santo Domingo.

[3] “English Next”, https://teachingenglish.org.uk/sites/teacheng/files/pub_english_next.pdf

Daniel Pimienta

Especialista en Tecnologías de la Información

Daniel Pimienta es Presidente del Observatorio de la diversidad lingüística y cultural en la Internet y profesor universitario, especialista internacional del uso de las tecnologías de la información y la comunicación con visión social... y amante de la naturaleza, especialmente del mar.

Ver más