Daniel Pimienta es Responsable del Observatorio de la diversidad lingüística y cultural en la Internet (https://obdilci.org).
Les propongo – sin dejar de recordarlos que el español es la tercera lengua de la Internet, de tras de inglés y chino – la traducción de un texto que acaba de ser publicado en una obra de referencia sobre el tema de multilingüismo, libro que asocia textos de autores contemporáneos con extractos de textos de filósofos y lingüistas prestigiosos de la historia: « De Babel à l’intelligence artificielle – Le plurilinguisme de Dante à nos jours », C. Tremblay, JC. Herreras (coord.). Collection plurilinguisme, édité par l’Observatoire européen du plurilinguisme. ISBN 9791042488130 – 1/2026 – https://livres.bookelis.com/documents/74996-De-Babel-a-l-IA.html
El texto será entregado en 4 partes. La primera entrega deconstruye el mito del inglés siendo representando más del 50% de los contenidos en línea y siendo la lengua franca de la Internet.
La percepción pública de la diversidad lingüística en la Internet —y a menudo, por desgracia, también la de las comunidades académicas y de investigación— se basa en un profundo malentendido, alimentado a su vez por una desinformación crónica. Esta desinformación se perpetúa por fuentes cuyos sesgos estructurales se derivan principalmente de la negación de lo que constituye la esencia misma de la Internet: el multilingüismo. Todo esto se resume en la concisa afirmación: «El inglés es la lengua franca de la Internet», repetida como un mantra, en directa contradicción con los hechos.
El malentendido surge de la creencia de que lo que es cierto para el mundo de la investigación y los negocios –un dominio innegable de la lengua inglesa– necesariamente debería ser cierto también en el mundo digital.
La diferencia esencial entre estos tres ámbitos, que es necesario integrar para aclarar este malentendido, reside en una herramienta todavía poco comprendida o conocida: la demolingüística, es decir, la demografía de las lenguas en el mundo.
Una encuesta global de investigadores demostraría casi con certeza que el inglés es una segunda lengua para la gran mayoría de quienes no lo tienen como lengua materna. No es que la fluidez en inglés sea un factor determinante para convertirse en investigador, sino, más prosaicamente, porque la intensa presión por publicar trabajos científicos en esta lengua actúa como un incentivo inevitable. De hecho, la cantidad de publicaciones, pero aún más el lugar de publicación y el número de citas generadas por este trabajo, son los indicadores esenciales que determinan las carreras de los investigadores. En los procedimientos para evaluar estos indicadores, el lugar obligatorio para obtener puntos siguen siendo las revistas científicas en inglés. El auge del acceso abierto mejora indirectamente la situación del multilingüismo en las publicaciones científicas, pero esta evolución sigue siendo lenta y sus efectos aún son apenas perceptibles.
En el mundo de los negocios, particularmente en el comercio internacional, prevalece un razonamiento similar: existe un fuerte incentivo para realizar negocios en inglés y, por lo tanto, para dominar el idioma, incluso si esta restricción es menos pronunciada que en el mundo de la investigación.
Es legítimo afirmar hoy que «el inglés es la lingua franca de la investigación» y, aunque en menor medida, también de los negocios. Esta menor proporción se explica, en particular, por el hecho de que, en el comercio electrónico —que representó más del 20 % del comercio mundial en 2020 y sigue creciendo rápidamente—, los consumidores prefieren mayoritariamente las plataformas que se dirigen a ellos en su lengua materna y se muestran reacios a comprar en un idioma extranjero que no comprenden del todo. Este factor también explica el ya significativo y creciente plurilingüismo de los sitios web de comercio electrónico.
Un malentendido demolingüístico perpetuado por un sesgo crónico
¿Por qué debería ser diferente para la Internet en su conjunto, y cómo se trata de un malentendido demolingüístico? Las comunidades de investigación y negocios representan segmentos muy específicos de la población mundial, que concentran un porcentaje minúsculo de la humanidad: más cercano al 0,1% que al 1% en el caso de los investigadores, y mucho mayor en el caso de quienes participan en el comercio internacional, aunque aún marginal. Los análisis muestran que las características demolingüísticas de estos segmentos distan mucho de los promedios globales. El alto porcentaje de angloparlantes dentro de estas comunidades no es comparable en absoluto con el promedio global, que es varias veces inferior.
Hoy en día, más del 60% de la población mundial tiene acceso a la Internet; en muchos países, la tasa de acceso supera el 90%. Considerando la población mundial de usuarios de la Internet, las proporciones se acercan a las de la población alfabetizada, estimada en alrededor del 85% de la población mundial. Por lo tanto, es necesario aplicar datos demolingüísticos globales para comprender la realidad lingüística de la Internet.
Según Ethnologue (2024), la población nativa de habla inglesa supera los 380 millones de personas, lo que representa poco más del 5% de la población mundial. Si se incluyen los hablantes de primera y segunda lengua, la proporción se mantiene por debajo del 15%. Incluso con las estimaciones más generosas (hasta dos mil millones de hablantes de inglés), menos del 20% de la humanidad entiende inglés. Una lengua franca entendida por menos del 20% de la población objetivo, francamente, no es viable.
Esta incomprensión sobre la realidad demolingüística de la Internet, estructuralmente incompatible con el predominio del inglés, se ha visto perpetuada por fuentes sesgadas. Su alcance se ha visto amplificado por los altavoces de los motores de búsqueda, Wikipedia e incluso algunas empresas especializadas en la comercialización de estadísticas. Por ejemplo, Statista.com seguía afirmando en 2022, con un marcado tono de marketing, que «el inglés es la lengua universal de la Internet». Al mismo tiempo, OBDILCI publicó los resultados de su modelo de indicadores lingüísticos en la Internet y concluyó que «la transición de la Internet, desde el predominio de las lenguas europeas, con el inglés a la cabeza, hacia las lenguas asiáticas y el árabe, con el chino a la cabeza, está muy avanzada. El verdadero ganador de esta transición es el multilingüismo, aunque las lenguas africanas aún tardan en ocupar su lugar».
Esta situación de datos sesgados, producidos por empresas de marketing con métodos no publicados, ha persistido durante años. La significativa influencia de estos pseudodatos, fabricados sin el rigor científico requerido y difundidos masivamente por los medios de comunicación —y con demasiada frecuencia por investigadores—, también se explica por la casi ausencia de académicos en este ámbito. Las pocas iniciativas universitarias, como el "Language Observatory Project, en Japón, que reunía una red de universidades y trabajaba en colaboración con la ahora desaparecida red mundial para la diversidad lingüística MAAYA lamentablemente no resistierón la prueba del tiempo.
Compartir esta nota