Crítica filosófica de los embeddings desde Wittgenstein y Nietzsche
I. Introducción
El auge de los modelos de lenguaje de gran escala ha producido una transformación epistemológica silenciosa pero radical: la idea de que el lenguaje puede ser comprendido, manipulado y predecido a partir de estructuras estadísticas altamente dimensionales. Los embeddings, representaciones vectoriales que codifican el “significado” de las palabras según patrones de coocurrencia, han sido centrales en este giro computacional. Su eficacia técnica es innegable, pero su operación y legitimidad conceptual exigen ser interrogadas desde coordenadas filosóficas.
En un trabajo anterior propuse una crítica de estas arquitecturas desde la hermenéutica de Hans-Georg Gadamer, subrayando la tensión estructural entre el modelo estadístico del sentido y la comprensión como acontecimiento histórico, dialógico y situado. El presente ensayo retoma y extiende aquella línea argumental incorporando dos perspectivas adicionales: la crítica del lenguaje ordinario formulada por Ludwig Wittgenstein y la filología genealógica desarrollada por Friedrich Nietzsche. Ambas permiten desestabilizar los supuestos epistémicos y ontológicos que subyacen al uso de embeddings como forma de comprensión lingüística.
II. Wittgenstein: el significado como uso y la irreductibilidad de las formas de vida
Wittgenstein, en sus Investigaciones Filosóficas, rompe con la concepción referencial del significado para proponer una teoría pragmática:
El significado de una palabra está determinado por su uso en un determinado “juego de lenguaje”, el cual se inscribe a su vez en una forma de vida concreta (Lebensform). Comprender un enunciado implica participar competentemente en dicho juego, lo que presupone no solo competencia lingüística, sino incorporación en un entramado histórico, corporal y social.
Desde una lectura superficial, los embeddings podrían parecer wittgensteinianos: modelan contextos de aparición y generan proximidades semánticas basadas en el uso. Sin embargo, esta analogía es engañosa. La operación de los modelos distribucionales abstrae el uso del lenguaje de sus condiciones materiales y existenciales. En ellos no hay gestos, cuerpos, intenciones ni instituciones: sólo regularidades estadísticas.
En términos wittgensteinianos, los embeddings no participan en los juegos de lenguaje, sino que simulan ciertos movimientos de dichos juegos sin habitar sus condiciones normativas. El modelo puede asociar “rey” con “reina” por similitud de contexto, pero no comprende la función sociopolítica de esos términos, ni puede intervenir en prácticas significativas que los actualicen.
Además, aunque la noción de parecido de familia (Familienähnlichkeit) parecería compatible con las operaciones vectoriales, dicha semejanza, para Wittgenstein, está cargada de normatividad contextual: no toda similitud es relevante, y no toda proximidad es significativa. El modelo no distingue entre analogías culturalmente válidas y coincidencias espurias, lo que debilita cualquier pretensión de inteligibilidad auténtica.
III. Reglas, normatividad y significado
Otro aspecto central de la crítica wittgensteiniana es la relación entre significado y reglas. Comprender una expresión no es reducirla a una fórmula, sino saber seguir una regla en el marco de una práctica socialmente compartida. Esta regla no es un algoritmo, sino una forma de comportamiento reconocida y validada intersubjetivamente. Por eso, para Wittgenstein, las reglas solo tienen sentido dentro de una comunidad que las sostiene y transmite.
Los embeddings operan bajo un paradigma distinto. Reducen las reglas a regularidades de coocurrencia. Así, por ejemplo, para un modelo estadístico, la expresión “lo siento” está asociada a contextos negativos. Pero esta asociación no implica comprensión del acto de disculparse ni de las condiciones pragmáticas que hacen que tal expresión sea significativa o inválida.
En este sentido, los embeddings carecen de normatividad en el sentido fuerte del término. No participan de una comunidad lingüística, no aprenden mediante corrección ni conflicto, no internalizan convenciones. El sentido que generan es posicional, no interactivo; estadístico, no intersubjetivo.
IV. Nietzsche como filólogo: verdad, estilo e interpretación
Antes que filósofo sistemático, Nietzsche fue un lector atento de los textos clásicos. Su formación filológica lo condujo a una concepción del lenguaje como campo de luchas, desplazamientos y sedimentaciones. En Sobre verdad y mentira en sentido extramoral, afirma que las verdades son metáforas gastadas, conceptos que han perdido su poder originario de invención. Las palabras son, así, cristalizaciones de relaciones de poder, mecanismos de simplificación, ficciones útiles.
La interpretación, en Nietzsche, no es una actividad secundaria, sino el modo primario de constitución del mundo.
“No hay hechos, solo interpretaciones”, escribe en sus Fragmentos Póstumos.
Esta afirmación desestabiliza toda pretensión de neutralidad semántica. Cada palabra es un vestigio, una máscara, una inscripción política.
La lectura filológica nietzscheana no busca estabilizar sentidos, sino descomponerlos: genealogizar, rastrear los desplazamientos, interrogar los silencios. Frente a toda consolidación conceptual, la filología actúa como disolvente.
V. Crítica genealógica de los embeddings
Desde esta perspectiva, los embeddings pueden leerse como artefactos culturales: productos técnicos que condensan una tradición textual determinada. Son, en efecto, dispositivos de sedimentación semántica. Pero esta sedimentación no es neutral. Al operar como promedios semánticos, los embeddings tienden a consolidar usos dominantes, invisibilizando la historicidad del lenguaje y borrando la conflictividad de sus significaciones.
Donde la crítica filológica introduce distancia, el modelo estadístico introduce repetición. Donde Nietzsche desestabiliza los conceptos, los embeddings estabilizan correlaciones. Así, se corre el riesgo de convertir herramientas técnicas en instancias normativas del sentido, reproduciendo estructuras semánticas sin hacer explícita su genealogía.
El problema no es técnico, sino epistémico: la delegación de la interpretación a modelos que operan sin conciencia crítica de sus condiciones de producción. En lugar de ser instrumentos de análisis textual, los embeddings corren el riesgo de reemplazarlo. La pregunta nietzscheana entonces se vuelve urgente:
¿Qué nos dice sobre nuestra cultura el hecho de que prefiramos un modelo predictivo a un lector atento?
VI. Conclusión: comprensión, sentido y crítica entre juego y genealogía
Las perspectivas de Wittgenstein y Nietzsche, aunque divergentes en método y estilo, coinciden en una sospecha común: el lenguaje no puede ser reducido a una estructura formal sin perder su espesor vital. Para el primero, el sentido se genera en el uso normado, dentro de formas de vida compartidas. Para el segundo, toda palabra es resultado de una lucha histórica, un síntoma que debe ser interpretado antes que clasificado.
Los embeddings, al operar como modelos estadísticos de coocurrencia, simulan inteligibilidad sin compartir ni los horizontes pragmáticos del lenguaje ordinario ni las tensiones genealógicas del concepto. Ejecutan operaciones sin cuerpo, sin conflicto, sin comunidad. Y al hacerlo, producen un tipo de sentido estabilizado que amenaza con volverse normativo.
Desde la filosofía del lenguaje, esto plantea un problema de descontextualización pragmática. Desde la crítica genealógica, un problema de deshistorización política. En ambos casos, lo que se desplaza es la dimensión interpretativa del lenguaje: su condición de acontecimiento situado, su apertura a la disidencia, su resistencia a la clausura.
Pensar con Wittgenstein y Nietzsche no implica oponer técnica y humanidad, sino reintroducir la pregunta por el sentido allí donde se ha naturalizado la eficiencia. La crítica no exige rechazar la tecnología, sino desactivar su pretensión de neutralidad. Interpretar, en este marco, es seguir pensando el lenguaje no como dato, sino como posibilidad: abierta, situada y, sobre todo, irreductible.
VII. Epílogo: preguntas para una crítica genealógica y pragmática del lenguaje técnico
Este ensayo no pretende cerrar el debate, sino intensificarlo. En lugar de respuestas inmediatas, propone habitar interrogantes que nacen del cruce entre tradiciones filosóficas fundamentales y tecnologías emergentes. Las siguientes preguntas no buscan resolución, sino continuidad: sostener la inquietud, abrir espacio para una crítica más lenta, más profunda y más situada.
- ¿Puede un sistema computacional “seguir una regla” sin haber sido iniciado en una práctica social compartida?
- ¿Qué ocurre con la historicidad del sentido cuando este es modelado como una función de la coocurrencia estadística?
- ¿Qué se pierde del lenguaje cuando la regla es reemplazada por frecuencia y la forma de vida por corpus?
- ¿Cómo distinguir entre similitudes significativas y semejanzas estadísticas cuando no hay criterios normativos internos?
- ¿Qué implica interpretar sin cuerpo, sin horizonte, sin posibilidad de desvío o malentendido?
- ¿Es posible conservar la pluralidad del sentido cuando toda ambigüedad tiende a ser disuelta en una proximidad vectorial?
- ¿Qué relación hay entre el entrenamiento masivo de modelos y la repetición acrítica de estructuras simbólicas heredadas?
- ¿Qué sucede con la noción de “uso” cuando no hay usuario, sino una máquina que estima contextos sin participar en ellos?
Estas preguntas no reclaman respuestas definitivas. Exigen ser habitadas críticamente, como parte de una reflexión mayor sobre lo que entendemos por lenguaje, por comprensión y por humanidad en un presente cada vez más mediado por dispositivos que simulan sentido sin vivirlo.
Gracias por leer: La crítica filosófica de los embeddings
Fernando Vega Riveros.