Volver al Inicio

Machine Learning, Óptica e IA

¿Y si el problema no fuera la IA, sino los incentivos que gobiernan la ciencia?

El ascenso de los “papers fantasma”, los riesgos de integridad científica y el papel de SCImago IRIS

Última Edición • 14 de junio de 2026

Hay una pregunta que la comunidad científica lleva años evitando.

Mientras todos discuten qué tan rápido un modelo de lenguaje puede escribir un artículo académico, casi nadie se atreve a preguntar lo otro: ¿el verdadero problema es la inteligencia artificial, o son los incentivos que desde hace décadas gobiernan la producción científica?

El origen del dilema: ¿vocación científica o negocio editorial?

La presión por publicar no es nueva. Es vieja, y tiene nombre: publish or perish, “publicar o perecer”.

Nadie se pone de acuerdo sobre quién la dijo primero. Algunos la rastrean hasta el geógrafo William Morris Davis, a finales de los años 1920. Otros la encuentran en un libro no académico de Coolidge y Lord, en 1932. La referencia más citada en el ámbito universitario es la del sociólogo Logan Wilson, quien en 1942 la describió como un “pragmatismo dominante impuesto al grupo académico” (Wilson, 1942, citado en Garfield, 1996). Bajo la presidencia de James B. Conant en Harvard, entre 1933 y 1953, la frase dejó de ser una observación y se convirtió en política institucional: quien no publicaba, perdía su puesto.

Aquí viene lo irónico. La frase nació con un sentido casi opuesto al que tiene hoy. En su origen, “publicar o perecer” era un llamado positivo: si no comunicas tus hallazgos, el conocimiento se pierde con ellos. Tenía nobleza. Con el tiempo, mutó en una métrica de supervivencia laboral, vaciada de cualquier relación con el valor real de lo que se publica.

Hoy, investigadores, grupos e instituciones enteras son evaluados por cuántos papers producen, cuántos indicadores acumulan, cuánto mejoran una métrica. Y de esos números, no de la ciencia en sí, dependen la financiación, los ascensos, los reconocimientos, incluso la estabilidad laboral.

Pero la historia tiene memoria, y la memoria es incómoda para este sistema.

El año más célebre de Albert Einstein, 1905, su annus mirabilis, se redujo a apenas cuatro o cinco artículos en Annalen der Physik: el efecto fotoeléctrico, el movimiento browniano, la relatividad especial, la equivalencia masa-energía (Einstein, 1905a, 1905b, 1905c, 1905d). Cualquiera de esos cuatro papers, solo, habría bastado para construir una carrera entera. Y gran parte del legado de George Boole descansa sobre dos obras: The Mathematical Analysis of Logic (1847) y An Investigation of the Laws of Thought (1854), los cimientos conceptuales de toda la computación moderna (Stanford Encyclopedia of Philosophy, 2010).

Esto no significa que Einstein o Boole tuvieran carreras pequeñas. Significa algo más allá de los papers: la trascendencia de una contribución científica no se mide en volumen. Boole nunca volvió a publicar sobre lógica después de 1854. Y fue justo esa obra la que lo hizo inmortal.

Con el pasar de los años, en las últimas décadas hemos construido sistemas que premian exactamente lo contrario: el volumen. Y cuando el volumen se vuelve el objetivo, aparecen, siempre aparecen, los mecanismos para inflarlo.

En esta ecuación, casi siempre se olvida a un actor decisivo: la industria global de la publicación científica.

Las universidades necesitan publicaciones para mejorar sus indicadores. Los investigadores las necesitan para avanzar en sus carreras. Los rankings las usan para comparar instituciones. Las agencias financiadoras las usan para justificar inversiones. Y las editoriales reciben, sin pausa, un flujo constante de manuscritos que alimenta un negocio global de suscripciones, cargos por procesamiento de artículos (APC), métricas de impacto e indexación.

Esto no es acusar a las editoriales de causar los problemas de integridad científica. Muchas han invertido fortunas en blindar su revisión por pares y su detección de fraude. Pero hay algo imposible de ignorar: prácticamente todos los actores del sistema ganan cuando aumenta el número de publicaciones.

La paradoja, entonces, queda al descubierto: las mismas publicaciones que deberían medir la calidad de la ciencia son, simultáneamente, la materia prima de una industria multimillonaria.

¿Es entonces “publicar o perecer” una exigencia retórica que alimenta el ego científico, esa necesidad de validación, de visibilidad, de trascender, o se ha convertido, sin que casi nadie lo admita, en el combustible de un modelo de negocio editorial y educativo que necesita ese volumen para sobrevivir?

Por eso la discusión sobre integridad científica no puede reducirse a si un artículo se escribió con ayuda de IA. La pregunta de fondo es otra, y es incómoda:

¿Los sistemas de evaluación están incentivando la generación de conocimiento, o simplemente la producción de artículos?

La IA generativa no creó esta tensión. Lo que hizo fue exponerla, sin piedad y con una claridad que ya no se puede ignorar.

La magnitud del fenómeno

Los números empiezan a hablar, y dicen cosas duras.

Un estudio con técnicas de machine learning analizó 2.6 millones de artículos de investigación oncológica. El hallazgo: alrededor del 10% mostraba características compatibles con publicaciones de fábricas de papers. Más de 170.000 de esos artículos estaban afiliados a instituciones chinas. Y la tendencia no es estable: creció de forma sostenida entre 1999 y 2024, incluso dentro del 10% de revistas con mayor impacto del mundo (Richardson et al., 2025).

El fenómeno no se queda en una sola disciplina. Otros análisis sobre retracciones científicas globales documentaron, solo entre 2024 y 2025, más de 6.400 artículos retirados por revisión por pares fraudulenta, cerca de 2.300 vinculados a fábricas de papers, y más de 2.100 retracciones donde las notas editoriales señalaban explícitamente contenido generado por inteligencia artificial o patrones propios de modelos de lenguaje (Análisis de tendencias globales en retracciones, 2025).

Entre las señales más perturbadoras están las llamadas tortured phrases, o “frases torturadas”: sustituciones automáticas de términos científicos estándar por expresiones extrañas, generadas para esquivar los sistemas antiplagio. “Inteligencia artificial” se convierte en “destreza artificial” o “consciencia artificial”. “Cáncer de mama” se transforma en “cáncer de seno”. El resultado es un texto técnicamente legible, pero ajeno, casi traducido a la fuerza, porque literalmente lo fue: un algoritmo cambió palabra por palabra para que ningún sistema detectara coincidencias textuales, aunque el contenido fuera copiado o inventado. Hoy es una de las huellas más usadas para detectar manuscritos generados o manipulados con IA.

La inteligencia artificial no inventó las debilidades del sistema científico. Las hizo imposibles de seguir ignorando. Y fue precisamente ese diagnóstico, el de un sistema que premia el volumen y deja huecos cada vez más visibles, el que abrió espacio para que apareciera SCImago IRIS: no como un árbitro de prestigio, sino como un árbitro de riesgo.

SCImago IRIS: el árbitro que no juzga prestigio, sino riesgo

A diferencia de los rankings universitarios de siempre, IRIS no mide prestigio. No mide excelencia. No le interesa decidir qué universidad es “mejor” que otra. Su propósito es distinto, y más incómodo: detectar señales estadísticas de posibles riesgos de integridad científica dentro de las instituciones (SCImago Lab, s.f.).

IRIS no es un tribunal. No condena, no acusa, no etiqueta a nadie de “bueno” o “malo”. Es un sistema de alerta temprana, una linterna, no un martillo.

Analiza nueve dimensiones específicas, confirmadas directamente en la metodología de la plataforma (SCImago Lab, s.f.):

  1. Multi-affiliation (afiliaciones múltiples): cuántos autores declaran pertenecer a varias instituciones a la vez.
  2. Retracted Output (producción retractada): proporción de artículos retirados por la revista.
  3. Self-Citation (autocitación institucional): cuánto se cita una institución a sí misma.
  4. Discontinued Journals Output (producción en revistas discontinuadas): cuánto del total publicado salió en revistas luego removidas de Scopus.
  5. Hyperauthored Output (producción hiperautorada): artículos con un número inusualmente alto de coautores.
  6. Leadership Impact Gap (brecha de liderazgo en el impacto): diferencia entre el impacto general de la institución y el impacto de los artículos donde realmente lideró la investigación.
  7. Hyperprolific Authors (autores hiperprolíficos): proporción de la producción que proviene de autores con un volumen de publicación extremadamente alto.
  8. Institutional Journal Output (producción en revistas propias): cuánto publican los investigadores de una institución en revistas editadas por ella misma.
  9. Redundant Output (producción redundante o salami slicing): fragmentación de un solo estudio en varios artículos mínimos.

Que existan estos nueve indicadores ya dice mucho. Dice que el ecosistema científico global sabe, desde hace tiempo, que algo no estaba bien.

La presencia de publicaciones retractadas no prueba mala fe institucional. Pero es una señal que pesa: las retractaciones son el mecanismo más visible de autocorrección de la ciencia cuando hay errores graves, manipulación de datos o irregularidades editoriales.

Algo parecido pasa con la producción en revistas que después fueron retiradas de Scopus. Haber estado indexada ayer no garantiza nada hoy. Scopus ha intensificado su vigilancia: solo en 2025 discontinuó 56 revistas, y entre abril y mayo de 2026 retiró 25 más, incluyendo títulos de sellos tan reconocidos como Elsevier, SAGE y Taylor & Francis (Elsevier, 2026). Cuando una institución concentra buena parte de su producción en ese tipo de revistas, la pregunta se vuelve inevitable: ¿qué estrategia de publicación está siguiendo realmente?

Las afiliaciones múltiples también se vigilan. A veces son colaboraciones legítimas. Otras veces se usan, sin más, para inflar indicadores institucionales. Lo mismo con la hiperautoría y los autores hiperprolíficos: la ciencia moderna es colaborativa, y hay campos donde artículos con cientos de firmantes son perfectamente legítimos. Pero cuando un patrón se sale demasiado de lo esperado para el contexto nacional, la pregunta vuelve a aparecer: ¿colaboración genuina, o maquinaria para maximizar bibliometría?

La autocitación, por sí sola, tampoco es un pecado: citar el propio trabajo previo es natural en cualquier comunidad científica. Pero cuando se dispara muy por encima de instituciones comparables, puede estar inflando artificialmente el impacto. Algo similar ocurre con publicar en revistas propias: depender demasiado de ellas puede limitar la evaluación externa y generar conflictos de interés.

Y finalmente está el salami slicing: tomar un estudio que cabría en un solo artículo coherente y partirlo en varios mínimos, solo para multiplicar el conteo de publicaciones. No siempre es fraude. Pero distorsiona la literatura, sobrecarga la revisión por pares e infla artificialmente la percepción de productividad de quien lo hace.

El indicador que más importa: Leadership Impact Gap

De los nueve, hay uno que merece un párrafo aparte: el Leadership Impact Gap.

¿Por qué? Porque mide algo que ningún ranking tradicional se atreve a preguntar: ¿esta institución es capaz de generar y liderar investigación propia, o solo aparece en los créditos de la investigación de otros?

Quien nunca ha hecho ciencia ve un paper como el producto final. Quien sí la ha hecho sabe que el artículo es apenas la punta visible de un iceberg gigantesco. Antes de que exista una publicación hay años de formular proyectos, conseguir financiación, levantar infraestructura, comprar equipos, formar magísteres y doctores, trabajar en campo o en laboratorio, procesar datos, y sostener toda una estructura institucional detrás.

Un paper no nace cuando alguien escribe un manuscrito. Nace cuando una institución construye, durante años, las condiciones para que ese conocimiento exista.

Por eso no es lo mismo ser uno de veinte coautores en un paper internacional que haber concebido, financiado y liderado la investigación que lo originó. No es lo mismo aparecer en la mitad de una lista de autores que cargar con la responsabilidad científica del proyecto entero. No es lo mismo que una institución ponga laboratorios, financiación, personal técnico y años de trabajo de campo, a que un investigador participe de forma marginal en una colaboración liderada desde otra parte del mundo y termine apareciendo como coautor.

Participar es valioso. Liderar es otra cosa completamente distinta.

La colaboración internacional es esencial para que la ciencia avance, nadie está diciendo lo contrario. Pero desde la perspectiva de las capacidades reales de una institución, hay un abismo entre participar y liderar. Eso es exactamente lo que el Leadership Impact Gap intenta capturar: compara el impacto de toda la producción asociada a una institución con el impacto específico de los artículos donde esa institución realmente lideró, identificado casi siempre a través del autor de correspondencia.

La pregunta que queda flotando es incómoda y necesaria: ¿esta institución está generando conocimiento propio, o solo está pidiendo prestada la visibilidad de investigaciones lideradas por otros?

Esta misma pregunta es la que conecta con la métrica que permite comparar a todas las instituciones entre sí de forma justa: el Z-score.

Por qué el Z-score siempre es nacional, nunca global

Para que estas comparaciones sean justas, SCImago IRIS hace algo clave: cada uno de los nueve indicadores se expresa como un Z-score, calculado siempre contra el promedio de las instituciones del mismo país, no contra el mundo entero.

Eso significa que una universidad colombiana no se compara con Stanford, Oxford o el MIT. Se compara con otras universidades colombianas. Una mexicana, con otras mexicanas. Una india, con otras indias. La razón es simple y justa: los sistemas científicos del mundo operan bajo condiciones radicalmente distintas de financiación, infraestructura e internacionalización. Medir a todos contra el mismo techo global castigaría injustamente a quienes parten de pisos distintos.

¿Cómo se lee, en términos simples? Imagina una fila de universidades del mismo país, ordenadas por su nivel de autocitación. El Z-score solo marca dónde se ubica cada una respecto al centro de esa fila:

Una referencia rápida: un Z cercano a ±1 es una diferencia moderada. Uno que se acerca a ±2 ya es una diferencia que llama la atención frente al resto del país.

El Z-score no busca decir quién es “el mejor del mundo”. Busca algo más útil: ¿esta institución se parece al resto de las de su país, o se aparta de forma que merece una mirada más atenta?

Más allá del puesto: el diagnóstico completo de una institución

Quizás el aporte más interesante de SCImago IRIS sea su radar de indicadores. Mientras los rankings tradicionales aplastan a una institución en una sola posición, un número, un puesto, fin de la historia, el radar permite ver, al mismo tiempo, sus fortalezas y sus grietas.

Una universidad puede tener un liderazgo científico sólido y, al mismo tiempo, una señal de alerta en autocitación o en producción redundante. Otra puede mostrar una intensa colaboración internacional, pero una dependencia preocupante de investigaciones lideradas desde afuera. Una tercera puede destacar en casi todos los indicadores y, sin embargo, tener una porción importante de su producción en revistas que después fueron retiradas de Scopus. Stanford, por ejemplo, muestra un indicador de retracciones muy por debajo del promedio nacional, reflejo de controles de calidad sólidos, aunque incluso ahí aparecen señales puntuales de mayor riesgo en producción redundante (SCImago Lab, s.f.).

Más que una clasificación, el radar es un diagnóstico.

Y quizás el verdadero valor de SCImago IRIS no sea señalar instituciones con riesgo. Quizás sea forzarnos a hacer preguntas que llevábamos años evitando. Porque una institución puede publicar miles de artículos al año y, aun así, depender por completo de investigaciones lideradas por otros. Y otra puede publicar mucho menos, pero construir laboratorios, formar doctores, desarrollar tecnología propia y liderar agendas científicas que nacen de su propio territorio. Son dos modelos de desarrollo científico completamente distintos. Y ninguno de los dos se ve si solo contamos publicaciones.

Guía práctica: cómo protegerse antes de publicar o citar

Toda esta discusión deja de ser abstracta cuando se vuelve personal: ¿cómo verifica un investigador, hoy mismo, si una revista es confiable?

1. Verificación básica (5 minutos):

2. Señales de revista predatoria:

Correo no solicitado y cargado de elogios. Promesa de revisión por pares en 24 a 72 horas. Nombre que imita, casi calca, a una revista prestigiosa. Comité editorial sin afiliación verificable en Google Scholar. Cobros que aparecen, como por sorpresa, justo después de la aceptación.

3. Cómo anticipar una descontinuación (lo menos conocido, y lo más útil):

Un dato que pocos conocen: una revista discontinuada no puede volver a aplicar a Scopus durante 5 años. Lo publicado antes del corte queda como registro histórico, intacto. Lo publicado después, simplemente, deja de existir para Scopus.

El Content Selection and Advisory Board (CSAB) de Scopus usa benchmarks anuales de autocitación comparados entre pares del mismo campo, además de una herramienta automatizada, llamada “Radar” y distinta del radar visual de IRIS, que detecta anomalías de coautoría y citación cruzada coordinada. La magnitud es real, no anecdótica: 56 revistas discontinuadas en 2025, y 25 más solo entre abril y mayo de 2026, incluyendo sellos tan grandes como Elsevier, SAGE y Taylor & Francis (Elsevier, 2026). La indexación nunca es una garantía permanente, ni siquiera para las editoriales más grandes del planeta.

Las señales tempranas que conviene vigilar son pocas y claras: un cambio brusco de alcance hacia “multidisciplinario” sin explicación, invitaciones masivas y no solicitadas a publicar, y una aceleración sospechosa de artículos fuera del área que la revista dice cubrir. Cuando un título de una editorial cae, conviene revisar de inmediato los demás títulos de esa misma casa, porque las remociones casi siempre vienen en grupo.

La ciencia no existe para producir papers

La IA puede escribir un texto en segundos, pero no puede construir un laboratorio, ni formar un doctor, ni liderar un proyecto durante años. No puede crear infraestructura científica, ni consolidar un grupo de investigación, ni construir una agenda científica que responda a las necesidades reales de una región o un país.

Los papers existen para comunicar la ciencia, no al revés. Y cuando publicar se convierte en el objetivo, en lugar de ser la consecuencia natural de investigar, aparecen distorsiones que ninguna tecnología, sin importar cuán avanzada sea, podrá resolver por sí sola.

Quizás, después de todo esto, la pregunta más importante ya no sea cuántos artículos publica una institución. Quizás la pregunta correcta sea, simplemente, qué tan capaz es de generar el conocimiento que les da origen.


¿Creen que las universidades, y los sistemas nacionales de ciencia, deberían rediseñar ya sus modelos de incentivos basados en cantidad de publicaciones? ¿O el verdadero problema es quién certifica la “calidad” en la era de la IA generativa?

Referencias (APA 7.ª edición)

Análisis de tendencias globales en retracciones explorado a través de un enfoque temático. (2025). arXiv.

Biblioteca del Congreso de los Estados Unidos. (s.f.). Introduction: Annus Mirabilis of Albert Einstein. Library of Congress Research Guides. https://guides.loc.gov/einstein-annus-mirabilis

Einstein, A. (1905a). Über einen die Erzeugung und Verwandlung des Lichtes betreffenden Gesichtspunkt [Sobre un punto de vista heurístico referente a la producción y transformación de la luz]. Annalen der Physik, 17, 132-148.

Einstein, A. (1905b). Über die von der molekularkinetischen Theorie der Wärme geforderte Bewegung von in ruhenden Flüssigkeiten suspendierten Teilchen [Sobre el movimiento de partículas pequeñas suspendidas en líquidos en reposo]. Annalen der Physik, 17, 549-560.

Einstein, A. (1905c). Zur Elektrodynamik bewegter Körper [Sobre la electrodinámica de los cuerpos en movimiento]. Annalen der Physik, 17, 891-921.

Einstein, A. (1905d). Ist die Trägheit eines Körpers von seinem Energieinhalt abhängig? [¿Depende la inercia de un cuerpo de su contenido energético?]. Annalen der Physik, 18, 639-641.

Elsevier. (2026). Scopus content policy and selection: Discontinued titles. Scopus. https://www.elsevier.com/products/scopus

Garfield, E. (1996). What is the primordial reference for the phrase “publish or perish”? The Scientist, 10(12), 11.

Richardson, R., et al. (2025). Machine learning based screening of potential paper mill publications in cancer research. BMJ Open / PMC.

SCImago Lab. (s.f.). SCImago IRIS: Integrity Risk Indicators [Portal]. https://www.scimagoiris.com/

Stanford Encyclopedia of Philosophy. (2010). George Boole (edición de invierno de 2010). https://plato.stanford.edu/archives/win2010/entries/boole/

Wilson, L. (1942). The academic man: A study in the sociology of a profession. Oxford University Press.

Nota de citación de SCImago IRIS: SCImago. (s.f.). SCImago IRIS [Portal]. Recuperado de https://www.scimagoiris.com/

#IntegridadCientífica #SCImagoIRIS #PapersFantasma #PublishOrPerish #MachineLearning #InteligenciaArtificial #RevistasPredatorias #TorturedPhrases #LeadershipImpactGap #CienciaAbierta #InvestigaciónAplicada #EscrituraCientífica

Claudia Milena Serpa Imbett, PhD
Investigadora en Óptica, Machine Learning, Agricultura Digital y Energía

¿Quieres ver todos los artículos?

Accede al blog completo con el histórico de todos los artículos publicados.

Ver Blog Completo

¿Te interesa la Agricultura Digital?

Obtén una certificación internacional en AgTech con Google Earth Engine, Machine Learning, Python y Excel, o aprende Machine Learning desde Excel a Python para despliegue de modelos científicos y análisis de datos avanzados

🎓 Conoce AgTech Program