LAS FORMAS DEL APRENDIZAJE A LA LUZ DE LAS REDES NEURONALES ARTIFICIALES

Carlos Hernández^[1]

Aprentell - España

Vicent Garcia^[2]

Universitat de València - España

Francesc J. Hernández^[3]

Universitat de València - España

Recibido: 24/10/2023
Aprobado: 18/12/2023

RESUMEN

Los datos de PISA ^[4]permiten avanzar en la premisa constructivista que afirma que el aprendizaje no es el epifenómeno de la enseñanza. Sin embargo, plantea el problema de una indagación “pura” del aprendizaje y sus formas al margen de las formas de enseñanza. En este artículo ofrecemos una indagación con Redes Neuronales Artificiales. La conclusión es el papel en el aprendizaje global del aprendizaje adhesivo o afectivo y la supresión de interferencias de aprendizaje, lo que está relacionado con los neurotransmisores serotonina y acetilcolina, respectivamente, y la función inversa del aprendizaje aversivo o defensivo, relacionado con la norepinefrina o noradrenalina.

Palabras clave: Aprendizaje, aprendizaje adhesivo, aprendizaje aversivo, redes neuronales artificiales, PISA

ABSTRACT

The PISA data allow us to advance the constructivist premise that learning is not the epiphenomenon of teaching. However, it raises the problem of a «pure» investigation of learning and its forms apart from the forms of teaching. In this article we offer an investigation with Artificial Neural Networks. The conclusion is the role in global learning of adhesive or affective learning and the suppression of learning interference, which is related to the neurotransmitters serotonin and acetylcholine, respectively, and the reverse function of aversive or defensive learning, related to norepinephrine or noradrenaline.

Keywords: Learning, adhesive learning, aversive learning, artificial neural networks, PISA, aversive learning.

1. Introducción

La didáctica es una disciplina que pretende, como enunció su creador J. A. Comenio, enseñar todo a todos. Se presentó como una ars, término latino que corresponde al griego tekné, y que traduciríamos como “técnica”, aunque en los desarrollos del siglo XIX y XX intentó conseguir el estatuto epistemológico de ciencia del proceso de enseñanza y aprendizaje. Sin embargo, la didáctica se enfrenta a la necesidad de repensar los procesos de aprendizaje después de que el constructivismo psicológico afirmara que el aprendizaje no puede considerarse un epifenómeno de la enseñanza (Dausien 2011). Los docentes programan sus enseñanzas y pueden medir los rendimientos de ellas, pero estos no circunscriben los aprendizajes de los individuos. Para el constructivismo, todo aprendizaje es un coaprendizaje (Holzkamp 1995), todo aprendizaje se realiza con los demás, pero no necesariamente con ese otro privilegiado que es el docente. Esto restringe la didáctica al papel de facilitadora o posibilitadora (Arnold y Schön 2021).

La situación de la disciplina didáctica en la cual ha de reconocer con humildad lo poco que sabemos de los procesos de aprendizaje se asemeja a lo que sucedió en la física a lo largo del siglo XVIII y XIX en los debates sobre la naturaleza de la luz: la división entre los que pensaban que era una onda (y que por lo tanto precisaba que una materia etérea, un éter atmosférico, llenara el espacio sideral) y aquellos otros que defendían que era un corpúsculo. El dilema sobre la naturaleza de la luz pudo desencallarse a partir de un ingenioso experimento. A mediados del siglo XIX, Gustav Kirchhoff propuso el experimento ideal de la radiación del cuerpo negro, es decir, la medida de la radiación emitida por un cuerpo que no refleja luz. Pudiera parecer una paradoja, pero no lo es. Recibimos la luz de los cuerpos que están a nuestro alrededor y que la reflejan. Pero ¿qué sucede con un “cuerpo negro” que absorbe toda la luz y sí emite radiación? En definitiva, se trataba de desenganchar la luz de los reflejos que forman los colores de los cuerpos que nos rodean.

De un modo análogo, podríamos suponer que se precisa algún tipo de experimento sobre qué sea un aprendizaje desenganchado de la enseñanza para aproximarnos a la naturaleza del aprendizaje mismo. En cierto sentido, los estudios antiguos sobre niños selváticos o los actuales del aprendizaje de los bebés (Schröder 2019) pretenden aproximarse a esa situación ideal del aprendizaje sin enseñanza. En este artículo expondremos dos aspectos: 1º) Una prueba a favor de la citada tesis constructivista antes mencionada, a saber, que el aprendizaje no es el epifenómeno de la enseñanza, que utiliza los datos de las pruebas PISA; 2º) Un, por así decirlo, experimento de “cuerpo negro” del aprendizaje, para el que utilizaremos las simulaciones de las redes neuronales, con la correspondiente explicación que lo relaciona con los tipos de aprendizaje. Esta simulación, como se verá, proporciona resultados notables en cuanto a la didáctica material, la que debe ocuparse de los procesos de enseñanza en los sistemas educativos. En cada una de estas dos partes formularemos por separado los objetivos, hipótesis y resultados de la investigación.

2. El disfrute de la lectura y el rendimiento de su enseñanza

2.1. Introducción

En textos de didáctica se aboga por realizar una enseñanza agradable o placentera. Incluso es frecuente que se hable de “gamificación”. La tradición de la schola ludus se remonta al mismo Comenio (1659). En estas propuestas didácticas subyace, naturalmente, la creencia de que si el aprendizaje reporta disfrute, la enseñanza debe orientarse a conseguirlo como medio de proporcionar enseñanza. La tesis de Comenio (que se refería en su época a la competencia lectora) y que ha sido repetida por infinidad de propuestas didácticas, supondría que encontraríamos correlaciones positivas notables entre los resultados de la medida de los rendimientos de la enseñanza y el placer o disfrute que experimentan los discentes por su aprendizaje. No hay duda que se pueden analizar infinidad estudios de prácticas escolares en las que una innovación se acompaña de una declaración de satisfacción, pero desde el punto de vista metodológico muchos de estos estudios adolecen de cuato críticas definitivas: ignoran el efecto que la innovación, por sí misma, produce en los destinatarios; carecen de grupo de control; miden la satisfacción en un tiempo inmediato y no a medio o largo plazo; se refieren a muestras reducidas y, generalmente, ni aleatorias ni representativas. Por ello, para llevar a estudio la suposición de Comenio debemos cambiar la escala de análisis, aportar muestras significativas y determinar con precisión rendimientos de la enseñanza y satisfacción del aprendizaje.

2.2. Hipótesis

A pesar de las críticas, las pruebas PISA son la mayor fuente de datos sobre rendimientos de la enseñanza y otras variables relacionadas con discentes y docentes de las que se puede disponer en la actualidad. PISA es el “Programa para la Evaluación Internacional de Alumnos” de la Organización para la Cooperación y el Desarrollo Económico (OCDE), que agrupa a los Estados con economías más ricas. Además de los países de la OCDE, participan otros adheridos al programa, que representan a 81 Estados y 8 territorios parciales o con autonomía política (como, por ejemplo, el área bajo el control de la Autoridad Palestina). Las pruebas se realizan cada tres años en el curso equivalente al de los estudiantes de 15 años (tengan esta edad u otra) y se examinan tres materias: ciencias (naturales), matemáticas y competencia lectora, aunque en cada edición se indaga más en una de estas materias. La edición de 2018 estuvo centrada en la competencia lectora (reading). Los cuestionarios también preguntaron por variables relacionadas con el disfrute (enjoyment) por la lectura, con preguntas como si se leía por disfrute o el tiempo que se le dedicaba a esta actividad.

Entonces, si se considera la suposición de Comenio, deberíamos encontrar, como hipótesis, correlaciones positivas notables entre los resultados generales de la competencia lectora y aquellas variables que miden el disfrute o el placer, lo que, como veremos, no es el caso.

2.3. Resultados

Los datos muestran lo contrario a la hipótesis. Los resultados generales de las dos variables (a saber, puntuación general de competencia lectora y porcentaje de estudiantado que declara que lee por placer) se recogen en la tabla 1.

Tabla 1. Puntuación general en competencia lectora (CL) y porcentage de estudiantes que leen por disfrute (ED)

Jurisdicción	CL	ED	Jurisdicción	CL	ED
Albania	405	88,6	Japón	504	54,6
Alemania	498	51,0	Jordania	419	74,6
Arabia Saudita	399	70,9	Katar	407	72,9
Argentina	402	53,1	Kazajstán	387	88,6
Australia	503	55,4	Kosovo	353	90,0
Austria	484	51,6	Letonia	479	66,3
Baku (Azerbaiyán )	389	68,2	Lituania	476	57,0
Bélgica	493	47,9	Luxemburgo	470	50,7
Bielorrusia	474	76,2	Macao (China)	525	80,9
Bosnia y Herzegovina	403	68,1	Malasia	415	84,2
Brasil	413	70,8	Malta	448	61,1
Brunei Darussalam	408	80,1	Marruecos	359	76,3
Beijing, Shanghai, Jiangsu y Zhejiang (China)	555	95,0	México	420	77,6
Bulgaria	420	71,9	Moldavia	424	79,9
Canadá	520	59,6	Montenegro	421	73,3
Chile	452	57,9	Noruega	499	49,7
Chipre	424	65,1	Nueva Zelanda	506	57,4
Colombia	412	70,5	Países Bajos	485	46,6
Corea	514	62,0	Panamá	377	68,3
Costa Rica	426	54,1	Perú	401	83,3
Croacia	479	59,6	Polonia	512	64,7
Dinamarca	501	53,1	Portugal	492	62,6
Emiratos Árabes Unidos	432	76,9	Reino Unido	504	51,3
Eslovenia	495	50,1	República Checa	490	55,5
Estados Unidos	505	56,4	República Dominicana	342	71,0
Estonia	523	61,4	República Eslovaca	458	59,8
Filipinas	340	89,7	Rumania	428	70,8
Finlandia	520	56,7	Rusia	479	79,8
Francia	493	54,8	Serbia	439	64,0
Georgia	380	83,1	Singapur	549	71,3
Grecia	457	76,9	Suecia	506	50,0
Hong Kong (China)	524	83,3	Suiza	484	48,9
Hungría	476	65,0	Tailandia	393	85,8
Indonesia	371	84,4	Taipei Chino	503	78,4
Irlanda	518	52,3	Turquía	466	75,9
Islandia	474	53,1	Ucrania	466	76,0
Israel	470	60,1	Uruguay	427	58,9
Italia	476	64,8	Vietnam	505	85,0

Fuente: OCDE PISA 2018.

Para relacionar las dos variables utilizaremos el índice de correlación de Pearson. Este estadístico oscila entre -1 y +1. Presenta valor 0 cuando entre dos variables no hay correlación y se incrementa con valores positivos cuando la correlación es directa y con negativos cuando la correlación es inversa.

La correlación de Pearson entre la puntuación general de competencia lectora y la variable “porcentaje de estudiantes que leen por disfrute” es R=-0,459, e incluso se eleva hasta R=-0,629 cuando prescindimos de las ciudades autónomas (como Hong Kong, Macao, etc.) y consideramos sólo Estados. Estos resultados se representan en el gráfico 1. En el eje X se ubica la puntuación general de competencia lectora y en el eje Y el porcentaje de estudiantado que lee por placer. Cada punto representa un país, donde se ha añadido la línea de tendencia recta y el coeficiente de determinidad (que es el cuadrado del coeficiente de Pearson, en este caso: R²=0,396).

Gráfico 1. Resultados en la prueba de competencia lectora y el porcentaje de estudiantes que lee por disfrute (PISA 2018)

Fuente: Elaboración propia a partir de la tabla 1.

Sin duda, este resultado hubiera sorprendido al propio Comenius porque hay una notable correlación negativa entre las dos variables.

PISA elabora también un índice de disfrute en las actividades de lectura, cuyo rango oscila entre -3 y +3. Es decir, elaboran un indicador compuesto donde consideran las variables relacionadas con el disfrute (por ejemplo, el tiempo de lectura), les asignan diversos pesos y las convierten en un índice compuesto que permite comparar unos países con otros y también unas materias con otras (es lo mismo que se hace, por ejemplo, con el índice de desarrollo humano). Este índice, como se podía suponer después del resultado anterior, correlaciona de forma notable y negativa con la puntuación general (con valores de R=-0,399). Hay que atribuir a la construcción del índice este aparente descenso en el valor de la correlación, que, sin embargo, sigue presentando un resultado importante, máxime cuando se considera una gran cantidad de países y el coeficiente de Pearson es muy sensible a pocos valores discrepantes.

En ediciones pasadas, PISA también elaboró índices equivalentes de disfrute en ciencias naturales (2006) o matemáticas (2012). En la tabla siguiente se recogen los valores de disfrute proporcionados por PISA. Se han eliminado aquellos países que no presentaban datos en alguna de las series. Recuérdese que lo que se presenta son unos índices relativos.

Tabla 2. Índice de satisfacción en ciencias (2006), matemáticas (2012) y competencia lectura (2018)

Jurisdicción	Ciencias (naturales) 2006	Matemáticas 2012	Competencia lectora 2018
Alemania	0,19	-0,11	-0,29
Argentina	0,22	0,18	0,02
Australia	-0,22	0,11	-0,13
Austria	0,05	-0,35	-0,28
Bélgica	0,02	-0,24	-0,44
Brasil	0,51	0,44	0,37
Bulgaria	0,18	0,22	0,23
Canadá	0,11	0,05	0,01
Chile	0,36	0,28	0,04
Colombia	1,15	0,59	0,38
Corea	-0,24	-0,20	0,23
Croacia	0,17	-0,26	-0,28
Dinamarca	-0,17	0,35	-0,37
Eslovenia	0,03	-0,24	-0,22
España	-0,18	-0,14	0,08
Estados Unidos	0,03	0,08	-0,07
Estonia	0,19	-0,01	0,00
Finlandia	-0,25	-0,22	-0,25
Francia	0,20	-0,02	-0,12
Grecia	0,19	0,21	0,11
Hong Kong (China)	0,19	0,30	0,29
Hungría	-0,07	-0,18	0,03
Indonesia	0,56	0,80	0,50
Irlanda	-0,14	0,06	-0,07
Islandia	-0,15	0,15	-0,22
Israel	-0,21	0,16	0,09
Italia	0,18	0,01	0,09
Japón	-0,13	-0,23	0,30
Jordania	0,68	0,81	0,47
Katar	0,28	0,61	0,27
Letonia	0,16	-0,05	0,02
Lituania	0,35	0,09	-0,11
Luxemburgo	0,14	-0,16	-0,24
Macao (China)	0,10	0,15	0,26
México	0,76	0,67	0,35
Montenegro	0,42	-0,01	0,15
Noruega	-0,03	-0,15	-0,51
Nueva Zelanda	-0,10	0,11	-0,08
Países Bajos	-0,35	-0,33	-0,57
Polonia	0,06	-0,16	0,18
Portugal	0,16	0,12	0,08
Reino Unido	-0,01	0,19	-0,21
República Checa	-0,04	-0,16	-0,05
República Eslovaca	-0,11	-0,19	0,11
Rumania	0,38	0,49	0,10
Rusia	0,28	0,29	0,33
Suecia	-0,13	0,12	-0,31
Suiza	0,00	-0,02	-0,32
Tailandia	0,79	0,77	0,27
Taipei Chino	0,09	0,07	0,34
Turquía	0,22	0,44	0,68
Uruguay	0,25	0,27	0,24

Fuente: OCDE PISA 2016, 2012, 2018.

Estos tres índices presentan entre ellos elevadas y positivas correlaciones, como muestra la tabla 3, donde se presenta la matriz de correlaciones de Pearson (lógicamente, simétrica respecto a la diagonal, porque la correlación de dos variables siempre presenta el mismo valor, con independencia de cuál de ellas consideremos primero).

Tabla 3. Matriz de correlaciones entre los índices de disfrute en ediciones de PISA

	Ciencias (naturales) (PISA, 2006 )	Matemáticas (PISA, 2012 )	Competencia lectora (PISA, 2018 )
Ciencias (naturales) (PISA, 2006 )	1	0,715	0,559
Matemáticas (PISA, 2012 )	0,715	1	0,625
Competencia lectora (PISA, 2018 )	0,559	0,625	1

Fuente: Elaboración propia OCDE PISA 2006, 2012, 2018.

Si seguimos con nuestro símil de la historia de la física, podríamos decir que los resultados anteriores son como el experimento de Michelson y Morley, que pretendían demostrar que la luz tenía una velocidad diferente según las diversas orientaciones del movimiento de la Tierra, por el efecto de arrastre del supuesto «éter atmosférico», pero encontraron el resultado contrario a lo esperado: la luz presentaba la misma velocidad en todas las direcciones. Es decir, aquel experimento se hizo con una hipótesis que los datos refutaron, y ello llevó a revisar la teoría y, en definitiva, auspició la teoría de la relatividad de Einstein. También en nuestro caso, la asociación de Comenius entre el rendimiento de la enseñanza y el disfrute no parece acorde con los datos disponibles. Ahora bien, debemos ser cautos con las conclusiones: intuimos una cierta relación entre el aprendizaje y el disfrute, pero la primera parte de nuestro argumento únicamente permite «desengancharla» de los rendimientos de la enseñanza, lo que por otra parte es coherente con las premisas constructivistas. Se plantea así la pregunta central de este texto: ¿cómo podemos estudiar el aprendizaje «desenganchado» de los procesos de enseñanza? Es decir, ¿cómo podemos estudiar el aprendizaje por sí mismo? Con el símil de la historia de la física, es una pregunta equivalente a: ¿cómo estudiar la luz sin considerar los reflejos? Lo que se resolvió con el experimento del cuerpo negro.

2.4. Comentario a los resultados

Como ampliación referida a la historia de la filosofía, ofrecemos un comentario a los resultados. Podríamos ilustrar la cuestión anterior con otra referencia, en este caso de la historia de la filosofía, porque justamente el uso del concepto “puro” en la “Crítica de la razón pura” de Immanuel Kant, tanto la teórica como la práctica, tiene ese mismo sentido. Para Kant, la metodología trascendental significa precisamente que la razón investigue el conocimiento del ser humano, que realiza precisamente la razón, pero de una manera pura, es decir, “sin” lo que aporta al conocimiento la experiencia, lo que exige, como dijo el filósofo de Königsberg, un sujeto trascendental (Adorno 2015), es decir, analizar un sujeto que, por así decir, a priori de la experiencia. La Inteligencia Artificial proporciona herramientas innovadoras para la construcción de tales sujetos trascendentales, como mostraremos a continuación.

3. Experimento de simulación de aprendizaje con Redes Neuronales Artificiales

3.1. Introducción

La Inteligencia Artificial nos permite disponer de un “cuerpo negro” (si utilizamos el símil de la física) o de un “sujeto trascendental” (si utilizamos el símil de la filosofía) del aprendizaje. Comenzaremos con un ejemplo sencillo y luego comentaremos nuestra aportación.

Consideremos el superordenador Deep Blue, que en febrero de 1996 derrotó al campeón de ajedrez Garry Kasparov. Deep Blue fue adiestrado, almacenando en su memoria miles de partidas. A finales de 2017, la compañía Deep Mind presentó su superordenador AlphaZero, capaz de vencer a otros supercomputadores en ajedrez y otros juegos. A diferencia de Deep Blue, AlphaZero no recibió archivos con partidas jugadas, sino que simplemente recibió las instrucciones básicas y los programadores le ordenaron que jugara consigo mismo. De este modo, aprendió sin, por así decir, una enseñanza anterior; aprendió por sí solo. A esto precisamente nos hemos referido anteriormente cuando nos referíamos a un aprendizaje “puro”, pero además en el que podamos controlar como variables los tipos de aprendizaje que desarrollan los seres humanos. Para este fin hemos utilizado un programa de Inteligencia Artificial, más concretamente de Redes Neuronales Artificiales (RNA).

Las RNA simulan las redes neuronales biológicas. De estas, se sabe bastante, porque la neurobiología ha estudiado sus configuraciones y el papel de los neurotransmisores en distintos tipos de aprendizajes. En las RNA estos neurotransmisores se simulan mediante procesos y cálculos que se pueden alterar mediante determinados parámetros. En una red dispuesta con un modelo simple, la combinatoria de estos parámetros nos indicará la composición de los distintos aprendizajes en un aprendizaje global, que podemos averiguar con un modelo simple de “actor crítico” (definido por Sutton en 1996, véase Sutton y Barto, 2015). Es, por tanto, un experimento “puro”, porque nuestro actor virtual no recibe ninguna enseñanza (salvo la orden de conseguir un objetivo), sino que, por así decirlo, aprende de sí mismo. Se trata, pues, de establecer la relación entre: neurotransmisores, tipos de aprendizaje y parámetros de RNA.

3.2. Neurotransmisores, tipos de aprendizaje y parámetros de RNA

En primer lugar, explicaremos brevemente la relación entre tres neurotransmisores y las formas de aprendizaje que tienen asociadas. Hemos de aclarar que tomamos la determinación de las formas de aprendizaje de la literatura neurobiológica, lo que significa que las determinaciones que se realizan no necesariamente han de ser precisas. Con todo, como explicaremos más adelante, nos interesa la presencia de esas formas en lo que hemos denominado aprendizaje global.

a) En el caso de la serotonina, los estudios experimentales (con ratas y humanos) y los modelos computacionales, ponen de manifiesto su relación con dinámicas de aprendizaje por adhesión. Así lo indican Luo et al. (2023: 3): “Los hallazgos apoyan el papel de la serotonina en la flexibilidad y la plasticidad del comportamiento, indicado, respectivamente, por aumentos o disminuciones de la repetición de la elección («adhesión») o las tasas de aprendizaje de refuerzo después de manipulaciones destinadas a aumentar o disminuir la función de la serotonina”. También Michely et al. (2020: 6), que han realizado investigaciones con modelos computacionales, llegan a una conclusión similar, que la serotonina está implicada en la “modulación de la dinámica de aprendizaje afectivo», lo que permite explicar «la evolución de una mejora gradual del estado de ánimo observada con estos agentes y proporciona un nuevo mecanismo candidato para el despliegue de los efectos antidepresivos de la serotonina a lo largo del tiempo”. Es decir, la serotonina parece estar implicada en un tipo de aprendizaje que denominaremos adhesivo o afectivo. Aunque evitaremos ejemplificar porque precisamente estamos buscando un experimento puro, podríamos pensar en la manera como aprendemos una canción que nos agrada.

b) En cuanto a la acetilcolina, la bibliografía científica ya registra su relación con el aprendizaje desde hace años. Podemos mencionar las investigaciones de Michael E. Hasselmo 1993 –criticado en Blockland 1995, que mantiene, sin embargo su papel en la atención– y 2006), que vinculó a este neurotransmisor con el aprendizaje asociativo y tiene un papel destacado en la supresión de interferencias que producen nuevos patrones en el aprendizaje precedente “fijando así la actividad a los patrones que deben aprenderse”: “Aquí propongo –escribe Hasselmo– que los efectos de la acetilcolina en las estructuras corticales pueden proporcionar un mecanismo neuropsicológico para este cierre [campling]” (1993: abstract; véase Neurobiology 2003). Este campling o cierre no debe confundir con el denominado cierre categorial en la teoría de sistemas (por ejemplo, en Luhmann) y debe relacionarse más bien con la noción clásica de disonancia cognitiva, formulada por Leon Festinger en 1957. Tiene que ver con la reducción de tensión que se experimenta cuando se resuelve un problema. Hay una larga tradición de didácticas problémicas, por problemas, por proyectos, etc., que en definitiva quieren suscitar que el individuo efectúe este cierre y suprima las interferencias del aprendizaje.

c) En el caso de la norepinefrina o noradrenalina también existe evidencia de que está vinculada con el cerebelo y el aprendizaje. Hay estudios que muestran la relación entre este neurotransmisor y un aprendizaje aversivo, modulado por la experiencia (Stanley et al. 2023). Este aprendizaje aversivo, según la neurología, podría relacionarse con el aprendizaje defensivo, tal y como lo definió el psicólogo social Klaus Holzkamp (véase Arnold y Holzkamp 2009). Se trataría de aquel aprendizaje que hacemos para evitar alguna cosa desagradable. Aunque evitaremos poner ejemplos, los textos de Holzkamp se refieren, por ejemplo, a la preparación de un examen para evitar el suspenso.

Ahora es necesario relacionar estos neurotransmisores biológicos con parámetros de RNA. Es decir, de lo que se trata es de utilizar las RNA para realizar un aprendizaje sin enseñanza en el que se puedan modular aquellas variables. Lo hemos realizado con el programa Simbrain (véase Tosi & Yoshimi 2016), que utiliza los parámetros correspondientes para simular estos neurotransmisores y, lógicamente, los tipos de aprendizajes indicados. En la terminología de este programa, estas variables son:

a) Factor gamma o factor de descuento: la orientación al futuro del agente. El rango es 0-1. Para valores más cercanos a 0, el agente está enfocado a recompensas más inmediatas; para valores más cercanos a 1, el agente se centra más en recompensas no inmediatas. Simularía la activación de la serotonina.

b) Tasa de aprendizaje: la proporción de saber (los «pesos», se llama metafóricamente) que se actualiza en cada paso de tiempo (también oscila entre 0 y 1). Simularía la activación de la acetilcolina.

c) Parámetro épsilon: la probabilidad que tiene el agente virtual de realizar una acción aleatoria. Lógicamente esta probabilidad oscila entre 0 (no tiene probabilidad de realizar acciones aleatorias) y 1 (todas las acciones son aleatorias), lo que se vincula con la norepinefrina o noradrenalina.

Por tanto, podemos establecer la relación que presenta la tabla 4, donde hemos añadido una primera columna de ejes que se explicará más adelante.

Tabla 4. Relaciones entre neurotransmisores, tipos de aprendizaje y parámetros de RNA

Eje X	Neurotransmisores	serotonina	acetilcolina	norepinefrina o noradrenalina
Eje Y	Parámetro RNA	factor gama	tasa de aprendizaje	parámetro épsilon
Eje Z	Tipo de aprendizaje	aprendizaje adhesivo, afectivo	supresión de interferencias	aprendizaje aversivo, defensivo

Fuente: Elaboración propia

3. 3. Experimentación

Aquí utilizaremos una implementación de Jeff Yoshimi y Jonathon Vickrey, disponible en el programa Simbrain , mediante el cual ejecutamos el modelo «actor-crítico» (mediante una red neuronal preentrenada), de modo que el sujeto (puro) virtual realiza una cantidad de intentos para conseguir un aprendizaje global determinado. Explicaremos esto con detalle.

Imaginemos la representación de un espacio virtual, como la que se presenta en un videojuego, en este caso un cuadrado dividido en una determinada cantidad de celdillas o sectores. En un ángulo del cuadrado tenemos una rata virtual y en el ángulo contrario un trozo de queso virtual, que nuestra rata no puede ver ni olfatear. Programamos las variables indicadas (factor gama, tasa de aprendizaje y parámetro épsilon), que corresponden con determinadas cantidades de neurotransmissores (serotonina, acetilcolina y norepinefrina o noradrenalina). La rata tiene la instrucción de alcanzar el queso, pero la manera como procede en cada caso (es decir, si deambula más o menos o está más centrada o menos en conseguir su objetivo) se puede programar mediante los parámetros. Cuando consiga el queso virtual, habrá realizado un aprendizaje, a saber, memorizará la ruta exitosa para alcanzar su objetivo, pero se mantendrán por ejemplo una cierta tendencia a deambular, de manera que en un segundo intento es probable que le cueste menos tiempo llegar a su objetivo, aunque no vaya directa. Podemos hacer que repita otra vez su camino, colocándola de nuevo en el ángulo opuesto. Lógicamente, tardará menos en general. Está claro que a partir de un número suficiente de intentos, el aprendizaje hará que la rata virtual no deambule y vaya directamente a su objetivo (podríamos hablar de una dinámica de saturación o una función logarítmica). Por ello no es necesario repetir indefinidamente el número de intentos, sino que podemos reducirlos a una cantidad y medir el tiempo que necesita la rata virtual para alcanzar el objetivo en ese número de intentos.

Dejando de lado los valores 0, si otorgamos valores 0,25, 0,5, 0,75 y 1 a cada uno de los parámetros y mantenemos fijo el número de intentos (variables independientes), podemos medir el tiempo de realización como una variable dependiente que representa el aprendizaje global como una magnitud inversa (a más aprendizaje global, menos tiempo de realización de los intentos. El número de intentos se ha fijado en 10 en todos los casos (3 parámetros por 4 posibilidades por 10 intentos = =640 desplazamientos de la rata virtual). Resulta claro que los tiempos de realización variarán de una experimentación a otra (como variarían si tuviéramos ratas reales), por lo que no deben calcularse matrices de correlaciones, sino que resulta preferible efectuar una representación las tendencias generales, como se hace más adelante.

3.4. Resultados

Los resultados de los 640 desplazamientos realizados, agrupados en tandas de 10 intentos, se incluyen en la tabla siguiente (tabla 5), donde se hace constar los diferentes valores de los parámetros (en los ejes X, Y y Z) así como el tiempo resultante, medido en unidades de tiempo del programa (no son segundos).

Tabla 5. Resultados de la experimentación (valores asignados a los parámetros y tiempo resultante)

X (gamma)	Y (learning rt.)	Z (epsilon)	Unidades de tiempo	X (gamma)	Y (learning rt.)	Z (epsilon)	Unidades de tiempo
0,25	0,25	0,25	426	0,75	0,25	0,25	347
0,25	0,50	0,25	448	0,75	0,50	0,25	271
0,25	0,75	0,25	391	0,75	0,75	0,25	293
0,25	1,00	0,25	667	0,75	1,00	0,25	318
0,25	0,25	0,50	518	0,75	0,25	0,50	348
0,25	0,50	0,50	470	0,75	0,50	0,50	372
0,25	0,75	0,50	333	0,75	0,75	0,50	350
0,25	1,00	0,50	373	0,75	1,00	0,50	427
0,25	0,25	0,75	466	0,75	0,25	0,75	461
0,25	0,50	0,75	378	0,75	0,50	0,75	397
0,25	0,75	0,75	666	0,75	0,75	0,75	793
0,25	1,00	0,75	435	0,75	1,00	0,75	616
0,25	0,25	1,00	1009	0,75	0,25	1,00	850
0,25	0,50	1,00	1205	0,75	0,50	1,00	1311
0,25	0,75	1,00	1317	0,75	0,75	1,00	1429
0,25	1,00	1,00	711	0,75	1,00	1,00	1325
0,50	0,25	0,25	310	1,00	0,25	0,25	343
0,50	0,50	0,25	281	1,00	0,50	0,25	329
0,50	0,75	0,25	387	1,00	0,75	0,25	363
0,50	1,00	0,25	319	1,00	1,00	0,25	365
0,50	0,25	0,50	387	1,00	0,25	0,50	327
0,50	0,50	0,50	457	1,00	0,50	0,50	332
0,50	0,75	0,50	322	1,00	0,75	0,50	291
0,50	1,00	0,50	492	1,00	1,00	0,50	365
0,50	0,25	0,75	481	1,00	0,25	0,75	440
0,50	0,50	0,75	717	1,00	0,50	0,75	628
0,50	0,75	0,75	606	1,00	0,75	0,75	575
0,50	1,00	0,75	535	1,00	1,00	0,75	432
0,50	0,25	1,00	810	1,00	0,25	1,00	1366
0,50	0,50	1,00	840	1,00	0,50	1,00	1226
0,50	0,75	1,00	1224	1,00	0,75	1,00	1320
0,50	1,00	1,00	1260	1,00	1,00	1,00	1000

Fuente: Elaboración própia

Hemos utilizado el programa Orange de minería de datos para proceder a una representación de los resultados en unos ejes cartesianos XYZ, tal y como habíamos definido las variables en la tabla 4. La variable dependiente se representa mediante el color y el tamaño de los puntos. Recuérdese que aquí el tiempo es una variable inversa a lo que hemos definido como aprendizaje global (a más tiempo, menos aprendizaje global y viceversa). Los resultados se representan en el gráfico 2.

Gráfico 2. Resultados de la experimentación

Fuente: Elaboración propia.

Los valores menores (círculos azul oscuro de menor diámetro) se dan con los valores superiores de X (factor gamma, lo relacionado con la serotonina y aprendizaje adhesivo o afectivo), seguido de valores mayores de Y (tasa de aprendizaje, relacionado con acetilcolina y supresión de interferencias –resolución de disonancia cognitiva–) y valores menores de Z (el parámetro épsilon, relacionado con la norepinefrina o noradrenalina y el aprendizaje aversivo o defensivo). Y al revés, con valores superiores de Z se logran resultados con valores mayores de la variable independiente (más tiempo), que se representan en colores amarillo-verdoso y puntos de mayor tamaño. Hay recordar que el gráfico 2 presenta en dos dimensiones lo que es una representación tridimensional (lo que exige una proyección bidimensional y un cierto esfuerzo de la persona que lee).

4. Conclusiones generales

La comprensión integral del aprendizaje se manifiesta como una amalgama compleja de diversas modalidades de adquisición de aprendizaje. Aunque existen sólidas razones experimentales que respaldan la distinción constructivista entre la enseñanza y el aprendizaje, tal como se evidencia en las correlaciones del programa PISA entre el rendimiento general y variables asociadas a un indicador de aprendizaje (tales como el porcentaje de individuos que disfrutan de la lectura, el índice de disfrute y las correlaciones de diversos índices en distintas materias), esta distinción no abarca completamente la complejidad del estudio del aprendizaje global.

Para abordar esta complejidad, se requiere un diseño experimental que, siguiendo la senda del experimento ideal sobre la radiación del cuerpo negro en física, contemple el aprendizaje independientemente de la influencia de cualquier método de enseñanza concebible. Hemos logrado este cometido mediante la implementación de una aplicación de Inteligencia Artificial que posibilita la simulación de RNA. Estos modelos se caracterizan por parámetros que pueden ser robustamente asociados con neurotransmisores y diversas formas de aprendizaje.

El resultado de este enfoque experimental se plasma en el gráfico 2, donde las tendencias se revelan con claridad. De este modo, logramos establecer un puente entre las diversas formas de aprendizaje y la comprensión global del proceso, prescindiendo de la interferencia de los métodos de enseñanza y sus correspondientes enfoques didácticos. Este planteamiento nos permite explorar y comprender mejor las complejas interrelaciones que subyacen en el aprendizaje, avanzando hacia una perspectiva más completa y holística de este fenómeno fundamental en la educación.

5. Discusión

La conceptualización de cualquier modelo, como en el caso del proceso de simulación (específicamente utilizando RNA), implica necesariamente una cierta nivelación y simplificación. En este contexto, optamos por la utilización de un modelo simple, en este caso, el modelo actor-crítico, no con la intención de evaluar exhaustivamente dicho modelo, sino más bien de examinar las formas de aprendizaje asociadas a él. Es evidente que investigaciones futuras pueden explorar y emplear modelos más complejos que permitan captar matices adicionales y dificultades en el proceso de simulación.

En lo que concierne a las formas de aprendizaje, es crucial destacar que no hemos sido nosotros quienes las hemos definido, sino que hemos adoptado las categorías que la literatura neurobiológica, previamente citada, presenta. En todo caso, estas no se presentan como el resultado de una reflexión metafísica o de una inducción de base escasa, sino como el intento de concebir los efectos de los neurotransmisores en la acción de los individuos. Cabe mencionar que la literatura neurobiológica es vasta y en constante expansión; por ejemplo, una simple búsqueda sobre aprendizaje y acetilcolina arroja más de 675,000 referencias. Por ende, nos hemos enfocado en las fuentes más relevantes y concluyentes, evitando caer en la abrumadora cantidad de información disponible.

En lo referente a la relación entre las RNA y las redes neuronales biológicas, es innegable que este campo de la Inteligencia Artificial se encuentra en constante evolución y promete avances significativos en los próximos años, incluso explorando las potenciales contribuciones de la computación cuántica (sobre la cual, véase Hernández y García 2022). No profundizamos aquí en los detalles de cómo las RNA simulan las redes neuronales biológicas, es decir, en la formulación de nodos, pesos, funciones de activación, entre otros aspectos. En la bibliografía, el uso de las RNA para simular modelos cognitivos se conoce como modelo connectionista.

No obstante, es esencial resaltar las diferencias sustanciales entre la computación clásica y las RNA. En una computadora clásica, la información se procesa de manera secuencial a través de reglas aplicadas a cadenas de bits. En contraste, la computación neuronal se basa en operaciones paralelas, donde los patrones de activación de los nodos se transforman mediante fuerzas de peso. Además, las RNA muestran una mayor tolerancia a las señales ruidosas y a los daños en comparación con las computadoras convencionales. Mientras que los ordenadores se programan manualmente para realizar tareas específicas, las redes neuronales se entrenan mediante adiestramiento, aprendiendo a partir de ejemplos y experiencias. En este contexto, el interés particular de nuestro estudio radica en realizar una combinatoria de parámetros para observar y comprender los resultados obtenidos en este contexto de aprendizaje supervisado y poderlo proyectar sobre la educación real.

6. Referencias

Adorno, Theodor W. (2015): Lecciones sobre la Crítica de la razón pura. Buenos Aires: Las Cuarenta.

Arnold, Rolf; Holzkamp, Klaus (2009): «Sobre el “cortocircuito enseñanza-aprendizaje”. Entrevista sobre el “aprendizaje”». Revista de Sociología de la Educación-RASE, 2 (1): 86-94.

Arnold, Rolf; Schön, M. (2021): Didáctica facilitadora. Un libro de aprendizaje. València: Institut de Creativitat i Innovacions Educatives de la Universitat de València.

Blokland, Arjan (1995): «Acetylcholine: a neurotransmitter for learning and memory?». Brain Research Reviews, 21 (3), 285-300 < https://doi.org/10.1016/0165-0173(95)00016-X>

Comenius (1659): Johan Amosi Comenii Schola Ludus, seu Encyclopaedia viva: hoc est Praxis Scenica Januaelingvarum & Rerum, Artificium exhibens amaenum... Typis Jacobi Lasché, Typografhi Hanoviensis.

Dausien, Bettina (2011): «“Biographisches Lernen” und “Biographizität” - Überlegungen zu einer pädagogischen Idee und Praxis in der Erwachsenenbildung». Hessische Blätter für Volksbildung, 2, 110-125.

Hasselmo, Michael E. (1993): «Acetylcholine and Learning in a Cortical Associative Memory», Neural Computation, 5 (1), gener, 32-44 <doi: 10.1162/neco.1993.5.1.32>

–––––– (2006): «The role of acetylcholine in learning and memory», Current opinion in Neurobiology 16 (6), 710-715.

Hernàndez, F. J.; Garcia, Vicent (2022): Sobre el lenguaje escrito y el lenguaje oral en la sociedad digital. Studia Humanitatis Journal, 2 (1) 69-86.

Holzkamp, Klaus (1995): Lernen. Subjektwissenschaftliche Grundlegung. Frankfurt d. M., etc.: Campus Verlag.

Luo, Q. et al. (2023): Comparable roles for serotonin in rats and humans for computations underlying flexible decision-making. Neuropsychopharmacol <https://doi.org/10.1038/s41386-023-01762-6>.

Michely, J. et al. (2020): A mechanistic account of serotonin’s impact on mood. Nat Commun 11 (2335) <https://doi.org/10.1038/s41467-020-16090-2>

Neurobiology (2003): Acetylcholine: Cognitive and Brain Functions, Neurobiology of Learning and Memory, 80 (3), 177-352 (número monográfico sobre la acetilcolina).

OCDE PISA 2006, 2012, 2018. Los datos se pueden descargar del portal: https://www.oecd.org/pisa/

Schröder, Tim (2019): «Raus mit der Sprache». Max Planck Forschung, 19 (4), 19-25.

Stanley, A. T. et al. (2023): «Norepinephrine release in the cerebellum contributes to aversive learning». Nat Commun 14 (4852) <doi.org/10.1038/s41467-023-40548-8>

Sutton, Richard S. i Barto, Andrew G. (2015): Reinforcement Learning: An Introduction [Second edition in progress, 2014, 2015]. Cambridge, Massachusetts; Londres: MIT Press.

Tosi, Zach i Yoshimi, Jeff (2016): Simbrain 3. A Flexible, Visually-Oriented Neural Network Simulator. Neural Networks (4 de juliol). En: <https://www.sciencedirect.com/science/article/pii/S0893608016300879>

* Simbrain y Orange Data Mining son marcas registradas.

^[1] Graduado en Educación (Aprentell, España). aprentell@gmail.com

^[2] Doctor en Educación (Universitat de València, España). Vicent.garcia@uv.es

^[3] Doctor en Sociología, Pedagogía y Filosofía (Universitat de València, España). Francesc.j.hernandez@uv.es

^[4] Al redactar este artículo han sido publicados los datos de PISA 2022, pero todavía no las variables relacionadas con enjoyment de esta tanda.