La ilusión que solo existe en el cerebro, este modelo de IA la "dibuja"

巴比特_

2023-12-01 02:38:44

Fuente original: Follow-up NextQuestion

Fuente de la imagen: Generado por Unbounded AI

Cuando vemos dos conjuntos de rejillas lineales una al lado de la otra, ligeramente desalineadas entre sí, parece que una línea que en realidad no existe aparece en nuestras mentes. Esta línea parece doblarse y extenderse entre dos conjuntos de líneas reales (Figura 1C).

Figura 1: Variante de alucinación rasterizada escalonada. A: Vasarely (1970), B: Vasarely’ Zebres (1939), C: Clásica ilusión de rejilla escalonada. Fuente: Vasarely*

Una disposición tan simple puede crear un efecto visual sorprendente, que llamamos la ilusión de la rejilla contigua. Lo que es aún más interesante es que cuando el número de estas líneas aumenta, nuestra percepción de las alucinaciones también se vuelve más fuerte.

También hay dos ilusiones de difusión de neón que también son interesantes:

La ilusión de Ehrenstein y la ilusión de Wallin. En la alucinación de Ehrenstein, un conjunto de líneas radiales se extiende hacia afuera. La dirección hacia afuera de la línea es oscura, mientras que la parte que se junta hacia el centro es clara. Si enfocas tu mirada en el centro de la línea, la parte clara del interior parece que se extiende hacia el área oscura circundante, formando un círculo translúcido.

Figura 2: La alucinación de Ehrenstein, donde un patrón de celosía rectilínea que se detiene en un punto específico aparece más brillante en el centro que en el fondo, creando la ilusión de un círculo. Fuente: Wikipedia

La ilusión de Wallin consistía en círculos en cuatro esquinas, una parte de cada círculo era de color más claro y las otras eran negras. Cuando miramos estos círculos, las partes de color claro parecen difundirse hacia el centro, formando finalmente un cuadrado translúcido.

Figura 3: Alucinación de Valin, donde la parte más brillante u oscura del centro se extiende hacia el centro, formando finalmente un cuadrado translúcido. Fuente: Percepción

Mecanismo algorítmico de percepción de contorno virtual

Los científicos han propuesto una variedad de teorías para explicar el mecanismo algorítmico de la percepción del contorno virtual desencadenado por estas alucinaciones.

Algunas escuelas creen que es la supresión lateral del color lo que realza el contraste y hace que las personas perciban líneas virtuales. Por ejemplo, cuando una neurona es excitada por el brillo, suprime las neuronas en las áreas más oscuras a su alrededor, lo que hace que las áreas brillantes parezcan más brillantes y las áreas oscuras parezcan más oscuras. El cerebro puede malinterpretar la mejora del contraste como un contorno y una línea distintos[1] [2]。 Otra teoría sugiere que esto puede deberse a funciones cerebrales superiores, como la suplementación cerebral a través del conocimiento y la memoria. Cuando nuestros cerebros comparan las imágenes que vemos con representaciones pasadas, pueden sentir que faltan ciertos elementos, por lo que automáticamente “completan” estas partes faltantes, formando una percepción de contornos virtuales [3]。 También hay muchas teorías, como que las conmociones cerebrales nerviosas pueden combinar características fragmentadas para formar una percepción de características que no existen [4]El factor de aumento cortical trata cuidadosamente el campo visual central y, por lo tanto, exagera las características de ciertos estímulos, por ejemplo …

La inhibición lateral :* un mecanismo de señalización de yuxtaposición conservado que impulsa la formación de una variedad de patrones finos, como manchas y bordes rayados, en tejidos inicialmente casi homogéneos durante el desarrollo de la mayoría de los organismos (Ref. 9)

En cuanto al mecanismo neurofisiológico de la percepción del contorno virtual, aunque los científicos han investigado mucho, todavía hay muchas controversias. Uno de los modelos que compiten sugiere que este mecanismo neurofisiológico ocurre en la corteza visual inferior (V1/V2) y luego afecta a la corteza superior de abajo hacia arriba, mientras que el otro sugiere que este proceso se localiza primero en la corteza superior, principalmente en la corteza occipital lateral (LOC), y luego afecta a V1/V2 de arriba hacia abajo[5] 。

Para la ilusión de difusión del color neón, algunos estudios sugieren que V3 y V4 tienen un impacto considerable en los fenómenos de relleno de color relacionados con la forma[6] [7]; Al mismo tiempo, hay algunos estudios que sugieren que la actividad cortical asociada con la apariencia del color resultante del relleno inducido por los bordes o la cromaticidad uniforme de la superficie se asocia con patrones complementarios de actividad en el flujo visual dorsal (V3A y V3B/KO) y ventral (V3v, hV4 y LO). (Figura 4).

Figura 4: Varias regiones funcionales y vías en la corteza visual. Fuente: Ref. 7.

Aunque estas teorías proporcionan alguna explicación para los mecanismos algorítmicos y fisiológicos de las alucinaciones, todavía no está claro cómo se representan estas alucinaciones visuales en la mente, y parece imposible verificarlas.

Cuando vemos alucinaciones, ¿realmente las “vemos”?

¿Podemos realmente estar seguros de que estamos usando “alucinaciones” para caracterizar los estímulos que causan aLucinaciones?

Reconstrucción de imágenes alucinatorias

Un artículo reciente publicado en Science Advances probó los dos tipos de alucinaciones visuales mencionadas anteriormente y reconstruyó con éxito imágenes de líneas y colores consistentes con la experiencia alucinatoria, demostrando la efectividad del modelo en la materialización de experiencias subjetivas[8] 。

▷Figura 1: Portada del artículo. Fuente: Referencia 8

En el experimento, los investigadores pidieron a 7 sujetos que vieran tres o más imágenes visuales de alucinación y sus correspondientes imágenes de control e imágenes de control positivo. ** Para cada ilusión, se ha cambiado la imagen de control. Por ejemplo, la imagen de control de la ilusión de trama intercalada reduce en gran medida la densidad de la cerca, la imagen de control de la alucinación de Ehrenstein, en la que el extremo de la cola de la línea que originalmente causó la alucción es más claro, mientras que la imagen de control positivo cambia el centro radiante de la línea a un círculo de luz, y la imagen de control de la alucinación de Wallin elimina la parte negra del estímulo alucinatorio (la inducción visual original), mientras que la imagen de control positivo cambia la parte central a un cuadrado de color más claro (consulte la Figura 5 para obtener más detalles).

Las imágenes parpadearon a una frecuencia de 0,625 Hz durante 8 segundos cada una y se repitieron 20 veces cada una. A lo largo del experimento, se utilizaron imágenes de resonancia magnética funcional (fMRI) para registrar la actividad cerebral mientras los participantes observaban las imágenes.

Figura 5: La columna izquierda de la Figura A es el estímulo que induce la alucinación, y la columna derecha de la Figura A es el estímulo de control correspondiente al estímulo que induce la alucinación. La primera línea de la Figura A es una alucinación rasterizada escalonada, la segunda línea de la Figura A es una alucinación de Ehrenstein y la tercera línea de la Figura A es una alucinación de Wallin. La Figura B muestra el proceso de entrenamiento de una DNN utilizando imágenes naturales. La Figura C muestra la actividad cerebral que se muestra en los datos de decodificación de la resonancia magnética funcional de la DNN como las características del estímulo y el proceso mediante el cual el generador genera una imagen basada en los resultados de la decodificación de la DNN. Fuente: Ciencia

A continuación, los datos cerebrales recopilados por fMRI de los investigadores se introdujeron en una red neuronal profunda (DNN) entrenada para su decodificación. Esta DNN es una variante de AlexNet, el modelo BAIR/BVLC CaffeNet, diseñado por Alex Krizhevsky, director de Open AI. Se trata de una red neuronal convolucional que utiliza un algoritmo de propagación hacia delante que ha sido entrenado previamente para clasificar 1.000 objetos en la base de datos de imágenes de ImageNet.

** Los resultados mostraron que las imágenes reconstruidas a partir de las representaciones mentales de estímulos alucinatorios exhibían propiedades alucinatorias. Por el contrario, las imágenes reconstruidas directamente a partir de la naturaleza del estímulo en sí no exhiben propiedades alucinatorias. Esto también muestra que la naturaleza de la alucinación reconstruida a partir de la representación mental no está construida por la naturaleza y el procesamiento de la DNN, sino por la naturaleza de la representación mental misma (ver Figura 6).

Figura 6: La columna más a la izquierda es la imagen del estímulo. La segunda columna de la izquierda es una imagen de la DNN reconstruida a partir de los datos de la propia imagen del estímulo en la columna de la izquierda. Las figuras 3-6 son representaciones mentales reconstruidas a partir de la actividad cerebral generada por la imagen de estímulo más a la izquierda del Sujeto 1. Las figuras 7-10 son representaciones mentales reconstruidas a partir de la actividad cerebral generada por las imágenes de estímulo más a la izquierda de los dos pares. Las líneas 1-3 de la Figura 1-3 son imágenes de la ilusión de rejilla escalonada. La primera fila trata sobre la ilusión de rejilla escalonada de dos columnas de matrices de rejilla dispuestas a lo largo de 90 grados, la segunda fila trata sobre la ilusión de rejilla escalonada de dos columnas de rejilla dispuestas a lo largo de 45 grados, y la tercera fila trata sobre el control de la ilusión de rejilla escalonada. Las líneas 4-7 son todas imágenes de las alucinaciones de Ehrenstein. La cuarta y sexta líneas son sobre la alucinación de Ehrenstein, la cuarta tiene 8 cuerdas y la seis tiene 4 líneas. Las líneas 5 y 7 se ocupan del control de la alucinación de Ehrenstein, con cinco con 8 líneas y siete con 4 líneas. Las líneas 8-9 de la figura 8-9 son imágenes de las alucinaciones de Wallin. El octavo acto es una alucinación de Wallin, y el noveno acto es controlador. Fuente: Ciencia

El estudio es único en el sentido de que las imágenes se decodifican a partir de datos de toda la corteza visual registrados en fMRI, y que las representaciones mentales reconstruidas generalmente muestran características que son de naturaleza más alucinatoria que el estímulo en sí. **

En el caso de las alucinaciones rasterizadas entrelazadas, la línea ilusoria en el estímulo alucinatorio parece ser mucho más pronunciada que las líneas cubiertas por cualquier estímulo en sí, mientras que las representaciones mentales reconstruidas a partir del estímulo de control no lo indican; en el caso de las alucinaciones de difusión de color neón, en la alucinación de Ehrenstein, la parte de difusión de color es mucho mayor que en la sección de control; en la alucinación de Wallin, aunque el estímulo de control todavía muestra el contorno de la forma de difusión, la parte de difusión de color sigue siendo mucho más grande que en la parte de control. Además, el control del estímulo en sí mismo está diseñado solo para inhibir la difusión del color en lugar del contorno de la forma, por lo que en el caso de la alucinación de Wallin, la propiedad alucinatoria es más fuerte que el estímulo en la representación mental, y esta propiedad sigue siendo válida.

Cuantificando la ilusión de la reconstrucción

La intensidad de las alucinaciones no solo se refleja en las imágenes reconstruidas, sino que también se puede cuantificar a través de una variedad de métodos. Este artículo proporciona un análisis cuantitativo detallado de la intensidad de las alucinaciones en las representaciones mentales producidas por las alucinaciones de rejilla escalonada y los estímulos alucinatorios de difusión de neón.

Los investigadores utilizaron la transformada de radón para analizar las propiedades alucinatorias de la ilusión de rejilla escalonada, es decir, la intensidad de las líneas virtuales entre las rejillas. ** Como método ampliamente utilizado para analizar datos radiográficos, la transformada de Ladong puede reconstruir matemáticamente la forma del objeto original a partir de los valores integrales (por ejemplo, densidad, masa, etc.) obtenidos al proyectar el objeto desde todas las direcciones, mientras que solo se puede conocer la descripción lateral. **

En este estudio, la transformada de Ladong se aplica al análisis de imágenes, y la dirección principal de la distribución de líneas en el gráfico reconstruido se obtiene sumando los “valores de píxel” obtenidos al proyectar la imagen desde todas las direcciones. Los experimentos han demostrado que para todos los datos sobre la corteza visual en la resonancia magnética funcional, las direcciones predominantes en las imágenes reconstruidas muestran una distribución bimodal, en la que aproximadamente el 61,1% de las direcciones predominantes están más cerca de la dirección predominante de la alucidión que de la dirección inducida visualmente.

Del gráfico se desprende que los valores absolutos verticales de la distribución bimodal en la dirección principal de la imagen reconstruida son más altos y están más agrupados que los de los valores absolutos transversales. A medida que disminuye el número de rejillas (líneas) en los estímulos alucinatorios, el valor absoluto vertical comienza a disminuir en relación con el valor absoluto transversal dentro de la distribución bimodal de la dirección principal en la imagen reconstruida del estímulo por representación mental, y el valor absoluto transversal es significativamente mayor que el valor absoluto vertical en el estímulo de control. ** Este resultado apoya la teoría de que una reducción en el número de rejillas (líneas) reducirá el grado de alucinación. **

Al mismo tiempo, la dirección principal del área de concentración alucinatoria está cerca de la dirección principal de la imagen reconstruida, mientras que la dirección principal del área sin alucinación (el área donde se concentra principalmente la inducción visual) no está cerca de la dirección principal de la imagen reconstruida. Esto demuestra que el área en la que se localizan las alucinaciones en la imagen reconstruida se encuentra entre los dos conjuntos de rejillas tal como se perciben (véase la figura 7B, C, D, E).

Figura 7: La Figura A ilustra el proceso de la transformación de Ladong. La figura B muestra que el 61,1% de las direcciones principales de la imagen reconstruida están más cerca de la dirección principal de las alucinaciones en relación con la dirección principal inducida. La figura C muestra que la dirección principal de la puntuación del estímulo está significativamente más cerca de la dirección principal de la inducción. La figura D muestra que cuanto menor es el número de líneas, más cerca está la dirección principal de la imagen de la dirección principal del incentivo. La figura E muestra que la dirección principal del área de concentración alucinatoria también está cerca de la dirección principal de la imagen reconstruida, la figura F muestra la representación mental reconstruida a partir de los datos extraídos de diferentes áreas de la corteza visual, y V1-V3 es más alucinatoria. Fuente: Ciencia

Los investigadores también utilizaron la regresión lineal para analizar la naturaleza alucinatoria de las alucinaciones de Ehrenstein y Wallin, es decir, el grado en que el color se difunde hacia afuera (formando un plano translúcido) de las líneas dadas por el estímulo. Construyeron un “mapa de enrojecimiento” basado en los valores RGB de los píxeles de cada imagen, respectivamente, para las imágenes reconstruidas de representaciones mentales alucinatorias, representaciones mentales de control y representaciones mentales de control positivo, así como para las imágenes de estímulo y las imágenes alucinatorias subjetivas esperadas.

A continuación, los investigadores intentaron ajustar el mapa de enrojecimiento de la representación mental con un mapa de enrojecimiento del estímulo y la alucinación subjetiva esperada. Cada uno de los estímulos y alucinaciones subjetivas esperadas tiene un coeficiente (β1 y β2) para ajustarse, y estos coeficientes representan sus respectivos pesos en las representaciones mentales reconstruidas. Es decir, cuantas más partes reconstruyan la parte roja de la representación mental, mayor será el coeficiente β1. Esto se debe a que sólo las alucinaciones subjetivas que son más rojas en el momento de la percepción tienen una mayor proporción de las alucinaciones subjetivas que hacen que las representaciones mentales parezcan más rojas (ver Fig. 8C, D, G, F).

Los resultados de la regresión lineal mostraron que, basándose en todos los datos sobre la corteza visual de la resonancia magnética funcional, los coeficientes de alucinación subjetiva de ambos estímulos que provocaron alucinaciones difusas de color neón fueron mayores que los del estímulo de control y menores que los del estímulo de control positivo. Sin embargo, el coeficiente de alucinación subjetiva de la alucinación de Walling, aunque mayor que el del control, fue significativamente menor que el de la alucinación de Ehrenstein (ver Fig. 8E, F, I, J).

Figura 8: La figura A ilustra la alucinación de Ehrenstein, con su control y control positivo en diferentes regiones de la corteza visual. El panel B ilustra la alucinación de Wallin, la representación de su control y control positivo en diferentes regiones de la corteza visual. El panel C muestra cómo se calcula la regresión lineal comparando las alucinaciones de Ehrenstein y el gráfico de enrojecimiento bajo su control. El panel D muestra cómo se calcula la regresión lineal de las alucinaciones de Wallin contrastantes y el mapa de enrojecimiento que controlan. El panel E muestra la proporción de las propiedades alucinatorias de las alucinaciones de Ehrenstein en relación con las propiedades de las alucinaciones de control en cada región de la corteza visual. La figura F muestra la proporción de las propiedades alucinatorias de las propiedades alucinatorias de Wallin en relación con las propiedades alucinatorias de control en las diversas regiones de la corteza visual. El panel G muestra cómo se calcula la regresión lineal para comparar el alucinante de Ehrenstein con su gráfico de enrojecimiento controlado positivamente. El panel H muestra cómo se calcula la regresión lineal de las alucinaciones de Wallin contrastantes y sus gráficos de enrojecimiento controlados positivamente. La figura I muestra la proporción de las propiedades alucinatorias de las alucinaciones de Ehrenstein en cada región de la corteza visual en relación con las propiedades alucinatorias de control positivo. La figura J muestra la proporción de las propiedades alucinatorias de Wallin en cada región de la corteza visual en relación con las propiedades alucinatorias de control positivo. Fuente: Ciencia

Área visual correspondiente a la alucinación

Los investigadores no solo reconstruyeron la representación mental de las alucinaciones en toda la corteza visual, sino que también reconstruyeron las representaciones psicológicas de las alucinaciones en cada región visual específica de la corteza.

Estas regiones visuales están organizadas en orden desde el centro y el flujo descendente hasta los tramos superiores de la vía visual (funcionamiento primario a superior), incluida la corteza visual primaria (V1), la corteza visual secundaria (V2), la corteza visual terciaria (V3), la corteza visual cuaternaria (V4), el complejo del lóbulo occipital lateral (LOC), la circunvolución fusiforme (FFA) y la región parahipocampal (PPA).

Figura 4: Diagrama de varias regiones funcionales y vías en la corteza visual. Fuente: Ref. 7.

Después de extraer datos de resonancia magnética funcional de diferentes regiones de la corteza visual y decodificar y reconstruir las representaciones mentales respectivamente, los investigadores encontraron que para las alucinaciones rasterizadas escalonadas, las propiedades alucinatorias se reflejaban principalmente en V1 a V3 solo a partir de las imágenes, y las propiedades y estímulos alucinatorios en V4 y regiones superiores no estaban claras. Después de cuantificar las principales direcciones de reconstrucción de imágenes en cada región, los investigadores encontraron que la naturaleza alucinatoria alcanzó su punto máximo entre V2 y V4 en todo el dominio de la imagen, y alcanzó su punto máximo entre V1 y V3 en el dominio de concentración alucinatoria. Estos resultados sugieren que la caracterización de las líneas se centra principalmente en la región visual temprana (Figura 7F).

Cuando se trata de alucinaciones de difusión de colores neón, la corteza visual emplea diferentes estrategias. El estudio mostró que la naturaleza alucinatoria de la alucinación de Ehrenstein se reflejaba significativamente en cada área de la corteza visual, lo que era consistente con la representación de la naturaleza de color neón del estímulo de control positivo en cada región de la corteza visual, mientras que la naturaleza alucinatoria de la alucinación de Walling solo se reflejaba significativamente en el área de la corteza visual en V4 y superior, mientras que la naturaleza de color neón del estímulo de control positivo también se reflejaba significativamente en V2 y V3. Combinado con los resultados de que el coeficiente de alucinación subjetiva de la alucinación de Wallin fue menor que el de la alucinación subjetiva de la alucinación de Ehrenstein, esto indica que incluso si la naturaleza de la alucinación es la misma, diferentes configuraciones de inducción causarán diferentes métodos de procesamiento de información en la corteza visual. **

Cuando tenemos alucinaciones visuales, ¿es la influencia de arriba hacia abajo de la corteza visual primaria de las regiones superiores hacia abajo para construir las alucinaciones, o es causada por la corteza visual primaria de abajo hacia arriba que afecta a las regiones superiores? Aunque este artículo solo presenta las representaciones predichas en las teorías anteriores desde otra perspectiva, en lugar de tratar de construir una relación causal entre la actividad cerebral y la naturaleza de las alucinaciones, su vívida presentación aún nos proporciona algunas pistas sobre cómo la experiencia subjetiva está activa en el cerebro.

Obviamente, no podemos simplemente usar una región del cerebro para reconstruir toda la experiencia alucinatoria, y todas las señales inducidas tendrán un impacto en el mecanismo de la misma experiencia alucinatoria. Parece que se necesita un marco teórico más completo para comprender el complejo mecanismo de las alucinaciones.

La próxima vez que veas esas deslumbrantes imágenes alucinatorias, puedes pensar en las alucinaciones construidas por estos modelos, en el maravilloso concurso “avanzado vs. principiante” que puede estar desarrollándose en tu cerebro, y luego sonreír y maravillarte ante la maravilla de la cognición.

Referencias:

[1] . Elliott, S. L., & Shevell, S. K. (2013). “La segmentación percibida del centro del envolvente por contornos ilusorios causa inhibición lateral cromática”. Este estudio sugiere que los contornos ilusorios pueden invocar el antagonismo espacial centro-envolvente para alterar la apariencia del color, lo que indica un locus neural cortical para la inhibición lateral

[2] . Pak A, Ryu E, Li C, Chubykin AA. La retroalimentación descendente controla la representación cortical de los contornos ilusorios en la corteza visual primaria del ratón. J Neurosci. 15 de enero de 2020; 40(3):648-660. doi: 10.1523/JNEUROSCI.1998-19.2019. Epub 2 de diciembre de 2019. PMID: 31792152; PMCID: PMC6961994.

[3] . Murray MM, Herrmann CS. Contornos ilusorios: una ventana a la neurofisiología de la construcción de la percepción. Tendencias Cogn Sci. 2013 Sep; 17(9):471-81. doi: 10.1016/j.tics.2013.07.004. Epub 6 de agosto de 2013. PMID: 23928336.

[4] . Gove, A., Grossberg, S., & Mingolla, E. (1995). Percepción de brillo, contornos ilusorios y retroalimentación corticogeniculada Neurociencia Visual, 12(6), 1027-1052. doi:10.1017/S0952523800006702

[5] . J. F. Knebel, M. M. Murray, Hacia una resolución de modelos conflictivos de procesamiento ilusorio de contornos en humanos. Neuroimagen 59, 2808–2817 (2012).

[6] . S. W. Hong, F. Tong, Representación neuronal del relleno de color contingente a la forma en la corteza visual temprana. J. Vis. 17, 10 (2017).

[7] . P. Gerardin, C. Abbatecola, F. Devinck, H. Kennedy, M. Dojat, K. Knoblauch, Circuitos neuronales para el relleno de color de largo alcance. Neuroimagen 181, 30–43 (2018).

[8] . Fan L. Cheng et al., Reconstrucción de experiencias visuales ilusorias a partir de la actividad cerebral humana.Sci. Adv.9,eadj3906(2023). DOI:10.1126/sciadv.adj3906

[9] Cohen, M. et al. (2010) «Los filopodios dinámicos transmiten la señalización intermitente de la muesca delta para impulsar el refinamiento del patrón durante la inhibición lateral», Developmental Cell, 19(1), pp. 78-89. doi:10.1016/j.devcel.2010.06.006

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Comentar

0/400

Sin comentarios