Cada vez que leemos sobre Inteligencias Artificiales como ChatGPT o Dall-e 2, se nos hace la boca agua. Solo imaginar que se puede establecer una conversación profunda con un ente artificial o pedirle a un software que genere prácticamente cualquier imagen que se te cruce por la cabeza, resulta tan increíble que asusta. El futuro ha llegado.
El aprendizaje, la percepción, la toma de decisiones y el razonamiento dejaron de ser características solamente humanas. El desarrollo de sistemas y programas que pueden realizar estas tareas dieron lugar a lo que conocemos como Inteligencia Artificial.
Oxford define a la inteligencia artificial como «la teoría y desarrollo de sistemas de computación capaces de realizar tareas que requieren la mediación de inteligencia humana, como la percepción visual, el reconocimiento del habla, la toma de decisiones y la traducción entre idiomas». Una versión simplificada del concepto podría ser «software para imitar aspectos de la inteligencia humana».
- Consulte además: ControlNet: qué es y cómo funciona esta inteligencia artificial de dibujo que mejora Stable Diffusion
Esto quiere decir que el programa no trabajará con una lista de instrucciones para seguir a rajatabla, sino que será capaz de procesar toda la información a la que tiene acceso para aprender a realizar la tarea que se le encomienda. Para ello, es preciso entrenar a la IA. Aunque existen muchas maneras de programar inteligencias artificiales, las que nos incumben en este caso funcionan gracias a redes neuronales.
Si las cámaras fotográficas son una reconstrucción del ojo, las ya mencionadas redes neuronales son una aproximación del cerebro: una red de conexiones similar a la que forman las neuronas a través de la cual se mueve la información. En dependencia de lo fuerte que sea el vínculo entre nodo y nodo, a cada entrada le corresponde una salida.
Visto de forma práctica y simple: la aspiradora robótica Roomba recibe las entradas como mediciones de sus sensores y, en respuesta, decide hacia dónde moverse. Esa es la salida. Si el sensor derecho detecta un objeto que le obstruye el paso, la información se atraviesa la red y el robot decide trasladarse hacia la izquierda.
Esta técnica que tanto ha dado de qué hablar se llama machine learning. Es la base de la mayoría de las IAs con las que diariamente lidiamos, desde la Alexa de Amazon hasta los cuadros de Midjourney. El potencial de este método se comenzó a explorar recientemente porque desde los años 40, cuando se teorizó, la humanidad no había tenido acceso a la cantidad de información necesaria para entrenar a un software así, ni a la capacidad de procesamiento necesaria para hacerlo.
- Consulte además: De cómo no confundir a tu profesor con una inteligencia artificial
El poder de cómputo actual sin precedentes y la cantidad de información que brinda internet o que se almacena en las supercomputadoras de los laboratorios donde se programan e investigan las inteligencias artificiales son quienes permiten los resultados que hoy vemos.
Aunque resulte difícil de creer, hace tiempo vivimos rodeados de Inteligencia Artificial. Desde los asistentes virtuales como Siri o Alexa, hasta los sistemas de recomendaciones de Netflix o Amazon, todos utilizan IA en mayor o menor medida.
En los últimos tiempos, las Inteligencias Artificiales generadoras de texto e imágenes han dado muchísimo de qué hablar. Ejemplos como ChatGPT o Dall-e 2 demuestran lo mucho que se ha avanzado en este campo. Pero, ¿cómo funcionan?
ARTISTAS GRÁFICAS VIRTUALES
Las IAs generadoras de imágenes no hacen collages de fotos sacadas de una base de datos, sino que efectivamente crean una imagen desde cero. La complejidad en la programación del software define la calidad del resultado, como es lógico. Dalle-e 2 y Midjourney superan por mucho a Craiyon o al generador de imágenes en Tinywow.
El procedimiento es relativamente simple a un nivel teórico. Durante el entrenamiento, cada programa se expone a miles o millones de fotos relacionadas con palabras y aplica un procedimiento que Platón patentó como dialéctica: enfrentar todas las ideas que conforman un concepto para encontrar la esencia de dicho concepto.
En la práctica, cuando Dall-e 2 procesa todas las imágenes relacionadas con la palabra «león», las está comparando para comprender qué formas, texturas, colores, combinaciones de píxeles hacen la esencia del león.
Lamentablemente para nosotros, Dall-e 2 y otras tantas IAs gráficas no están disponibles para Cuba. Las compañías desarrolladoras son mayormente norteamericanas y el bloqueo económico de Estados Unidos hacia nuestro país les impide prestarnos esos servicios. Además, y es el caso específico de Dall-e 2, muchas herramientas son de pago. Pero, no te preocupes, en el mar hay muchos peces. Acá te dejamos un par de herramientas que te servirán si necesitas una IA generadora de imágenes.
CONVERSAR CON UNA IA
Con el texto ocurre algo similar. La tecnología con la que trabajan los generadores de texto se denomina transformer (un tipo de arquitectura de red neuronal) y tiene tres aspectos fundamentales. Primeramente, guarda como dato el orden de las palabras asignándole a cada una un número. Originalmente se pensó esta tecnología para traductores automáticos cuyo principal problema era que llevaban las palabras de un idioma al otro ciegamente.
Luego, la atención y la autoatención, que consisten en determinar el significado de cada palabra según el contexto, así, cuando la IA procesa una palabra con varios significados, analiza otra palabra de la frase para entender correctamente lo que se le dice. La diferencia entre una y otra se marca según si la máquina procesa palabras entre la oración traducida y la original, o solo dentro de esta última.
Entonces, en el entrenamiento procesa cuanto texto puede y comienza a comprender qué estructuras idiomáticas son las más usadas, cuáles tienen significado y cuáles no, y aspectos formales del idioma como el vocabulario según el estilo.
Para esto último el método es el mismo que para las imágenes: todos los textos definidos como «sonetos» y se destila qué hace soneto al soneto. Lo mismo ocurre con otros tipos de textos como líneas de código, ensayos, reportajes e incluso conversaciones. De ahí aprende la IA a responder a la interacción humana.
Los generadores de texto son muy útiles pues logran sintetizar y entender el contexto, la gramática y las convenciones lingüísticas, y puede aprender y ofrecer grandes cantidades de datos. De nuevo, muchas IAs generadoras de texto se encuentran bloqueadas para Cuba. Por ejemplo, a ChatGPT –la más famosa– solo es posible acceder mediante una conexión de VPN. Pero, como te mencionamos anteriormente, no es la única que existe. Incluso, Puede que ni siquiera la mejor. Prueba estas y coméntanos cuál te gusta más.
El progreso de la Inteligencia Artificial avanza a un ritmo vertiginoso. Los proyectos en desarrollo son muchísimos. Desde la música, hasta investigaciones médicas, la IA abarca todo. Sam Altman, el mismísimo creador de OpenAI –la empresa detrás de ChatGPT y Dall-e 2–, alertó que no queda mucho para que surja una IA verdaderamente aterradora.
Mientras tanto, solo nos queda aprovechar las ventajas que traen y, por qué no, divertirnos con creaciones como «Un reggaeton con música electrónica, con un sonido de otro mundo, que induce la experiencia de estar perdido en el espacio y evocar una sensación de asombro que, además, se puede bailar». Por supuesto, generado por Inteligencia Artificial.
Términos y condiciones
Este sitio se reserva el derecho de la publicación de los comentarios. No se harán visibles aquellos que sean denigrantes, ofensivos, difamatorios, que estén fuera de contexto o atenten contra la dignidad de una persona o grupo social. Recomendamos brevedad en sus planteamientos.