El pasado día 30 de noviembre se cumplieron justo 3 años del lanzamiento de ChatGPT por OpenAI y comenzó lo que conocemos como Inteligencia Artificial (generativa). Hasta entonces apenas nadie había oído sobre el término Inteligencia Artificial, en la actualidad está presente en todas partes, tarde o temprano oirás una información o noticia sobre el tema.
Está claro que la IA, que no es más que software, es una tecnología que nos va a permitir un gran avance en muchos campos. Un ejemplo destacado se encuentra en la investigación científica, donde la IA ha logrado resolver uno de los mayores retos de la biología: predecir la estructura tridimensional de las proteínas, gracias al sistema de IA desarrollado por Google Deepmind llamado AlphaFold.
En apenas 3 años, la IA ha dejado de ser una promesa futurista para convertirse en una herramienta cotidiana que impacta prácticamente en todos los sectores de nuestra sociedad. Lo que comenzó como un chatbot capaz de mantener conversaciones coherentes se ha expandido y está redefiniendo cómo trabajamos, creamos y nos comunicamos.
Bienvenidos al show de la IA generativa:
Supongo que a todos nos ha pasado lo mismo cuando probamos, por primera vez, ChatGPT y le hicimos una pregunta y nos respondió como si fuera una persona al otro lado de la pantalla. Y seguimos con la misma sensación, cuando le preguntamos una consulta médica o jurídica y nos responde con una excelencia jamás vista. Todos estábamos acostumbrados a conversar con Alexa o Siri y que nos respondiera a demandas muy sencillas o incluso habíamos probado con algún chatbot de una tienda online. Pero nunca esperábamos que un programa informático nos pudiera contestar sin haber sido programado “específicamente” para ello, a cualquier cosa que le pidamos: cualquiera.
Pero si bien la capacidad de la IA para generar y procesar texto ha sido impresionante, es en el ámbito de la creación visual donde verdaderamente podemos apreciar el poder revolucionario de esta tecnología. Es donde realmente uno flipa con lo que cualquier modelo de IA generativa puede realizar. Sobe todo cuando vemos imágenes y vídeos superrealistas. Sino juzgar vosotros mismos las siguientes imágenes y vídeos que hemos elegido al azar de tantas que hay y que se han vuelto virales. Son tan reales que el concepto de “realidad” en imagen y vídeo va a ser muy complicado de descifrar, porque no vamos a saber si lo que vemos es real o ficción.
Juzgar sino el contenido siguiente, todo creado por IA:
Este vídeo de arriba me gusta mucho, porque si no fuera porque vemos que el conejo es de ficción no nos daríamos cuenta de que es un vídeo creado totalmente por IA. Fijaros bien en todo lo que aparece en el vídeo: desde el rostro de la mujer, sus manos, a la habitación donde limpia el conejo y la sartén donde lo cocina para acabar con todos los chinos que se lo comen en un patio. No me diréis que no está bien hecho. Repito si no fuera porque el conejo es de ficción sería 100% «real». Para algunos, que hayáis estado en China y comido cosas «raras» incluso el animal no os parecerá irreal.
Para seguir, veamos una imagen de una cámara de seguridad en la calle :
Según explican en el mismo post, la imagen ha sido creada con un prompt o instrucción como éste: «I lost my bag somewhere in the Mission District in San Francisco, check the city’s surveillance cameras to see where I last had it» La imagen fue creada por Nano Banana Pro de Google.
Pero si queremos más vídeos creados por IA y que son «totalmente» reales, veamos a estos niños:
Fijaros en el fondo de la imagen y veréis a un niño en bici y a personas caminando. El vídeo fue creado con Sora de OpenAI.
Aquí seguimos con un vídeo de animales, en este caso de tigres, similar a los que hemos visto cientos de veces en TV o Youtube:
La IA puede crear vídeos e imágenes alucinantes, de pura fantasía, pero donde el don de la IA se manifiesta y asusta de lo bien que lo hace es en todo aquello que se asemeje a la realidad y que no nos permita diferenciar lo que es real, de lo que ha sido creado por IA. Si no mirar la abuela rockera:
Si os fijáis al principio del vídeo veréis que en las gafas se refleja el aro de luz, que es el tipo de lámpara que utilizan todos los instagramers y youtubers. Pero además es que la abuela habla como una persona mayor y las arrugas se ven naturales.
Pero el más difícil todavía lo representa el siguiente vídeo donde aparecen dos estrellas grandiosas, como son el mítico Bruce Lee y el one and only James Brown. En el caso de personas conocidas es aún más difícil de crear de forma artificial, porque todos conocemos muy bien al personaje y cualquier elemento que nos nos coincida o no sea parecido al original no nos será creíble. Mirar a estos dos personajes bailar juntos:
Y no solo la imagen, es aún más escalofriante como imita el sonido o voces de los protagonistas. Los que seáis fans del padrino del Soul, escuchad este vídeo sin verlo y sentiréis al verdadero James Brown, Mr. Dyamite. Imita tan bien que incluso la imagen del programa de TV es «verdadero» con esos tonos pasteles tan típicos de los 70 del siglo pasado. La IA generativa es extraordinaria creando texto pero con las imágenes y vídeos es un caso que incluso nos debería de preocupar por lo real que «es».
Para finalizar os dejo un popurri de vídeos realistas, a cual mejor:
Una buena herramienta para crear imágenes y vídeos con IA: Higgsfield.ai
Pues para crear vídeos tan asombrosos como los que acabamos de ver lo que necesitamos son 2 cosas: un modelo de IA generativa capaz de crear contenido visual y saber escribir un prompt.
Hay muchos modelos de IA para generar imágenes como Nano Banana de Google, o Dall E de Open AI pero también están otros específicos como Leonardo, Midjourney o Freepik.
Para la generación de vídeos os aconsejamos Google Veo y Sora de OpenAI o herramientas como Runway, Pika o Kling.
Pero hay una plataforma que os permite incluir varios de los modelos que os hemos comentado (como los modelos de Google, OpenAI y también el espectacular Kling) pero además nos permite aprender de los prompts con los que otros usuarios han creado sus imágenes y vídeos. Se llama Higgsfield.ai
Cuando entréis a Higgsfield.ai lo primero que os aparece es una galería pública de vídeos e imágenes creados por otros usuarios de la comunidad. La mayoría de imágenes y vídeos vienen acompañados del prompt exacto que lo generó. Esto significa que puedes explorar visualmente resultados que te resulten atractivos o interesantes, y luego estudiar exactamente qué instrucciones textuales o prompts produjeron ese resultado específico. Aquí podéis ver, por ejemplo, imágenes creadas por Nano Banana de Google y en cada imagen aparece el prompt con el que ha sido creada la imagen (en inglés).
Esta metodología de aprendizaje por observación y análisis es extraordinariamente efectiva. En lugar de enfrentarte a una pantalla en blanco sin saber qué escribir, puedes:
Navegar por la galería hasta encontrar un estilo visual, composición o concepto que resuene contigo
Examinar el prompt que lo generó, observando la estructura, el vocabulario, el nivel de detalle y las técnicas utilizadas
Analizar qué elementos específicos del prompt contribuyeron a qué aspectos del resultado visual
Experimentar modificando ese prompt como punto de partida, cambiando variables individuales para entender su impacto
Los 5 principales Tips para crear vídeos e imágenes con IA
Para ayudarte a comenzar tu viaje en la creación visual con inteligencia artificial y aprovechar al máximo plataformas como Higgsfield.ai, aquí están los 5 consejos esenciales que debes conocer:
1) Utiliza el inglés en los prompts:
Todos tus prompts deben estar escritos en inglés, independientemente de tu idioma nativo. La razón es que los modelos de IA generativa han sido entrenados con un conjunto de datos en inglés, haciendo de este idioma su «lengua materna» cognitiva. El vocabulario especializado en inglés para describir estilos artísticos, técnicas fotográficas, composiciones visuales y efectos cinematográficos es mucho más rico y está mejor representado en los datos de entrenamiento. Términos como «bokeh», «chiaroscuro», «golden hour lighting», «Dutch angle», «establishing shot» o «rim lighting» tienen asociaciones visuales muy específicas que el modelo comprende perfectamente en inglés, pero que pierden parte de su especificidad al traducirse. El modelo no lo entiende igual de bien que en inglés.
2) Sé extremadamente específico y detallado:
Un prompt tipo «un perro caminando por una calle de Londres al atardecer» dará un resultado genérico. Un buen prompt debe ser una «receta» con ingredientes. Incluye detalles como: Sujeto (un labrador dorado anciano), Acción (caminando lentamente), Ambiente (en una calle adoquinada del barrio de Shad Thames cerca del Tower Bridge), Hora/Luz (al atardecer, luz dorada suave), y Emoción/Atmósfera (con un aire melancólico, como si estuviera perdido o vagando por las calles).
3) Domina el vocabulario de estilos y técnicas artísticas:
Los modelos de IA han sido entrenados con millones de imágenes etiquetadas con términos artísticos específicos, lo que significa que responden extremadamente bien cuando utilizas vocabulario técnico del mundo del arte, la fotografía y el cine.
Familiarízate con términos (en inglés) como:
- Estilos artísticos: «impressionist», «art nouveau», «cyberpunk», «steampunk», «baroque», «minimalist»
- Técnicas fotográficas: «shallow depth of field», «bokeh», «long exposure», «HDR», «tilt-shift»
- Iluminación: «golden hour», «blue hour», «dramatic lighting», «studio lighting», «volumetric lighting», «rim lighting»
- Composición: «rule of thirds», «symmetrical composition», «aerial view», «wide angle», «macro shot»
- Calidad y renderizado: «4K resolution», «photorealistic», «hyperrealistic», «cinematic», «highly detailed»
Cuando incorporas estos términos en tus prompts, estás activando vastos conjuntos de conocimiento visual que el modelo ha aprendido, lo que resulta en creaciones más sofisticadas y profesionales.
4) Utiliza referencias culturales y artísticas conocidas:
Los modelos de IA tienen un conocimiento profundo de obras de arte famosas, estilos de artistas reconocidos, películas icónicas y referencias culturales ampliamente conocidas. Puedes aprovechar esto para comunicar conceptos visuales complejos de forma muy eficiente.
Por ejemplo, puedes escribir «inspired by Blade Runner aesthetics» para evocar esa atmósfera cyberpunk oscura y de neón. Mencionar «like a Wes Anderson film» inmediatamente comunica composiciones simétricas, paletas de colores pastel específicas y un estilo visual muy particular.
Similarmente, puedes referenciar artistas: «in the style of Van Gogh» para pinceladas expresionistas y colores vibrantes, o «inspired by Ansel Adams» para fotografía de paisajes en blanco y negro con alto contraste y composición dramática.
5) Utiliza un asistente para crear tu prompt:
Y el mejor tip puede ser que todo lo dicho no lo tengas que hacer tú, sino que se lo encargas a un asistente tipo ChatGPT, Gemini o Copilot y le dices, por ejemplo: «Escríbeme, como si fueras un experto guionista de Hollywood, un prompt en inglés para crear una imagen con IA de un perro melancólico caminando por una calle del barrio de Shad Thames en Londres al atardecer y define bien qué tipo de perro es, el ambiente, la acción, la hora de la luz, con todos los parámetros técnicos necesarios así como el estilo artístico más apropiado para el tipo de imagen. El prompt debe ser muy específico y detallado, repito en inglés. La imagen va a ser creada por el modelo Nano Banana de Google»
Seguro que así podemos conseguir un prompt sobresaliente, pero es necesario que siempre tengáis muy presentes los tips o consejos necesarios para crear un buen vídeo o imagen con IA.
Esperamos que estos consejos os sean de ayuda, como asesores expertos en IA os ayudamos a utilizar la IA de una manera fácil y asequible. Si tenéis alguna duda o buscáis una herramienta de IA apropiada para crear imágenes o vídeo poneros en contacto con nosotros, en Gana Inteligencia.



