Inteligencia artificial aplicada a la creación de contenidos

En este artículo encontrarás, entre mucha más información, cuatro imágenes y un texto generados por una inteligencia artificial. Y es que, las aplicaciones dirigidas a la creación de contenidos están resultando ser incontables. Sigue leyendo y descubre las tendencias que debes conocer para estar a la vanguardia.

Por Daniel Hernández

09 Dic 2022

8 minutos

En los últimos años hemos vivido una auténtica revolución en lo que se refiere a los modelos de aprendizaje automático. Una revolución que fácilmente podemos equiparar (y puede estar por encima incluso) a la revolución que supuso la masiva incorporación de los PC en casas en los años 90 y la posterior incorporación a internet o a la aparición del iPhone. Estos dos ejemplos supusieron un cambio de paradigma cuyas consecuencias impactaron de lleno en la vida de miles de millones de personas

Si bien el gran público puede no ser del todo consciente de lo que supone la revolución de estos modelos de aprendizaje automático, a nivel empresarial las aplicaciones ya son tangibles y son muchas las empresas interesadas en la explotación comercial de la inteligencia artificial de infinidad de formas. Este artículo se centrará exclusivamente en la vertiente de la generación de contenidos, pero las implicaciones de esta explosión van mucho más allá.

Los modos en los que un modelo de aprendizaje automático pueden facilitar la labor de generación de contenidos editoriales o de múltiples índoles son variados, pero podemos nombrar varios:

Generación de imágenes
Mejora de imágenes (ampliación, detallado, estilos etc.)
Sustitución de elementos en imágenes
Generación de textos
Generación de voces / Locución de voces
Generación de modelos de 3D (caras, escenarios, objetos…)
Asistentes en diseño en general

Además, los modelos comerciales han ido extendiéndose y a día de hoy es factible que las empresas cuenten con modelos de suscripción a estas herramientas o incluso que puedan adaptarse hardware a la medida de sus necesidades, para entrenar modelos con usos centrados en sus necesidades concretas.

Generación de imágenes para el ámbito empresarial

El ámbito en el que más tangibles resultan ser las aplicaciones es el relativo a las imágenes. Son múltiples los modelos que han sido entrenados en los últimos meses, ya sea por grandes corporaciones como Google (con su modelo IMAGEN), OpenAI (con sus modelos Dall-e) o como modelos abiertos accesibles por el gran público como Stable Diffusion (con su beta Dream Studio, con las que hemos generado las imágenes que ves en este post a través de inputs como: “a realistic painting of a spanishs sunny town” y “a tasty hamburger in the middle of an empty city square”).

En esencia, estos modelos son entrenados con multitud de imágenes y textos, de modo que una vez listos (cuantos más inputs contengan, más afinarán en su resultado final), son capaces de generar imágenes nuevas en base a descripciones textuales que les sean indicadas. Es posible, por ejemplo, generar una imagen de una ciudad con un estilo determinado, indicando la hora del día (noche, día…), elementos que tendrán que aparecer en escena… Esto posibilita el trasladar un concepto desde el pensamiento hasta la imagen de forma casi instantánea.

Además de poder usar estos modelos con el entrenamiento general que se le haya planteado, en modelos abiertos como Stable Diffusion, es posible descargar y entrenar los modelos con medios propios, de modo que es factible dotarle de inputs concretos que queramos explotar. Así pues, se abre un abanico de posibilidades casi infinitas, pudiendo indicar al modelo que determinadas imágenes pertenecen por ejemplo a una persona concreta, para posteriormente solicitarle una imagen de esta persona en un contexto diferente.

Una imagen de mí creada mediante un modelo entrenado con machine learning

Y más allá, podemos entrenarla en cualquier directriz que queramos especificar: estilos pictóricos o artísticos concretos, modelos de ciudades concretas etc. para conseguir generar imágenes con una concreción realmente inaudita. De hecho, este modelo abierto es susceptible de incorporar cualquier elemento al entrenamiento, a diferencia de modelos desarrollados por empresas, los cuales prescinden por ejemplo de personajes famosos, para evitar generar imágenes que los incorporen.

Generación y edición de vídeo usando machine learning

Y no sólo la imagen estática es susceptible de beneficiarse de estos avances. En el campo del vídeo, también existen modelos entrenados para realizar labores tan variopintas como:

Restaurar vídeos antiguos (quitar artefactos, rellenar huecos…)
Redimensionar el material original para hacerlo más grande o incorporarle nuevos frames intermedios.
Cambiar estilos, iluminaciones…
Extraer elementos en movimiento y sustituirlos por un fondo contextual.

A nivel técnico, este tipo de asistencia es realmente útil para optimizar recursos y convertir tareas que hace muy pocos años resultaban tediosas en un puñado de clics. En este sentido, compañías como Adobe, llevan unos años explotando estas posibilidades en sus suites comerciales y aplicando la inteligencia artificial en sus software de referencia.

Generación de textos automáticos para empresas

Una de las áreas inicialmente más impactada fue la de generación de contenidos textuales a partir de inputs o prompts sencillos. La gran repercusora de la revolución fue GPT (serie de modelos de OpenAI), que con su tercera y última versión hasta la fecha, lanzada en 2020, revolucionó la industria y los usos que las empresas podían llevar a cabo con este tipo de modelos.

GPT-3 es un modelo de procesamiento de lenguaje natural entrenado con 175.000 millones de parámetros. Su contexto de entrenamiento fue general, ya que fue entrenado con textos de muy diversas índoles e idiomas. Esto ha ocasionado que este modelo pueda ser útil en aplicaciones tan variadas como generar códigos de programación desde un lenguaje natural, como a escribir artículos, traducir, resumir…

Ya no es el modelo con mayor número de parámetros, pero su planteamiento comercial sigue haciendo de él un modelo realmente útil y con muchas aplicaciones para las empresas. Es posible usar este modelo directamente desde la web de OpenAI o usarlo por medio de otras empresas que lo explotan para crear soluciones adaptadas, como el caso de Jasper, solución comercial que hace uso de esta tecnología y la aplica a todo tipo de contenidos editoriales, desde escritura de artículos para blog hasta copies para redes sociales, pasando por ser también una buena fuente de ideas para romper con el folio en blanco o tener una batería de sugerencias a modo de tormenta de ideas.

A modo de ejemplo, sugerimos a esta herramienta escribir un post con las indicaciones (en español): “Cómo las empresas pueden usar herramientas basadas en inteligencia artificial para generar contenidos, ya sean imágenes o textos y optimizar así recursos” e indicando que el lenguaje fuera profesional y éste fue el resultado (te sorprenderá, de verdad).

Aplicación de IA en contenidos de audio

Otra aplicación muy útil a la hora de comunicar por parte de las empresas, es la generación y edición de audios por medio de la inteligencia artificial. Esto permite por ejemplo locutar con voz natural cualquier texto entregado como input. Los avances están produciéndose con gran velocidad y aunque apenas hace un par de años las voces sintéticas eran fácilmente detectables por el oído humano, hoy en día se están entrenando modelos de gran calidad, si bien la expresividad otorgada por actores y actrices de doblaje aún sigue dotada de una genuinidad superior.

No debemos perder de vista que aunque existan diferencias, las aplicaciones de esta tecnología siguen resultando ser muy útiles para enfoques que hace años las empresas no habrían utilizado, como la locución automática de textos de una web o un blog. ¿El punto fuerte? Que el idioma no es una barrera y que una vez producido un vídeo, la tecnología actual permite ya que sea locutado en distintos idiomas adaptando además los movimientos de la boca de los actores / actrices al nuevo idioma.

¿Qué escenario podemos esperar en 5 o 10 años?

Es realmente complicado prever un escenario realista de lo que la aplicación de la inteligencia artificial va a ser capaz de traer al ámbito empresarial de las comunicaciones y la generación de contenidos. Cada día aparecen nuevas propuestas, modelos o ideas que con gran velocidad consiguen resultados aplicables a la empresa. ¿El reto? Seguir de cerca estas tendencias y hacer un uso óptimo de las herramientas que tenemos al alcance para no perder competitividad y permanecer en una posición ventajosa.

En Flat 101 contamos con un equipo a la vanguardia de las tendencias tecnológicas, lo que nos permite integrar las mejores soluciones para nuestros clientes. ¿Quieres saber más? Contacta con nosotros; estaremos encantados de atenderte.