Existen múltiples formas de categorizar las inteligencias artificiales. Como en el caso de la definición, es algo que no nos importa demasiado.
Para lo que nos ocupa, nos interesa diferenciar las utilidades que tienen. Es decir, para qué sirven o qué hacen.
Más de 3000 orangotanes ya reciben mis emails
Suscríbete a la Niusleta de Joseo20.
Yo sí mando spam. Cuando tengo que vender, vendo. El resto de tiempo envío emails con temas que considero interesantes.
Hablo de todo lo que me sale de los cojones, no sólo de marketing o negocios. Hay política, filosofía y otras gilipolleces.
Es probable que después de leerla me odies.
Incluye orangotanes.
En este sentido, vamos a diferenciar las siguientes (no es una categorización académica, pero nos será útil):
- IAs de Texto: Son aquellas capaces de comprender el lenguaje natural. En consecuencia, pueden hacer tareas relacionadas con la lectura y la escritura, hacer resúmenes, traducir, organizar información, etc. La más conocida y potente en el momento de escribir estas líneas es es GPT-4.
- IAs conversacionales: Las IAs conversacionales o de diálogo no son más que IAs de Texto pensadas para poder conversar. La más famosa, sin duda, es ChatGPT, y también tenemos BingBot (se llama sólo Bing o BingChat, pero a mí me hace gracia llamarlo BingBot).
- IAs de Imágenes: Son aquellas capaces de comprender visualmente los conceptos. En el momento de escribir estas líneas están muy de moda IAs como MidJourney, Stable Diffusion o Dall-E, que traducen a imagen conceptos escritos (les dices que te dibujen un gato y te lo dibujan, por ejemplo). Sin embargo, también funciona en la dirección contraria. Cuando haces una búsqueda inversa de imágenes en Google, éste te indica qué es lo que hay en la imagen y elementos semánticos de la misma (aproximadamente).
- IAs de Audio: Son aquellas capaces de procesar audio. No necesariamente comprenden los conceptos. Por ejemplo, hay IAs que transcriben audios (Speech-To-Text) y otras que ponen voz a texto escrito (Text-To-Speech).
- IAs de Vídeo: Similares a las IA de Imágenes, pero aplicado a vídeo. En el momento de escribir estas líneas, aún no hay ninguna IA pública con suficiente calidad como para aprovecharla, pero ya hay proyectos muy avanzados. Es cuestión de meses que tengamos un Midjourney en versión vídeo.
Coge con pinzas esta categorización.
Como digo, no es ni académica ni oficial. Hay muchas subcategorías dentro de cada una de ellas, algunas comparten características, algunas otras faltan (como las orientadas a salud o a las matemáticas), IAs de distintas categorías pueden compartir funcionamiento interno, mientras que IAs que pertenecen a la misma categoría pueden tener funcionamientos internos distintos, etc.
Es una categorización útil para lo que se va a hablar en este parque. Nada más.
¿Por qué es importante tener este tipo de categorizaciones?
Pues porque cada IA es diferente y exige una forma de comunicarse con ella distinta. Pero la mayoría de ellas necesitan que les des instrucciones a través de prompts.
Deja un comentario
Lo siento, debes estar conectado para publicar un comentario.