Skip to main content

Modelos

image.png

Un modelo de inteligencia artificial es un programa entrenado para aprender patrones a partir de datos (como texto, imágenes o sonidos), y luego usar esos patrones para hacer tareas “inteligentes”, por ejemplo:

  • Entender preguntas

  • Escribir texto

  • Traducir

  • Reconocer imágenes o voz

🔹 Un modelo de IA aprende de muchos ejemplos y luego predice o genera cosas nuevas que tienen sentido.

🔹Un modelo de IA es un sistema entrenado para hacer una tarea específica.

🔹 Cada tipo de modelo de IA se especializa en un tipo de información.
🔹 Algunos (como los multimodales) combinan varios tipos a la vez.
🔹 Los modelos de lenguaje grandes (LLMs) son los más usados hoy por su versatilidad (chat, análisis, generación, etc.).


Tipos

Los tipos de modelos se diferencian por el tipo de datos que usan (texto, imagen, sonido, etc.) y lo que saben hacer (predecir, clasificar, generar, etc.).

Tipo de modelo Qué hace Ejemplos
1. Modelos de lenguaje (LLMs) Entienden y generan texto, mantienen conversaciones, escriben, traducen. ChatGPT, Llama 3, Mistral, Gemini, Claude
2. Modelos de visión Reconocen y analizan imágenes o videos. YOLO, CLIP, ResNet, OpenCV, SAM (Segment Anything)
3. Modelos de voz y audio Reconocen voz o generan audio y música. Whisper (transcripción), TTS (Text-to-Speech), MusicGen
4. Modelos multimodales Combinan texto, imágenes, audio o video para razonar con varios tipos de datos a la vez. GPT-4o, Gemini 1.5, Claude 3.5, Kosmos-2
5. Modelos de recomendación Predicen qué te gustará (productos, películas, música). Netflix, Amazon, TikTok, Spotify
6. Modelos predictivos / analíticos Detectan patrones y hacen pronósticos basados en datos numéricos. Modelos de predicción de ventas, clima, finanzas
7. Modelos generativos Crean contenido nuevo: texto, imágenes, código, video o música. DALL·E, Stable Diffusion, Midjourney, Code Llama
8. Modelos de refuerzo (Reinforcement Learning) Aprenden a tomar decisiones por ensayo y error. AlphaGo, agentes de videojuegos, robots autónomos
9. Modelos de embeddings / vectoriales Representan texto o imágenes como números para comparar similitud. OpenAI Embeddings, Nomic, Sentence Transformers

Ejemplo 

Imagina una empresa con distintos tipos de tareas:

Tarea Tipo de modelo ideal
Chat interno con empleados Modelo de lenguaje (LLM)
Leer facturas escaneadas Modelo de visión
Transcribir llamadas Modelo de voz
Recomendar cursos a empleados Modelo de recomendación
Predecir ventas Modelo predictivo
Generar imágenes publicitarias Modelo generativo

Cada modelo tiene su especialidad, igual que en un equipo de trabajo.


Modelos populares por tipo

Área Modelos conocidos
Texto / conversación ChatGPT, Claude, Llama, Mistral, Phi
Imagen Stable Diffusion, Midjourney, DALL·E, CLIP
Audio / voz Whisper, Bark, MusicGen
Multimodal (todo en uno) GPT-4o, Gemini 1.5, Claude 3.5, Kosmos
Código / programación Code Llama, StarCoder, DeepSeek Coder
Recomendaciones Matrix Factorization, Transformers, DeepFM

Cómo se forma un modelo

Un modelo tiene capas de redes neuronales con miles de millones de parámetros (sus “neuronas”).
Durante el entrenamiento:

  • Ajusta esos parámetros para aprender relaciones entre los datos.

  • Una vez entrenado, se guarda en un archivo enorme (por ejemplo, llama3.1:70b ocupa decenas de GB).

Cuando tú hablas con él, el modelo usa lo que aprendió para procesar tus tokens (las partes de texto que le mandas) y generar una respuesta.


🧩 En resumen

Término Qué significa Ejemplo
Modelo de IA Un cerebro artificial entrenado para hacer una tarea. ChatGPT, Llama, Mistral
Entrenamiento El proceso donde aprende de muchos datos. Leer millones de textos
Parámetros Las conexiones o “neurones” que guardan lo aprendido. 70 B en Llama 3 – 70B
Tokens Las piezas de texto que el modelo lee o genera. “Hola mundo” → 3 tokens