Modelos

Un modelo de inteligencia artificial es un programa entrenado para aprender patrones a partir de datos (como texto, imágenes o sonidos), y luego usar esos patrones para hacer tareas “inteligentes”, por ejemplo:
-
Entender preguntas
-
Escribir texto
-
Traducir
-
Reconocer imágenes o voz
En resumen:
🔹 Un modelo de IA aprende de muchos ejemplos y luego predice o genera cosas nuevas que tienen sentido.
Un modelo de IA es un sistema entrenado para hacer una tarea específica.
Tipos
Los tipos de modelos se diferencian por el tipo de datos que usan (texto, imagen, sonido, etc.) y lo que saben hacer (predecir, clasificar, generar, etc.).
Tipos
| Tipo de modelo | Qué hace | Ejemplos |
|---|---|---|
| 1. Modelos de lenguaje (LLMs) | Entienden y generan texto, mantienen conversaciones, escriben, traducen. | ChatGPT, Llama 3, Mistral, Gemini, Claude |
| 2. Modelos de visión | Reconocen y analizan imágenes o videos. | YOLO, CLIP, ResNet, OpenCV, SAM (Segment Anything) |
| 3. Modelos de voz y audio | Reconocen voz o generan audio y música. | Whisper (transcripción), TTS (Text-to-Speech), MusicGen |
| 4. Modelos multimodales | Combinan texto, imágenes, audio o video para razonar con varios tipos de datos a la vez. | GPT-4o, Gemini 1.5, Claude 3.5, Kosmos-2 |
| 5. Modelos de recomendación | Predicen qué te gustará (productos, películas, música). | Netflix, Amazon, TikTok, Spotify |
| 6. Modelos predictivos / analíticos | Detectan patrones y hacen pronósticos basados en datos numéricos. | Modelos de predicción de ventas, clima, finanzas |
| 7. Modelos generativos | Crean contenido nuevo: texto, imágenes, código, video o música. | DALL·E, Stable Diffusion, Midjourney, Code Llama |
| 8. Modelos de refuerzo (Reinforcement Learning) | Aprenden a tomar decisiones por ensayo y error. | AlphaGo, agentes de videojuegos, robots autónomos |
| 9. Modelos de embeddings / vectoriales | Representan texto o imágenes como números para comparar similitud. | OpenAI Embeddings, Nomic, Sentence Transformers |
Ejemplo
Imagina una empresa con distintos tipos de tareas:
| Tarea | Tipo de modelo ideal |
|---|---|
| Chat interno con empleados | Modelo de lenguaje (LLM) |
| Leer facturas escaneadas | Modelo de visión |
| Transcribir llamadas | Modelo de voz |
| Recomendar cursos a empleados | Modelo de recomendación |
| Predecir ventas | Modelo predictivo |
| Generar imágenes publicitarias | Modelo generativo |
Cada modelo tiene su especialidad, igual que en un equipo de trabajo.
Modelos populares por tipo
| Área | Modelos conocidos |
|---|---|
| Texto / conversación | ChatGPT, Claude, Llama, Mistral, Phi |
| Imagen | Stable Diffusion, Midjourney, DALL·E, CLIP |
| Audio / voz | Whisper, Bark, MusicGen |
| Multimodal (todo en uno) | GPT-4o, Gemini 1.5, Claude 3.5, Kosmos |
| Código / programación | Code Llama, StarCoder, DeepSeek Coder |
| Recomendaciones | Matrix Factorization, Transformers, DeepFM |
Conclusión
🔹 Cada tipo de modelo de IA se especializa en un tipo de información.
🔹 Algunos (como los multimodales) combinan varios tipos a la vez.
🔹 Los modelos de lenguaje grandes (LLMs) son los más usados hoy por su versatilidad (chat, análisis, generación, etc.).
🧠 Ejemplo con lenguaje
Un modelo de lenguaje (como ChatGPT o Llama) aprende cómo se usan las palabras en millones de textos.
Durante el entrenamiento:
-
Ve miles de frases como:
“El sol sale por el ___”
-
Aprende que “este”, “oeste” o “horizonte” son posibles, pero “manzana” no encaja.
-
Así aprende patrones del idioma y cómo las palabras se relacionan.
Después del entrenamiento, el modelo puede predecir la siguiente palabra o token, y así escribir o conversar.
⚙️ Cómo se forma un modelo
Un modelo tiene capas de redes neuronales con miles de millones de parámetros (sus “neuronas”).
Durante el entrenamiento:
-
Ajusta esos parámetros para aprender relaciones entre los datos.
-
Una vez entrenado, se guarda en un archivo enorme (por ejemplo,
llama3.1:70bocupa decenas de GB).
Cuando tú hablas con él, el modelo usa lo que aprendió para procesar tus tokens (las partes de texto que le mandas) y generar una respuesta.
🧩 En resumen
| Término | Qué significa | Ejemplo |
|---|---|---|
| Modelo de IA | Un cerebro artificial entrenado para hacer una tarea. | ChatGPT, Llama, Mistral |
| Entrenamiento | El proceso donde aprende de muchos datos. | Leer millones de textos |
| Parámetros | Las conexiones o “neurones” que guardan lo aprendido. | 70 B en Llama 3 – 70B |
| Tokens | Las piezas de texto que el modelo lee o genera. | “Hola mundo” → 3 tokens |