Modelos

Un modelo de inteligencia artificial es un programa entrenado para aprender patrones a partir de datos (como texto, imágenes o sonidos), y luego usar esos patrones para hacer tareas “inteligentes”, por ejemplo:
-
Entender preguntas
-
Escribir texto
-
Traducir
-
Reconocer imágenes o voz
🔹 Un modelo de IA aprende de muchos ejemplos y luego predice o genera cosas nuevas que tienen sentido.
🔹Un modelo de IA es un sistema entrenado para hacer una tarea específica.
🔹 Cada tipo de modelo de IA se especializa en un tipo de información.
🔹 Algunos (como los multimodales) combinan varios tipos a la vez.
🔹 Los modelos de lenguaje grandes (LLMs) son los más usados hoy por su versatilidad (chat, análisis, generación, etc.).
Tipos
Los tipos de modelos se diferencian por el tipo de datos que usan (texto, imagen, sonido, etc.) y lo que saben hacer (predecir, clasificar, generar, etc.).
| Tipo de modelo | Qué hace | Ejemplos |
|---|---|---|
| 1. Modelos de lenguaje (LLMs) | Entienden y generan texto, mantienen conversaciones, escriben, traducen. | ChatGPT, Llama 3, Mistral, Gemini, Claude |
| 2. Modelos de visión | Reconocen y analizan imágenes o videos. | YOLO, CLIP, ResNet, OpenCV, SAM (Segment Anything) |
| 3. Modelos de voz y audio | Reconocen voz o generan audio y música. | Whisper (transcripción), TTS (Text-to-Speech), MusicGen |
| 4. Modelos multimodales | Combinan texto, imágenes, audio o video para razonar con varios tipos de datos a la vez. | GPT-4o, Gemini 1.5, Claude 3.5, Kosmos-2 |
| 5. Modelos de recomendación | Predicen qué te gustará (productos, películas, música). | Netflix, Amazon, TikTok, Spotify |
| 6. Modelos predictivos / analíticos | Detectan patrones y hacen pronósticos basados en datos numéricos. | Modelos de predicción de ventas, clima, finanzas |
| 7. Modelos generativos | Crean contenido nuevo: texto, imágenes, código, video o música. | DALL·E, Stable Diffusion, Midjourney, Code Llama |
| 8. Modelos de refuerzo (Reinforcement Learning) | Aprenden a tomar decisiones por ensayo y error. | AlphaGo, agentes de videojuegos, robots autónomos |
| 9. Modelos de embeddings / vectoriales | Representan texto o imágenes como números para comparar similitud. | OpenAI Embeddings, Nomic, Sentence Transformers |
Ejemplo
Imagina una empresa con distintos tipos de tareas:
| Tarea | Tipo de modelo ideal |
|---|---|
| Chat interno con empleados | Modelo de lenguaje (LLM) |
| Leer facturas escaneadas | Modelo de visión |
| Transcribir llamadas | Modelo de voz |
| Recomendar cursos a empleados | Modelo de recomendación |
| Predecir ventas | Modelo predictivo |
| Generar imágenes publicitarias | Modelo generativo |
Cada modelo tiene su especialidad, igual que en un equipo de trabajo.
Modelos populares por tipo
| Área | Modelos conocidos |
|---|---|
| Texto / conversación | ChatGPT, Claude, Llama, Mistral, Phi |
| Imagen | Stable Diffusion, Midjourney, DALL·E, CLIP |
| Audio / voz | Whisper, Bark, MusicGen |
| Multimodal (todo en uno) | GPT-4o, Gemini 1.5, Claude 3.5, Kosmos |
| Código / programación | Code Llama, StarCoder, DeepSeek Coder |
| Recomendaciones | Matrix Factorization, Transformers, DeepFM |
Terminología
Parámetros
Son las “conexiones internas” del cerebro del modelo. Cada parámetro guarda un número que el modelo ajustó mientras aprendía. Un modelo tiene capas de redes neuronales con miles de millones de parámetros (sus “neuronas”). Durante el entrenamiento, el modelo ajusta esos parámetros para aprender relaciones entre los datos.
Los parámetros son lo que el modelo aprende durante su entrenamiento.
Por ejemplo:
-
llama3.1:70b tiene 70 mil millones de parámetros.(ocupa decenas de GB).
-
Esos son los “pesos” de una red neuronal, como las sinapsis de un cerebro.
-
Cuantos más parámetros, más conocimiento y más capacidad de razonamiento.
🔹 “B” = billones de parámetros
🔹 Más parámetros = más inteligencia, más tamaño, más consumo
🔹 “70B” = modelo muy grande, con calidad similar a ChatGPT avanzado
Analogía: pensando en un modelo como una persona, los parámetros son sus neuronas entrenadas; no cambian cuando hablas con ella.
Tokens
Los tokens son las unidades de texto que el modelo procesa o genera. No son palabras exactamente, sino pedacitos de palabras.
Los tokens son las piezas del texto que entran o salen del modelo cuando conversas.
Cuando tú hablas con él, el modelo usa lo que aprendió para procesar tus tokens (las partes de texto que le mandas) y generar una respuesta.
Resumen
| Término | Qué significa | Ejemplo |
|---|---|---|
| Modelo de IA | Un cerebro artificial entrenado para hacer una tarea. | ChatGPT, Llama, Mistral |
| Entrenamiento | El proceso donde aprende de muchos datos. | Leer millones de textos |
| Parámetros | Las conexiones o “neuronas” que guardan lo aprendido. | 70 B en Llama 3 – 70B |
| Tokens | Las piezas de texto que el modelo lee o genera. | “Hola mundo” → 3 tokens |